簡(jiǎn)介
隨著 BERT、Megatron、GPT-3 等預(yù)訓(xùn)練模型在NLP領(lǐng)域取得矚目的成果,越來越多團(tuán)隊(duì)投身到超大規(guī)模訓(xùn)練中,這使得訓(xùn)練模型的規(guī)模從億級(jí)別發(fā)展到了千億甚至萬億的規(guī)模。然而,這類超大規(guī)模的模型運(yùn)用于實(shí)際場(chǎng)景中仍然有一些挑戰(zhàn)。首先,模型參數(shù)量過大使得訓(xùn)練和推理速度過慢且部署成本極高;其次在很多... 更多
技術(shù)信息
開源協(xié)議
Apache-2.0
開發(fā)語(yǔ)言
Python
操作系統(tǒng)
跨平臺(tái)
軟件類型
開源軟件
所屬分類
神經(jīng)網(wǎng)絡(luò)/人工智能、 機(jī)器學(xué)習(xí)/深度學(xué)習(xí)
開源組織
阿里巴巴
地區(qū)
國(guó)產(chǎn)
適用人群
未知
評(píng)價(jià)
0.0(滿分 10 分)0 個(gè)評(píng)分
什么是點(diǎn)評(píng)分
圖片
表情
全部評(píng)價(jià)(
0)
推薦率
100%

