簡介
CTranslate2 是一個 C++ 和 Python 庫,用于使用 Transformer 模型進(jìn)行高效推理。該項(xiàng)目實(shí)現(xiàn)了一個自定義運(yùn)行時,應(yīng)用了許多性能優(yōu)化技術(shù),如權(quán)重量化、層融合、批量重新排序等,以加速和減少Transformer 模型在 CPU 和 GPU 上的內(nèi)存使用。目前支持以下模型類... 更多
技術(shù)信息
開源協(xié)議
MIT
開發(fā)語言
C/C++
Python
操作系統(tǒng)
跨平臺
軟件類型
開源軟件
所屬分類
神經(jīng)網(wǎng)絡(luò)/人工智能、 機(jī)器學(xué)習(xí)/深度學(xué)習(xí)
開源組織
無
地區(qū)
不詳
適用人群
未知
評價
0.0(滿分 10 分)0 個評分
什么是點(diǎn)評分
圖片
表情
全部評價(
0)
推薦率
100%

