大模型即服務(wù)(MaaS):技術(shù)現(xiàn)狀和面臨挑戰(zhàn)
共 4271字,需瀏覽 9分鐘
·
2024-07-15 09:06
本文來自“模型即服務(wù):MaaS框架與應(yīng)用研究報告(2024年)”,隨著以大模型為核心的人工智能技術(shù)的深入發(fā)展,模型即服務(wù)(MaaS,Model as a Service)作為一種新型人工智能服務(wù)模式煥發(fā)新生。本章將明確MaaS的概念及主要的服務(wù)能力范圍,剖析大模型時代MaaS快速發(fā)展的必然性,闡述MaaS在解決大模型規(guī)模化落地方面的重要意義。
1、MaaS起源與概念
MaaS基本形態(tài)早已形成。2012年美國數(shù)據(jù)科學(xué)家DJ·帕蒂爾(DJ Patil)首次提出MaaS概念1,即“將機器學(xué)習(xí)算法打包成可重復(fù)使用的服務(wù),使企業(yè)能夠快速地構(gòu)建、部署和監(jiān)控模型,無須開發(fā)和維護底層基礎(chǔ)架構(gòu)”,以此來適應(yīng)AI模型需求快速增長的情況。
此時MaaS多以AI能力開放平臺的形式存在,平臺之上承載人臉識別、光學(xué)字符識別(OCR)等特定場景的AI能力。該類AI能力由若干個模型及規(guī)則、數(shù)據(jù)庫等組合構(gòu)成,但覆蓋功能和場景有限,應(yīng)用方式較為單一,主要以工具包(SDK)等方式嵌入至業(yè)務(wù)系統(tǒng)。傳統(tǒng)AI模型落地成本低且泛化性不足,MaaS所帶來的增益尚不明顯。
大模型背景下MaaS概念是指將AI模型及其相關(guān)能力打包成可重復(fù)使用的服務(wù),使企業(yè)能夠快速高效地構(gòu)建、部署、監(jiān)控、調(diào)用模型,無須開發(fā)和維護底層基礎(chǔ)能力。與早期MaaS概念相比能力范圍有所拓展,一方面機器學(xué)習(xí)算法擴展至包括深度學(xué)習(xí)、大模型等在內(nèi)的所有AI模型;另一方面基于模型服務(wù),用戶不僅可直接調(diào)用服務(wù)進行推理,也可基于服務(wù)進行AI應(yīng)用的構(gòu)建,擴大模型服務(wù)的使用范圍。MaaS主要提供三部分:
一是提供包括模型訓(xùn)練、調(diào)優(yōu)和部署等在內(nèi)的全棧平臺型服務(wù),以支持低門檻的模型開發(fā)與定制,用戶無需關(guān)注AI算力、框架和平臺即可生產(chǎn)和部署模型;
二是提供包括大小模型及公私域數(shù)據(jù)集的豐富資產(chǎn)庫服務(wù),以支持模型和數(shù)據(jù)集的靈活快速調(diào)用,用戶無須生產(chǎn)和部署模型即可調(diào)用模型和數(shù)據(jù)集服務(wù);
三是提供基于AI模型的應(yīng)用開發(fā)工具服務(wù),以支持快速打造場景化應(yīng)用,用戶無須搭建開發(fā)工具即可進行AI應(yīng)用開發(fā)。
MaaS主要具備三個顯著特性。技術(shù)低門檻,有助于將模型普惠更廣泛的用戶群體;模型可共享,推動行業(yè)資源的有效利用和技術(shù)進步;應(yīng)用易適配,使得模型服務(wù)能夠快速融入業(yè)務(wù)場景。
MaaS圍繞模型生產(chǎn)、模型調(diào)用、模型應(yīng)用開發(fā)等過程,提供包括平臺服務(wù)、模型服務(wù)、數(shù)據(jù)集服務(wù)、AI應(yīng)用開發(fā)服務(wù)在內(nèi)的全棧服務(wù),并對模型等資產(chǎn)進行統(tǒng)一管理,提升規(guī)模化生產(chǎn)效率,培育和打造新質(zhì)生產(chǎn)力,為各行業(yè)帶來變革。
MaaS通過提供全流程平臺工具降低技術(shù)門檻。在模型訓(xùn)調(diào)方面,降低了學(xué)習(xí)新型訓(xùn)練或調(diào)優(yōu)算法的成本;在模型部署及運營管理方面,對于部署上線過程復(fù)雜等問題,提供快速部署服務(wù),并匹配全生命周期運營監(jiān)控工具,降低了模型部署和運維的技術(shù)難度。
MaaS通過提供集約化的模型庫和數(shù)據(jù)集,解決重復(fù)造輪子的資源浪費問題。在管理方面,當(dāng)模型從單點試驗向規(guī)模化落地發(fā)展時,模型的量變將引起效率的質(zhì)變,通過模型共享可減少開發(fā)資源的浪費,通過模型等數(shù)字資產(chǎn)的統(tǒng)一管理有助于提升風(fēng)險可控性,資源的高效利用和規(guī)范管理將成為企業(yè)長遠發(fā)展的保障;在落地方面,通過直接調(diào)用模型服務(wù)和數(shù)據(jù)集,減少了數(shù)據(jù)處理、選擇模型以及模型調(diào)優(yōu)部署的過程,加快了開發(fā)進度,快速響應(yīng)業(yè)務(wù)需求。
MaaS通過提供模型應(yīng)用的高效開發(fā)能力,適配企業(yè)規(guī)模化場景需求。在面臨單個模型無法解決復(fù)雜業(yè)務(wù)需求的情況下,提供檢索增強生成(RAG)、大小模型協(xié)同、插件編排等多種方式以增強模型能力,并以智能體(AI Agent)等方式向用戶提供更優(yōu)質(zhì)的服務(wù)。MaaS讓更多用戶可以生產(chǎn)個性化的模型應(yīng)用,為AI模型規(guī)模化落地提供有效路徑。
二、MaaS發(fā)展現(xiàn)狀及挑戰(zhàn)
MaaS作為一種智能化服務(wù)新模式得到迅速發(fā)展,本章將圍繞產(chǎn)業(yè)圖譜及落地方式闡述當(dāng)前MaaS的產(chǎn)業(yè)發(fā)展現(xiàn)狀,并分析MaaS落地面臨的挑戰(zhàn)。
(一)MaaS產(chǎn)業(yè)發(fā)展現(xiàn)狀
MaaS在人工智能產(chǎn)業(yè)鏈中處于中游位置,基于平臺服務(wù)、模型及數(shù)據(jù)集服務(wù)、應(yīng)用開發(fā)服務(wù)的供給能力,形成了初步的產(chǎn)業(yè)圖譜,且各類參與方積極發(fā)揮自身優(yōu)勢,形成不同落地模式。
1.MaaS產(chǎn)業(yè)圖譜初步形成
MaaS基于算力基礎(chǔ)設(shè)施的支持,面向場景提供多種應(yīng)用,具備從模型生產(chǎn)到模型調(diào)取并打造成AI應(yīng)用的全流程能力。
MaaS產(chǎn)業(yè)圖譜中,平臺服務(wù)構(gòu)成了MaaS生態(tài)系統(tǒng)的基座能力。國外如Google的AI Platform、微軟的AzureMachine Learning以及亞馬遜的Amazon SageMaker等平臺,提供了從數(shù)據(jù)處理到模型訓(xùn)練、驗證、部署及監(jiān)控的流水線服務(wù)。
國內(nèi)如阿里云PAI平臺、騰訊云太極平臺、百度千帆大模型平臺和華為的ModelArts平臺等,均支持多種機器學(xué)習(xí)算法和大模型,并提供低代碼開發(fā)環(huán)境與高效的模型訓(xùn)練及部署能力,能夠適應(yīng)多樣化的模型定制需求。
2.MaaS兩種落地方式
MaaS具備公有云和私有云兩種落地方式,公有云模式下模型資源更加豐富,但私有云模式下模型資源的行業(yè)領(lǐng)域?qū)傩愿鼘I(yè)。
公有云方式下,通過豐富的資源可吸引更多用戶而提升產(chǎn)品知名度,有助于進一步商業(yè)轉(zhuǎn)化。其模型面向社會大眾提供服務(wù),模型的種類和數(shù)量更多,通用性更強,但是對于業(yè)務(wù)需求較高的特定場景,部分模型難以直接應(yīng)用。
私有云方式下,企業(yè)內(nèi)研發(fā)團隊專注于研究符合垂直領(lǐng)域場景需求的模型,旨在通過調(diào)用模型服務(wù)以直接解決業(yè)務(wù)需求,且模型資產(chǎn)和數(shù)據(jù)隱私性強,各團隊在模型共享的過程中可降低資產(chǎn)泄露的風(fēng)險。
(二)MaaS發(fā)展面臨的挑戰(zhàn)
隨著MaaS的快速發(fā)展,平臺、模型等服務(wù)能力迅速得以完善,但MaaS在規(guī)范性、生態(tài)建設(shè)等方面仍存在不足,模型服務(wù)的易用性仍有待提升。
模型服務(wù)質(zhì)量缺乏規(guī)范性。目前產(chǎn)業(yè)界已發(fā)布多個MaaS產(chǎn)品,并匯聚了大量的模型服務(wù),但服務(wù)內(nèi)容和服務(wù)質(zhì)量難以統(tǒng)一和衡量,無法確保用戶獲得滿意的服務(wù)。一方面模型服務(wù)本身的可用性要求尚未建立統(tǒng)一規(guī)范,另一方面服務(wù)規(guī)模化落地所必須的穩(wěn)定性、可靠性和安全性等并未形成標(biāo)準(zhǔn)體系。
模型服務(wù)易用性不足。由于模型卡片的建設(shè)尚不完善,導(dǎo)致模型信息的不透明現(xiàn)象較為普遍。用戶無法獲取清晰、準(zhǔn)確的模型信息,從而難以選擇所需模型。此外,模型的可解釋性也相對較弱,使得用戶難以理解模型的運作機制和輸出結(jié)果。因此,加強模型卡片的信息透明度,增強模型的可解釋性,提升模型服務(wù)易用性,是當(dāng)前面臨的重要挑戰(zhàn)。
MaaS基建成本控制能力需加強。MaaS的體系構(gòu)建離不開堅實的基建支撐,涵蓋云計算基礎(chǔ)設(shè)施如算力資源和數(shù)據(jù)中心的搭建,以及專業(yè)技術(shù)人才的培育,這些都需要巨額的資金投入。因此MaaS建設(shè)方應(yīng)考慮有效地管理和利用基建資產(chǎn),降低運營成本提高運營效率,從而降低和控制建設(shè)成本。
合規(guī)管理體系亟需進一步完善。MaaS在合規(guī)性方面面臨數(shù)據(jù)規(guī)范與權(quán)責(zé)確認的雙重考驗。就數(shù)據(jù)合規(guī)而言,既要關(guān)注用戶在使用模型服務(wù)時個人數(shù)據(jù)的隱私安全,也要確保用于模型訓(xùn)練和優(yōu)化的數(shù)據(jù)來源合法合規(guī)。
中國交換機行業(yè)短報告(行業(yè)概況、分類、架構(gòu)、市場規(guī)模、競爭格局 、產(chǎn)業(yè)鏈等)
-
InfiniBand高性能網(wǎng)絡(luò)設(shè)計概述
-
面向E級計算的4款高性能處理器概述
-
基于鯤鵬處理器的高性能計算實踐
-
高性能計算關(guān)鍵組件核心知識
-
一文全解高性能制造仿真技術(shù)
-
高性能計算:RoCE技術(shù)分析及應(yīng)用
-
高性能計算:談?wù)劚缓鲆暤膰仄?/span>
-
高性能計算:RoCE v2 vs. InfiniBand網(wǎng)絡(luò)該怎么選?
-
高性能網(wǎng)絡(luò)全面向RDMA進軍
轉(zhuǎn)載申明:轉(zhuǎn)載本號文章請注明作者和來源,本號發(fā)布文章若存在版權(quán)等問題,請留言聯(lián)系處理,謝謝。
推薦閱讀
更多架構(gòu)相關(guān)技術(shù)知識總結(jié)請參考“架構(gòu)師全店鋪技術(shù)資料打包(全)”相關(guān)電子書(41本技術(shù)資料打包匯總詳情可通過“閱讀原文”獲取)。
全店內(nèi)容持續(xù)更新,現(xiàn)下單“架構(gòu)師技術(shù)全店資料打包匯總(全)”一起發(fā)送“服務(wù)器基礎(chǔ)知識全解(終極版)”和“存儲系統(tǒng)基礎(chǔ)知識全解(終極版)”pdf及ppt版本,后續(xù)可享全店內(nèi)容更新“免費”贈閱,價格僅收249元(原總價399元)。
溫馨提示:
掃描二維碼關(guān)注公眾號,點擊閱讀原文鏈接獲取“架構(gòu)師技術(shù)全店資料打包匯總(全)”電子書資料詳情。
