Percy Liang、李飛飛等百余位學(xué)者聯(lián)名發(fā)布:「基礎(chǔ)模型」的機(jī)遇與挑戰(zhàn)




能力:語言、視覺、機(jī)器人學(xué)、推理、交互、理解等; 應(yīng)用:醫(yī)療、法律、教育等; 技術(shù):模型內(nèi)部角度(建模、訓(xùn)練、適應(yīng)、評估),模型輸入輸出角度(數(shù)據(jù)),模型的系統(tǒng)性分析角度(數(shù)據(jù)、安全與隱私、穩(wěn)健性、理論、可解釋性) 社會影響:不平等、濫用、環(huán)境、法規(guī)、經(jīng)濟(jì)、倫理道德等。

基礎(chǔ)模型的能力
1.1 語言能力

1.2 視覺能力

文章概述了計算機(jī)視覺領(lǐng)域的關(guān)鍵能力和方法,闡明了計算機(jī)視覺領(lǐng)域的幾大關(guān)鍵任務(wù),包括:語義理解任務(wù),含有幾何、運(yùn)動等元素的三維任務(wù),多模態(tài)集成任務(wù)等,基礎(chǔ)模型在這些任務(wù)中可以起到重要作用。
但文章也同時指出基礎(chǔ)模型處于初級階段,可能會整合和影響視覺模型,如面向醫(yī)療保健和家庭環(huán)境的外圍( ambient )智能領(lǐng)域;移動和消費(fèi)領(lǐng)域;可互動的智能體中領(lǐng)域等。未來發(fā)展大規(guī)模動態(tài)視覺輸入的高效建模,將視覺有效推廣到自然場景和人類層面的技術(shù)將是前景。
1.3 機(jī)器人

1.4 推理和搜索

1.5 交互

1.6 理解的原理
基礎(chǔ)模型的應(yīng)用
2.1 醫(yī)療保健

2.2 法律

2.3 教育

基礎(chǔ)模型的技術(shù)層面
3.1 模型內(nèi)部層面
1)模型的構(gòu)建

2)模型訓(xùn)練
從系統(tǒng)參數(shù)和評價衍生原則選擇; 跨數(shù)據(jù)源、多模態(tài)、可擴(kuò)展的統(tǒng)一訓(xùn)練方法。
3)模型適應(yīng)性

4)模型評估
3.2 模型的數(shù)據(jù)層面
3.3 模型的系統(tǒng)性分析
1)系統(tǒng)協(xié)同設(shè)計

2)安全、穩(wěn)定、魯棒與隱私問題

基礎(chǔ)模型帶來的社會影響
4.1 不平等
4.2 濫用


4.4 合法性
4.5 經(jīng)濟(jì)
4.6 道德尺度

評論
圖片
表情
