自由軟件基金會(huì)批 GitHub Copilot:“不可接受且不公正”
距離 GitHub 推出 Copilot 服務(wù)已經(jīng)一個(gè)月。這款 AI 編程工具基于從 GitHub 上提取的萬(wàn)億字節(jié)公開可用代碼以及英語(yǔ)示例進(jìn)行訓(xùn)練,能夠自動(dòng)補(bǔ)全整行代碼或整段函數(shù)、基于注釋生成對(duì)應(yīng)代碼,還能編寫測(cè)試、快速發(fā)現(xiàn)解決問題的替代方法,帶來了極大的效率提升。然而官宣一個(gè)月以來,它引發(fā)的關(guān)于版權(quán)、開源許可證、隱私安全等的討論從未止息。
近日,自由軟件基金會(huì)(FSF)也表明了質(zhì)疑態(tài)度,并征集白皮書以探討關(guān)于 Copilot 的哲學(xué)與法律問題。

自由軟件基金會(huì)是一個(gè)致力于推廣自由軟件的民間非營(yíng)利性組織,其主要工作是運(yùn)行 GNU 計(jì)劃,開發(fā)更多的自由軟件。自 1990 年代中期以來,自由軟件基金會(huì)的雇員和志愿者主要在自由軟件運(yùn)動(dòng)的法律和結(jié)構(gòu)問題上工作。
FSF 許可合規(guī)經(jīng)理 Donald Robertson 在一篇博客中指出,Copilot 是不可接受且不公正的。它需要運(yùn)行非免費(fèi) / 自由軟件(如 Visual Studio 或 Visual Studio Code 的一部分),并且 Copilot 屬于軟件替代性服務(wù)(Service as a Software Substitute),即基于他人的計(jì)算獲得能力。
FSF 表示 Copilot 對(duì)于 freely licensed 軟件的使用給自由軟件社區(qū)中很大一部分成員帶來影響:開發(fā)者想知道在其軟件上訓(xùn)練神經(jīng)網(wǎng)絡(luò)是否為合理使用;其他對(duì)使用 Copilot 感興趣的人想知道從 GitHub 托管的 repo 中復(fù)制的代碼片段和其他元素是否會(huì)導(dǎo)致侵權(quán);即使這些在法律上是合理的,開發(fā)者也想知道,一家專有軟件公司利用開發(fā)者的工作構(gòu)建服務(wù),是否存在根本上的不公平。
為了幫助社區(qū)獲得所需要的答案,并尋求在這一領(lǐng)域捍衛(wèi)用戶自由的最佳機(jī)會(huì),F(xiàn)SF 宣布資助白皮書征集活動(dòng),以解決 Copilot、版權(quán)、機(jī)器學(xué)習(xí)和自由軟件問題。FSF 表示將閱讀提交的白皮書,并選擇有助于闡明問題的白皮書進(jìn)行發(fā)表,被發(fā)表的文章將獲得 500 美元獎(jiǎng)金,截止時(shí)間為 2021 年 8 月 23 日。
此外,F(xiàn)SF 列出了一些感興趣的問題:
Copilot 基于公共存儲(chǔ)庫(kù)進(jìn)行訓(xùn)練是否侵犯版權(quán)?是否屬于合理使用?
Copilot 的輸出對(duì) GPL 許可作品產(chǎn)生可訴侵權(quán)索賠的可能性有多大?
開發(fā)者如何確保其擁有版權(quán)的代碼免受 Copilot 的影響?
是否有辦法讓使用 Copilot 的開發(fā)人員遵守自由軟件許可證,如 GPL?
如果 Copilot 學(xué)習(xí) AGPL 覆蓋的代碼,那么 Copilot 是否侵犯了 AGPL?
如果 Copilot 生成的代碼確實(shí)導(dǎo)致了對(duì)自由軟件許可作品的侵犯,版權(quán)所有者如何發(fā)現(xiàn)這種侵犯?
由機(jī)器學(xué)習(xí)產(chǎn)生的人工智能 / 機(jī)器學(xué)習(xí)模型是訓(xùn)練數(shù)據(jù)的編譯版本,還是用戶可以通過進(jìn)一步訓(xùn)練來修改的東西,如源代碼?
-Copilot 訓(xùn)練的 AI/ML 模型有版權(quán)嗎?如果是,誰(shuí)擁有版權(quán)?像 FSF 這樣的道德倡導(dǎo)組織是否應(yīng)該主張修改與這些問題相關(guān)的版權(quán)法?

