<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          索賠649億!GitHub Copilot惹上官司,被指控侵犯代碼版權(quán),是開源社區(qū)“寄生蟲”

          共 6226字,需瀏覽 13分鐘

           ·

          2022-11-22 22:00

          大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自AI前線

          整理:劉燕,核子可樂


          一位 20 年老開源程序員:GitHub Copilot 就是開源社區(qū)的“寄生蟲”。



          GitHub 面臨集體起訴,索賠 647 億



          GitHub 和它的母公司微軟,以及 OpenAI,正在面臨一項集體訴訟。訴訟案中,廣大程序員們指控 OpenAI 涉嫌違反開源許可。程序員們認為,OpenAI 和微軟使用他們貢獻的代碼訓(xùn)練專有 AI 工具 GitHub Copilot。


          據(jù)悉,該訴訟已提交到美國加州北區(qū)地方法院,要求法院批準(zhǔn) 90 億美元(約 649 億人民幣)的法定損害賠償金。


          根據(jù)集體訴訟文件:“每當(dāng) Copilot 提供非法輸出,它就違反第 1202 條三次,即分發(fā)沒有(1)注明出處,(2)版權(quán)通知,(3)許可條款的許可材料。”


          “因此,如果每個用戶在使用 Copilot 的整個過程中(早期用戶使用 Copilot 最多長達 15 個月之久)只收到一個違反第 1202 條的輸出,那么 GitHub 和 OpenAI 就違反了 DMCA 360 萬次。每次違反的最低法定賠償金為 2500 美元,換算后相當(dāng)于 90 億美元。”


          集體訴訟文件:

          https://www.prnewswire.com/news-releases/joseph-saveri-law-firm-and-matthew-butterick-file-class-action-lawsuit-against-github-microsoft-and-openai-over-violations-of-open-source-licenses-arising-from-github-copilot-an-ai-based-product-301668255.html


          GitHub Copilot 項目啟動于今年 6 月,其功能是向 GitHub 用戶提供代碼建議和輔助功能。Codex 是由 OpenAI 開發(fā)、并獲得微軟許可的 AI 系統(tǒng),Copilot 的各項功能正是基于 Codex AI。


          OpenAI 聲稱,Codex 訓(xùn)練自數(shù)百萬個公共代碼倉庫,堪稱“代碼公平應(yīng)用的變革性案例”。但 GitHub 程序員們卻對此嗤之以鼻,認為 Codex 違反了他們的開源許可條款。這些許可證雖然允許各方對代碼進行非商業(yè)性分發(fā),但卻不得修改,而且還有保留原作者姓名在內(nèi)的其他一些要求。


          律師兼程序員 Matthew Butterick 領(lǐng)導(dǎo)了這場集體訴訟行動。


          Matthew Butterick 是一位從業(yè) 20 多年的老程序員。他的自我介紹顯示,Matthew Butterick 從 1998 年起就參與開源軟件貢獻了,他曾在 Red Hat 工作過兩年,發(fā)布過不少開源軟件,最近,他又成了 Racket 的貢獻者。


          今年 6 月,Matthew Butterick 寫了一篇關(guān)于 GitHub Copilot 法律問題的文章,該文直指 GitHub Copilot 對開源許可證處理不當(dāng)?shù)膯栴}。


          近期,他決定再推進下一步行動——他重新激活了自己的加州律師資格證書,并力邀約 Joseph Saveri 律師事務(wù)所與他一道組織這次集體訴訟。


          Butterick 在一份新聞稿中指出,Copilot 從一開始就明顯存在法律問題。“作為擁有多年經(jīng)驗的開源程序員,我在第一次試用時就感受到了其中的問題。而且相信其他很多開發(fā)者也跟我一樣,發(fā)現(xiàn) Copilot 不對勁。結(jié)合自身法律背景,我覺得有必要拿起法律武器支持開源社區(qū)。”


          其他 Copilot 用戶也在自己的社交平臺中吐槽,Copilot 在所生成的代碼中使用了錯誤的許可證,而且在未進行來源歸因的前提下盲目向用戶提供版權(quán)代碼。 




          面對關(guān)于此次訴訟的置評請求,GitHub 方面一位發(fā)言人 表示,他們致力于通過 Copilot 開展負責(zé)任的創(chuàng)新。


          早在 2018 年微軟收購 GitHub 時,很多用戶就對這個全球規(guī)模最大的開源社區(qū)將走向何方展開過討論。微軟曾在 2000 年代和 1990 年代向開源操作系統(tǒng) Linux 發(fā)起過一系列攻擊,宣稱這款系統(tǒng)侵犯了 235 項微軟專利。


          原告方律師 Joseph Saveri 表示,他感謝程序員和用戶們?yōu)檫@起訴訟做出的努力。他還提到,OpenAI、微軟和 GitHub 絕不可以用這種毫無公平性可言的方式,從開源貢獻者的成果中獲利。


          “此案是針對 AI 系統(tǒng)在科技行業(yè)內(nèi)引發(fā)知識侵權(quán)爭議的第一步。在本案中,AI 系統(tǒng)利用了程序員們做出的開源編程貢獻,并將影響到眾多創(chuàng)作者。我們就是要代表這些創(chuàng)作者們的利益,確保 AI 開發(fā)企業(yè)必須遵照法律要求行事。”


          此次訴訟表明,程序員、藝術(shù)家等群體越來越關(guān)注 AI 系統(tǒng)在未經(jīng)許可之下使用他們的代碼、作品或其他數(shù)據(jù)的問題。圖形生成類 AI 工具(包括 DALL-E 和 Stable Diffusion 等)就在使用算法從互聯(lián)網(wǎng)上抓取數(shù)十億條數(shù)據(jù),且完全沒有考慮過任何許可或所有權(quán)限制。正是由于這種版權(quán)歸屬爭議的存在,Shutterstock 和 Getty Images 等公司才禁止在其平臺上使用 AI 生成圖像。


          Butterick 聲稱,微軟將開源代碼訓(xùn)練而成的 Copilot 作為商業(yè)產(chǎn)品提供給程序員的行為,不僅侵犯了開源代碼版權(quán),也打擊了人們參與開源社區(qū)的熱情。Butterick 因此認為,微軟這種將開源代碼與開源社區(qū)強行割裂的行為,有違開源編程精神。



          Copilot 的問題在哪?



          此前,Matthew Butterick 還開設(shè)了一個專門針對 GitHub Copilot 的 調(diào)查網(wǎng)站,調(diào)查收集 GitHub Copilot 違反其對開源作者和最終用戶的法律義務(wù)的線索。


          Matthew Butterick 認為,總結(jié)而言,Copilot 在系統(tǒng)訓(xùn)練與系統(tǒng)使用方面都存在法律問題。



          (備注:以下論斷僅代表 Matthew Butterick 觀點)



          系統(tǒng)訓(xùn)練


          絕大多數(shù)開源軟件包是在授權(quán)許可之下發(fā)布的,在授予用戶一定權(quán)利的同時也要求其承擔(dān)一定義務(wù)(例如保留源代碼的精確屬性)。而這種授權(quán)的合法實現(xiàn)方式,就是由軟件作者在代碼中聲明版權(quán)。


          因此,要想使用開源軟件,大家就必須做出選擇:


          要么遵守許可證所規(guī)定的義務(wù);要么使用那些屬于許可證例外的代碼(即版權(quán)法所規(guī)定的「合理使用」情形)。微軟和 OpenAI 已經(jīng)承認,Copilot 和 Codex 就是由 GitHub 上開源軟件的公共repo 訓(xùn)練而成。所以在這兩條路里,他們到底要走哪條?


          如果微軟和 OpenAI 決定基于各 repo 的開源許可來使用這些訓(xùn)練素材,那就得發(fā)布大量屬性(attribution),這已經(jīng)算是各類開源許可的底限要求了。但截至目前,我們還沒有看到任何屬性聲明。


          這樣一來答案就明確了,微軟和 OpenAI 必須找到“合理使用”的理由。GitHub 前 CEO Nat Firedman 就曾在 Copilot 的技術(shù)預(yù)覽會上提到,“在公開數(shù)據(jù)上訓(xùn)練(機器學(xué)習(xí))系統(tǒng)屬于合理使用的范疇。”


          但真這么簡單嗎?對于這種法律問題,可不是說屬于就屬于的。當(dāng)然,微軟、OpenAI 和其他多家研究機構(gòu)一直在強調(diào)這種“合理使用”的論點。Nat Firedman 還曾放話說,作為“機器學(xué)習(xí)社區(qū)所廣泛依賴的”依據(jù),這種“合理使用”辦公室有其“法理基礎(chǔ)”。然而,軟件自由保護組織(SFC)明顯不同意他的觀點,并要求微軟方面提供能支持其立場的證據(jù)。


          保護組織負責(zé)人 Bradley Kuhn 指出:我們曾在 2021 年 6 月私下詢問過 Firedman 和其他幾位微軟 /GitHub 代表,要求他們?yōu)?GitHub 的公開法律立場提供可靠的參考依據(jù)……但他們什么都拿不出來。


          為什么微軟拿不出支持立場的法律依據(jù)?因為保護組織說得沒錯:他們根本找不出依據(jù)來。盡管一些法院已經(jīng)考量過相關(guān)問題,但目前全美還沒有哪個判例能夠直接解決 AI 訓(xùn)練中的“合理使用”問題。


          另外,所有涉及“合理使用”的案例均權(quán)衡了大量相關(guān)因素。即使法院最終判定某些類型的 AI 訓(xùn)練屬于“合理使用”,也不代表其他類型的訓(xùn)練就能無腦照辦、高枕無憂。就目前來看,我們還不知道 Copilot 和 Codex 到底合不合法,微軟和 OpenAI 其實也說不準(zhǔn)。


          系統(tǒng)使用


          雖然沒法確定“合理使用”最終要怎么在 AI 訓(xùn)練中落地,但可以想見,其結(jié)果并不會影響到 Copilot 用戶。為什么呢?因為用戶只是在使用 Copilot 提供的代碼,而這部分代碼的版權(quán)和許可狀態(tài)同樣模糊不清。


          微軟倒是有自己的說法。2021 年,Nat Friedman 曾聲稱 Copilot 的輸出結(jié)果歸屬于操作者,其性質(zhì)與使用編譯器一樣。但 Copilot 已經(jīng)暗暗給用戶挖好了坑。


          微軟將 Copilot 輸出描述為一系列代碼“建議”,并強調(diào)不會對這些建議“主張任何權(quán)利”。但與此同時,微軟也不會對由此生成的代碼的正確性、安全性或延伸出的知識產(chǎn)權(quán)問題做任何保證。所以只要接納了 Copilot 的建議,那這些問題就都要由用戶自己承擔(dān)。


          “您需要對自己代碼的安全性和質(zhì)量負責(zé)。我們建議您在使用由 GitHub Copilot 生成的代碼時,采取與使用其他一切非本人所編寫代碼相同的防范措施,包括嚴格測試、IP(知識產(chǎn)權(quán))掃描和安全漏洞跟蹤。” ....


          有觀點認為,Copilot 將版權(quán)遵循義務(wù)留給了用戶。隨著 Copilot 的不斷改進,用戶需要承擔(dān)的責(zé)任也將越來越大。


          那這些建議真會惹出麻煩來嗎?已經(jīng)有 Copilot 用戶控訴,Copilot 可能存在一種設(shè)計傾向,會從可識別的 repo 處一字不差地照搬代碼。前段時間,得克薩斯農(nóng)工大學(xué)教授 Tim Davis 也列舉了不少證據(jù),表明 Copilot 確實原樣照抄了他的大段代碼,特別是極具個人風(fēng)格的 /Tim Davis 稀疏矩陣轉(zhuǎn)置/。


          使用這樣的代碼,當(dāng)然會產(chǎn)生相應(yīng)的許可遵守義務(wù)。但從 Copilot 的設(shè)計來看,用戶完全接觸不到代碼的來源、作者和許可證。根本無一物,拿什么去遵守?


          從這個角度看,Copilot 的代碼檢索方法就像一顆煙霧彈,下面掩蓋的是骯臟的真相:


          Copilot 本身,只是連通海量開源代碼的一套替代接口。只要用上它,用戶可能就需要承擔(dān)起代碼原作者提出的許可義務(wù)。意識到這一點,Nat Firedman 所謂 Copilot“不像是編譯器”的說法根本不靠譜。畢竟編譯器只會改變代碼形式,但絕不會注入新的知識產(chǎn)權(quán)屬性。微軟當(dāng)然也清楚這一點,所以他們并沒有嘴硬到底,只是把這些細節(jié)用小字“略微”說明了一下。


          Copilot 的本質(zhì):一只“寄生蟲”?


          通過將 Copilot 當(dāng)作海量開源代碼的替代接口,微軟不僅借此切斷了開源作者與用戶之間的法律關(guān)系,甚至建立起新的“圍墻花園”——阻止程序員接觸傳統(tǒng)開源社區(qū),從而消除了他們?yōu)橹暙I的可能性。隨著時間推移,這勢必會讓開源社區(qū)變得愈發(fā)貧乏。用戶的注意力和參與方向?qū)⒅饾u朝著 Copilot 轉(zhuǎn)移,最終徹底告別開源項目本身——告別源代碼 repo、告別問題跟蹤器、告別郵件列表、告別討論板。這樣的變化必將給開源帶來痛苦、甚至永遠無法挽回的損失。


          就連微軟云計算負責(zé)人 Scott Guthrie 最近也承認,雖然微軟 CEO 納德拉當(dāng)初收購 GitHub 時曾承諾“讓 GitHub 繼續(xù)保持開放平臺的地位”,但微軟一刻也沒有放慢過把 GitHub 服務(wù)(包括 Copilot)納入自家 Azure 云平臺的腳步。


          Matthew Butterick 表示,包括他自己在內(nèi)的開源開發(fā)者之所以提出抗議,所圖的絕不是錢,只是不想讓自己的努力貢獻被白白浪費掉。開源軟件的核心在于人,在于由人組成的用戶、測試者和貢獻者社區(qū)。正是因為有了這樣的社區(qū),我們才能以超越自身的方式改進軟件,讓工作充滿樂趣。


          Copilot 則向開源軟件注入了自私的基因:我想要什么,你就得給我什么!Copilot 的建議將開源用戶與軟件開發(fā)者徹底割裂開來,導(dǎo)致他們永遠不必與社區(qū)互動、更遑論為更多項目做出貢獻。


          與此同時,開源軟件作者也需要注意到,我們的工作成果被掩蓋在了 Copilot 這塊大布之下。我們成了牧場里的奶牛、成了《黑客帝國》中為母體供電的電池,我們成了不斷為 Copilot 注入資源的“人肉礦脈”。


          但就連奶牛也能靠勞動換取牧草和牛棚,而 Copilot 不會對我們的個人項目乃至整個開源社區(qū)做出絲毫反哺。


          Copilot 建立的圍墻花園與開源明確對立,而且危害極大。這也是對微軟當(dāng)初收購 GitHub 時所做承諾的赤裸背叛。早期接觸過 GitHub 的朋友應(yīng)該還記得,GitHub 之所以能在受眾當(dāng)中建立起良好的聲譽,靠的就是真正服務(wù)于開源開發(fā)者、培育開源社區(qū)的赤子之心。而 Copilot 的出現(xiàn)顯然背離了這一路線,也是對 GitHub 立身之本的無情踐踏。


          也許有人會說,那咱們就聽保護組織的建議,把代碼搬出 GitHub 吧。但這真的沒什么作用。只要微軟能把 AI 訓(xùn)練成功規(guī)定成“合理使用”,那么不只是 GitHub,互聯(lián)網(wǎng)上的一切公共代碼 repo 都逃不出他們的手掌心。


          如果坐視一切發(fā)展下去,那么 Copilot 不僅會吞噬 GitHub 上的開源代碼,更會淹沒世界上的每一行開源成果。


          另一方面,有些朋友可能對 Copilot 評價不錯,覺得 AI 代表著未來方向。拜托,我們這里反對的絕不是 AI 輔助編程工具,而是微軟在 Copilot 當(dāng)中的種種具體行徑。其實微軟完全可以把 Copilot 做得更開發(fā)者友好一些——比如邀請大家自愿參加,或者由編程人員有償對訓(xùn)練語料庫做出貢獻。但截至目前,口口聲聲自稱熱愛開源的微軟根本沒做過這方面的嘗試。另外,如果大家覺得 Copilot 效果挺好,那主要也是因為底層開源訓(xùn)練數(shù)據(jù)的質(zhì)量過硬。Copilot 其實是在從開源項目那邊搞生命虹吸,而一旦開源活力枯竭,Copilot 也將失去發(fā)展的依憑。


          在之前討論 Copilot 的時候,我曾說“我并不擔(dān)心它對開源的影響。”現(xiàn)在也是,如果從短期來看,Copilot 還不足以威脅整個開源生態(tài)。但回顧自己近 25 年來的開源之旅,我發(fā)現(xiàn)這東西的存在本身就是最大的問題。畢竟開源靠的不是一支固定的隊伍,而是一種不斷成長、不斷變化的集體智慧,它需要持續(xù)吸引新鮮頭腦來完成自我更新。開源參與者們彼此設(shè)定新的標(biāo)準(zhǔn)與挑戰(zhàn),也共同拉高了開源成就的期望標(biāo)桿。


          在這場奇妙而盛大的化學(xué)反應(yīng)中,Copilot 橫空殺出,想要把整個開源宇宙據(jù)為己有。哪怕拋開微軟那劣跡斑斑的開源記錄,我們也能一眼看出 Copilot 的本質(zhì)——一只寄生蟲。因此在對開源世界造成無法彌補的傷害之前,我們必須質(zhì)疑 Copilot 的合法性。


          參考鏈接:

          https://www.theinsaneapp.com/2022/11/programmers-filed-lawsuit-against-openai-microsoft-and-github.html

          https://githubcopilotinvestigation.com/




          點「在看」的人都變好看了哦!


          瀏覽 30
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  欧美日韩激情在线 | 婷婷综合久久五月天丁香 | 亚洲天堂网在线视频 | 中字三级视频网站在线观看 | 白丝自慰一区二区 |