<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          終于有人把聯(lián)邦學(xué)習(xí)講明白了

          共 3295字,需瀏覽 7分鐘

           ·

          2021-05-19 17:24

          01 什么是聯(lián)邦學(xué)習(xí)

          聯(lián)邦學(xué)習(xí)是一種帶有隱私保護(hù)、安全加密技術(shù)的分布式機器學(xué)習(xí)框架,旨在讓分散的各參與方在滿足不向其他參與者披露隱私數(shù)據(jù)的前提下,協(xié)作進(jìn)行機器學(xué)習(xí)的模型訓(xùn)練。

          經(jīng)典聯(lián)邦學(xué)習(xí)框架的訓(xùn)練過程可以簡單概括為以下步驟:

          1. 協(xié)調(diào)方建立基本模型,并將模型的基本結(jié)構(gòu)與參數(shù)告知各參與方;
          2. 各參與方利用本地數(shù)據(jù)進(jìn)行模型訓(xùn)練,并將結(jié)果返回給協(xié)調(diào)方;
          3. 協(xié)調(diào)方匯總各參與方的模型,構(gòu)建更精準(zhǔn)的全局模型,以整體提升模型性能和效果。

          聯(lián)邦學(xué)習(xí)框架包含多方面的技術(shù),比如傳統(tǒng)機器學(xué)習(xí)的模型訓(xùn)練技術(shù)、協(xié)調(diào)方參數(shù)整合的算法技術(shù)、協(xié)調(diào)方與參與方高效傳輸?shù)耐ㄐ偶夹g(shù)、隱私保護(hù)的加密技術(shù)等。此外,在聯(lián)邦學(xué)習(xí)框架中還存在激勵機制,數(shù)據(jù)持有方均可參與,收益具有普遍性。

          Google首先將聯(lián)邦學(xué)習(xí)運用在Gboard(Google鍵盤)上,聯(lián)合用戶終端設(shè)備,利用用戶的本地數(shù)據(jù)訓(xùn)練本地模型,再將訓(xùn)練過程中的模型參數(shù)聚合與分發(fā),最終實現(xiàn)精準(zhǔn)預(yù)測下一詞的目標(biāo)。

          除了分散的本地用戶,聯(lián)邦學(xué)習(xí)的參與者還可以是多家面臨數(shù)據(jù)孤島困境的企業(yè),它們擁有獨立的數(shù)據(jù)庫但不能相互分享。聯(lián)邦學(xué)習(xí)通過在訓(xùn)練過程中設(shè)計加密式參數(shù)傳遞代替原有的遠(yuǎn)程數(shù)據(jù)傳輸,保證了各方數(shù)據(jù)的安全與隱私,同時滿足了已出臺的法律法規(guī)對數(shù)據(jù)安全的要求。

          02 聯(lián)邦學(xué)習(xí)的架構(gòu)思想

          聯(lián)邦學(xué)習(xí)的架構(gòu)分為兩種,一種是中心化聯(lián)邦(客戶端/服務(wù)器)架構(gòu),一種是去中心化聯(lián)邦(對等計算)架構(gòu)。

          • 針對聯(lián)合多方用戶的聯(lián)邦學(xué)習(xí)場景,一般采用的是客戶端/服務(wù)器架構(gòu),企業(yè)作為服務(wù)器,起著協(xié)調(diào)全局模型的作用;
          • 而針對聯(lián)合多家面臨數(shù)據(jù)孤島困境的企業(yè)進(jìn)行模型訓(xùn)練的場景,一般可以采用對等架構(gòu),因為難以從多家企業(yè)中選出進(jìn)行協(xié)調(diào)的服務(wù)器方。

          在客戶端/服務(wù)器架構(gòu)中,各參與方須與中央服務(wù)器合作完成聯(lián)合訓(xùn)練,如圖2-1所示。當(dāng)參與方不少于兩個時,啟動聯(lián)邦學(xué)習(xí)過程。

          ▲圖2-1 聯(lián)邦學(xué)習(xí)系統(tǒng)客戶端/服務(wù)器架構(gòu)

          在正式開始訓(xùn)練之前,中央服務(wù)器先將初始模型分發(fā)給各參與方,然后各參與方根據(jù)本地數(shù)據(jù)集分別對所得模型進(jìn)行訓(xùn)練。接著,各參與方將本地訓(xùn)練得到的模型參數(shù)加密上傳至中央服務(wù)器。中央服務(wù)器對所有模型梯度進(jìn)行聚合,再將聚合后的全局模型參數(shù)加密傳回至各參與方。

          在對等計算架構(gòu)中,不存在中央服務(wù)器,所有交互都是參與方之間直接進(jìn)行的,如圖2-2所示。

          ▲圖2-2 聯(lián)邦學(xué)習(xí)對等系統(tǒng)架構(gòu)

          當(dāng)參與方對原始模型訓(xùn)練后,需要將本地模型參數(shù)加密傳輸給其余參與聯(lián)合訓(xùn)練的數(shù)據(jù)持有方。因此,假設(shè)本次聯(lián)合訓(xùn)練有n個參與方,則每個參與方至少需要傳輸2(n-1)次加密模型參數(shù)。

          在對等架構(gòu)中,由于沒有第三方服務(wù)器的參與,參與方之間直接交互,需要更多的加解密操作。在整個過程中,所有模型參數(shù)的交互都是加密的。目前,可以采用安全多方計算、同態(tài)加密等技術(shù)實現(xiàn)。全局模型參數(shù)的更新可運用聯(lián)邦平均等聚合算法。當(dāng)需要對參與方數(shù)據(jù)進(jìn)行對齊時,可以采用樣本對齊等方案。

          03 聯(lián)邦學(xué)習(xí)的應(yīng)用場景

          根據(jù)各方數(shù)據(jù)集的貢獻(xiàn)方式不同,可以將聯(lián)邦學(xué)習(xí)具體分為橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)和聯(lián)邦遷移學(xué)習(xí),每種技術(shù)細(xì)分對應(yīng)不同場景。

          1. 橫向聯(lián)邦學(xué)習(xí)

          如圖2-3所示,橫向聯(lián)邦學(xué)習(xí)適用于各數(shù)據(jù)持有方的業(yè)務(wù)類型相似、所獲得的用戶特征多而用戶空間只有較少重疊或基本無重疊的場景。例如,各地區(qū)不同的商場擁有客戶的購物信息大多類似,但是用戶人群不同。

          ▲圖2-3 橫向聯(lián)邦學(xué)習(xí)圖解

          橫向聯(lián)邦學(xué)習(xí)以數(shù)據(jù)的特征維度為導(dǎo)向,取出參與方特征相同而用戶不完全相同的部分進(jìn)行聯(lián)合訓(xùn)練。在此過程中,通過各參與方之間的樣本聯(lián)合,擴(kuò)大了訓(xùn)練的樣本空間,從而提升了模型的準(zhǔn)確度和泛化能力。

          2. 縱向聯(lián)邦學(xué)習(xí)

          如圖2-4所示,縱向聯(lián)邦學(xué)習(xí)適用于各參與方之間用戶空間重疊較多,而特征空間重疊較少或沒有重疊的場景。例如,某區(qū)域內(nèi)的銀行和商場,由于地理位置類似,用戶空間交叉較多,但因為業(yè)務(wù)類型不同,用戶的特征相差較大。

          ▲圖2-4 縱向聯(lián)邦學(xué)習(xí)圖解

          縱向聯(lián)邦學(xué)習(xí)是以共同用戶為數(shù)據(jù)的對齊導(dǎo)向,取出參與方用戶相同而特征不完全相同的部分進(jìn)行聯(lián)合訓(xùn)練。因此,在聯(lián)合訓(xùn)練時,需要先對各參與方數(shù)據(jù)進(jìn)行樣本對齊,獲得用戶重疊的數(shù)據(jù),然后各自在被選出的數(shù)據(jù)集上進(jìn)行訓(xùn)練。

          此外,為了保證非交叉部分?jǐn)?shù)據(jù)的安全性,在系統(tǒng)級進(jìn)行樣本對齊操作,每個參與方只有基于本地數(shù)據(jù)訓(xùn)練的模型。

          3. 聯(lián)邦遷移學(xué)習(xí)

          聯(lián)邦遷移學(xué)習(xí)是對橫向聯(lián)邦學(xué)習(xí)和縱向聯(lián)邦學(xué)習(xí)的補充,適用于各參與方用戶空間和特征空間都重疊較少的場景。例如,不同地區(qū)的銀行和商場之間,用戶空間交叉較少,并且特征空間基本無重疊。在該場景下,采用橫向聯(lián)邦學(xué)習(xí)可能會產(chǎn)生比單獨訓(xùn)練更差的模型,采用縱向聯(lián)邦學(xué)習(xí)可能會產(chǎn)生負(fù)遷移的情況。

          聯(lián)邦遷移學(xué)習(xí)基于各參與方數(shù)據(jù)或模型之間的相似性,將在源域中學(xué)習(xí)的模型遷移到目標(biāo)域中。大多采用源域中的標(biāo)簽來預(yù)測目標(biāo)域中的標(biāo)簽準(zhǔn)確性。


          04 聯(lián)邦學(xué)習(xí)的優(yōu)勢與前景

          分布式機器學(xué)習(xí)框架通過集中收集數(shù)據(jù),再將數(shù)據(jù)進(jìn)行分布式存儲,將任務(wù)分散到多個CPU/GPU機器上進(jìn)行處理,從而提高計算效率。與之不同的是,聯(lián)邦學(xué)習(xí)強調(diào)將數(shù)據(jù)一開始就保存在參與方本地,并且在訓(xùn)練過程中加入隱私保護(hù)技術(shù),擁有更好的隱私保護(hù)特性。

          各參與方的數(shù)據(jù)一直保存在本地,在建模過程中,各方的數(shù)據(jù)庫依然獨立存在,而聯(lián)合訓(xùn)練時進(jìn)行的參數(shù)交互也是經(jīng)過加密的,各方通信時采用嚴(yán)格的加密算法,難以泄露原始數(shù)據(jù)的相關(guān)信息,因而聯(lián)邦學(xué)習(xí)保證了數(shù)據(jù)的安全與隱私。

          此外,聯(lián)邦學(xué)習(xí)技術(shù)可使分布式訓(xùn)練獲得的模型效果與傳統(tǒng)中心式訓(xùn)練效果相差無幾,訓(xùn)練出的全局模型幾乎是無損的,各參與方能夠共同獲益。

          在大數(shù)據(jù)與人工智能快速發(fā)展的當(dāng)下,聯(lián)邦學(xué)習(xí)解決了人工智能模型訓(xùn)練中各方數(shù)據(jù)不可用、隱私泄露等問題,因而應(yīng)用前景十分廣闊。聯(lián)邦學(xué)習(xí)可用于在海量數(shù)據(jù)集下的模型訓(xùn)練,實現(xiàn)部門、企業(yè)及組織之間的聯(lián)動。例如:

          • 智慧金融領(lǐng)域中,可以根據(jù)多方數(shù)據(jù)建立更準(zhǔn)確的業(yè)務(wù)模型,從而實現(xiàn)合理定價、定向業(yè)務(wù)推廣、企業(yè)風(fēng)控評定等;
          • 智慧城市中,實現(xiàn)各政府機構(gòu)之間、企業(yè)與政府之間的聯(lián)合,實現(xiàn)更準(zhǔn)確的實時交通預(yù)測,更簡化的機關(guān)辦事步驟,更高效的信息內(nèi)容查詢,更全面的安全防控檢測等;
          • 智慧醫(yī)療中,聯(lián)邦學(xué)習(xí)可以綜合各醫(yī)院之間的數(shù)據(jù),提高醫(yī)療影像診斷的準(zhǔn)確性,預(yù)警病人的身體情況等。

          上述舉例只是聯(lián)邦學(xué)習(xí)可用領(lǐng)域中的一部分,未來它將覆蓋更廣闊的應(yīng)用場景。


          05 小結(jié)

          本文對聯(lián)邦學(xué)習(xí)進(jìn)行了系統(tǒng)性概述。聯(lián)邦學(xué)習(xí)基于分布式機器學(xué)習(xí)框架,擁有嚴(yán)格的隱私保護(hù)策略,保證了各參與方數(shù)據(jù)的安全。聯(lián)邦學(xué)習(xí)有客戶端/服務(wù)器架構(gòu)和對等架構(gòu)兩種架構(gòu),不同的架構(gòu)下交互方式不同。

          不論是在何種架構(gòu)下,聯(lián)邦學(xué)習(xí)過程都可以保證隱私安全,符合數(shù)據(jù)條例和參與方共同受益原則。基于場景中各方數(shù)據(jù)的特征對比,聯(lián)邦學(xué)習(xí)可以分為橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)和聯(lián)邦遷移學(xué)習(xí)。此外,在智慧城市、智慧醫(yī)療、智慧金融等實際場景中,聯(lián)邦學(xué)習(xí)擁有廣闊的應(yīng)用和發(fā)展前景。

          (歡迎大家加入數(shù)據(jù)工匠知識星球獲取更多資訊。)

          聯(lián)系我們

          掃描二維碼關(guān)注我們

          微信:SZH9543
          郵箱:[email protected]
          QQ:2286075659

          熱門文章


          漫畫 | 給喬布斯提供肩膀的巨人


          繁華落盡,做數(shù)據(jù)有了“面子”,更別忘了“里子”


          第七次人口普查數(shù)據(jù)新鮮出爐,有哪些信息值得關(guān)注?


          ERP已死,“中臺”已涼,“低代碼”稱王!


          數(shù)字孿生在制造業(yè)的7種應(yīng)用

          我們的使命:發(fā)展數(shù)據(jù)治理行業(yè)、普及數(shù)據(jù)治理知識、改變企業(yè)數(shù)據(jù)管理現(xiàn)狀、提高企業(yè)數(shù)據(jù)質(zhì)量、推動企業(yè)走進(jìn)大數(shù)據(jù)時代。

          我們的愿景:打造數(shù)據(jù)治理專家、數(shù)據(jù)治理平臺、數(shù)據(jù)治理生態(tài)圈。

          我們的價值觀:凝聚行業(yè)力量、打造數(shù)據(jù)治理全鏈條平臺、改變數(shù)據(jù)治理生態(tài)圈。

          了解更多精彩內(nèi)容


          長按,識別二維碼,關(guān)注我們吧!

          數(shù)據(jù)工匠俱樂部

          微信號:zgsjgjjlb

          專注數(shù)據(jù)治理,推動大數(shù)據(jù)發(fā)展。

          瀏覽 19
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  亚洲在线视频网站 | 五月婷婷深夜影院 | 艹b视频 嗯~啊~乖~进去了~h~乖视频网站免费 | av电影在线一区 AV日韩中文字幕 AV天堂成人电影 AV天堂电影在线 AV天堂中文字幕 AV天堂资源网站 a在线免费视频了 | 黃色A片成人直播啪啪 |