<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          前沿技術(shù)|聯(lián)邦學(xué)習(xí)入門筆記

          共 2335字,需瀏覽 5分鐘

           ·

          2021-07-27 05:13

          點 擊 藍 字   關(guān) 注 我 們!

          聯(lián)邦學(xué)習(xí)入門筆記

          一、聯(lián)邦學(xué)習(xí)的核心思想

                  數(shù)據(jù)孤島正阻礙著訓(xùn)練人工智能模型所必須的大數(shù)據(jù)的使用,同時為了確保用戶隱私和數(shù)據(jù)安全,各組織間交換模型信息的過程將會被精心地設(shè)計,使得沒有組織能夠猜測到其他任何組織的隱私數(shù)據(jù)內(nèi)容。

                  一種可行的方法是由每一個擁有數(shù)據(jù)源的組織訓(xùn)練一個模型,之后讓各個組織在各自的模型上彼此交流溝通,最終通過模型聚合得到一個全局模型。


          二、聯(lián)邦學(xué)習(xí)的定義

                  聯(lián)邦學(xué)習(xí)是一種具有以下特征的用來建立機器學(xué)習(xí)模型的算法框架:

          多方參與有兩個或以上的聯(lián)邦學(xué)習(xí)參與方協(xié)作構(gòu)建一個共享的機器學(xué)習(xí)模型。每一個參與方都擁有若干能夠用來訓(xùn)練模型的訓(xùn)練數(shù)據(jù)。

          本地計算在聯(lián)邦學(xué)習(xí)模型的訓(xùn)練過程中,每一個參與方擁有的數(shù)據(jù)都不會離開該參與方,即數(shù)據(jù)不離開數(shù)據(jù)擁有者。

          加密消息聯(lián)邦學(xué)習(xí)模型相關(guān)的信息能夠以加密方式在各方之間進行傳輸和交換,并且需要保證任何一個參與方都不能推測出其他方的原始數(shù)據(jù)。

          聯(lián)邦性能聯(lián)邦學(xué)習(xí)模型的性能要能夠充分逼近理想模型(是指通過將所有訓(xùn)練數(shù)據(jù)集中在一起并訓(xùn)練獲得的機器學(xué)習(xí)模型)的性能。


                 值得注意的是,聯(lián)邦學(xué)習(xí)的性能允許比數(shù)據(jù)集中訓(xùn)練模型的性能稍差,對于聯(lián)邦學(xué)習(xí),確保用戶數(shù)據(jù)的安全性和隱私保護比模型性能更有價值。

                 如果使用安全的聯(lián)邦學(xué)習(xí)在分布式數(shù)據(jù)源上構(gòu)建機器學(xué)習(xí)模型,這個模型在未來數(shù)據(jù)上的性能近似于把所有數(shù)據(jù)集中到一個地方訓(xùn)練所得到的模型的性能。


          三、聯(lián)邦學(xué)習(xí)系統(tǒng)模式

                  根據(jù)應(yīng)用場景的不同,聯(lián)邦學(xué)習(xí)系統(tǒng)可能涉及也可能不涉及中央?yún)f(xié)調(diào)方。
          客戶ー服務(wù)器(C/S)模式
               協(xié)調(diào)方是一臺聚合服務(wù)器,在聯(lián)邦學(xué)習(xí)過程中負責(zé)模型參數(shù)的“分發(fā)”和“聚合”。在這種模式下,參與方的原始數(shù)據(jù)永遠不會離開自己。

          C/S架構(gòu)

          點對點對等(P2P)模式:不需要協(xié)調(diào)方,因為各方無須借助第三方便可以直接通信,這種模式的優(yōu)點是提高了系統(tǒng)的安全性,但是會消耗更多的計算資源對消息內(nèi)容進行加密和解密。

          P2P架構(gòu)


          四、聯(lián)邦學(xué)習(xí)的評價

          聯(lián)邦學(xué)習(xí)的優(yōu)點

          • 保護用戶的隱私和數(shù)據(jù)安全。

          • 允許若干參與方協(xié)同訓(xùn)練一個機器學(xué)習(xí)模型,使得各參與方獲得一個優(yōu)于自己訓(xùn)練的模型。

          • 有效解決“數(shù)據(jù)孤島”問題,應(yīng)用領(lǐng)域廣泛,如檢測多方借貸風(fēng)險、醫(yī)療健康診斷等。

          • 商業(yè)潛力巨大,3-5年內(nèi)進入行業(yè)藍海。


          聯(lián)邦學(xué)習(xí)的挑戰(zhàn)

          • 系統(tǒng)開銷大,加密和解密消耗大多數(shù)計算資源。

          • 參與方數(shù)據(jù)的統(tǒng)計學(xué)分布不均,造成聯(lián)邦訓(xùn)練模型與實際情況存在較大偏差。

          • 聯(lián)邦學(xué)習(xí)的參與方與協(xié)調(diào)方地理位置分散,難以被認證身份,系統(tǒng)容易遭到惡意攻擊,破環(huán)聯(lián)邦模型的可用性。

          • 參與方協(xié)同訓(xùn)練的激勵策略存在公平性問題。


          聯(lián)邦學(xué)習(xí)的知識組成

          • 機器學(xué)習(xí)

          • 分布式計算

          • 密碼學(xué)與網(wǎng)絡(luò)安全

          • 區(qū)塊鏈共識機制

          • 隱私保護數(shù)據(jù)挖掘

          • 同態(tài)加密

          • 差分隱私

          • 多方安全計算

          • 博弈論與經(jīng)濟學(xué)原理

          • 數(shù)據(jù)安全相關(guān)法律


          五、聯(lián)邦學(xué)習(xí)的分類

          橫向聯(lián)邦學(xué)習(xí)


                 橫向聯(lián)邦學(xué)習(xí)的主要應(yīng)用場景為用戶特征部分重疊較多,但是用戶樣本部分重疊較少。簡單來說,橫向聯(lián)邦學(xué)習(xí)根據(jù)用戶維度進行切分,是一種基于用戶樣本的聯(lián)邦學(xué)習(xí)方式。



          舉例:業(yè)務(wù)規(guī)模相似的兩個不同地區(qū)的電信運營商,各自持有當(dāng)?shù)氐挠脩魯?shù)據(jù),因為其分布在不同的區(qū)域,所以用戶重疊較少,但是由于業(yè)務(wù)相似,因此特征空間的重疊區(qū)域較大。

          縱向聯(lián)邦學(xué)習(xí)

              縱向聯(lián)邦學(xué)習(xí)的主要應(yīng)用場景為用戶特征部分重疊較少,但是用戶樣本部分重疊較多。簡單來說,縱向聯(lián)邦學(xué)習(xí)根據(jù)特征維度進行切分,是一種基于特征維度的聯(lián)邦學(xué)習(xí)方式。

          舉例:公司A作為數(shù)據(jù)提供方,擁有大量用戶的行為特征和部分信貸數(shù)據(jù);信貸公司擁有大量的用戶信貸數(shù)據(jù)。現(xiàn)在對公司A數(shù)據(jù)和信貸公司數(shù)據(jù)中同一批用戶進行聯(lián)邦建模,就屬于縱向聯(lián)邦學(xué)習(xí)。

          聯(lián)邦遷移學(xué)習(xí)

                聯(lián)邦遷移學(xué)習(xí)的主要應(yīng)用場景為用戶特征部分和用戶樣本部分重疊均較少。

          舉例:假設(shè)現(xiàn)在有中國某銀行的數(shù)據(jù)集和美國某外賣公司的數(shù)據(jù)集,因為在不同的國家,所以用戶的交叉很少。因為銀行業(yè)務(wù)和外賣公司業(yè)務(wù)相差很大,所以用戶特征的交叉也很少。如果用戶需要進行有效的聯(lián)邦建模,就需要借助遷移學(xué)習(xí)技術(shù),解決單邊數(shù)據(jù)缺乏或者標簽少的問題,從而更有效地進行聯(lián)邦模型訓(xùn)練。


          內(nèi)容來源:開放隱私計算公眾號


          數(shù)據(jù)科學(xué)與人工智能公眾號創(chuàng)建了機器學(xué)習(xí)群,添加我的微信,備注:姓名-ML,邀請你加入機器學(xué)習(xí)群,一起學(xué)習(xí)和進步。


          六、參考文獻

          [1]楊強,劉洋,程勇,等.聯(lián)邦學(xué)習(xí)[M].電子工業(yè)出版社:北京,2020:2.

          [2]彭南博,王虎.聯(lián)邦學(xué)習(xí)技術(shù)及實戰(zhàn)[M].電子工業(yè)出版社:北京,2021:2-.


          END

          點個“在看”每天收到最新資訊!


          瀏覽 97
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  欧美亚洲成人精品 | 丁香五月色情二区 | 国产免费无码精品视频网站 | 不用播放器的AV网站 | 亚洲伊人大香蕉 |