發(fā)展數(shù)據(jù)要素市場,破解“數(shù)據(jù)孤島”之殤!
···約1800字,閱5分鐘···


隨著數(shù)字經(jīng)濟的發(fā)展,“連接—在線—數(shù)據(jù)”將是數(shù)字社會的永恒主題。連接和在線的結(jié)果是所有人類行為和經(jīng)濟活動數(shù)據(jù)化,數(shù)據(jù)既是過去人類行為的結(jié)果,也是預測未來人類行為的基礎(chǔ)。因此,數(shù)據(jù)是數(shù)字社會的核心資源,是發(fā)展數(shù)字經(jīng)濟的關(guān)鍵要素,也是目前所有互聯(lián)網(wǎng)公司最重要的資產(chǎn),同時由于數(shù)據(jù)具有的可無限復制、重復使用的特性,使得其無法在不同主體之間達成和諧共享,從而形成“數(shù)據(jù)孤島”。
非競爭性造成“數(shù)據(jù)孤島”問題打車公司會收集用戶出行數(shù)據(jù),音樂公司收集用戶聽音樂的習慣數(shù)據(jù),搜索引擎收集用戶搜索數(shù)據(jù),移動支付廠商收集用戶的支付數(shù)據(jù)等等。數(shù)據(jù)這種資源,和其他資源最大的區(qū)別在于,它具有非競爭性,可以無限復制、重復使用。非競爭性一方面意味著相比于傳統(tǒng)的競爭性物質(zhì)資本,數(shù)據(jù)資產(chǎn)能給社會帶來更多的經(jīng)濟價值,但一方面也產(chǎn)生了大量的隱私問題。一個機構(gòu)無法把數(shù)據(jù)借出幾天然后再收回,因為數(shù)據(jù)給出去就再也收不回來了。

同時,數(shù)據(jù)這種資源也不是天生就屬于公司的,數(shù)據(jù)里面含有大量用戶的敏感信息,導致在數(shù)據(jù)交換的時候,還有道德和法律風險。因此,在現(xiàn)代社會中,別說公司和公司之間,就算是同一個公司的不同部門,在交換數(shù)據(jù)的時候也是格外的小心謹慎。不同公司之間建立在共享數(shù)據(jù)的前提下的合作,往往是很難達成的。于是,就產(chǎn)生了所謂的“數(shù)據(jù)孤島”問題:各個機構(gòu)組織各自擁有一部分的數(shù)據(jù),卻無法和其他的數(shù)據(jù)共同作用,產(chǎn)生新的收益。

發(fā)展數(shù)據(jù)要素市場
打破“數(shù)據(jù)孤島”
通過發(fā)展數(shù)據(jù)要素市場,促進數(shù)據(jù)交易,有助于打破現(xiàn)有的數(shù)據(jù)孤島問題,更好地促進數(shù)字經(jīng)濟發(fā)展。
中共中央國務(wù)院發(fā)布關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見,成為構(gòu)建更加完善的要素市場化配置體制機制的綱領(lǐng)性文件。其中特別提到要加快培育數(shù)據(jù)要素市場,加強數(shù)據(jù)資源整合和安全保護。如何在實現(xiàn)數(shù)據(jù)安全保護的前提下發(fā)展數(shù)據(jù)要素市場,成為數(shù)字經(jīng)濟學領(lǐng)域的前沿戰(zhàn)略課題。而且重視數(shù)據(jù)隱私和安全也已成為了世界性的趨勢。每一次公眾數(shù)據(jù)的泄露都會引起媒體和公眾的極大關(guān)注,例如Facebook的數(shù)據(jù)泄露事件就引起了大范圍的抗議行動。
同時各國都在加強對數(shù)據(jù)安全和隱私的保護。特別是歐盟在實施的《通用數(shù)據(jù)保護條例》對用戶的個人隱私和數(shù)據(jù)安全進行嚴格保護,并依此對谷歌開出了5000萬歐元的巨額罰單。因此“一方收集數(shù)據(jù),轉(zhuǎn)移到另一方處理和清洗并建模,最后再把模型賣給第三方”這樣一種傳統(tǒng)的數(shù)據(jù)處理模式已經(jīng)變得不可行。如何重新設(shè)計數(shù)據(jù)要素市場交易機制和監(jiān)管模式,成為數(shù)字經(jīng)濟未來發(fā)展亟待解決的問題。信息博弈論是解決上述問題的基礎(chǔ)性理論工具。
數(shù)據(jù)是信息博弈論的基礎(chǔ)。Blackwell提出的信息結(jié)構(gòu)包含了數(shù)據(jù)和模型兩個基本要素。但信息博弈論理論往往是給定信息結(jié)構(gòu),探討博弈參與者之間的策略性互動和機制設(shè)計問題。隨著數(shù)字經(jīng)濟的飛速發(fā)展,數(shù)據(jù)不再是博弈參與者的外生約束,而成為一種新型生產(chǎn)要素。一方面,數(shù)字經(jīng)濟的發(fā)展催生了海量的數(shù)據(jù)。據(jù)統(tǒng)計,從計算機誕生以來到2003年,人類所產(chǎn)生的數(shù)據(jù)總量已經(jīng)達到50億GB。2014年時,我們每兩天就能產(chǎn)生同等規(guī)模數(shù)據(jù),現(xiàn)在是每個小時就能產(chǎn)生同等規(guī)模數(shù)據(jù)。另一方面,大數(shù)據(jù)處理技術(shù)的發(fā)展使得人們可以輕易從海量數(shù)據(jù)中獲取信息。
《關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見》將數(shù)據(jù)安全保護提高到前所未有的高度。而缺乏安全保護正是現(xiàn)在我國數(shù)據(jù)交易市場的一大痛點。特別是很多所謂的“大數(shù)據(jù)公司”用爬蟲技術(shù)盜取數(shù)據(jù),然后采用薄利多銷的方式,用低廉的價格出售獲利。從很多新聞媒體上,我們看到諸如“一個人的身份隱私單價只要1塊多錢;當購買者所需要的數(shù)據(jù)量足夠大,單價甚至可以低至1分錢”以及“一個人的人臉照片只值5毛錢”這樣的報道,引起了社會的廣泛關(guān)注。
近些年來,隨著機器學習、神經(jīng)網(wǎng)絡(luò)等人工智能領(lǐng)域的蓬勃發(fā)展以及各國加強對隱私保護的監(jiān)管,MPC也煥發(fā)了新的光彩。計算機領(lǐng)域中的加密以及多方安全計算技術(shù)已經(jīng)擴展到聯(lián)邦學習、遷移學習、差分隱私、不經(jīng)意傳輸、同態(tài)加密、秘密共享、混淆電路等等許多不同的技術(shù)。這些技術(shù)被廣泛應(yīng)用于在保證數(shù)據(jù)保護隱私的情況下完成模型的訓練以及預測等過程。不同的技術(shù)有不同的功能,同時在安全性和效率方面也有不一樣的表現(xiàn),比如在諸如算力負擔、通信開銷、數(shù)據(jù)使用效率損失、對數(shù)據(jù)毒化和對抗性樣本等惡意攻擊的抵御程度等維度上存在差異。這些差異使得博弈者的策略空間和收益函數(shù)在不同技術(shù)下均不一樣,因此數(shù)據(jù)要素市場交易機制的設(shè)計需要考慮到底采用什么樣的加密以及多方安全計算技術(shù)?;诓煌募夹g(shù)特性,有針對性地設(shè)計不同的交易機制。


