挖掘數(shù)據(jù)要素潛能,助力產(chǎn)業(yè)革新升級
2023全球數(shù)商大會即將舉辦,億歐采訪了多家大數(shù)據(jù)企業(yè),以梳理目前數(shù)據(jù)要素產(chǎn)業(yè)發(fā)展圖景。
文 | 黃嵐清
2022年12月,“數(shù)據(jù)二十條”出臺,明確提出激活數(shù)據(jù)要素潛能,做強做優(yōu)做大數(shù)字經(jīng)濟,增強經(jīng)濟發(fā)展新動能,構(gòu)筑國家競爭新優(yōu)勢。2023全球數(shù)商大會即將舉辦,億歐采訪了多家大數(shù)據(jù)企業(yè),以梳理目前數(shù)據(jù)要素產(chǎn)業(yè)發(fā)展圖景。
數(shù)據(jù)要素在2020年正式成為第五生產(chǎn)要素,成為數(shù)字時代的競爭焦點?!皵?shù)據(jù)二十條”的出臺對數(shù)據(jù)基礎(chǔ)制度建設(shè)系統(tǒng)化提出指導(dǎo)意見,構(gòu)建了以數(shù)據(jù)產(chǎn)權(quán)、流通交易、收益分配、安全治理為核心的四個數(shù)據(jù)基礎(chǔ)制度,隨后相關(guān)政策細(xì)則迭出。
近年來,國家高度重視數(shù)據(jù)要素及其市場化配置改革,出臺了多項數(shù)據(jù)要素相關(guān)政策。進(jìn)入數(shù)字時代,做強做優(yōu)做大數(shù)字經(jīng)濟,是把握時機、贏得未來的重要選擇。
數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)資源要素化,建立多層次的數(shù)據(jù)流通交易市場是一個復(fù)雜艱巨的任務(wù),除了政府端,數(shù)據(jù)服務(wù)商和投資方也在數(shù)據(jù)要素產(chǎn)業(yè)發(fā)展中扮演著極為重要的“賦能者”角色,將數(shù)據(jù)要素標(biāo)準(zhǔn)化、資源化使其具有流通性和價值性,努力發(fā)揮國內(nèi)海量數(shù)據(jù)規(guī)模和豐富應(yīng)用場景優(yōu)勢,增加數(shù)據(jù)價值,促進(jìn)生產(chǎn)效率。
炎凰數(shù)據(jù)賦能高效探索數(shù)據(jù)價值
數(shù)據(jù)可以分為結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)三類,其中結(jié)構(gòu)化數(shù)據(jù)是目前應(yīng)用最廣泛的主流數(shù)據(jù)庫。近年來,隨著全球各個行業(yè)的數(shù)字化進(jìn)程推進(jìn)以及智能物聯(lián)場景的廣泛普及,產(chǎn)生了大量的半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。
在異構(gòu)數(shù)據(jù)大規(guī)模增長的情況下,傳統(tǒng)的數(shù)據(jù)處理和分析方式無法通過預(yù)先規(guī)劃的方式對非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,需要耗費更多的時間和人力來獲得分析結(jié)果,一個項目工程的實施周期需要以周或者月為單位計算。
更大的弊端在于,當(dāng)獲取結(jié)果后提出新的數(shù)據(jù)需求,該項目工程可能需要重新將原始數(shù)據(jù)寫入數(shù)據(jù)庫,實施周期需要翻倍或者更多。
作為國內(nèi)非結(jié)構(gòu)數(shù)據(jù)處理技術(shù)的領(lǐng)頭企業(yè),炎凰數(shù)據(jù)專注異構(gòu)數(shù)據(jù)處理,通過讀時建模、處理半結(jié)構(gòu)化數(shù)據(jù)的SQL引擎等核心技術(shù)為客戶提供實時交互分析、異構(gòu)數(shù)據(jù)融合的解決方案。為解決快速查詢分析異構(gòu)數(shù)據(jù)的需求,炎凰數(shù)據(jù)搭建了獨立的數(shù)據(jù)庫,結(jié)合查詢引擎和計算引擎,通過全鏈路自研實現(xiàn)算法和數(shù)據(jù)庫相互優(yōu)化,從而滿足對原始數(shù)據(jù)快速查詢分析的需求。
其中,實現(xiàn)異構(gòu)數(shù)據(jù)即時分析的核心技術(shù)是讀時建模。與傳統(tǒng)寫時建模的技術(shù)實現(xiàn)邏輯不同,讀時建模是指在數(shù)據(jù)接入時不進(jìn)行清洗將原始數(shù)據(jù)直接存入系統(tǒng),用戶可以根據(jù)業(yè)務(wù)需求用標(biāo)準(zhǔn)化數(shù)據(jù)庫查詢語言訪問原始數(shù)據(jù),系統(tǒng)根據(jù)算法抽取所需數(shù)據(jù)展現(xiàn)。
讀時建模的技術(shù)壁壘較高,炎凰創(chuàng)始團隊來自Splunk,在數(shù)據(jù)引擎開發(fā)的實力強勁、經(jīng)驗豐富。成立三年,炎凰團隊一直專注產(chǎn)品研發(fā),目前國內(nèi)沒有其他通過讀時建模實現(xiàn)的軟件產(chǎn)品。
相比于傳統(tǒng)的數(shù)字工具,炎凰異構(gòu)數(shù)據(jù)即時分析平臺以讀時建模為核心,在傳統(tǒng)應(yīng)用場景下可以提高效率、降低成本,縮短實施和部署時間縮短至以天甚至更小單位的實施周期。
同時,炎凰數(shù)據(jù)平臺還可以滿足用戶快速更新迭代需求,由于不需要經(jīng)過數(shù)據(jù)寫入、清洗再讀取、分析的固定路徑,所以可以更加靈活、高效地完成建模過程。炎凰數(shù)據(jù)平臺不僅能滿足大規(guī)模的數(shù)據(jù)清洗和快速迭代的數(shù)據(jù)建模,其高效的優(yōu)勢還能夠滿足傳統(tǒng)工具無法實現(xiàn)的應(yīng)用需求。
炎凰數(shù)據(jù)CEO葉曉路介紹,“在安全場景下,當(dāng)企業(yè)內(nèi)部系統(tǒng)出現(xiàn)安全漏洞時需要系統(tǒng)快速發(fā)現(xiàn)并定位問題,而傳統(tǒng)工具需要幾周甚至更長的時間,響應(yīng)時間過長會導(dǎo)致巨量的損失。對于炎凰數(shù)據(jù)平臺在時間周期上可以提高1-2個數(shù)量級?!?/span>
截至目前,炎凰數(shù)據(jù)平臺已更新至2.12版本,完成存儲端和計算端的分布式,持續(xù)優(yōu)化查詢性能,不僅可以滿足日增數(shù)據(jù)量增長的需求,還可以通過增加節(jié)點縮短用戶的等待時間,實現(xiàn)秒級到亞秒級的響應(yīng)時間完成查詢。
針對數(shù)據(jù)安全問題,炎凰在創(chuàng)建之初就對產(chǎn)品內(nèi)部包括數(shù)據(jù)導(dǎo)入、數(shù)據(jù)審查和展示視圖等權(quán)限以及角色管理進(jìn)行了詳細(xì)規(guī)劃并在開發(fā)上投入大量人力。
關(guān)于軟件代碼漏洞問題,葉曉路表示,“我們的產(chǎn)品核心組件完全自研,產(chǎn)品依賴開源產(chǎn)品的部分占整體體量不超過5%,所以市場上的開源產(chǎn)品出現(xiàn)漏洞時,我們不需要等待漏洞修復(fù),并且在產(chǎn)品版本發(fā)布前,我們會使用主流的商用開源工具對產(chǎn)品進(jìn)行全代碼掃描,在交付時會主動向客戶提供安全漏洞掃描報告?!?/span>
為了更好的國內(nèi)用戶,炎凰數(shù)據(jù)在融資時選擇人民幣基金,明確定位要做國內(nèi)市場,堅持打造國產(chǎn)自主可控軟件,滿足國內(nèi)信息安全標(biāo)準(zhǔn)。
未來,炎凰數(shù)據(jù)將持續(xù)優(yōu)化產(chǎn)品性能,讓每一家企業(yè)輕松實現(xiàn)數(shù)字化轉(zhuǎn)型,為數(shù)字化決策提供高效高能的生產(chǎn)工具。
富數(shù)科技賦能安全實現(xiàn)數(shù)據(jù)價值
在數(shù)據(jù)流通的實踐中,為保障數(shù)據(jù)隱私安全問題衍生出了“原始數(shù)據(jù)不出域,數(shù)據(jù)可用不可見,可算不可識”的要求。除了在技術(shù)上滿足數(shù)據(jù)不出域的要求,隱私安全計算在經(jīng)濟收益上為數(shù)據(jù)源提供保障,在法理上實現(xiàn)所有權(quán)和使用權(quán)分離。
作為隱私安全計算領(lǐng)域的科技服務(wù)商,富數(shù)科技專注于聯(lián)邦學(xué)習(xí)、多方安全計算、匿蹤查詢等加密計算領(lǐng)域,是國內(nèi)隱私安全計算的領(lǐng)跑者和數(shù)聯(lián)網(wǎng)的先行先試者。
在技術(shù)層面,富數(shù)科技組建了國內(nèi)少有的密碼學(xué)專家團隊,團隊由來學(xué)嘉教授領(lǐng)銜,吸納了二十多位密碼學(xué)算法背景的博士。
作為科技部國家課題承擔(dān)單位和工信部大數(shù)據(jù)示范單位,富數(shù)科技積極推動國內(nèi)外相關(guān)技術(shù)規(guī)范的制定,是隱私計算互聯(lián)互通首個國家標(biāo)準(zhǔn)的牽頭單位。目前,富數(shù)科技Avatar隱私計算平臺已經(jīng)從“企業(yè)級”發(fā)展為“運營商級”隱私計算平臺,支持海量數(shù)據(jù)多場景的大規(guī)模應(yīng)用推廣。已經(jīng)成功中標(biāo)了中國移動、銀聯(lián)集團、交通銀行、郵儲銀行、中信銀行等數(shù)十個大型隱私計算平臺建設(shè)。
在生態(tài)層面,富數(shù)科技已經(jīng)對接了豐富的數(shù)據(jù)源方和數(shù)據(jù)使用方,落地場景覆蓋金融、政務(wù)、運營商、電力等各個數(shù)據(jù)相關(guān)領(lǐng)域。在金融領(lǐng)域中,富數(shù)科技以技術(shù)支持方助力交通銀行實現(xiàn)國內(nèi)第一例多方安全計算,助力交通銀行獲得2020年度人民銀行金融科技發(fā)展獎一等獎,引發(fā)了金融行業(yè)隱私計算平臺建設(shè)的熱潮。
富數(shù)科技在隱私安全計算應(yīng)用有豐富的實踐經(jīng)驗,富數(shù)科技CEO張偉奇表示,“目前看來,參與數(shù)據(jù)要素開展還是以大型央企、國企和地方政府為主,這一類客戶對于安全性和產(chǎn)品性能、穩(wěn)定性的要求比較高,而數(shù)據(jù)安全和產(chǎn)品性能存在一定矛盾,因此需要考慮安全的深度能力和性能的極值情況?!?/span>
富數(shù)科技根據(jù)具體場景出發(fā),將安全計算平臺拆分為多個專用產(chǎn)品,通過工具組合解決實際問題。其中,安全多方計算主要解決在各方原數(shù)據(jù)不泄露的前提下,完成聯(lián)合計算統(tǒng)計的任務(wù);聯(lián)邦學(xué)習(xí)主要解決兩邊數(shù)據(jù)都不出域的情況下,實現(xiàn)建模計算獲得數(shù)據(jù)挖掘的結(jié)果,可用于運營商與銀行針對信用卡貸款的聯(lián)合建模;匿蹤查詢主要解決對數(shù)據(jù)方加密的情況下,獲得查詢結(jié)果反饋,可用于銀行聯(lián)盟進(jìn)行聯(lián)防聯(lián)控反詐的場景。
目前國內(nèi)處于數(shù)據(jù)流通交易市場的探索期,正在逐步完善市場交易機制和監(jiān)管機制,張偉奇表示,“非常明確的一點是數(shù)據(jù)需要流通,而原本點對點的流通形式存在合規(guī)流程長、數(shù)據(jù)流通的運營商專線成本高、模型有效性評估效率低等困難。因此,建立網(wǎng)絡(luò)化數(shù)據(jù)流通基礎(chǔ)設(shè)施是必然趨勢,在數(shù)據(jù)要素流通的頂層設(shè)計來看,國家數(shù)據(jù)交易所的建立將逐步完善市場監(jiān)督管理,通過接入網(wǎng)絡(luò)即可在高效率、低成本、可信賴的市場中體現(xiàn)數(shù)據(jù)價值?!?/span>
為提供低成本、高效率、可信賴的數(shù)據(jù)流通解決方案,運營商基于隱私計算、區(qū)塊鏈、低代碼開發(fā)等核心技術(shù)打造了可信數(shù)據(jù)流通基礎(chǔ)措施——數(shù)聯(lián)網(wǎng),實現(xiàn)數(shù)據(jù)價值的網(wǎng)狀流通。其中,富數(shù)科技作為運營商的合作伙伴提供相應(yīng)的基礎(chǔ)支撐,在保證數(shù)據(jù)安全的前提下,充分發(fā)揮數(shù)據(jù)要素價值,助力國家數(shù)字化轉(zhuǎn)型發(fā)展。
面向未來,張偉奇表示,“我們認(rèn)為未來中國的數(shù)據(jù)要素至少是十萬億級的產(chǎn)業(yè)規(guī)模,作為數(shù)據(jù)服務(wù)商,我們將發(fā)揮自身優(yōu)勢,持續(xù)提升隱私計算技術(shù),打造在數(shù)聯(lián)網(wǎng)中演變出數(shù)據(jù)路由器等產(chǎn)品形態(tài),與運營商、地方政府共同推動探索互聯(lián)互通數(shù)據(jù)生態(tài)建設(shè)。為適配未來發(fā)展,在商業(yè)模式上,在成熟應(yīng)用的領(lǐng)域通過產(chǎn)品標(biāo)準(zhǔn)化的形式降低邊際成本,對于新領(lǐng)域新需求將通過項目平臺化的形式提升服務(wù),圍繞客戶和市場實際提供解決方案?!?/span>
容億投資賦能數(shù)字科技企業(yè)發(fā)展
作為炎凰數(shù)據(jù)和富數(shù)科技的投資方,容億投資源自產(chǎn)業(yè),重點布局硬科技和數(shù)字科技兩大領(lǐng)域,在數(shù)字科技領(lǐng)域圍繞數(shù)據(jù)要素產(chǎn)業(yè)鏈,聚焦數(shù)字化能力和產(chǎn)業(yè)數(shù)字化兩大板塊,在數(shù)源、數(shù)商、數(shù)基等細(xì)分領(lǐng)域布局深厚。
數(shù)據(jù)作為新型生產(chǎn)要素,在過去的一年中一直被強調(diào)也逐漸成為共識,是數(shù)字經(jīng)濟深化發(fā)展的核心引擎。
容億投資執(zhí)行董事聞茗萱表示:“追溯歷史,農(nóng)業(yè)社會中的生產(chǎn)要素是土地和人力,文明的進(jìn)化受限于土地和人力,古代社會呈線性發(fā)展;工業(yè)革命之后,人類社會進(jìn)入到工業(yè)社會,人類文明通過技術(shù)和資本的配置擺脫了土地和人力的約束,呈指數(shù)性發(fā)展;在20世紀(jì)90年代互聯(lián)網(wǎng)信息革命后,社會的發(fā)展空間從原來的物理空間拓展到了虛擬的數(shù)字世界,數(shù)字世界承載了人類一切需求活動的根基和映射,因此如何利用好數(shù)字資源是未來數(shù)字社會向前發(fā)展的根基?!?/span>
對于今年的數(shù)字經(jīng)濟趨勢變化,聞茗萱觀察到由OpenAI訓(xùn)練的ChatGPT已達(dá)到萬億級,參數(shù)模型的訓(xùn)練將成為未來數(shù)據(jù)奇點的應(yīng)用。
去年年底國家公布的“數(shù)據(jù)20條”的核心主線是促進(jìn)數(shù)據(jù)合規(guī)高效流通使用,賦能實體經(jīng)濟,隨后各地發(fā)改委或者數(shù)據(jù)局都在推動相關(guān)的細(xì)節(jié)性政策落地,這將會極大推動數(shù)據(jù)交易流通。
聞茗萱表示,目前,數(shù)據(jù)要素產(chǎn)業(yè)要真正發(fā)展任重而道遠(yuǎn),因為政府和企業(yè)都要轉(zhuǎn)型為數(shù)據(jù)要素型組織,需要他們做好數(shù)據(jù)管理的組織文化和機制建設(shè),建立跨部門的數(shù)據(jù)資產(chǎn)委員會,將數(shù)據(jù)管理制度嵌入到組織日常流程中,基于數(shù)據(jù)的合規(guī)控制與業(yè)務(wù)結(jié)合,將組織資產(chǎn)數(shù)據(jù)要素當(dāng)做資產(chǎn)的一部分。未來,數(shù)據(jù)互通互聯(lián),對于每一個數(shù)據(jù)要素型組織而言,繪制數(shù)字資產(chǎn)地圖是數(shù)據(jù)要素化的首要任務(wù)。他們需要把各個業(yè)務(wù)場景下所處理的各類數(shù)據(jù)納入統(tǒng)一管理范疇,針對內(nèi)外環(huán)境變化動態(tài)盤點,同時對數(shù)據(jù)進(jìn)行分類分級從而識別不同數(shù)據(jù)的不同風(fēng)險以及合規(guī)義務(wù)。
數(shù)字經(jīng)濟在數(shù)據(jù)要素大模型的推動下全面進(jìn)入數(shù)據(jù)要素時代。
在互聯(lián)網(wǎng)時代,數(shù)據(jù)存在壟斷封閉的現(xiàn)象,而在數(shù)據(jù)要素時代則需要數(shù)據(jù)開放共享,因此在金融或者工業(yè)等非互聯(lián)網(wǎng)場景會最先落地,先以行業(yè)為核心匯總數(shù)據(jù)實現(xiàn)行業(yè)內(nèi)流轉(zhuǎn),再延伸至跨行業(yè)流轉(zhuǎn)。其中需要一些政策去做各種各樣的推動和引導(dǎo)。
聞茗萱介紹道,“例如修改會計準(zhǔn)則鼓勵數(shù)據(jù)資產(chǎn)入表,能夠為要素型企業(yè)獲得金融支持,不僅能夠增厚企業(yè)的資產(chǎn)負(fù)債表,也能改善企業(yè)的利潤表和現(xiàn)金流量表?!?/span>
容億投資始終堅持“行業(yè)+技術(shù)”的理念,炎凰數(shù)據(jù)和富數(shù)科技就是該理念的投資實踐。對于數(shù)字科技投資會更加注重技術(shù)能力和交易層面能夠放大垂直行業(yè)中數(shù)字價值的能力。一方面關(guān)注能為滿足新的需求或場景提供技術(shù)能力的底座性質(zhì)公司,需要團隊畫像為技術(shù)能力強,同時由于技術(shù)底座的研發(fā)周期長,切入客戶的難度比較大,需要團隊畫像在技術(shù)能力強的同時,銷售能力強,并且能夠解決客戶問題。另一方面重點關(guān)注在工業(yè)現(xiàn)場、能源或者交通等垂直行業(yè)中相對成熟的企業(yè),由于行業(yè)數(shù)據(jù)開發(fā)運營會更看重行業(yè)積累,需要一定的客戶基礎(chǔ)和數(shù)據(jù)基礎(chǔ)。
談到全球數(shù)商大會,聞茗萱表示,“期待在數(shù)據(jù)流通層面有政策落地或者試點,數(shù)據(jù)發(fā)展的實質(zhì)推動離不開國家政策的細(xì)則落地。國內(nèi)的數(shù)據(jù)產(chǎn)業(yè)發(fā)展處于世界前列,中國在數(shù)據(jù)完整性層面有獨特優(yōu)勢,同時數(shù)據(jù)作為生產(chǎn)要素最終目的是賦能產(chǎn)業(yè)鏈,國內(nèi)擁有完整的工業(yè)鏈條和全面的工業(yè)數(shù)據(jù),因此當(dāng)數(shù)據(jù)實現(xiàn)全流通后,我國制造業(yè)將有一個全面升級,因此我們認(rèn)為國家在數(shù)據(jù)要素時代能夠?qū)崿F(xiàn)彎道超車的機會?!?/span>
結(jié)語
作為新型生產(chǎn)要素,數(shù)據(jù)已經(jīng)成為全球關(guān)注和博弈的焦點。目前,數(shù)字領(lǐng)域國際規(guī)則體系仍在構(gòu)建中,我國正在牢牢抓住新一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性機遇,努力探索出一條中國特色數(shù)字經(jīng)濟發(fā)展道路,贏得數(shù)字經(jīng)濟時代國際競爭的主動權(quán)。
2023全球數(shù)商大會將進(jìn)一步圍繞數(shù)據(jù)要素基礎(chǔ)設(shè)施建設(shè)、數(shù)據(jù)要素交易流通、數(shù)據(jù)資產(chǎn)化創(chuàng)新等領(lǐng)域的話題開展深入交流,為全球經(jīng)濟的可持續(xù)發(fā)展貢獻(xiàn)力量。讓我們期待這場盛會的到來,共同見證市場發(fā)展,研判未來趨勢,展望行業(yè)圖景,為全球數(shù)據(jù)要素市場發(fā)展舉旗定向。

屆時,億歐將發(fā)布《2023中國數(shù)據(jù)要素生態(tài)研究報告》,通過梳理數(shù)據(jù)要素行業(yè)市場化現(xiàn)狀和分析市場各主體及其行動,展示數(shù)據(jù)要素產(chǎn)業(yè)全景與價值分析,希望能為產(chǎn)業(yè)合作與投資提供有益幫助。(關(guān)于本報告如有意合作,歡迎掃碼溝通)


