螞蟻金服:金融智能中臺建設實踐,25頁PPT干貨詳解! | IDCF

內(nèi)容來源:螞蟻金服?發(fā)布:BAT架構(ID:kbcs2019)整理:安德魯這是之前螞蟻金服技術專家分享的智能中臺建設實踐,整理出來供大家參考,ppt來自網(wǎng)絡,如有侵權請聯(lián)系刪除。01 AI在螞蟻金服的應用場景
資料來源:螞蟻金服AI在螞蟻金服的應用場景有:- 智能風控?;谏疃葘W習的風險識別與防控。
- 智能理財?;诮鹑诖髷?shù)據(jù)提供智能、理財策略分析和決策建議。
- 智能信貸。基于數(shù)據(jù)隱私加密共享、學習的聯(lián)合放貸。
- 智能營銷。個性化智能營銷決策、提升業(yè)務運營效率。
- 智能保險。智能保險定價、定損、理賠,線上自動化流程管理。
- 智能客服與助理。一站式金融場景機器人、智能業(yè)務決策和執(zhí)行助理。
資料來源:螞蟻金服螞蟻AI能力大圖分成兩部分:- 場景&行業(yè):智能風控、智能客服助理、智能營銷、智能保險、智能信貸、智能理財。?
- 金融大腦:金融知識圖譜&NLP、機器人平臺、金融信息服務、生物識別、金融視覺平臺、金融算法(AutoML ,圖推理,隱私保護共享學習,運籌優(yōu)化,無監(jiān)督學習,在線學習,強化學習,模型可解釋)。
資料來源:螞蟻金服先來了解,理賠業(yè)務流程:用戶上傳->圖像識別-> 實體抽取-> 實體匹配-> 系統(tǒng)智能核賠。理賠寶對比傳統(tǒng)流程核賠效率提升5倍以上,主要包含三大核心平臺:1)感知(金融視覺平臺Computer vision)- 圖像分類:區(qū)別病歷、發(fā)票、證明等
- OCR:支持文字、圖章識別
- 反欺詐:識別PS圖片等
- 數(shù)十個圖像模型多鏈路融合決策
- 健康知識圖譜:醫(yī)院、疾病、科室、手術、保險產(chǎn)品等實體關聯(lián)
- 億級節(jié)點和邊在線實時融合推理
- Algorithmic
- decision
資料來源:螞蟻金服智能中臺- 從角色上分成:算法研發(fā)、數(shù)據(jù)研發(fā)、工程研發(fā)。
- 從架構上分成:模型、研發(fā)平臺、底層技術。
資料來源:螞蟻金服為什么數(shù)據(jù)底座很重要?- 數(shù)據(jù)處理貫穿模型迭代的始終;
- 數(shù)據(jù)和特征決定了機器學習的上限;
- 數(shù)據(jù)安全是金融行業(yè)生命線。
資料來源:螞蟻金服金融智能數(shù)據(jù)底座的挑戰(zhàn),主要有三方面:1)效率- 存儲分散,多次拷貝;濫用批處理;標注效率低
- 標注質(zhì)量;數(shù)據(jù)快速refine
- 標注安全;訓練安全
資料來源:螞蟻金服- 數(shù)據(jù)閉環(huán)主要環(huán)節(jié)包括:數(shù)據(jù)采集、數(shù)據(jù)預處理、數(shù)據(jù)標注、數(shù)據(jù)轉(zhuǎn)換、模型訓練、業(yè)務場景。
- 治理的準則是:統(tǒng)一存儲、統(tǒng)一格式、統(tǒng)一分析、統(tǒng)一編碼。
資料來源:螞蟻金服基于one ID的數(shù)據(jù)復用,過程包括:原始數(shù)據(jù)、標注數(shù)據(jù)、樣本數(shù)據(jù)、模型數(shù)據(jù)。09 智能標注:模型市場賦能標注
資料來源:螞蟻金服智能標接入移動、PC各端,把樣本輸入算法平臺,通過自訓練模型、通用模型進行標注,包括視頻、圖像、文本等媒體物料。10 數(shù)據(jù)選擇:通過主動學習節(jié)省90%的標注量
資料來源:螞蟻金服通過主動學習節(jié)省90%的標注量。- 主動學習(Active Learning )是一個迭代過程,不斷選擇對當前模型效果提升最有效的樣本,優(yōu)先進行標注。
- 分類寶case:約10%的樣本達到所有數(shù)據(jù)的訓練效果。
- 能力集成到數(shù)據(jù)底座,包括基于信息熵的通用選擇和算法自定義選擇。
資料來源:螞蟻金服- 復制、翻轉(zhuǎn)、剪切、縮放
- 高斯噪聲、高斯模糊…
- SMOTE、GAN
資料來源:螞蟻金服- AntLable 支持視頻、圖像、語音、文字、地圖等內(nèi)容標注;
- 很多業(yè)務場景帶來數(shù)倍的效率提升;
- 大部分實現(xiàn)基于前端算法,計劃開源。
資料來源:螞蟻金服由于實際場景中,拍照都有角度,會造成傾斜、重合等,智能輔標:傾斜校正、自動貼合+OCR,很好的解決了這些問題。14 智能輔標:圖像自動分割
資料來源:螞蟻金服識別圖像中的目標部分,如文字、商標等,進行自動裁剪分割。15 智能輔標:視頻人物跟蹤
資料來源:螞蟻金服對視頻中的特定人物進行目標跟蹤。16 智能輔標:視頻圖像對齊
資料來源:螞蟻金服視頻圖像的邊界對齊。17 標注質(zhì)量:基于數(shù)據(jù)指標的流程管控體系
資料來源:螞蟻金服對于巨量的標注工作,需要有一個流程管控體系。如:標注->檢查-->駁回/驗收-->訓練。結(jié)合工具、數(shù)據(jù)、引擎。18 標注質(zhì)量報表
資料來源:螞蟻金服對于標準質(zhì)量,有可視化的報表展示,不斷提高標注質(zhì)量。19 樣本分析
資料來源:螞蟻金服對樣本進行深入分析。20 模型效果報表
資料來源:螞蟻金服對模型效果報表展示。21 安全要求和解決思路
資料來源:螞蟻金服安全要求包括安全存儲、拒絕查看。通過文件管控,如加密、分割、脫敏、水印等方法進行安全管控。通過訪問控制,如不落庫、鑒權、頻次、時效等對訪問進行管理。22 安全標注:不落數(shù)據(jù)標后即焚
資料來源:螞蟻金服安全標注主要思路:數(shù)據(jù)不落庫,標注后源數(shù)據(jù)銷毀。23 安全標注:分割標注
資料來源:螞蟻金服安全標注包括:- 語音、文本、圖片。
- 最小化分割。
- 數(shù)據(jù)脫敏sdk。
資料來源:螞蟻金服安全訓練是通過加密標注數(shù)據(jù)、數(shù)據(jù)分割、加載到內(nèi)存、解碼合成、訓練等流程。25 數(shù)據(jù)底座總體功能框架
資料來源:螞蟻金服數(shù)據(jù)底座總體框架包括:平臺、產(chǎn)品封裝、采集接入、標注、加工數(shù)據(jù)、能力組件,如上圖所示。螞蟻金服的金融智能中臺,就好比企業(yè)的大腦,通過對業(yè)務數(shù)據(jù)抽取、加工、標注、輸出,數(shù)據(jù)反哺業(yè)務,形成了數(shù)據(jù)業(yè)務雙中臺,驅(qū)動整個金融科技的發(fā)展。研究一家科技企業(yè),就看它的核心系統(tǒng)建設思想,梧桐一葉而天下知秋,現(xiàn)在你知道螞蟻金服,為何估值萬億了吧。
想要提升敏捷DevOps技能,來場DevOps黑客馬拉松!想要尋找第二增長曲線實現(xiàn)創(chuàng)新增速,來場DevOps黑客馬拉松!2021年4月24-25日,IDCF DevOps黑客馬拉松走進天府之國-成都趕緊報名參加吧~可自己報名,也可公司組團參加哦!
評論
圖片
表情
