京東 | AI人才聯(lián)合培養(yǎng)計(jì)劃


01 京東AI項(xiàng)目實(shí)戰(zhàn)教學(xué)
項(xiàng)目一、京東智能對(duì)話系統(tǒng)項(xiàng)目
項(xiàng)目簡(jiǎn)介:智能客服機(jī)器人已經(jīng)成為了客服系統(tǒng)的重要組成部分,幫助人工客服提升工作效率,為企業(yè)降低人工成本。作為智能客服的行業(yè)先驅(qū),京東多年來(lái)致力打造全鏈路的客服機(jī)器人,最大化提升商家的接待效率和用戶體驗(yàn)。目前智能機(jī)器人的對(duì)話生成策略已經(jīng)在“京小智”、“京東JIMI“等智能客服機(jī)器廣泛應(yīng)用,在用戶購(gòu)買(mǎi)商品的售前以及售后環(huán)節(jié),為數(shù)千萬(wàn)用戶以及數(shù)十萬(wàn)商家進(jìn)行服務(wù),為商家降本增效,為用戶提升購(gòu)物客服體驗(yàn)。
項(xiàng)目二、京東智能營(yíng)銷文本生成項(xiàng)目
項(xiàng)目簡(jiǎn)介:在京東零售場(chǎng)景,數(shù)百萬(wàn)的寫(xiě)作達(dá)人每天為商品創(chuàng)作賣(mài)點(diǎn)突出、風(fēng)格多樣的營(yíng)銷文案以促進(jìn)用戶下單,同時(shí)達(dá)人也會(huì)賺取傭金。但達(dá)人創(chuàng)業(yè)也會(huì)導(dǎo)致創(chuàng)作成本高、量產(chǎn)性差、質(zhì)量參差不齊的問(wèn)題。目前京東AI營(yíng)銷文案的人工審核通過(guò)率超過(guò)95%,并覆蓋了全品類的商品。模型已成功應(yīng)用于京東APP-發(fā)現(xiàn)好貨,對(duì)話機(jī)器人京小智和搭配購(gòu)等場(chǎng)景。
項(xiàng)目三、京東同類商品競(jìng)價(jià)搜索項(xiàng)目
項(xiàng)目簡(jiǎn)介:當(dāng)商家上架或選擇新品時(shí),往往需要更全面了解產(chǎn)品性能參數(shù)等指標(biāo)對(duì)比,為便于幫助商戶的決策,京東提供了一款同類商品搜索功能產(chǎn)品;給定一個(gè)商品,它可以根據(jù)商品相關(guān)的信息去自動(dòng)找到網(wǎng)上的同類商品。這里的一個(gè)難點(diǎn)在于,每一個(gè)商品在網(wǎng)上的標(biāo)題、描述都有一些區(qū)別,所以定位到同一個(gè)商品本身具有一定的挑戰(zhàn)。
對(duì)課程有意向的同學(xué)
可掃描二維碼咨詢
??????
第1章:自然語(yǔ)言處理概述
什么是自然語(yǔ)言處理及現(xiàn)狀和前景
自然語(yǔ)言處理應(yīng)用
自然語(yǔ)言處理經(jīng)典任務(wù)及技術(shù)
第2章:數(shù)據(jù)結(jié)構(gòu)與算法基礎(chǔ)
時(shí)間復(fù)雜度、空間復(fù)雜度
斐波那契數(shù)列的時(shí)間和空間復(fù)雜度
動(dòng)態(tài)規(guī)劃算法
經(jīng)典的DP問(wèn)題
第3章:機(jī)器學(xué)習(xí)基礎(chǔ) - 邏輯回歸
分類問(wèn)題以及邏輯回歸重要性
邏輯回歸的條件概率
最大似然估計(jì)
構(gòu)建邏輯回歸的目標(biāo)函數(shù)
優(yōu)化與梯度下降法
隨機(jī)梯度下降法
第4章:機(jī)器學(xué)習(xí)基礎(chǔ) - 模型的泛化
理解什么是過(guò)擬合
如何防止過(guò)擬合現(xiàn)象
L1與L2正則
交叉驗(yàn)證
L1正則與拉普拉斯分布
L2正則與高斯分布
第二部分:文本處理篇
第5章:分詞、詞的標(biāo)準(zhǔn)化、過(guò)濾
文本分析流程
中英文的分詞
最大匹配算法
基于語(yǔ)言模型的分詞
Stemming和Lemmazation
停用詞的使用
拼寫(xiě)糾錯(cuò)問(wèn)題
編輯距離的實(shí)現(xiàn)
暴力搜索法
基于后驗(yàn)概率的糾錯(cuò)
第6章:文本的表示
單詞的獨(dú)熱編碼表示
句子的獨(dú)熱編碼表示
tf-idf表示
句子相似度比較
獨(dú)熱編碼下的單詞語(yǔ)義相似度
從獨(dú)熱編碼到詞向量
詞向量的可視化、句子向量
第7章:【項(xiàng)目作業(yè)】豆瓣電影評(píng)分預(yù)測(cè)
數(shù)據(jù)描述以及任務(wù)
中文分詞
獨(dú)熱編碼、tf-idf
分布式表示與Word2Vec
BERT向量
句子向量
第8章:詞向量技術(shù)
獨(dú)熱編碼表示的優(yōu)缺點(diǎn)
獨(dú)熱編碼與分布式表示的比較
靜態(tài)詞向量與動(dòng)態(tài)詞向量
學(xué)習(xí)詞向量 - 分布式假設(shè)
SkipGram與CBOW
SkipGram模型的目標(biāo)
負(fù)采樣(Negative Sampling)
基于矩陣分解的詞向量學(xué)習(xí)
基于Glove的詞向量學(xué)習(xí)
在非歐式空間中的詞向量學(xué)習(xí)
第9章:【項(xiàng)目作業(yè)】智能客服問(wèn)答系統(tǒng)
問(wèn)答系統(tǒng)和應(yīng)用場(chǎng)景
問(wèn)答系統(tǒng)搭建流程
文本的向量化表示
FastText
倒排表技術(shù)
問(wèn)答系統(tǒng)中的召回、排序
第10章:語(yǔ)言模型
語(yǔ)言模型的必要性
馬爾科夫假設(shè)
Unigram語(yǔ)言模型
Bigram、Trigram語(yǔ)言模型
語(yǔ)言模型的評(píng)估
語(yǔ)言模型的平滑技術(shù)
第三部分:自然語(yǔ)言處理與深度學(xué)習(xí)
第11章:深度學(xué)習(xí)基礎(chǔ)
理解神經(jīng)網(wǎng)絡(luò)
各類常見(jiàn)的激活函數(shù)
理解多層神經(jīng)網(wǎng)絡(luò)
反向傳播算法
神經(jīng)網(wǎng)絡(luò)中的過(guò)擬合
淺層模型與深層模型對(duì)比
深度學(xué)習(xí)中的層次表示
第12章:Pytorch的使用
環(huán)境安裝
Pytorch與Numpy的語(yǔ)法比較
Pytorch中的Autograd用法
Pytorch的Forward函數(shù)
第13章:RNN與LSTM
從HMM到RNN模型
RNN中的梯度問(wèn)題
解決梯度爆炸問(wèn)題
梯度消失與LSTM
LSTM到GRU
雙向LSTM模型
基于LSTM的生成
練習(xí):利用Pytorch實(shí)現(xiàn)RNN/LSTM
第14章:Seq2Seq模型與注意力機(jī)制
Seq2Seq模型
Greedy Decoding
Beam Search
長(zhǎng)依賴所存在的問(wèn)題
注意力機(jī)制
注意力機(jī)制的不同實(shí)現(xiàn)
第15章:【項(xiàng)目實(shí)戰(zhàn)】京東智能營(yíng)銷文案生成
構(gòu)建Seq2Seq模型
Beam Search的改造
模型調(diào)優(yōu)
Length Normalization
Coverage Normalization
評(píng)估標(biāo)準(zhǔn) Rouge
Pointer-Generator Network
PGN與Seq2Seq的融合
第16章:動(dòng)態(tài)詞向量與ELMo技術(shù)
基于上下文的詞向量技術(shù)
圖像識(shí)別中的層次表示
文本領(lǐng)域中的層次表示
深度BI-LSTM
ELMo模型簡(jiǎn)介及優(yōu)缺點(diǎn)
ELMo的訓(xùn)練與測(cè)試
第17章:自注意力機(jī)制與Transformer
基于LSTM模型的缺點(diǎn)
Transformer結(jié)構(gòu)概覽
理解自注意力機(jī)制
位置信息的編碼
理解Encoder與Decoder區(qū)別
理解Transformer的訓(xùn)練和預(yù)測(cè)
Transformer的缺點(diǎn)
第18章:BERT與ALBERT
自編碼器介紹
Transformer Encoder
Masked LM
BERT模型及其不同訓(xùn)練方式
ALBERT
第19章:【項(xiàng)目實(shí)戰(zhàn)】京東智能客服系統(tǒng)項(xiàng)目
對(duì)話系統(tǒng)的分類方法
檢索方式與生成方式
對(duì)話系統(tǒng)架構(gòu)
意圖識(shí)別分類器
閑聊引擎的搭建
Transformer與BERT的使用
第20章:GPT與XLNet
Transformer Encoder回顧
GPT-1,GPT-2,GPT-3
ELMo的缺點(diǎn)
語(yǔ)言模型下同時(shí)考慮上下文
Permutation LM
雙流自注意力機(jī)制
Transformer-XL
第四部分、信息抽取
第21章:命名實(shí)體識(shí)別與實(shí)體消歧
信息抽取的應(yīng)用和關(guān)鍵技術(shù)
命名實(shí)體識(shí)別
NER識(shí)別常用技術(shù)
實(shí)體消歧技術(shù)
實(shí)體消歧常用技術(shù)
實(shí)體統(tǒng)一技術(shù)
指代消解
第22章:關(guān)系抽取
關(guān)系抽取的應(yīng)用
基于規(guī)則的方法
基于監(jiān)督學(xué)習(xí)方法
Bootstrap方法
Distant Supervision方法
第23章:依存文法分析
從語(yǔ)法分析到依存文法分析
依存文法分析的應(yīng)用
使用依存文法分析
基于圖算法的依存文法分析
基于Transtion-based的依存文法分析
其他依存文法分析方法論
第24章:知識(shí)圖譜
知識(shí)圖譜以及重要性
知識(shí)圖譜中的實(shí)體和關(guān)系
利用非結(jié)構(gòu)化數(shù)據(jù)構(gòu)造知識(shí)圖譜
知識(shí)圖譜的設(shè)計(jì)
第25章:【項(xiàng)目實(shí)戰(zhàn)】京東同類商品競(jìng)價(jià)搜索項(xiàng)目
Entity Linking介紹
Entity Linking技術(shù)概覽
從商品描述、商品標(biāo)題中抽取關(guān)鍵實(shí)體
搭建商品知識(shí)圖譜
基于GNN學(xué)習(xí)商品的詞嵌入
商品的ranking以及相似度計(jì)算
第五部分:圖神經(jīng)網(wǎng)絡(luò)以及其他前沿主題
第26章:模型的壓縮
模型壓縮的必要性
常見(jiàn)的模型壓縮算法總覽
基于矩陣分解的壓縮技術(shù)
從BERT到ALBERT的壓縮
基于貝葉斯模型的壓縮技術(shù)
模型的量化
模型的蒸餾方法
第27章:圖神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)的回顧
圖神經(jīng)網(wǎng)絡(luò)發(fā)展歷程
圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)
GAT詳解
對(duì)課程有意向的同學(xué)
可掃描二維碼咨詢
??????

01 項(xiàng)目講解&實(shí)戰(zhàn)幫助
訓(xùn)練營(yíng)最終的目的是幫助學(xué)員完成項(xiàng)目,理解項(xiàng)目中包含核心知識(shí)技能,訓(xùn)練營(yíng)中會(huì)花大量的時(shí)間幫助學(xué)員理解項(xiàng)目以及所涉及到的實(shí)戰(zhàn)講解。

▲節(jié)選往期部分課程安排
02 最佳工程實(shí)戰(zhàn)
來(lái)自京東智聯(lián)云等業(yè)界專家來(lái)講述工業(yè)界的最佳工程實(shí)戰(zhàn),如AI模型的部署、代碼編寫(xiě)、模型的調(diào)參以及debug等技術(shù)。

▲源自京東智聯(lián)云AI某模塊架構(gòu)圖
03 專業(yè)的論文解讀
作為AI工程師,閱讀論文能力是必須要的。在課程里,我們會(huì)安排經(jīng)典英文文章供學(xué)員閱讀,之后由老師幫助解讀。

▲節(jié)選往期部分論文安排
04 代碼解讀&實(shí)戰(zhàn)
對(duì)于核心的模型如BERT,XLNet都會(huì)精心安排代碼解讀和實(shí)戰(zhàn)課,幫助學(xué)員深入理解其細(xì)節(jié)并有能力去實(shí)現(xiàn)。

▲B(niǎo)ERT模型代碼實(shí)戰(zhàn)講解
05 行業(yè)案例分享
訓(xùn)練營(yíng)過(guò)程中會(huì)邀請(qǐng)合作的專家來(lái)分享行業(yè)案例以及技術(shù)解決方案,如知識(shí)圖譜的搭建、保險(xiǎn)領(lǐng)域的客服系統(tǒng)等。

▲專家分享
《Google YouTube 基于深度學(xué)習(xí)的視頻推薦》
嘉賓簡(jiǎn)介:曾博士
計(jì)算機(jī)視覺(jué),機(jī)器學(xué)習(xí)領(lǐng)域?qū)<?/span>
先后在CVPR,ACMMM,TPAMI,SCI 期刊,EI 會(huì)議等發(fā)表超過(guò)30篇論文
06 日常社群答疑
為了幫助解決學(xué)員遇到的問(wèn)題,專業(yè)助教會(huì)提供全天社群答疑服務(wù)。我們的助教均來(lái)來(lái)自于一線AI公司和國(guó)內(nèi)外名校,扎實(shí)的理論和工業(yè)界應(yīng)用也是我們選拔助教老師的重要標(biāo)準(zhǔn),拒絕空談理論。


▲社群內(nèi)老師專業(yè)的解答
07 日常作業(yè)&講解
為了鞏固對(duì)一些核心知識(shí)點(diǎn),學(xué)員除了大項(xiàng)目,也需要完成日常的小作業(yè)。之后助教會(huì)給出詳細(xì)的解答。

▲課程學(xué)習(xí)中的小作業(yè)
課程適合哪些學(xué)員吶?
大學(xué)生:
計(jì)算機(jī)或者信息領(lǐng)域相關(guān)的本科/研究/博士生,畢業(yè)后希望從事AI相關(guān)的工作。
希望在真實(shí)工業(yè)場(chǎng)景中磨煉技術(shù),提升職場(chǎng)競(jìng)爭(zhēng)力。
畢業(yè)之后希望申請(qǐng)國(guó)內(nèi)外名校的碩士或者博士。
在職人士:
具備良好的工程研發(fā)背景,希望從事AI相關(guān)的項(xiàng)目或者工作。
從事AI工作,希望進(jìn)一步提升NLP實(shí)戰(zhàn)經(jīng)驗(yàn)。
從事NLP工作,希望深入了解模型機(jī)理。
AI developer, 希望突破技術(shù)瓶頸, 了解NLP前沿信息。
入學(xué)標(biāo)準(zhǔn):
1、 理工科專業(yè)相關(guān)本科生,碩士生或博士生或者IT領(lǐng)域的在職人士
2、具備很強(qiáng)的動(dòng)手能力、熟練使用Python編程
3、具備良好的英文文獻(xiàn)閱讀能力,至少達(dá)到CET-4級(jí)水平
對(duì)課程有意向的同學(xué)
可掃描二維碼咨詢
??????
