基于機(jī)器學(xué)習(xí)與BERT的在線招聘欺詐檢測(cè)平臺(tái)

向AI轉(zhuǎn)型的程序員都關(guān)注了這個(gè)號(hào)??????
機(jī)器學(xué)習(xí)AI算法工程 公眾號(hào):datayx
隨著個(gè)人電腦使用者的增多和互聯(lián)網(wǎng)技術(shù)的普及與發(fā)展,企業(yè)進(jìn)行招聘的方式也發(fā)生了很大的改變。從早期主要是內(nèi)部推薦、張貼海報(bào),到較早期發(fā)展為在報(bào)紙、雜志、電視或廣播電臺(tái)上發(fā)布招聘廣告,再到到外地舉辦大型招聘會(huì)等方式,直至現(xiàn)如今網(wǎng)絡(luò)招聘的興起,可以看出,企業(yè)愈來(lái)愈主動(dòng)拓展眼界,積極向外尋找適合的人才。與此相協(xié)調(diào)的是,而今求職者在尋找合適職位時(shí),不僅僅局限于所在地區(qū)的企業(yè),對(duì)于網(wǎng)絡(luò)招聘的依賴程度日益增高。網(wǎng)絡(luò)有效地拉近了全國(guó)范圍內(nèi)企業(yè)與求職者的距離。招聘的網(wǎng)絡(luò)化已成為一種普遍的招聘模式。
然而,在線招聘并非一片凈土,與之相反,由于網(wǎng)絡(luò)平臺(tái)的開(kāi)發(fā)性、不安全性以及相關(guān)制度和法律的不健全等等原因,在線招聘平臺(tái)逐漸變成了欺騙者的“無(wú)法無(wú)天之地”。更加令人沮喪的是,如今的虛假招聘變得越來(lái)越難以與真實(shí)招聘區(qū)分開(kāi)來(lái),越來(lái)越多的求職者陷入發(fā)布虛假招聘者的圈套之中。
項(xiàng)目目標(biāo)
具體的研究在線招聘欺詐的各個(gè)方面
提供我們使用的在線招聘數(shù)據(jù)集
詳細(xì)的分析數(shù)據(jù)集,并根據(jù)數(shù)據(jù)集給出判定招聘是否虛假的參考規(guī)則集
提出給予機(jī)器學(xué)習(xí)的在線招聘欺詐檢測(cè)的解決方案
提供檢測(cè)的使用接口及擴(kuò)展接口
如果時(shí)間及精力允許,實(shí)現(xiàn)一個(gè) demo
項(xiàng)目原則
客觀性
保證項(xiàng)目從始至終進(jìn)行的過(guò)程客觀的看待每一個(gè)步驟
真實(shí)性
保證項(xiàng)目用到的所有數(shù)據(jù)及其他信息均真實(shí)且來(lái)源可靠
有效性
保證所有項(xiàng)目理論及項(xiàng)目成果測(cè)試有效,爭(zhēng)取滿足商業(yè)使用
易用性
保證項(xiàng)目提供的數(shù)據(jù)集、源程序或者成果易于使用,項(xiàng)目代碼盡量保證模塊化、自動(dòng)化,項(xiàng)目結(jié)構(gòu)保證解耦規(guī)范
可擴(kuò)展性
保證項(xiàng)目成果(特別是模型訓(xùn)練結(jié)果及輸入數(shù)據(jù)集)具有高度的可擴(kuò)展性
代碼 獲取方式:
關(guān)注微信公眾號(hào) datayx 然后回復(fù) 招聘 即可獲取。
二、項(xiàng)目總體分析
業(yè)務(wù)分析

系統(tǒng)分析

項(xiàng)目流程圖


項(xiàng)目部署
由于本項(xiàng)目為同時(shí)對(duì)數(shù)據(jù)的向量和文本分類,使用了 Bert 作為文本編碼服務(wù),部署文本分類的環(huán)境比較大,故本倉(cāng)庫(kù)沒(méi)有提供文本編碼服務(wù)(只有一個(gè)文本分類的模型)
測(cè)試:測(cè)試向量分類可在安裝好環(huán)境后直接運(yùn)行 tests-vec.py 查看運(yùn)行結(jié)果。如果部署好了文本編碼服務(wù)也可直接運(yùn)行 tests.py 查看運(yùn)行結(jié)果
機(jī)器學(xué)習(xí)算法AI大數(shù)據(jù)技術(shù)
搜索公眾號(hào)添加: datanlp
長(zhǎng)按圖片,識(shí)別二維碼
閱讀過(guò)本文的人還看了以下文章:
TensorFlow 2.0深度學(xué)習(xí)案例實(shí)戰(zhàn)
基于40萬(wàn)表格數(shù)據(jù)集TableBank,用MaskRCNN做表格檢測(cè)
《基于深度學(xué)習(xí)的自然語(yǔ)言處理》中/英PDF
Deep Learning 中文版初版-周志華團(tuán)隊(duì)
【全套視頻課】最全的目標(biāo)檢測(cè)算法系列講解,通俗易懂!
《美團(tuán)機(jī)器學(xué)習(xí)實(shí)踐》_美團(tuán)算法團(tuán)隊(duì).pdf
《深度學(xué)習(xí)入門:基于Python的理論與實(shí)現(xiàn)》高清中文PDF+源碼
《深度學(xué)習(xí):基于Keras的Python實(shí)踐》PDF和代碼
python就業(yè)班學(xué)習(xí)視頻,從入門到實(shí)戰(zhàn)項(xiàng)目
2019最新《PyTorch自然語(yǔ)言處理》英、中文版PDF+源碼
《21個(gè)項(xiàng)目玩轉(zhuǎn)深度學(xué)習(xí):基于TensorFlow的實(shí)踐詳解》完整版PDF+附書代碼
《深度學(xué)習(xí)之pytorch》pdf+附書源碼
PyTorch深度學(xué)習(xí)快速實(shí)戰(zhàn)入門《pytorch-handbook》
【下載】豆瓣評(píng)分8.1,《機(jī)器學(xué)習(xí)實(shí)戰(zhàn):基于Scikit-Learn和TensorFlow》
《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》PDF+完整源碼
汽車行業(yè)完整知識(shí)圖譜項(xiàng)目實(shí)戰(zhàn)視頻(全23課)
李沐大神開(kāi)源《動(dòng)手學(xué)深度學(xué)習(xí)》,加州伯克利深度學(xué)習(xí)(2019春)教材
筆記、代碼清晰易懂!李航《統(tǒng)計(jì)學(xué)習(xí)方法》最新資源全套!
《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》最新2018版中英PDF+源碼
將機(jī)器學(xué)習(xí)模型部署為REST API
FashionAI服裝屬性標(biāo)簽圖像識(shí)別Top1-5方案分享
重要開(kāi)源!CNN-RNN-CTC 實(shí)現(xiàn)手寫漢字識(shí)別
同樣是機(jī)器學(xué)習(xí)算法工程師,你的面試為什么過(guò)不了?
前海征信大數(shù)據(jù)算法:風(fēng)險(xiǎn)概率預(yù)測(cè)
【Keras】完整實(shí)現(xiàn)‘交通標(biāo)志’分類、‘票據(jù)’分類兩個(gè)項(xiàng)目,讓你掌握深度學(xué)習(xí)圖像分類
VGG16遷移學(xué)習(xí),實(shí)現(xiàn)醫(yī)學(xué)圖像識(shí)別分類工程項(xiàng)目
特征工程(二) :文本數(shù)據(jù)的展開(kāi)、過(guò)濾和分塊
如何利用全新的決策樹(shù)集成級(jí)聯(lián)結(jié)構(gòu)gcForest做特征工程并打分?
Machine Learning Yearning 中文翻譯稿
全球AI挑戰(zhàn)-場(chǎng)景分類的比賽源碼(多模型融合)
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
python+flask搭建CNN在線識(shí)別手寫中文網(wǎng)站
中科院Kaggle全球文本匹配競(jìng)賽華人第1名團(tuán)隊(duì)-深度學(xué)習(xí)與特征工程
不斷更新資源
深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、數(shù)據(jù)分析、python
搜索公眾號(hào)添加: datayx
