<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          基于tensorflow 1.x 的bert系列預(yù)訓(xùn)練模型工具

          共 2364字,需瀏覽 5分鐘

           ·

          2021-09-23 09:13


          向AI轉(zhuǎn)型的程序員都關(guān)注了這個(gè)號(hào)??????

          機(jī)器學(xué)習(xí)AI算法工程   公眾號(hào):datayx



          tfbert

          • 基于tensorflow 1.x 的bert系列預(yù)訓(xùn)練模型工具

          • 支持多GPU訓(xùn)練,支持梯度累積,支持pb模型導(dǎo)出,自動(dòng)剔除adam參數(shù)

          • 采用dataset 和 string handle配合,可以靈活訓(xùn)練、驗(yàn)證、測(cè)試,在訓(xùn)練階段也可以使用驗(yàn)證集測(cè)試模型,并根據(jù)驗(yàn)證結(jié)果保存參數(shù)。


            源代碼獲取方式

            關(guān)注微信公眾號(hào) datayx  然后回復(fù) tf 即可獲取。

            AI項(xiàng)目體驗(yàn)地址 https://loveai.tech

          說明

          config、tokenizer參考的transformers的實(shí)現(xiàn)。

          內(nèi)置有自定義的Trainer,像pytorch一樣使用tensorflow1.14,具體使用下邊會(huì)介紹。

          目前內(nèi)置 文本分類、文本多標(biāo)簽分類、命名實(shí)體識(shí)別例子。

          內(nèi)置的幾個(gè)例子的數(shù)據(jù)處理代碼都支持多進(jìn)程處理,實(shí)現(xiàn)方式參考的transformers。

          內(nèi)置代碼示例數(shù)據(jù)集百度網(wǎng)盤提取碼:rhxk

          支持模型

          bert、electra、albert、nezha、wobert、ChineseBert(GlyceBert)


          requirements

          tensorflow==1.x
          tqdm
          jieba

          目前本項(xiàng)目都是在tensorflow 1.x下實(shí)現(xiàn)并測(cè)試的,最好使用1.14及以上版本,因?yàn)閮?nèi)部tf導(dǎo)包都是用的

          import tensorflow.compat.v1 as tf


          使用說明

          Config 和 Tokenizer

          使用方法和transformers一樣


          多卡運(yùn)行方式,需要設(shè)置環(huán)境變量CUDA_VISIBLE_DEVICES,內(nèi)置trainer會(huì)讀取參數(shù):

          CUDA_VISIBLE_DEVICES=1,2 python run.py

          詳情查看代碼樣例

          XLA和混合精度訓(xùn)練訓(xùn)練速度測(cè)試

          使用哈工大的rbt3權(quán)重進(jìn)行實(shí)驗(yàn)對(duì)比,數(shù)據(jù)為example中的文本分類數(shù)據(jù)集。開啟xla和混合精度后剛開始訓(xùn)練需要等待一段時(shí)間優(yōu)化,所以第一輪會(huì)比較慢, 等開啟后訓(xùn)練速度會(huì)加快很多。最大輸入長(zhǎng)度32,批次大小32,訓(xùn)練3個(gè)epoch, 測(cè)試環(huán)境為tensorflow1.14,GPU是2080ti。




          開啟混合精度比較慢,base版本模型的話需要一兩分鐘,但是開啟后越到后邊越快,訓(xùn)練步數(shù)少的話可以只開啟xla就行了,如果多的話 最好xla和混合精度(混合精度前提是你的卡支持fp16)都打開。


          可加載中文權(quán)重鏈接


          機(jī)器學(xué)習(xí)算法AI大數(shù)據(jù)技術(shù)

           搜索公眾號(hào)添加: datanlp

          長(zhǎng)按圖片,識(shí)別二維碼




          閱讀過本文的人還看了以下文章:


          TensorFlow 2.0深度學(xué)習(xí)案例實(shí)戰(zhàn)


          基于40萬(wàn)表格數(shù)據(jù)集TableBank,用MaskRCNN做表格檢測(cè)


          《基于深度學(xué)習(xí)的自然語(yǔ)言處理》中/英PDF


          Deep Learning 中文版初版-周志華團(tuán)隊(duì)


          【全套視頻課】最全的目標(biāo)檢測(cè)算法系列講解,通俗易懂!


          《美團(tuán)機(jī)器學(xué)習(xí)實(shí)踐》_美團(tuán)算法團(tuán)隊(duì).pdf


          《深度學(xué)習(xí)入門:基于Python的理論與實(shí)現(xiàn)》高清中文PDF+源碼


          特征提取與圖像處理(第二版).pdf


          python就業(yè)班學(xué)習(xí)視頻,從入門到實(shí)戰(zhàn)項(xiàng)目


          2019最新《PyTorch自然語(yǔ)言處理》英、中文版PDF+源碼


          《21個(gè)項(xiàng)目玩轉(zhuǎn)深度學(xué)習(xí):基于TensorFlow的實(shí)踐詳解》完整版PDF+附書代碼


          《深度學(xué)習(xí)之pytorch》pdf+附書源碼


          PyTorch深度學(xué)習(xí)快速實(shí)戰(zhàn)入門《pytorch-handbook》


          【下載】豆瓣評(píng)分8.1,《機(jī)器學(xué)習(xí)實(shí)戰(zhàn):基于Scikit-Learn和TensorFlow》


          《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》PDF+完整源碼


          汽車行業(yè)完整知識(shí)圖譜項(xiàng)目實(shí)戰(zhàn)視頻(全23課)


          李沐大神開源《動(dòng)手學(xué)深度學(xué)習(xí)》,加州伯克利深度學(xué)習(xí)(2019春)教材


          筆記、代碼清晰易懂!李航《統(tǒng)計(jì)學(xué)習(xí)方法》最新資源全套!


          《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》最新2018版中英PDF+源碼


          將機(jī)器學(xué)習(xí)模型部署為REST API


          FashionAI服裝屬性標(biāo)簽圖像識(shí)別Top1-5方案分享


          重要開源!CNN-RNN-CTC 實(shí)現(xiàn)手寫漢字識(shí)別


          yolo3 檢測(cè)出圖像中的不規(guī)則漢字


          同樣是機(jī)器學(xué)習(xí)算法工程師,你的面試為什么過不了?


          前海征信大數(shù)據(jù)算法:風(fēng)險(xiǎn)概率預(yù)測(cè)


          【Keras】完整實(shí)現(xiàn)‘交通標(biāo)志’分類、‘票據(jù)’分類兩個(gè)項(xiàng)目,讓你掌握深度學(xué)習(xí)圖像分類


          VGG16遷移學(xué)習(xí),實(shí)現(xiàn)醫(yī)學(xué)圖像識(shí)別分類工程項(xiàng)目


          特征工程(一)


          特征工程(二) :文本數(shù)據(jù)的展開、過濾和分塊


          特征工程(三):特征縮放,從詞袋到 TF-IDF


          特征工程(四): 類別特征


          特征工程(五): PCA 降維


          特征工程(六): 非線性特征提取和模型堆疊


          特征工程(七):圖像特征提取和深度學(xué)習(xí)


          如何利用全新的決策樹集成級(jí)聯(lián)結(jié)構(gòu)gcForest做特征工程并打分?


          Machine Learning Yearning 中文翻譯稿


          螞蟻金服2018秋招-算法工程師(共四面)通過


          全球AI挑戰(zhàn)-場(chǎng)景分類的比賽源碼(多模型融合)


          斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)


          python+flask搭建CNN在線識(shí)別手寫中文網(wǎng)站


          中科院Kaggle全球文本匹配競(jìng)賽華人第1名團(tuán)隊(duì)-深度學(xué)習(xí)與特征工程



          不斷更新資源

          深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、數(shù)據(jù)分析、python

           搜索公眾號(hào)添加: datayx  

          瀏覽 82
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  婬乱A片欧美大片无码芳芳 | 91麻豆亚洲国产成人久久精品 | 肏屄视频免费在线观看 | 少妇愉情理伦片BD在线播放 | 一道本一区二区日韩一区二区 |