<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          對話短文本語義匹配-冠軍代碼

          共 2683字,需瀏覽 6分鐘

           ·

          2021-10-02 12:37


          向AI轉(zhuǎn)型的程序員都關注了這個號??????

          機器學習AI算法工程   公眾號:datayx


          小布助手是OPPO公司為歐加集團三品牌手機和IoT設備自研的語音助手,為用戶提供了有趣、貼心、便捷的對話式服務。意圖識別是對話系統(tǒng)中的一個核心任務,而對話短文本語義匹配是意圖識別的主流算法方案之一。本賽道要求參賽隊伍根據(jù)脫敏后的短文本query-pair,預測它們是否屬于同一語義。


          冠軍方案

            源代碼獲取方式

            關注微信公眾號 datayx  然后回復 語義配匹 即可獲取。

            AI項目體驗地址 https://loveai.tech

          數(shù)據(jù)

          本項目沒有提供數(shù)據(jù),如果需要數(shù)據(jù),請到天池比賽主頁下載

          https://tianchi.aliyun.com/competition/entrance/531851/introduction


          預訓練模型準備

          • 下載預訓練模型

            • nezha-base:

              https://drive.google.com/file/d/1HmwMG2ldojJRgMVN0ZhxqOukhuOBOKUb/view?usp=sharing

            • nezha-large:

              https://drive.google.com/file/d/1EtahNvdjEpugm8juFuPIN_Fs2skFmeMU/view?usp=sharing

            • uer/bert-base:

              https://share.weiyun.com/5QOzPqq

            • uer/bert-large:

              https://share.weiyun.com/5G90sMJ

            • macbert, chinese-bert-wwm-ext, chinese-roberta-wwm-ext-large

              https://huggingface.co/models


          • 預訓練模型開源倉庫

            • https://github.com/dbiir/UER-py

            • https://github.com/huawei-noah/Pretrained-Language-Model

          • 下載并解壓, 解壓到文件夾 data, 文件夾結構如下:



          • 預訓練模型md5

          環(huán)境準備

          • torch==1.7.0

          • transformers=4.3.0.rc1

          • simpletransformers==0.51.15

          • TensorRT-7.2.1.6

          端到端訓練腳本

          cd code
          bash ./run.sh

          不同版本方案

          • 方案一: 預訓練(多個模型) + finetune-分類(多個模型) + 生成軟標簽 + 訓練regression模型(軟標簽,單模型)

            cd code
            bash ./train.sh

            初賽使用的該方案,初賽成績?yōu)?.9220;

          • 方案二: 預訓練(多個模型) + 加載預訓練參數(shù),初始化一個大模型 + 訓練分類模型(單模型)

            pipeline/pipeline_b.py

            訓練一個144層模型(6 * 12 + 24 * 3);

            該模型單模型在復賽A榜成績0.9561;推理平均時間15ms;

          • 方案三: 預訓練(多個模型) + finetune-分類(多個模型) + 平均融合

            pipeline/pipeline_d.py

            融合6個bert-base + 3個bert-large模型;

            該模型在復賽A榜沒測試,B榜成績0.9593;推理平均時間15ms;



          機器學習算法AI大數(shù)據(jù)技術

           搜索公眾號添加: datanlp

          長按圖片,識別二維碼




          閱讀過本文的人還看了以下文章:


          TensorFlow 2.0深度學習案例實戰(zhàn)


          基于40萬表格數(shù)據(jù)集TableBank,用MaskRCNN做表格檢測


          《基于深度學習的自然語言處理》中/英PDF


          Deep Learning 中文版初版-周志華團隊


          【全套視頻課】最全的目標檢測算法系列講解,通俗易懂!


          《美團機器學習實踐》_美團算法團隊.pdf


          《深度學習入門:基于Python的理論與實現(xiàn)》高清中文PDF+源碼


          特征提取與圖像處理(第二版).pdf


          python就業(yè)班學習視頻,從入門到實戰(zhàn)項目


          2019最新《PyTorch自然語言處理》英、中文版PDF+源碼


          《21個項目玩轉(zhuǎn)深度學習:基于TensorFlow的實踐詳解》完整版PDF+附書代碼


          《深度學習之pytorch》pdf+附書源碼


          PyTorch深度學習快速實戰(zhàn)入門《pytorch-handbook》


          【下載】豆瓣評分8.1,《機器學習實戰(zhàn):基于Scikit-Learn和TensorFlow》


          《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》PDF+完整源碼


          汽車行業(yè)完整知識圖譜項目實戰(zhàn)視頻(全23課)


          李沐大神開源《動手學深度學習》,加州伯克利深度學習(2019春)教材


          筆記、代碼清晰易懂!李航《統(tǒng)計學習方法》最新資源全套!


          《神經(jīng)網(wǎng)絡與深度學習》最新2018版中英PDF+源碼


          將機器學習模型部署為REST API


          FashionAI服裝屬性標簽圖像識別Top1-5方案分享


          重要開源!CNN-RNN-CTC 實現(xiàn)手寫漢字識別


          yolo3 檢測出圖像中的不規(guī)則漢字


          同樣是機器學習算法工程師,你的面試為什么過不了?


          前海征信大數(shù)據(jù)算法:風險概率預測


          【Keras】完整實現(xiàn)‘交通標志’分類、‘票據(jù)’分類兩個項目,讓你掌握深度學習圖像分類


          VGG16遷移學習,實現(xiàn)醫(yī)學圖像識別分類工程項目


          特征工程(一)


          特征工程(二) :文本數(shù)據(jù)的展開、過濾和分塊


          特征工程(三):特征縮放,從詞袋到 TF-IDF


          特征工程(四): 類別特征


          特征工程(五): PCA 降維


          特征工程(六): 非線性特征提取和模型堆疊


          特征工程(七):圖像特征提取和深度學習


          如何利用全新的決策樹集成級聯(lián)結構gcForest做特征工程并打分?


          Machine Learning Yearning 中文翻譯稿


          螞蟻金服2018秋招-算法工程師(共四面)通過


          全球AI挑戰(zhàn)-場景分類的比賽源碼(多模型融合)


          斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)


          python+flask搭建CNN在線識別手寫中文網(wǎng)站


          中科院Kaggle全球文本匹配競賽華人第1名團隊-深度學習與特征工程



          不斷更新資源

          深度學習、機器學習、數(shù)據(jù)分析、python

           搜索公眾號添加: datayx  


          瀏覽 106
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  伊人成人激情 | 日韩精品一区二区三区免费视频 | 成人婷婷五月天 | 国产成人黄色毛片不卡在线看 | 丁香 亚洲 |