<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          18行!Python 識(shí)別文本情感就這么簡(jiǎn)單

          共 2973字,需瀏覽 6分鐘

           ·

          2021-10-10 09:17

          很多同學(xué)都對(duì)自然語(yǔ)言處理感興趣,但是卻不知道應(yīng)該從哪里下手。需要從構(gòu)建數(shù)據(jù)集到訓(xùn)練數(shù)據(jù),再到測(cè)試數(shù)據(jù),整個(gè)流程確實(shí)需要耐心的人才能成功走通。

          不過現(xiàn)在有了paddlehub,我們可以先省略掉構(gòu)建數(shù)據(jù)集和訓(xùn)練數(shù)據(jù)這兩個(gè)步驟,直接拿模型過來分類。一旦簡(jiǎn)單版的分類成功了,你就會(huì)有動(dòng)力繼續(xù)前進(jìn),繼續(xù)學(xué)習(xí)如何訓(xùn)練屬于自己的模型。

          今天我們用paddlehub中比較簡(jiǎn)單的情感傾向分析模型 senta_lstm 來對(duì)文本做一個(gè)簡(jiǎn)單的積極和消極的分類。

          1.準(zhǔn)備

          為了實(shí)現(xiàn)這個(gè)實(shí)驗(yàn),Python是必不可少的,如果你還沒有安裝Python,建議閱讀我們的這篇文章哦:超詳細(xì)Python安裝指南

          然后,我們需要安裝百度的paddlepaddle, 進(jìn)入他們的官方網(wǎng)站就有詳細(xì)的指引:
          https://www.paddlepaddle.org.cn/install/quick

          根據(jù)你自己的情況選擇這些選項(xiàng),最后一個(gè)CUDA版本,由于本實(shí)驗(yàn)不需要訓(xùn)練數(shù)據(jù),也不需要太大的計(jì)算量,所以直接選擇CPU版本即可。選擇完畢,下方會(huì)出現(xiàn)安裝指引,不得不說,Paddlepaddle這些方面做的還是比較貼心的(就是名字起的不好)。

          不過雖然它里面寫了這么多,大部分人用一句話安裝,打開CMD(Win+R)或者Terminal(Command+空格搜索)輸入以下命令即可安裝:

          pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

          還需要安裝paddlehub,這點(diǎn)別忘了:

          pip install -i https://mirror.baidu.com/pypi/simple paddlehub

          2.編寫代碼

          整個(gè)步驟分為三步:

          1.加載模型
          2.指定待分類文本
          3.情感分類


          就能得到以下結(jié)果:

          {'text': '你長(zhǎng)得真好看', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.9866, 'negative_probs': 0.0134}

          {'text': '《黑色四葉草》是部不錯(cuò)的番', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.9401, 'negative_probs': 0.0599}

          其中:
          1.sentiment_key?代表分類結(jié)果,postive是 積極 ,negative是 消極 。
          2.sentiment_label?是分類結(jié)果標(biāo)簽,1代表 積極 ,0代表 消極 。
          3.?positive_probs?是積極分類的置信度,0.9866即模型判斷98.66%的可能性是正面。
          4.?negative_probs?與?positive_probs?相對(duì),是消極分類的置信度。

          3.結(jié)果分析

          這么看,你會(huì)發(fā)現(xiàn)其實(shí)在有明顯的積極消極詞匯面前,這個(gè)模型的分類效果還是不錯(cuò)的。那在特殊的例子面前效果又如何呢?我們?nèi)ノ⒉╇S便取一條試一下,比如銀教授的段子:

          分類結(jié)果:

          {'text': '他們都網(wǎng)上辦公、網(wǎng)上學(xué)習(xí)了,你什么時(shí)候跟我網(wǎng)戀?', 'sentiment_label': 0, 'sentiment_key': 'negative', 'positive_probs': 0.0507, 'negative_probs': 0.9493}

          竟然意外的分對(duì)了雖然是段子,但確實(shí),明顯有對(duì)方不跟自己網(wǎng)戀的消極態(tài)度。


          再試試有潛在含義的句子:

          {'text': '不想說什么了,聽首歌吧', 'sentiment_label': 0, 'sentiment_key': 'negative', 'positive_probs': 0.0321, 'negative_probs': 0.9679}

          {'text': '我忘了世界還有一種人火星人,你從那來的吧', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.7261, 'negative_probs': 0.2739}

          第一句分對(duì)了,第二句沒分對(duì)。確實(shí),第二句太隱晦了,機(jī)器可能分不出來。不過,置信度并不高,如果真的需要應(yīng)用這個(gè)模型,可以通過置信度過濾掉一些分類。

          總的而言,這個(gè)模型效果還是不錯(cuò)的,在網(wǎng)上那么多情感分類開源的模型中,百度的這個(gè)應(yīng)該可以打80分左右。而且,它支持你自己做一些微調(diào)(Fine-tune),也就是能夠使用自定義的訓(xùn)練集調(diào)整模型到你需要的樣子,詳見github:
          https://github.com/PaddlePaddle/models/tree/develop/PaddleNLP/sentiment_classification

          如果你喜歡今天的Python 教程,請(qǐng)持續(xù)關(guān)注菜鳥學(xué)Python,如果對(duì)你有幫助,麻煩在下面點(diǎn)一個(gè)贊/在看,歡迎來留言區(qū)點(diǎn)評(píng)指導(dǎo)工作!






          推薦閱讀:

          入門:?最全的零基礎(chǔ)學(xué)Python的問題? |?零基礎(chǔ)學(xué)了8個(gè)月的Python??|?實(shí)戰(zhàn)項(xiàng)目?|學(xué)Python就是這條捷徑


          量化:?定投基金到底能賺多少錢?? |?我用Python對(duì)去年800只基金的數(shù)據(jù)分析??


          干貨:爬取豆瓣短評(píng),電影《后來的我們》?|?38年NBA最佳球員分析?|? ?從萬眾期待到口碑撲街!唐探3令人失望? |?笑看新倚天屠龍記?|?燈謎答題王?|用Python做個(gè)海量小姐姐素描圖?|碟中諜這么火,我用機(jī)器學(xué)習(xí)做個(gè)迷你推薦系統(tǒng)電影


          趣味:彈球游戲? |?九宮格? |?漂亮的花?|?兩百行Python《天天酷跑》游戲!


          AI:?會(huì)做詩(shī)的機(jī)器人?|?給圖片上色?|?預(yù)測(cè)收入?|?碟中諜這么火,我用機(jī)器學(xué)習(xí)做個(gè)迷你推薦系統(tǒng)電影


          小工具:?Pdf轉(zhuǎn)Word,輕松搞定表格和水?。?/a>?|?一鍵把html網(wǎng)頁(yè)保存為pdf!|??再見PDF提取收費(fèi)!?|?用90行代碼打造最強(qiáng)PDF轉(zhuǎn)換器,word、PPT、excel、markdown、html一鍵轉(zhuǎn)換?|?制作一款釘釘?shù)蛢r(jià)機(jī)票提示器!?|60行代碼做了一個(gè)語(yǔ)音壁紙切換器天天看小姐姐!


          年度爆款文案


          點(diǎn)閱讀原文,領(lǐng)AI全套資料!

          瀏覽 18
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  男人天堂成人网 | 一级黄色电影在线免费观看 | 国产成人探花 | 大香蕉在线啪啪 | 国产激情在线内射 |