<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          釘釘在線求饒?爬取釘釘App Store真實(shí)評(píng)價(jià)數(shù)據(jù)并分析

          共 2388字,需瀏覽 5分鐘

           ·

          2020-02-22 23:24

          一、前言

          近釘釘火了,因?yàn)橐咔橛绊懀斸敱唤逃窟x為給學(xué)生用來在線上網(wǎng)課的平臺(tái),本以為自己因?yàn)闃I(yè)務(wù)過硬得到官方的認(rèn)可,是2020上天選中的寵鵝,萬萬沒想到到由于小學(xué)生不爽被占用寒假時(shí)間上課,于是集體出征在各大應(yīng)用商店給釘釘打低分??


          293b12a1b820ca857ac19ffef284c243.webp


          于是就出現(xiàn)了前幾天的“釘釘十一億下載量,整體評(píng)分只有一星”,真是好慘一軟件。那么就跟隨本文一起通過爬取釘釘在App Store的評(píng)分,看看用戶的真實(shí)反應(yīng)吧。

          二、數(shù)據(jù)爬取

          我們的目標(biāo)就是從App Store官網(wǎng)拿下這些評(píng)論數(shù)據(jù)做分析??

          de3babc4180a3680e9b97d5203e4b7a7.webp

          本來以為要寫個(gè)爬蟲在用正則表達(dá)式去提取,結(jié)果一搜發(fā)現(xiàn)有現(xiàn)成的App Store評(píng)論API??

          https://itunes.apple.com/rss/customerreviews/page=1/id=/sortby=mostrecent/json?l=en&&cc=cn?

          只要將釘釘?shù)膇d添加進(jìn)去就OK,這就很簡(jiǎn)單了,連F12都不用??


          040fe85aa8d3d33035c5dac44a07ca38.webp

          于是我們很輕松的就得到了釘釘在App Store的評(píng)論API

          https://itunes.apple.com/rss/customerreviews/page=1/id=930368978/sortby=mostrecent/json?l=en&&cc=cn?

          打開看看,OK就是這個(gè)??,但是比較可惜的是App Store并沒有提供評(píng)論時(shí)間,所以對(duì)我們有用的數(shù)據(jù)就只有用戶評(píng)分、評(píng)論標(biāo)題、評(píng)論內(nèi)容。


          b1a0333cbeae2b1b1edae4e877521163.webp

          注意到這僅僅是第一頁的評(píng)論,而通過測(cè)試發(fā)現(xiàn)最多可以查看10頁的評(píng)論,所以寫一個(gè)簡(jiǎn)單的循環(huán)把我們需要的信息提取出來,具體代碼??

          import requests
          import pandas as pd
          from pandas import DataFrame
          flag = [1,2,3,4,5,6,7,8,9,10]
          urllist = []
          for i in flag:
          url = f"https://itunes.apple.com/rss/customerreviews/page={i}/id=930368978/sortby=mostrecent/json?l=en&&cc=cn"
          urllist.append(url)
          rating = [] #評(píng)分
          title = [] #標(biāo)題
          content = [] #內(nèi)容
          for url in urllist:
          res = requests.get(url)
          data = res.json()['feed']['entry']
          for i in range(len(data)):
          rating.append(data[i]['im:rating']['label'])
          title.append(data[i]['title']['label'])
          content.append(data[i]['content']['label'])
          data = {'打分':rating,
          '標(biāo)題':title,
          '內(nèi)容':content
          }
          df = DataFrame(data)

          最終爬取的數(shù)據(jù)長(zhǎng)這樣??


          e223b9d4cd37c95eeffd1bacb17708c4.webp

          三、數(shù)據(jù)分析

          我們首先看下這500條評(píng)分的分值分布

          eac108b500fe4de4caf71e408c984dc6.webp

          從圖中可以看出一共500次評(píng)分,1分和5分占了490次,其中打一分的250人,5分的240人,而2分、3分、4分的人數(shù)則分別為1、3、6人??磥泶蚍值母魑贿€真是愛憎分明。


          接著我們?cè)購膖itle和content中提取與學(xué)生相關(guān)的文字并統(tǒng)計(jì)??

          eddc3a33d035e2501b7d22192c14b2ee.webp

          看來不管是不是評(píng)論者是不是小學(xué)生,都喜歡在評(píng)論里面聊小學(xué)生。


          我們?cè)俳y(tǒng)計(jì)一下標(biāo)題和內(nèi)容中出現(xiàn)最多的一些關(guān)鍵詞??梢杂胮andas里面的.str.contains()方法??


          533b407bc354fc836b50ae6059fad963.webp


          再可視化一下??


          9fb7095cb7edfba4b0769c125e27970d.webp

          可以看到,給好評(píng)的人和給一星的人旗鼓相當(dāng),有罵釘釘吵著下架的,也有鼓勵(lì)釘釘喊著加油的。但是唯一值得關(guān)注的是,有不少人想分期消費(fèi)40c179fc4dba8f116d069c622c255c60.webp


          83477852473879b981ce4133c54ff764.webp

          ee82449d55f3b3ab9136cb075d9408cd.webp


          好了,最后我們來制作下詞云圖,上面的可視化主要利用pyecharts,具體在我之前文章中有詳細(xì)說明。而詞云圖的制作選擇了python里的wordcloud庫,具體使用方法就不細(xì)說,看代碼??

          from wordcloud import WordCloud
          import matplotlib.pyplot as plt #繪制圖像的模塊
          import jieba #jieba分詞

          path_txt='content.txt'
          f = open(path_txt,'r',encoding='UTF-8').read()

          # 結(jié)巴分詞,生成字符串,wordcloud無法直接生成正確的中文詞云
          cut_text = " ".join(jieba.cut(f))

          wordcloud = WordCloud(
          #設(shè)置字體,不然會(huì)出現(xiàn)口字亂碼,文字的路徑是電腦的字體一般路徑,可以換成別的
          font_path="msyh.ttc",
          #設(shè)置了背景,寬高
          background_color="white",width=2000,height=1880).generate(cut_text)

          plt.imshow(wordcloud, interpolation="bilinear")
          plt.axis("off")
          plt.show()

          從標(biāo)題生成的詞云圖來看,依舊是褒貶摻半

          a22f7e1b0aa2ec747557c77674baf362.webp

          下面是由內(nèi)容生成的詞云圖

          e1af058728393ab1df9b098f96df2355.webp

          四、結(jié)束語

          以上就是本文的全部?jī)?nèi)容,筆者也是使用釘釘進(jìn)行辦公。而對(duì)于釘釘這波哭笑不得的熱搜,我想釘釘官方鬼畜已經(jīng)給出了答案


          2cac15e73b7d2a3eda431401eee0429f.webp


          e589e92eb913c36f47d5e93197f7a3a0.webp

          8de76f4238604e0b9033aef0c265ca39.webp

          1b986bda4a4fb7d38cf2720f971bd9d8.webp

          f007371145abc09d8e8dff669d5b274e.webp29fcda9f08933208ab32cda87521010f.webp

          最新進(jìn)展:釘釘被小學(xué)生逼瘋,拍片在線求饒,哈哈哈!

          釘釘把小學(xué)生惹毛之后,一度被噴下架了......

          【內(nèi)含福利】資源極度敏感!隨時(shí)刪除!絕對(duì)禁止傳播!

          推薦掃碼關(guān)注一波~~

          點(diǎn)個(gè)在看在走哦

          瀏覽 63
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  欧美大香蕉久久 | 日本片A天堂 | 免费在线一级片 | 日韩视频在线观看免费 | 三区视频免费看 |