吹牛,是不可能的
昨天發(fā)了一篇用pillow裁剪圖片的文章,然后很多人后臺(tái)留言說(shuō)這個(gè)功能很雞肋,明明有很多現(xiàn)成的工具,干嘛還要自己造個(gè)輪子,麻煩的一逼。

其實(shí)這個(gè)需求不是我YY出來(lái)的,而是確實(shí)有這樣的場(chǎng)景。今天我就給你們講個(gè)爬蟲(chóng)領(lǐng)域的使用場(chǎng)景。
可能有些人知道,我在爬蟲(chóng)這塊比較專業(yè),特別是公眾號(hào)這塊,然后有次一個(gè)客戶找到我,他們希望有個(gè)能實(shí)時(shí)獲取公眾號(hào)內(nèi)容更新的需求。
但是微信并沒(méi)有提供這樣的接口可以讓你去實(shí)時(shí)獲取更新,你只有不斷去輪詢?cè)儐?wèn)服務(wù)器有沒(méi)有更新內(nèi)容,如果一兩個(gè)號(hào)你輪詢下還好,幾百上千個(gè)號(hào)你去輪詢就不可取了。
想要實(shí)時(shí)獲取最新的推送內(nèi)容有一種方法就是DDL注入技術(shù),不過(guò)這種技術(shù)難度大,風(fēng)險(xiǎn)指數(shù)高,動(dòng)不動(dòng)就會(huì)被封號(hào)。
那么退而求其次的方法是什么呢?
就是將公眾號(hào)的訂閱列表先截圖,然后通過(guò)圖文識(shí)別技術(shù)將公眾號(hào)名字提取出來(lái)。接著就可以根據(jù)公眾號(hào)名字去查詢最近的文章列表(至于怎么查是另外一個(gè)話題了)

那這跟圖片裁剪有什么關(guān)系呢?因?yàn)槲乙眉舻墓潭▍^(qū)域的圖片,其它地方的內(nèi)容都屬于干擾信息,所以首先要進(jìn)行裁剪。
整個(gè)流程可以做到完全自動(dòng)化無(wú)需人工參與來(lái)實(shí)現(xiàn)這個(gè)需求。
今天推薦一下我的一個(gè)星球,價(jià)值365元的免費(fèi)星球,為什么免費(fèi)星球卻要說(shuō)價(jià)值365呢,因?yàn)槲視?huì)將自己思考、認(rèn)知的東西記錄下來(lái),順便能給一部分人帶來(lái)啟發(fā),這就是它的價(jià)值。所以現(xiàn)在加入相當(dāng)于白嫖。
上周大偉贈(zèng)送了他的一本新書(shū)給我,關(guān)于Echarts可視化方面的,對(duì)做數(shù)據(jù)分析可視化這塊的同學(xué)會(huì)有幫助。這里送5本書(shū)給大家,有一本已經(jīng)在朋友圈提前送出去了。直接用抽獎(jiǎng)助手參與抽獎(jiǎng)就好。

你還見(jiàn)過(guò)哪些爬蟲(chóng)騷操作?
