<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          【程序源代碼】微信爬蟲

          共 1773字,需瀏覽 4分鐘

           ·

          2020-10-25 17:08

          關鍵字:爬蟲

          正文?|?內容

          01

          【介紹】

          一個爬蟲代碼。主要用于對公眾號進行獲取數(shù)據(jù)使用的。使用的python進行開發(fā)的。內容比較簡單。可以簡單試用下。

          02

          【技術框架】

          1、python環(huán)境, 檢查python的版本,是否為2.7.x,如果不是,安裝2.7.6。

          2、安裝依賴包, clone代碼 安裝Mysql-python依賴

          yum install python-devel mysql-devel gcc

          安裝lxml依賴

          yum install libxslt-devel libxml2-devel

          安裝瀏覽器環(huán)境 selenium依賴.(如果是mac環(huán)境,僅需安裝firefox, 但確保版本是 firefox 36.0,使用最新的版本會報錯)

          yum install xorg-x11-server-Xvfb
          yum upgrade glib2 # 確保glib2版本大于2.42.2,否則firefox啟動會報錯
          yum install firefox # centos下安裝最新的firefox版本

          clone代碼,安裝依賴python庫

          $ git clone https://github.com/bowenpay/wechat-spider.git
          $ cd wechat-spider
          $ pip install -r requirements.txt

          3、創(chuàng)建mysql數(shù)據(jù)庫

          創(chuàng)建數(shù)據(jù)庫wechatspider,默認采用utf8編碼。(如果系統(tǒng)支持,可以采用utf8mb4,以兼容emoji字符)

          mysql> CREATE DATABASE `wechatspider` CHARACTER SET utf8;

          4、安裝和運行Redis

          $ wget http://download.redis.io/releases/redis-2.8.3.tar.gz
          $ tar xzvf redis-2.8.3.tar.gz
          $ cd redis-2.8.3
          $ make
          $ make install
          $ redis-server

          5、更新配置文件local_settings

          在 wechatspider 目錄下,添加?local_settings.py?文件,配置如下:

          6、初始化表

          $ python manage.py migrate

          7、啟動網(wǎng)站

          python manage.py runserver 0.0.0.0:8001

          訪問 http://localhost:8001/。

          創(chuàng)建超級管理員賬號,訪問后臺,并配置要爬取的公眾號和關鍵字

          python manage.py createsuperuser

          8)啟動爬蟲

          $ python bin/scheduler.py
          $ python bin/downloader.py
          $ python bin/extractor.py
          $ python bin/processor.py

          03

          【源碼獲取方式】

          https://github.com/bowenpay/wechat-spider.git


          聯(lián)




          公眾號ID:??itcode


          微信ID:??itcoder





          【寫作說明】以上文章屬于此公眾號原創(chuàng)所有,如需轉載請注明出處。【免責申明】本公眾號不是廣告商,也沒有為其他三方網(wǎng)站或者個人做廣告宣傳。文章發(fā)布源代碼和文章均來源于各類開源網(wǎng)站社區(qū)或者是小編在項目中、學習中整理的一些實例項目。主要目的是將開源代碼分享給喜歡編程、有夢想的程序員,希望能幫助到你們與他們共同成長。其中用戶產(chǎn)生的一些自愿下載或者付費行為,原則與平臺沒有直接關系。如果涉及開源程序侵犯到原作者相關權益,可聯(lián)系小編進行相關處理。
          【投稿郵箱】[email protected]

          —————————————

          目前已有1000000+優(yōu)秀的程序員加入我們
          ??????????????????????????
          ?????????????????????????

          ——————————————

          【你的每一份打賞就是對我最真誠的鼓勵】

          瀏覽 64
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  国产午夜成人电影 | 97午夜 | 午夜福利淫秽视频 | 五月天婷婷丁香在线播放 | 无码人妻精品一区二区三千菊电影 |