<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          Crawler跨平臺(tái)不寫代碼的爬蟲

          聯(lián)合創(chuàng)作 · 2023-09-29 13:31

          Crawler 基于 Java 開發(fā)的一款跨平臺(tái)爬蟲,可以使用Shell腳本和DOS命令進(jìn)行任務(wù)式處理。

          比如CR命令 使用一個(gè)Email正則就可以從貼吧中提取所有郵箱

          爬取貼吧email

          使用Ci命令 爬取所有新聞 java -jar crawler.jar -ci url.txt title,h1[id=artibodyTitle]#date,span[id=pub_date]#nodes,div[id=artibody] data.xml

          執(zhí)行結(jié)果

          使用Crawler抓取騰訊新聞并保存入庫(kù):http://my.oschina.net/u/2311702/blog/652856

          詳細(xì)信息:http://git.oschina.net/puguoan/Crawler

          可以與Shell DOS命令等配合組成跨平臺(tái)、分布式、多線程的爬蟲

          瀏覽 25
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          編輯 分享
          舉報(bào)
          評(píng)論
          圖片
          表情
          推薦
          點(diǎn)贊
          評(píng)論
          收藏
          分享

          手機(jī)掃一掃分享

          編輯 分享
          舉報(bào)
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  黄色视频网站在线看 | 国产综合精品久久久久成人AV | 麻豆视频二区 | 一区二区视频在线 | 亚洲永久精品视频 |