skycaiji基于 PHP 的數(shù)據(jù)采集發(fā)布爬蟲系統(tǒng)
藍天采集器(skycaiji)是一款免費的數(shù)據(jù)采集發(fā)布爬蟲軟件,采用php+mysql開發(fā),可部署在云服務(wù)器,幾乎能采集所有類型的網(wǎng)頁,無縫對接各類CMS建站程序,免登錄實時發(fā)布數(shù)據(jù),全自動無需人工干預(yù)!是大數(shù)據(jù)、云時代網(wǎng)站數(shù)據(jù)自動化采集的最佳云端爬蟲軟件。
-
支持 php5.4~php7
-
支持多級、多頁、分頁抓取
-
支持正則、xpath、json 匹配內(nèi)容
-
可將數(shù)據(jù)導(dǎo)入 cms 系統(tǒng)或自己開發(fā)的程序、直接入庫、保存為文件等
-
實現(xiàn)定時定量全自動采集發(fā)布
-
圖片本地化,可自定義圖片下載目錄
-
代理ip防屏蔽、將內(nèi)容翻譯成各類語言
-
可循環(huán)入庫同頁面格式一致的數(shù)據(jù)列表
-
可以配合谷歌瀏覽器實現(xiàn)網(wǎng)頁渲染自動加載ajax內(nèi)容
-
界面自適應(yīng)寬度,手機也可以操作采集
評論
圖片
表情
