<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          基于 Spring Cloud 開發(fā)的分布式系統(tǒng),遇到爬蟲、接口盜刷怎么辦?

          共 2484字,需瀏覽 5分鐘

           ·

          2020-07-29 08:19

          來源 |?oschina.net/p/kk-anti-reptile

          kk-anti-reptile是,適用于基于spring-boot開發(fā)的分布式系統(tǒng)的反爬蟲組件。

          系統(tǒng)要求

          • 基于spring-boot開發(fā)(spring-boot1.x, spring-boot2.x均可)
          • 需要使用redis
          工作流程

          kk-anti-reptile使用基于Servlet規(guī)范的的Filter對請求進行過濾,在其內(nèi)部通過spring-boot的擴展點機制,實例化一個Filter,并注入到Spring容器FilterRegistrationBean中,通過Spring注入到Servlet容器中,從而實現(xiàn)對請求的過濾

          在kk-anti-reptile的過濾Filter內(nèi)部,又通過責任鏈模式,將各種不同的過濾規(guī)則織入,并提供抽象接口,可由調(diào)用方進行規(guī)則擴展

          Filter調(diào)用則鏈進行請求過濾,如過濾不通過,則攔截請求,返回狀態(tài)碼509,并輸出驗證碼輸入頁面,輸出驗證碼正確后,調(diào)用過濾規(guī)則鏈對規(guī)則進行重置

          目前規(guī)則鏈中有如下兩個規(guī)則

          ip-rule

          ip-rule通過時間窗口統(tǒng)計當前時間窗口內(nèi)請求數(shù),小于規(guī)定的最大請求數(shù)則可通過,否則不通過。時間窗口、最大請求數(shù)、ip白名單等均可配置

          ua-rule

          ua-rule通過判斷請求攜帶的User-Agent,得到操作系統(tǒng)、設(shè)備信息、瀏覽器信息等,可配置各種維度對請求進行過濾

          命中規(guī)則后

          命中爬蟲和防盜刷規(guī)則后,會阻斷請求,并生成接除阻斷的驗證碼,驗證碼有多種組合方式,如果客戶端可以正確輸入驗證碼,則可以繼續(xù)訪問

          d7a90043a864ba99e76ea88e97872c7f.webp

          驗證碼有中文、英文字母+數(shù)字、簡單算術(shù)三種形式,每種形式又有靜態(tài)圖片和GIF動圖兩種圖片格式,即目前共有如下六種,所有類型的驗證碼會隨機出現(xiàn),目前技術(shù)手段識別難度極高,可有效阻止防止爬蟲大規(guī)模爬取數(shù)據(jù)

          374e1eebd03508a2c771941e57eca846.webp3ec0968b77887ff9ae72a6371eaa3f1e.webp

          d664ae22fada37c5e6fd4adcacf23c09.webp79ccfeed4a9bf81ee793d448543c1e0a.webp

          42faa826669f02ee36ac61067c6e608c.webpc7ca8f37cda766691ff2e3dde13953d0.webp


          接入使用

          后端接入非常簡單,只需要引用kk-anti-reptile的maven依賴,并配置啟用kk-anti-reptile即可 加入maven依賴

          <dependency>
          ????<groupId>cn.keking.projectgroupId>
          ????<artifactId>kk-anti-reptileartifactId>
          ????<version>1.0.0-SNAPSHOTversion>
          dependency>

          配置啟用 kk-anti-reptile

          anti.reptile.manager.enabled=true

          前端需要在統(tǒng)一發(fā)送請求的ajax處加入攔截,攔截到請求返回狀態(tài)碼509后彈出一個新頁面,并把響應(yīng)內(nèi)容轉(zhuǎn)出到頁面中,然后向頁面中傳入后端接口baseUrl參數(shù)即可,以使用axios請求為例:

          import?axios?from?'axios';
          import?{baseUrl}?from?'./config';

          axios.interceptors.response.use(
          ??data?=>?{
          ????return?data;
          ??},
          ??error?=>?{
          ????if?(error.response.status?===?509)?{
          ??????let?html?=?error.response.data;
          ??????let?verifyWindow?=?window.open("","_blank","height=400,width=560");
          ??????verifyWindow.document.write(html);
          ??????verifyWindow.document.getElementById("baseUrl").value?=?baseUrl;
          ????}
          ??}
          );

          export?default?axios;

          注意

          1、apollo-client需啟用bootstrap

          使用apollo配置中心的用戶,由于組件內(nèi)部用到@ConditionalOnProperty,要在application.properties/bootstrap.properties中加入如下樣例配置,(apollo-client需要0.10.0及以上版本)詳見apollo bootstrap說明

          apollo.bootstrap.enabled = true

          2、需要有Redisson連接

          如果項目中有用到Redisson,kk-anti-reptile會自動獲取RedissonClient實例對象; 如果沒用到,需要在配置文件加入如下Redisson連接相關(guān)配置

          spring.redisson.address=redis://192.168.1.204:6379
          spring.redisson.password=xxx
          配置一覽表

          在spring-boot中,所有配置在配置文件都會有自動提示和說明,如下圖 :?

          9788f032d175b480f7dee9dd08ec5d63.webp所有配置都以anti.reptile.manager為前綴,如下為所有配置項及說明

          NAME描述默認值示例
          enabled是否啟用反爬蟲插件truetrue
          include-urls需要反爬的接口列表,以'/'開頭,以','分隔/client,/user
          ip-rule.enabled是否啟用IP Ruletruetrue
          ip-rule.expiration-time時間窗口長度(ms)50005000
          ip-rule.request-max-size單個時間窗口內(nèi),最大請求數(shù)2020
          ip-rule.ignore-ipIP白名單,支持后綴'*'通配,以','分隔192.168.*,127.0.0.1
          ua-rule.enabled是否啟用User-Agent Ruletruetrue
          ua-rule.allowed-linux是否允許Linux系統(tǒng)訪問falsefalse
          ua-rule.allowed-mobile是否允許移動端設(shè)備訪問truetrue
          ua-rule.allowed-pc是否允許移PC設(shè)備訪問truetrue
          ua-rule.allowed-iot是否允許物聯(lián)網(wǎng)設(shè)備訪問falsefalse
          ua-rule.allowed-proxy是否允許代理訪問falsefalse
          瀏覽 16
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  操逼香蕉 | 日韩无在线 | 天天更新成人av 天天日天天操天天 | 精品久久中文 | 亚色国产|