<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          作為一只 Python 爬蟲:如何破解滑動驗(yàn)證碼

          共 2672字,需瀏覽 6分鐘

           ·

          2021-03-27 12:26

          作者:劉志軍
          來源:Python之禪

          做爬蟲總會遇到各種各樣的反爬限制,反爬的第一道防線往往在登錄就出現(xiàn)了,為了限制爬蟲自動登錄,各家使出了渾身解數(shù),所謂道高一尺魔高一丈。

          今天分享個如何簡單處理滑動圖片的驗(yàn)證碼的案例。


          類似這種拖動滑塊移動到圖片中缺口位置與之重合的登錄驗(yàn)證在很多網(wǎng)站或者 APP 都比較常見,因?yàn)樗鼘φ鎸?shí)用戶體驗(yàn)友好,容易識別。同時也能攔截掉大部分初級爬蟲。

          作為一只 python 爬蟲,如何正確地自動完成這個驗(yàn)證過程呢?

          先來分析下,核心問題其實(shí)是要怎么樣找到目標(biāo)缺口的位置,一旦知道了位置,我們就可以借用 selenium 等工具完成拖動的操作。

          我們可以借用 opencv 來解決這個問題,主要步驟:


          opencv 是什么?

          OpenCV(Open Source Computer Vision Library)是開放源代碼計(jì)算機(jī)視覺庫,主要算法涉及圖像處理、計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)相關(guān)方法,可用于開發(fā)實(shí)時的圖像處理、計(jì)算機(jī)視覺以及模式識別程序。

          直接安裝

          pip install opencv-python

          首先將圖片進(jìn)行高斯模糊處理,高斯模糊的主要作用是減少圖像的噪聲,用于預(yù)處理階段。

          import cv2 as cv
          image = cv.imread(image_path)
          blurred = cv.GaussianBlur(image, (55), 0)
          cv.imshow("blurred", blurred)

          處理后的效果

          接著用 Canny 邊緣檢測到得到一個包含“窄邊界”的二值圖像。所謂二值圖像就是黑白圖,只有黑色和白色。

          canny = cv.Canny(blurred, 200400)
          cv.imshow("canny", canny)


          輪廓檢測

          contours, hierarchy = cv.findContours(canny, cv.RETR_CCOMP, cv.CHAIN_APPROX_SIMPLE)
          for i, contour in enumerate(contours):  # 所有輪廓
              x, y, w, h = cv.boundingRect(contour)  # 外接矩形
              cv.rectangle(image, (x, y), (x + w, y + h), (00255), 2)
          cv.imshow('image', image)

          找出所有的輪廓,并用紅色線框?qū)⑵淅L制標(biāo)識出來了,看出來大大小小有幾十個輪廓

          剩下的問題就好辦了,我們只需要對輪廓的面積或者周長范圍做限制,就能過濾出目標(biāo)輪廓的位置, 前提是我們對目標(biāo)位置的輪廓大小是預(yù)先確定的。

          for i, contour in enumerate(contours):  # 所有輪廓
              if 6000 < cv.contourArea(contour) <= 8000 and 300 < cv.arcLength(contour, True) < 500:
                  x, y, w, h = cv.boundingRect(contour)  # 外接矩形
                  print(x, y, w, h)
                  cv.rectangle(image, (x, y), (x + w, y + h), (00255), 2)
                  cv.imshow('image', image)
                  # 找目標(biāo)缺口,第一個可能是滑塊
                  if x <= 200:
                      continue
                  return x + int(w / 2), 675

          輪廓的面積大概是 6000 到 8000 之間,周長在 300 到 500 之間, 最后用外接矩形獲取該輪廓圖的坐標(biāo)位置和寬高大小。

          如上就找到了目標(biāo)位置,剩下的工作就是將滑塊移動到指定位置即可。

          瀏覽 44
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點(diǎn)贊
          評論
          收藏
          分享

          手機(jī)掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  波多野结衣av一区二区蜜桃观看 | 欧美日韩一级免费看 | 国产主播中文字幕 | 精品乱子伦一区二区三区在线播放 | 免费 无码 国产免费 |