天天噪天天射天天拍,青青草视频网站,在线观看亚洲福利,午夜精品久久久久久久久久久久久蜜桃 ,我要看国产靠逼的,尻屄视屏,国产高清肏屄自拍,操逼视频欧美

作者：劉志軍

來源：Python之禪

做爬蟲總會遇到各種各樣的反爬限制，反爬的第一道防線往往在登錄就出現(xiàn)了，為了限制爬蟲自動登錄，各家使出了渾身解數(shù)，所謂道高一尺魔高一丈。

今天分享個如何簡單處理滑動圖片的驗(yàn)證碼的案例。

類似這種拖動滑塊移動到圖片中缺口位置與之重合的登錄驗(yàn)證在很多網(wǎng)站或者 APP 都比較常見，因?yàn)樗鼘φ鎸?shí)用戶體驗(yàn)友好，容易識別。同時也能攔截掉大部分初級爬蟲。

作為一只 python 爬蟲，如何正確地自動完成這個驗(yàn)證過程呢？

先來分析下，核心問題其實(shí)是要怎么樣找到目標(biāo)缺口的位置，一旦知道了位置，我們就可以借用 selenium 等工具完成拖動的操作。

我們可以借用 opencv 來解決這個問題，主要步驟：

opencv 是什么？

OpenCV（Open Source Computer Vision Library）是開放源代碼計(jì)算機(jī)視覺庫，主要算法涉及圖像處理、計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)相關(guān)方法，可用于開發(fā)實(shí)時的圖像處理、計(jì)算機(jī)視覺以及模式識別程序。

直接安裝

pip install opencv-python

首先將圖片進(jìn)行高斯模糊處理，高斯模糊的主要作用是減少圖像的噪聲，用于預(yù)處理階段。

import cv2 as cv
image = cv.imread(image_path)
blurred = cv.GaussianBlur(image, (5, 5), 0)
cv.imshow("blurred", blurred)

處理后的效果

接著用 Canny 邊緣檢測到得到一個包含“窄邊界”的二值圖像。所謂二值圖像就是黑白圖，只有黑色和白色。

canny = cv.Canny(blurred, 200, 400)
cv.imshow("canny", canny)

輪廓檢測

contours, hierarchy = cv.findContours(canny, cv.RETR_CCOMP, cv.CHAIN_APPROX_SIMPLE)
for i, contour in enumerate(contours):  # 所有輪廓
    x, y, w, h = cv.boundingRect(contour)  # 外接矩形
    cv.rectangle(image, (x, y), (x + w, y + h), (0, 0, 255), 2)
cv.imshow('image', image)

找出所有的輪廓，并用紅色線框?qū)⑵淅L制標(biāo)識出來了，看出來大大小小有幾十個輪廓

剩下的問題就好辦了，我們只需要對輪廓的面積或者周長范圍做限制，就能過濾出目標(biāo)輪廓的位置，前提是我們對目標(biāo)位置的輪廓大小是預(yù)先確定的。

for i, contour in enumerate(contours):  # 所有輪廓
    if 6000 < cv.contourArea(contour) <= 8000 and 300 < cv.arcLength(contour, True) < 500:
        x, y, w, h = cv.boundingRect(contour)  # 外接矩形
        print(x, y, w, h)
        cv.rectangle(image, (x, y), (x + w, y + h), (0, 0, 255), 2)
        cv.imshow('image', image)
        # 找目標(biāo)缺口，第一個可能是滑塊
        if x <= 200:
            continue
        return x + int(w / 2), 675

輪廓的面積大概是 6000 到 8000 之間，周長在 300 到 500 之間，最后用外接矩形獲取該輪廓圖的坐標(biāo)位置和寬高大小。

如上就找到了目標(biāo)位置，剩下的工作就是將滑塊移動到指定位置即可。

作為一只 Python 爬蟲：如何破解滑動驗(yàn)證碼