亚洲日本中文字幕在线观看,欧美福利在线观看,日韩高清综合,三级黄色小电影网站,精品视频不卡一区北条麻妃,黄色视频在线免费看,黄色操逼片黄色操逼,亚洲色频

點(diǎn)擊上方藍(lán)色“程序猿DD”，選擇“設(shè)為星標(biāo)”

回復(fù)“資源”獲取獨(dú)家整理的學(xué)習(xí)資料！

在我們辦公時(shí)，是不是經(jīng)常遇到圖片內(nèi)容轉(zhuǎn)文字的需求？

你是用什么工具解決的呢？是手機(jī)自帶拍照轉(zhuǎn)文字功能？還是使用 QQ 里面的工具？

今天我們就為大家介紹一款 GitHub 用戶 ianzhao05 剛發(fā)布的小工具 ——textshot，只需要截屏就能實(shí)時(shí)生成文字。讀者也可以通過此項(xiàng)目大致了解如何對(duì)圖像中的文本進(jìn)行識(shí)別。

項(xiàng)目鏈接：

https://github.com/ianzhao05/textshot

使用方法

運(yùn)行 textshot.py，在屏幕上打開一個(gè) overlay，在你希望提取的文字區(qū)域畫一個(gè)矩形。

使用可選的命令行參數(shù)指定語言。例如，python textshot.py eng + fra 將使用英語作為主要語言，使用法語作為次要語言。默認(rèn)值為英語（eng）。同時(shí)確保為其他語言安裝了適用于 Tesseract 的數(shù)據(jù)文件。

建議將熱鍵附加到此工具上。對(duì)于 Windows 來說，可以使用 AutoHotkey 腳本來完成此操作；textshot.ahk 同時(shí)也包含一個(gè)可以使用的示例 AHK 腳本。

如果是 Ubuntu 系統(tǒng)，可以打開「鍵盤設(shè)置」，其中顯示了所有 Gnome 快捷方式。底部有一個(gè)「+」按鈕，可用于添加你自己的快捷方式。單擊并將其命令設(shè)置為 /usr/bin/python3 。如果使用的是 venv，則上面的 python3 路徑應(yīng)指向 venv 的 python3 而不是全局 python3。

部分代碼展示

如何安裝

安裝 Python 3；
復(fù)制 TextShot 庫，并使用跳轉(zhuǎn)命令 cd 進(jìn)入該庫；
（可選項(xiàng)）創(chuàng)建一個(gè)虛擬環(huán)境，例如使用 python -m venv .venv ；
使用 pip install -r requirements.txt 安裝所需的軟件包；
安裝 Google 的 Tesseract OCR 引擎（https://github.com/tesseract-ocr/tesseract），并通過將目錄添加到系統(tǒng)路徑來確?？梢詮拿钚性L問 tesseract。

這個(gè)實(shí)用小工具的開發(fā)也離不開谷歌經(jīng)典 OCR 開源項(xiàng)目 Tesseract。

Tessract 的使用

Tesseract 是目前最好的用于機(jī)器打印字符識(shí)別的開源 OCR 工具。20 世紀(jì) 80 年代由 Hewlett Packard 開發(fā)，2005 年開源，自 2006 年起由谷歌贊助開發(fā)。該工具在受控條件下也能很好地運(yùn)行，但是如果存在大量噪聲或者圖像輸入 Tesseract 前未經(jīng)恰當(dāng)處理，則性能較差。

Tesseract OCR 引擎于 20 世紀(jì) 80 年代出現(xiàn)，更新迭代至今，它已經(jīng)包括內(nèi)置的深度學(xué)習(xí)模型，變成了十分穩(wěn)健的 OCR 工具。而 Tesseract 和 OpenCV 的 EAST 檢測(cè)器是一個(gè)很棒的組合。

Tesseract 支持 Unicode（UTF-8）字符集，可以識(shí)別超過 100 種語言，還包含多種輸出支持，比如純文本、PDF、TSV 等。但是為了得到更好的 OCR 結(jié)果，還必須提升提供給 Tesseract 的圖像的質(zhì)量。

值得注意的是，在執(zhí)行實(shí)際的 OCR 之前，Tesseract 會(huì)在內(nèi)部執(zhí)行多種不同的圖像處理操作（使用 Leptonica 庫）。通常情況下表現(xiàn)不錯(cuò)，但在一些特定的情況下的效果卻不夠好，導(dǎo)致準(zhǔn)確度顯著下降。在將圖像傳遞給 Tesseract 之前，可以嘗試以下圖像處理技術(shù)，但具體使用哪些技術(shù)取決于使用者想要讀取的圖像：