轉載請註明作者和出處:美二 https://blog.csdn.net/qq_32654897/article/details/88579713
背景
(win10 +python3.6.5 )
編寫自動化登錄腳本時,遇到圖形驗證碼,據說tesseract-OCR是最方便的,所以有了這篇帖子(圖形驗證碼百度滴~)
步驟
1. 安裝tesseract
tesseract的下載地址:https://digi.bib.uni-mannheim.de/tesseract/ (按需下載)
本例中下載安裝的是: tesseract-ocr-setup-3.05.00dev.exe
注意一個地方:(記得勾選)
我的安裝路徑:D:\Tesseract-OCR
- 將該路徑添加至系統變量path下
- 添加系統變量TESSDATA_PREFIX —>D:\Tesseract-OCR
*!配置環境變量後cmd–>tesseract無效
*!解決辦法:(無需重啓電腦,重新打開終端窗口即可)
2. 安裝tesserocr(巨坑)
tesserocr的下載地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases
rc 代表不是最終版本
beta 代表測試
rc 代表發佈最終版本前的版本
master 代表最終版本
- pip安裝 建議:pip安裝失敗直接用方法3
pip3 install tesserocr install
我下載的版本:tesserocr-2.2.2-cp36-cp36m-win_amd64.whl
將下載的文件放至:D:\python\venv\Scripts
結果:失敗,提示安裝 Microdoft Visual C++ 14.0
不瞞你說,我真的安裝了,但越來越坑,建議直接下一個方法
- whl安裝
下載對應的.whl文件,切記一定要和tesseract版本對應
pip3 install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl
按照提示,重新輸入:
python -m pip install --upgrade pip
提示版本不對,查看python對應wheel的版本:cmd->python
顯示如下:
查看到對應的版本爲“cp36” “cp36m” “win32”,之前安裝的是win_amd64,所以版本衝突
重新下載win32->tesserocr-2.2.2-cp36-cp36m-win32.whl
(此方法是網上找的,但是在我這兒依然失敗,各位也可以嘗試一下
) - Anaconda安裝
Anaconda下載地址:https://mirrors.ustc.edu.cn/anaconda/archive/
輸入命令:
conda install -c simonflueckiger tesserocr
顯示成功。(^-^)V
3. 驗證tesserocr是否成功安裝
`cmd-->python-->import tesserocr`![驗證成功](https://img-blog.csdnimg.cn/20190315171244161.png)
沒有報錯就證明對了,如上圖。
附:
隨後幫同事電腦安裝了一次(環境是win7+Anaconda)
安裝步驟可參考以上,但需注意兩點
- 將Tesseract-OCR下的tessdata文件夾放置Anaconda的script下
- 添加系統變量TESSDATA_PREFIX 時變量值要具體到script下(C:\ProgramData\Anaconda3\Scripts\tessdata)