Python破解圖形驗證碼(1)---安裝tesseract和tesserocr遇到的那些坑!!!

轉載請註明作者和出處:美二 https://blog.csdn.net/qq_32654897/article/details/88579713

背景

(win10 +python3.6.5 )
編寫自動化登錄腳本時,遇到圖形驗證碼,據說tesseract-OCR是最方便的,所以有了這篇帖子(圖形驗證碼百度滴~)
驗證碼

步驟

1. 安裝tesseract

tesseract的下載地址:https://digi.bib.uni-mannheim.de/tesseract/ (按需下載)
本例中下載安裝的是: tesseract-ocr-setup-3.05.00dev.exe
注意一個地方:(記得勾選)
在這裏插入圖片描述
我的安裝路徑:D:\Tesseract-OCR

  • 將該路徑添加至系統變量path下
  • 添加系統變量TESSDATA_PREFIX —>D:\Tesseract-OCR

*!配置環境變量後cmd–>tesseract無效
*!解決辦法:(無需重啓電腦,重新打開終端窗口即可)

2. 安裝tesserocr(巨坑)

tesserocr的下載地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases

rc 代表不是最終版本
beta 代表測試
rc 代表發佈最終版本前的版本
master 代表最終版本

  1. pip安裝 建議:pip安裝失敗直接用方法3
    pip3 install tesserocr install
    我下載的版本:tesserocr-2.2.2-cp36-cp36m-win_amd64.whl
    將下載的文件放至:D:\python\venv\Scripts
    結果:失敗,提示安裝 Microdoft Visual C++ 14.0
    不瞞你說,我真的安裝了,但越來越坑,建議直接下一個方法
  2. whl安裝
    下載對應的.whl文件,切記一定要和tesseract版本對應
    pip3 install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl提示報錯
    按照提示,重新輸入:
    python -m pip install --upgrade pip
    提示報錯
    提示版本不對,查看python對應wheel的版本:cmd->python
    在這裏插入圖片描述
    顯示如下:
    在這裏插入圖片描述
    查看到對應的版本爲“cp36” “cp36m” “win32”,之前安裝的是win_amd64,所以版本衝突
    重新下載win32->tesserocr-2.2.2-cp36-cp36m-win32.whl
    此方法是網上找的,但是在我這兒依然失敗,各位也可以嘗試一下
  3. Anaconda安裝
    Anaconda下載地址:https://mirrors.ustc.edu.cn/anaconda/archive/在這裏插入圖片描述
    輸入命令:
    conda install -c simonflueckiger tesserocr
    成功啦
    顯示成功。(^-^)V

3. 驗證tesserocr是否成功安裝

`cmd-->python-->import tesserocr`![驗證成功](https://img-blog.csdnimg.cn/20190315171244161.png)

沒有報錯就證明對了,如上圖。

附:
隨後幫同事電腦安裝了一次(環境是win7+Anaconda)
安裝步驟可參考以上,但需注意兩點

  1. 將Tesseract-OCR下的tessdata文件夾放置Anaconda的script下
  2. 添加系統變量TESSDATA_PREFIX 時變量值要具體到script下(C:\ProgramData\Anaconda3\Scripts\tessdata

下篇預告:pycharm導入tesserocr庫報錯該如何解決?(關於python和Anaconda兩套環境的運用)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章