今天試用了一下 百度ocr_文字識別 功能。
我的想法是用python編程的方式調用 百度ocr_文字識別 ,上傳一幅圖片,識別圖片上的文字
整個過程不難,這裏將一些關鍵點記錄下來。
第一步 註冊或登陸百度雲賬號,創建百度應用
進入“百度雲”的控制檯,如下所示:
點擊左側導航欄中的“文字識別” 然後“創建應用”
創建應用的目的是爲了生成三個字符串: appId, apiKey, secretKey 。這三個串在後面的python編程中需要用到
當應用創建完成後,可以看到與應用對應的這三個字符串:
把上面這三個字符串的內容複製下來,以後在python編程中要使用。
接下來點擊左側的SDK下載
第二步,下載SDK
我選擇了python SDK進行下載
下載得到壓縮包文件: aip-python-sdk-2.2.15.zip
將該包解壓到本地:
打開CMD命令窗口,進入到以上setup.py文件所在目錄。執行命令
python setup.py install
這一命令將 “aip”包安裝到了 python的安裝目錄中的Lib\site-packages 子目錄。
第三步 編寫測試代碼
下面就可以編寫一個測試程序,測試一下是否可以調用接口,識別圖片上的文字
test.py
#測試百度在線圖片文本識別包
#導入百度的OCR包
from aip import AipOcr
if __name__ == "__main__":
#此處填入在百度雲控制檯處獲得的appId, apiKey, secretKey的實際值
appId, apiKey, secretKey =['12345678','xxxxxxxxxxx','yyyyyyyyyyyyyyy']
#創建ocr對象
ocr = AipOcr(appId, apiKey, secretKey)
with open('pic/piece0.png', 'rb') as fin:
img = fin.read()
res = ocr.basicGeneral(img)
print(res)
用前面提到的appId, apiKey, secretKey 三個字符串的值替換源碼中相應的內容
並且在源碼文件test.py所在的目錄下有一個字目錄pic,其中存放有一張圖片
piece0.png
我故意選擇了一張有些歪斜,有些雜點的圖片,看看識別效果如何。
識別結果如下:
可以看到,圖片上的文字 :“連長” 被正確地識別了出來。