python 調用 百度ocr_文字識別接口,識別圖片上的文字

今天試用了一下 百度ocr_文字識別 功能。

我的想法是用python編程的方式調用 百度ocr_文字識別 ,上傳一幅圖片,識別圖片上的文字

整個過程不難,這裏將一些關鍵點記錄下來。

第一步 註冊或登陸百度雲賬號,創建百度應用

在這裏插入圖片描述

進入“百度雲”的控制檯,如下所示:
在這裏插入圖片描述
點擊左側導航欄中的“文字識別” 然後“創建應用”
在這裏插入圖片描述
創建應用的目的是爲了生成三個字符串: appId, apiKey, secretKey 。這三個串在後面的python編程中需要用到

當應用創建完成後,可以看到與應用對應的這三個字符串:
在這裏插入圖片描述
把上面這三個字符串的內容複製下來,以後在python編程中要使用。

接下來點擊左側的SDK下載
在這裏插入圖片描述

第二步,下載SDK

我選擇了python SDK進行下載
在這裏插入圖片描述

下載得到壓縮包文件: aip-python-sdk-2.2.15.zip

將該包解壓到本地:
在這裏插入圖片描述

打開CMD命令窗口,進入到以上setup.py文件所在目錄。執行命令
python setup.py install

這一命令將 “aip”包安裝到了 python的安裝目錄中的Lib\site-packages 子目錄。

第三步 編寫測試代碼

下面就可以編寫一個測試程序,測試一下是否可以調用接口,識別圖片上的文字
test.py


#測試百度在線圖片文本識別包
#導入百度的OCR包

from aip import AipOcr

if __name__ == "__main__":
    
    #此處填入在百度雲控制檯處獲得的appId, apiKey, secretKey的實際值
    appId, apiKey, secretKey =['12345678','xxxxxxxxxxx','yyyyyyyyyyyyyyy'] 
    #創建ocr對象
    ocr = AipOcr(appId, apiKey, secretKey)
    with open('pic/piece0.png', 'rb') as fin:
        img = fin.read()    
        res = ocr.basicGeneral(img)
        print(res)

用前面提到的appId, apiKey, secretKey 三個字符串的值替換源碼中相應的內容
並且在源碼文件test.py所在的目錄下有一個字目錄pic,其中存放有一張圖片
piece0.png
在這裏插入圖片描述
我故意選擇了一張有些歪斜,有些雜點的圖片,看看識別效果如何。

識別結果如下:

在這裏插入圖片描述
可以看到,圖片上的文字 :“連長” 被正確地識別了出來。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章