python 調用百度ocr_文字識別接口，識別圖片上的文字

原創

littleZhuHui

2020-06-20 01:51

今天試用了一下百度ocr_文字識別功能。

我的想法是用python編程的方式調用百度ocr_文字識別，上傳一幅圖片，識別圖片上的文字

整個過程不難，這裏將一些關鍵點記錄下來。

第一步註冊或登陸百度雲賬號，創建百度應用

進入“百度雲”的控制檯，如下所示：

點擊左側導航欄中的“文字識別” 然後“創建應用”

創建應用的目的是爲了生成三個字符串: appId, apiKey, secretKey 。這三個串在後面的python編程中需要用到

當應用創建完成後，可以看到與應用對應的這三個字符串：

把上面這三個字符串的內容複製下來，以後在python編程中要使用。

接下來點擊左側的SDK下載

第二步，下載SDK

我選擇了python SDK進行下載

下載得到壓縮包文件： aip-python-sdk-2.2.15.zip

將該包解壓到本地：

打開CMD命令窗口，進入到以上setup.py文件所在目錄。執行命令
python setup.py install

這一命令將 “aip”包安裝到了 python的安裝目錄中的Lib\site-packages 子目錄。

第三步編寫測試代碼

下面就可以編寫一個測試程序，測試一下是否可以調用接口，識別圖片上的文字
test.py


#測試百度在線圖片文本識別包
#導入百度的OCR包

from aip import AipOcr

if __name__ == "__main__":
    
    #此處填入在百度雲控制檯處獲得的appId, apiKey, secretKey的實際值
    appId, apiKey, secretKey =['12345678','xxxxxxxxxxx','yyyyyyyyyyyyyyy'] 
    #創建ocr對象
    ocr = AipOcr(appId, apiKey, secretKey)
    with open('pic/piece0.png', 'rb') as fin:
        img = fin.read()    
        res = ocr.basicGeneral(img)
        print(res)

用前面提到的appId, apiKey, secretKey 三個字符串的值替換源碼中相應的內容
並且在源碼文件test.py所在的目錄下有一個字目錄pic,其中存放有一張圖片
piece0.png

我故意選擇了一張有些歪斜，有些雜點的圖片，看看識別效果如何。

識別結果如下：

可以看到，圖片上的文字：“連長” 被正確地識別了出來。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

python 調用百度ocr_文字識別接口，識別圖片上的文字

第一步註冊或登陸百度雲賬號，創建百度應用

第二步，下載SDK

第三步編寫測試代碼

識別結果如下：

.Net 8.0 下的新RPC，IceRPC之試試的新玩法"打洞"

完美替代postman的軟件

Vue mockjs mock.js

關於遊戲付費的一點想法

我通過CKA和CKS啦！

安裝chromadb注意事項

《最新出爐》系列入門篇-Python+Playwright自動化測試-42-強大的可視化追蹤利器Trace Viewer

大數據怎麼學？對大數據開發領域及崗位的詳細解讀，完整理解大數據開發領域技術體系

python 調用百度ocr_文字識別接口，識別圖片上的文字

freeCAD學習筆記一：嘗試一個最簡單的例子

在word中用vba爲選中區域自動添加行號或刪除行號

關於鼠害智能監控的一個設想

python開發的軍棋自動裁判軟件

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

python 調用 百度ocr_文字識別接口，識別圖片上的文字

第一步 註冊或登陸百度雲賬號，創建百度應用

第二步，下載SDK

第三步 編寫測試代碼

識別結果如下：

python 調用百度ocr_文字識別接口，識別圖片上的文字

第一步註冊或登陸百度雲賬號，創建百度應用

第三步編寫測試代碼