python本身也有識別圖片轉文字的框架,但是相比調用接口,識別的精度就略顯不行了;
這是 百度AI 的網站: https://ai.baidu.com/ ;
點擊右上角的 控制檯 ,申請或者登陸;
進去之後左側有 【文字識別】:
點擊【創建應用】,創建接口;
之後會得到創建的三個連接密鑰:
AppID
API Key
Secret Key
這三個參數會在後面調用的時候會用到;
同樣,在頁面也可以找到文字識別的技術文檔: https://ai.baidu.com/docs#/OCR-API/top
裏面有調用的例子,基本複製、粘貼,直接調用就能用;
所使用的python包也只需安裝 baidu-aip 即可;
我是用 pycharm工具開發的,所以在設置中直接查找安裝了 baidu-aip ,
如果是windows、linux 用pip安裝: pip install baidu-aip
直接上代碼:
# -*- coding: UTF-8 -*-
from aip import AipOcr
# 定義常量
APP_ID = 'XXXXXXXXX'
API_KEY = 'XXXXXXXXXXXXXXXXXX'
SECRET_KEY = 'XXXXXXXXXXXXXXXXXXXXXXXXXXX'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
""" 讀取圖片 的方法"""
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
#定義圖片的絕對路徑
image = get_file_content('D:/共享文件夾/圖片/123.png')
""" 調用通用文字識別(高精度版) """
restu1 = client.basicAccurate(image);
lists = restu1['words_result'] #列表
for listss in lists:
print(listss['words'])
百度AI 上的文檔也是這個代碼,不會對於新手來說還是不會用(不知道怎麼“調用”);代碼裏的註釋很清楚了,有點python基礎的都可以看懂;
APP_ID = 'XXXXXXXXX'
API_KEY = 'XXXXXXXXXXXXXXXXXX'
SECRET_KEY = 'XXXXXXXXXXXXXXXXXXXXXXXXXXX'
這三個參數裏填寫的就是文章開始你申請的百度AI;
其實最後可以直接 print(restu1)
但是輸出的是 字典、列表,在此我將結果遍歷了一下,從圖片中識別的文字會一行一行顯示,剩下的操作看你咋搞了,存入數據也行,生成表格也行;