安裝OCR Python SDK
支持Python版本:2.7.+ ,3.+
安裝使用Python SDK有如下方式:
- 如果已安裝pip,執行
pip install baidu-aip
即可。 - 如果已安裝setuptools,執行
python setup.py install
即可。
OCR Python SDK目錄結構
├── README.md
├── aip //SDK目錄
│ ├── __init__.py //導出類
│ ├── base.py //aip基類
│ ├── http.py //http請求
│ └── ocr.py //OCR
└── setup.py //setuptools安裝
新建AipOcr
AipOcr是OCR的Python SDK客戶端,爲使用OCR的開發人員提供了一系列的交互方法。
參考如下代碼新建一個AipOcr:
from aip import AipOcr
""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
在上面代碼中,常量APP_ID
在百度智能雲控制檯中創建,常量API_KEY
與SECRET_KEY
是在創建完畢應用後,系統分配給用戶的,均爲字符串,用於標識用戶,爲訪問做簽名驗證,可在AI服務控制檯中的應用列表中查看。
注意:如您以前是百度智能雲的老用戶,其中API_KEY
對應百度智能雲的“Access Key ID”,SECRET_KEY
對應百度智能雲的“Access Key Secret”。
配置AipOcr
如果用戶需要配置AipOcr的網絡請求參數(一般不需要配置),可以在構造AipOcr之後調用接口設置參數,目前只支持以下參數:
接口 | 說明 |
---|---|
setConnectionTimeoutInMillis | 建立連接的超時時間(單位:毫秒 |
setSocketTimeoutInMillis | 通過打開的連接傳輸數據的超時時間(單位:毫秒) |
一般代碼結構爲:
# 讀取圖片
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
#文件下載函數
def file_download(url, file_path):
r = requests.get(url)
with open(file_path, 'wb') as f:
f.write(r.content)
if __name__ == "__main__":
root = tk.Tk()
root.withdraw()
data_dir = filedialog.askdirectory(title='請選擇圖片文件夾') + '/'
print("path is :" + data_dir)
num = 0
for name in os.listdir(data_dir):
print('{0} : {1} 正在處理:'.format(num + 1, name.split('.')[0]))
image = get_file_content(os.path.join(data_dir, name))
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "false"
options["detect_language"] = "false"
options["probability"] = "false"
result_dict = client.basicGeneral(image, options)
result_str = '\n'.join([entity['words'] for entity in result_dict['words_result']])
print("res:" + result_str)
下一篇:接口說明