從零開始OCR字符識別
出發目的:
期末快到了,各種各樣的水課都佈置了寫文章寫報告的作業,這對於我來說簡直就是噩夢,上網參考文章想要引用但是又受限於圖片格式和複製限制,所以我就想着使用ocr識別。
本文就來講講如何使用python和ocr將圖片轉化爲文本。
本文參考wzgg的一篇博客,歡迎看wzgg博客
調用百度的OCR接口進行字符之別
註冊賬號點擊跳轉並創建 圖像識別 > 通用文字識別 應用。
下載
pip3 install baidu-aip
pip和pip3沒有本質區別,只是爲了區別python2和python3.
解釋器from aip import AipOcr,沒有報錯就可以了(這裏wzgg的博客裏有點問題)
因爲暫時還沒有系統學過python 這裏就直接在wzgg的代碼基礎上進行修改了 也算是一種學習吧
from aip import AipOcr
import sys,os
from urllib.request import urlopen
APP_ID = '輸入你的'
API_KEY = '輸入你的'
SECRET_KEY = '輸入你的'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
length = len(sys.argv)
""" 讀取圖片 """
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
""" 調用通用文字識別, 圖片爲本地圖片 """
filename = input()
if not os.path.exists(filename):
print('Target couldn\'t be accessed')
exit(1)
#print(filename)
image = get_file_content(filename)
res=client.general(image)
for item in res['words_result']:
print(item['words'])
我實現的是本地的ocr識別只需要在運行時輸入圖片地址即可。
下面給出我的成功示例。