RPA之眼:AI-OCR,Fax-OCR概述

文丨馬磊

OCR是一種與RPA機器人協作的一項重要技術,相當於機器人的眼睛。

OCR是英文“Optical Character Recognition/Reader”的簡稱,光學字符識別。從名字我們不難看出,OCR就是讀取手寫和印刷文字,並把讀取的信息轉換成可以在電腦的Excel,World等軟件上使用的文字信息處理技術。

 當前的信息化社會,大量的文件被電子化,紙質的文件越來越少。但事實上依然存在很多不得不使用紙質文件的情況,比如說街頭調查問卷。OCR技術的誕生可以取代人工讀取紙質文件的工作,並將紙質文件的信息電子化。

RPA之眼:AI-OCR,Fax-OCR概述

RPA和OCR的協作

RPA目前活躍在以金融機關代表的企業中,但是這些企業的紙質媒體和打印數據等非電子化的數據僅僅依靠RPA來進行業務處理的話還是相當困難的。這就爲RPA技術與OCR技術的協同合作提供了契機。

在只有RPA的情況下,需要員工手動把紙質文件的信息錄入到Excel,Word等電子文檔中,然後運行RPA機器人讀取電子文檔中的信息實現業務的自動化處理。

而RPA + OCR的情況下,只需實現掃描好紙質文件,OCR會自動讀取掃描文件,將圖片信息讀取並寫入Excel等文檔中,然後RPA機器人運行,進行業務處理。這個過程完全替代了人工手動錄入,極大地節約了人力成本。

RPA之眼:AI-OCR,Fax-OCR概述

近年來, OCR引起了廣泛關注,但目前的OCR軟件存在精度不高和無法應對非固定文件模板等課題。未來通過在OCR中引入AI的深度機器學習等技術以後,相信一定會解決這個課題。

Fax-OCR是什麼?

RPA之眼:AI-OCR,Fax-OCR概述

Fax-OCR是把傳真機接收的訂單等紙質文件通過OCR技術自動轉爲文本信息的技術。雖說現在社會尤其是國內公司,很多都是網上接單了,但是用傳真接收客戶訂單這種古老的方式還是在一定程度上存在的。尤其是日本的小型公司依然採用這種老舊的接收訂單的方式。如果把傳真資料自動讀入系統將減少大量人工錄入的費時操作,同時人工失誤也會大幅減少。

OCR的注意點

OCR技術確實可以自動實現數據的文本化,也是一項非常有效的效率改善的技術手段,但是現在的階段OCR並非無所不能。

1、無法對應多份文件。

一般來說,OCR 需要讀取文本內容以及文件內容的模板,並定義好抽出的對象數據的位置。但是,由於客戶的文件模板並不統一,文件模板和數據座標位置也不盡相同,這種情況應對起來就比較困難了。所以對於一些既有模板以外的文件要格外注意。

2、文字數據抽出後,必須進行人工確認。

雖然AI-OCR可以通過機器學習技術去識別手寫文字,但是很多不清楚,或者寫法不鮮明的文字還是很難做到完美識別。因此,數據抽出完畢後還是要通過人去確認數據的正確性。

原文地址:https://www.uibot.com.cn/news...
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章