圖像識別技術(shù)在檔案OCR工作中的應(yīng)用
原載于《中國檔案報》
作者:徐亮
光學(xué)字符識別(Optical Character Recognition,OCR)是將圖像中的文字信息轉(zhuǎn)化為可供計算機(jī)處理的字符信息的技術(shù),發(fā)揮著計算機(jī)“眼睛”的功能,是機(jī)器與現(xiàn)實(shí)世界進(jìn)行視覺交互的重要技術(shù)基礎(chǔ)。早期的OCR技術(shù)可追溯到1870年,電報技術(shù)和為盲人設(shè)計的閱讀設(shè)備的出現(xiàn)標(biāo)志著OCR的誕生。近年來,隨著人工智能技術(shù)在OCR中的實(shí)際應(yīng)用,OCR的性能和效率都得到了很大的提升。如今,基于人工智能的OCR已經(jīng)廣泛應(yīng)用于金融、交通、政務(wù)、司法、醫(yī)療等多個領(lǐng)域,進(jìn)入到人們生產(chǎn)生活的方方面面。
檔案OCR是利用OCR技術(shù)對紙質(zhì)檔案數(shù)字化副本等圖像文件中的字符形狀進(jìn)行識別、文字轉(zhuǎn)換和文本輸出、呈現(xiàn)的過程。利用人工智能技術(shù)開展檔案OCR工作,對于提高工作效率和準(zhǔn)確性,加快自動著錄、全文檢索、數(shù)據(jù)分析等系統(tǒng)功能更好實(shí)現(xiàn),推動檔案信息資源建設(shè)從數(shù)字化向數(shù)據(jù)化轉(zhuǎn)型具有重要意義。
檔案OCR工作現(xiàn)狀
傳統(tǒng)OCR的不足
基于人工智能技術(shù)的OCR
編輯:SAN
End 
聲明:部分內(nèi)容來源于網(wǎng)絡(luò),僅供讀者學(xué)術(shù)交流之目的。文章版權(quán)歸原作者所有。如有不妥,請聯(lián)系刪除。

