【光學字元辨認】 OpticalCharacterRecognition,OCR
【辭書名稱】教育大辭書
光學字元辨認,是一種讀入資料的系統。
一般最普遍的資料輸入方法,是透過鍵盤將資料一一鍵入電腦中。
可是,如果待輸入的資料已經是採用特定字體印刷而成,甚至是業經電腦列印完成者,便可以透過光學字元辨認系統來進行資料輸入,而省去鍵盤輸入的操作。
這對龐大印刷資料的輸入有很大的助益。
相對於光學字元辨認系統的是手寫字辨認系統。
其差異是:前者所辨認的是具有特定字體的印刷資料,後者所辨認的是個人的手寫資料。
一般來說,一套字元辨認系統通常包含三大部分,影像掃描器(Imagescanner)、光學字元辨認軟體(或硬體)及輸出介面(Outputinterface)。
其操作原理是:先透過影像掃描器將待輸入之文件掃描成一個影像,這個影像再送給字元辨認軟體(或硬體)進行字元辨認,由於有可供參考的字體,所以,整分影像文件會被轉換成一個個字元所組成的文件檔案。
就像這些字元是由鍵盤輸入的一樣。
最後,這個文件檔案再經由輸出介面,送到其他應用程式(如,文書處理軟體)進行資料輸入後之處理。
OCR裝置基本操作步驟如下:1.將待讀文件置於OCR之輸入器中。
2.將文件傳送入掃描裝置中。
3.用光束掃描文件,產生的反射光線由感光裝置所接收。
4.感光裝置將光學信號送至轉換器轉換成電腦內碼。
5.電腦程式辨認轉換後的電腦內碼,並將無法辨認的內碼顯示在螢幕,由使用者重新輸入。
一般而言,印刷字元辨認的正確率達99%以上,而手寫字體由於較為潦草,且書寫方式因人而異,其辨認技術仍有待進一步突破。
轉自:http://edic.nict.gov.tw/cgi-bin/tudic/gsweb.cgi?o=ddictionary
|