OCR ——光學字符識別

OCR究竟是什麼?

光學字符識別或OCR是一種使您能夠將不同類型的文檔(如掃描的紙張文檔,僅含圖片的PDF檔或數碼相機獲取的圖像)轉換為可編輯可搜索的資料的技術。

所有掃描器可以做的是創建文檔的圖像或快照,這只不過是黑白或彩色點的匯合,稱為點陣影像。為了從掃描的文檔、攝像機圖像或PDF中提取和重新利用資料,您需要一個能將圖片上字母挑出,將它們組成單詞並轉換為句子的OCR軟件,從而使您能夠訪問及編輯原始文檔的內容。

OCR究竟有什麼技術?

最先進的光學字符識別系統,如ABBYY FineReader OCR,專注于複製自然的或“像動物一樣的”識別。這些系統的核心在於三個基本原則:完整性、有目的性和適應性。完整性原則即,觀察物件必須總是被認為是由許多相互關聯的部分組成的“整體”。目的性原則假定對資料的任何解釋必須總是用於某種目的。適應性原則意味著程式必須能夠自我學習。

FineReader OCR通過​​幾個步驟識別文本:

  1. 分析文檔圖像的結構
  2. 將頁面劃分為諸如文本、表格、圖像等元素
  3. 行被分成單詞,然後分成字符
  4. 然後程式將字符與一組圖案圖像進行比較。
  5. 基於這些假設,程式分析將行分解成詞和字的不同變體。
  6.  該程序最終做出結論,向您呈現識別的文本。此外,ABBYY FineReader為48種語言提供字典支援。這使得能夠在詞組級別上對文本元素進行二次分析。借助字典支援,該程式確保對文檔的更準確的分析和識別,並簡化對識別結果的進一步驗證。

人們不必作為OCR專家來瞭解基於IPA原則構建的OCR應用程式的優點。這些原則賦予該項目最大的靈活性和智慧,使其盡可能接近人工識別。

經過多年的研究,ABBYY能夠在其OCR技術中實施上述IPA原則。

數碼相機圖像識別

由數碼相機捕獲的圖像與掃描的文檔或僅含圖像的PDF不同。它們通常具有缺陷,例如邊緣處的失真和光線不足,使大多數OCR應用難以正確地識別文本。最新版本的 ABBYY FineReader支持專門為處理攝像機圖像而設計的自我調整識別技術。它提供了一系列功能,以提高這些圖像的品質,使您能夠充分利用您的數位設備的功能。

有關識別數碼相機OCR的更多資訊 請與我們聯繫 >>.

如何使用OC軟件?

ABBYY FineReader OCR易於使用:過程一般包括三個階段:打開(掃描)文檔、識別,然後以方便的格式(DOC,RTF,XLS,PDF,HTML,TXT等)保存或直接將資料匯出到一個Office應用程式,如Microsoft Word,Excel或Adobe Acrobat。

此外,最新版本的ABBYY FineReader支援自動任務模式,當您定期處理常規任務時,這是必不可少的。使用此功能,識別任務自動運行,而不必手動執行所有上述步驟。

優點

  • 在創建、處理和重新利用各種文檔時節省大量的時間和精力。
  • 掃描紙質文檔以進一步編輯並能與同事和合作夥伴共用。
  • 提取書籍和雜誌的報價,無需重新鍵入便可利用它們來創建課程研究和論文。
  • 在戶外從橫幅、海報和時間表中擷取文本,然後使用擷取的資訊來完成目的。
  • 使用OCR軟件創建可搜索的PDF文檔。
  • 從原始紙質文檔、圖像或PDF進行資料轉換的整個過程需要不到一分鐘,識別的最終文檔看起來和原始文檔一樣。