數據擷取軟件 | ABBYY FlexiCapture

ABBYY FlexiCapture 是非常淮確的,可擴展的文檔影像和數據提取軟件,可以自動轉換任何結構,語言或內容的文檔轉換成可用的和可訪問的業務就緒數據。

智能的自學分類和國家的最先進的識別技術使FlexiCapture,以取代自動文檔分類和處理容易出錯的手動流程。

靈活和可定制的,FlexiCapture可以處理幾乎所有的文檔處理方案,並可以針對任何公司的工作流程和規定。

為什麽選擇 ABBYY FlexiCapture?

加速數據輸入業務流程的軟件

一個系統就可處理所有類型的商業文件

智能自動學習技術,使得設置簡單

交互式培訓技術簡化了系統的實施和建立。

移動文檔捕獲

FlexiCapture的手機客戶端拍攝提供了文檔的替代切入點 – 隨時可用,從任何地方。

采集數據,離開紙張。

產品亮點

自動化文檔分類

  • 任何文檔導入到系統后自動分離和分類;
  • 分類規則的設置沒有限制;
  • 隨著企業業務的發展而不斷擴展的大量數據和文檔處理可擴展性。

準確的表格數據提取能力

  • 表格行列的自動識別和數據提取
  • 通過點擊和自動匹配簡單設置
  • 能跨頁提取多頁表格或發票的數據
  • 能單獨提取表格中行數據
  • 具有容錯性,因掃描的分辨率不同和頁面識別問題而造成頁面表格的移動
  • 能自定義匹配精確提取數據

自動化處理的工作流程

  • 自動文檔處理,包括導入、分類、識別、提取和導出
  • 採用靈活的處理工作流程,可以輕鬆地調整客戶的具體業務
  • 雙重校驗:針對關鍵的業務數據字段,支持兩個操作員同時獨立校驗

與您現有的業務系統集成使用

數據輸入

FlexiCapture 支持導入來自:

  • 掃描設備 (TWAIN, ISIS, WIA)
  • 監控文件夾 (本地或局域網)
  • FTP 服務器
  • 電子郵件附件(來自MS Exchange服務器和POP3郵件服務器)

支持導入文檔格式:

  • PDF, BMP, JPEG, JPEG 2000, TIFF, DjVu, PNG, PCX, DCX

數據輸出

FlexiCapture 支持輸出到:

  • 文件夾
  • SharePoint 2003/2007/2010/2013
  • 通過ODBC輸出到數據庫
  • 任何ERP系統和發票審批工作流
  • 任何外部可自定義腳本模塊的應用程序

支持輸出格式:

數據輸出格式: .XML, .TXT, .XLS, .DBF, .CSV.
圖像輸出格式: PDF (Image only, text under image), PDF/A (Image only, text under image), TIFF, JPEG, JPEG2000, PCX, BMP, PNG, DCX.

處理所有類型文件的一站式解決方案

通過自動數據輸入軟件加快數據輸入業務流程,消除由於人力錄入造成的時間和資源浪費。智能的捕獲演算法使系統能夠處理任何類型的商業文檔,包括發票、協議、採購訂單、登記表等等。

6470e_all_types_of_documents

從任何文檔捕獲的數據,從結構形式非結構化文本為主的論文。

工作原理?

ABBYY FlexiCapture 支持各種的輸入通道,確保簡單容易的處理任何類型和來源的文檔。它適合于從監控文件夾、FIT服務器和電子郵件下載掃描和圖片。

1. 數據輸入選項

  • 掃描設備 (TWAIN, ISIS, WIA)
  • 監控文件夾(本地或局域網)
  • FTP服務器
  • 電子郵件附件(來自MS Exchange服務器和POP3郵件服務器)

2. 支持輸入文檔格式

  • PDF, BMP, JPEG, JPEG 2000, TIFF, DjVu, PNG, PCX, DCX

3. 掃描站

FlexiCapture掃描站點可輕鬆通過任何TWAIN-、ISIS-和WIA-功能的設備掃描,可兼容胖客戶端方式和瘦客戶端方式。

6470e_scanning_station

4. 掃描配置文件

掃描站點實現選項掃描,預定義的設置應用程序中的被應用到的特定字段。當掃描新部分的文檔,用戶只需要從下拉菜單中選擇正確的選項。

6470e_scanning_profiles

5. 圖像改進

加載或掃描的圖像會在處理前得到改善,例如旋轉、糾偏、隱藏敏感數據等等。

6470e_image_improving

識別階段包括文檔、分類、文本的數據提取和自動驗證的程序集,並且這些階段是同時執行的無人參與模式。

1. 自動將一個混合頁面組合分離為多頁文檔

由於可以探測文檔類型,基於空白頁、頁碼或者ABBYY先進的分類演算法將文檔分割成不同類型,從而能加速模板匹配和數據抽取。

2. 自動文檔分類

  • 内容分類
  • 規則分類
  • 以上任意組合分類

3. 高精確的 OCR/ICR/OMR 和條碼識別技術

  • OCR: 支持包括中日韩越南语超过190种语言
  • ICR: 支持超过110种语言
  • 條碼: 支持各種1D和2D條碼
  • OMR: 支持各種的復選標記

6470e_examples

4. 自動驗證

  • 數据庫比較
  • 符合內置的驗證規則
  • 遵循格式
  • 數據標準化
  • 對其他自定義檢查適用

5. 支持多種語言識別

  • 包含全內置詞典支持的43 種主要語言: 阿拉伯語 (沙烏地阿拉伯),亞美尼亞語 (東部),亞美尼亞 (格拉)、 亞美尼亞 (西部)、 阿澤裏語 (拉丁)、 巴什基爾語、 保加利亞語、 加泰羅尼亞語、 克羅地亞、 捷克、 丹麥語,荷蘭語,荷蘭語 (比利時)、 英語、 愛沙尼亞語、 芬蘭語、 法國、 德國、 德國 (新拼寫)、 希臘、 希伯來語、 匈牙利、印尼、 義大利、 拉脫維亞、 立陶宛、 挪威、 挪威語 (博克馬爾語)、 挪威語 (尼諾斯克語)、 波蘭語、 葡萄牙語,葡萄牙語 (巴西)、 羅馬尼亞、 俄羅斯、 斯洛伐克、 斯洛文尼亞語、 西班牙語、 瑞典語、 韃靼、 泰國、 土耳其、 烏克蘭、 越南;
  • 不含内置词典支持的133 種其他语言: 阿布哈茲、 子音、 南非荷蘭文、 安吉爾、 阿爾巴尼亞、 阿勒泰、 阿瓦爾、 艾馬拉語、 亞塞拜然語 (西瑞爾文)、 巴斯克、 白俄羅斯文、 貝姆巴、 阿爾袞琴、 不列塔尼、 Bugotu、 布裡亞特、 宿務、 查莫羅、 車臣、 楚克其、 楚瓦什、 科西嘉、 克裡米亞韃靼文、 烏鴉、 達爾格瓦文、 鄧,愛斯基摩人 (西瑞爾文),愛斯基摩語 (拉丁語系),甚至,鄂溫克、 法羅語、 斐濟、 弗裡斯蘭、 弗、 加告茲、 加里斯亞文、 甘達、 德語 (盧森堡)、 瓜拉尼、 哈尼族、 豪薩語、 夏威夷、 冰島文、 印尼、 印古什、 愛爾蘭、 景頗族、 卡巴爾達語、 卡爾梅克、 卡拉恰伊-巴爾卡爾土庫曼、 Kasub、 卡瓦、 哈薩克、 中國木偶劇院舉行經典、 漢特、 基庫尤人,柯爾克孜族、 金剛、 寇里亞克、 克佩萊、 Kumyk、 庫爾德、 Lak、 拉丁語、 萊茲吉、 綠霸、 馬其頓、 馬達加斯加人、 馬來文 (馬來西亞)、 馬林、 馬爾他、 曼西、 毛利人、 馬里、 瑪雅、 廟、 米南卡保人、 莫霍克、 摩爾多瓦、 蒙古、 Mordvin、 納瓦特爾語、 涅涅茨、 尼、 Nogay、 尼揚賈、 和 Ojibway、 奧塞梯、 阿門、 普羅旺斯、 克丘亞語、 拉托-羅曼尼奇、 吉卜賽、 潤、 俄羅斯 (舊拼寫)、 盧安達,Sami (拉普蘭),薩摩亞語、 蘇格蘭蓋爾文、 Selkup、 塞爾維亞文 (西瑞爾文)、 塞爾維亞文 (拉丁語)、 紹蘇 (南達科他州)、 索馬里、 索布語、 索托語、 巽他、 史瓦希里文、 農技、 Tabasaran、 他加祿語、 大溪地、 塔吉克、 巴布亞皮欽語、 同安、 茨瓦納語、 屯、 土庫曼、 圖、 烏德莫爾特、 維吾爾文 (西瑞爾文)、 維吾爾文 (拉丁語系)、 烏玆別克文 (西瑞爾文)、 烏玆別克文 (拉丁文)、 威爾士、 沃洛夫文、 科薩語、 雅庫特、 意第緒語、 薩巴特克和祖魯語;
  • 5種東亞語言: 中文(繁體中文,簡體中文)、日語、韓語、朝鮮語(韓國)
  • 6種對印製于17-19世紀的古歐洲文獻和哥特字体的語言識別:
    • 英语,
    • 法语,
    • 德语,
    • 意大利语,
    • 西班牙语,
    • 拉脱维亚語;
  • 4種人造語言: 世界语(Esperanto)、伊多语(Ido)、拉丁国际语/英特林瓜语(Interlingua)和西方语(Occidental);
  •  數字
  • 1D條碼
    • Code 39, Check Code 39, Interleaved 25, Check Interleaved 25, EAN 13, EAN 8, Code 128, Codabar, Code 93, IATA 25, UCC-128, UPC-A, UPC-E, Matrix 2 of 5, Industrial 2 of 5, PostNet, Patch code (1, 2, 3, 4, T/Transfer, 6)
  • 2D條碼
    • PDF 417, Aztec, Datamatrix, QR code
  • 文本字體
    • 印刷、手寫、打字機、矩陣打印機、索引、 OCR-A、 OCR-B、 MICR (E13B)、 MICR (CMC7)
針對人工驗證識別結果,ABBYY FlexiCapture提供了各種驗證模式,使核查更迅速和方便。

1. 核查小组

複選標記和數字的組驗證應用於文檔的窗體識別專案中,從整個文檔批處理和顯示相同的數字(標誌) 。

6470e_group_verification

2. 域驗證

域驗證:逐個檢查數據字段。

6470e_field_verification

3. 驗證文檔窗口

驗證在文檔窗口允許所有必需的數據字段可以同時查看和識別結果與原始圖像進行比較。不通過識別的信息,諸如手寫文本或註釋,可以手動輸入到字段中。

6470e_verification_in_window

數據驗證兼容于胖客戶端和瘦客戶端版本,並且這個是一個可被跳過的操作階段。

1.

ABBYY FlexiCapture 能夠用於數據、圖像以及生成可搜索PDF文檔到多個目的地。

2. 靈活的導出選項

FlexiCapture 支持輸出到:

  • 文件夾
  • SharePoint 2003/2007/2010/2013
  • 通過ODBC輸出到數據庫
  • 任何ERP系統和發票審批工作流
  • 任何外部可自定義腳本模塊的應用程序

FlexiCapture 支持輸出格式:
數據輸出格式: .XML, .TXT, .XLS, .DBF, .CSV。
圖像輸出格式: PDF (Image only, text under image), PDF/A (Image only, text under image), TIFF, JPEG, JPEG2000, PCX, BMP, PNG, DCX。

1. 基於Web的管理和監控控制臺

ABBYY FlexiCapture 提供了一個基於Web的管理和監控控制台,通過Web瀏覽器隨時隨地實現接入監管。管理員可以輕鬆地管理用戶權限,檢查事件日誌,查看標準報告或生成自定義性能報告。

6470e_monitoring_console

2. 電郵提醒

管理員可以選擇接收電子郵件警報壹樣的錯誤,許可證過期和頁數限制的重要事件。管理員也可以通知有關即將數據庫溢出,在運行的磁盤空間不足,請求訪問權限,或失敗的嘗試登錄。

6470e_e_mail_alerts

ABBYY 文檔成像和識別軟件可以量身定制您的工作流程和處理方案。處理之間執行階段的腳本使ABBYY FlexiCapture根據您的需求修改文檔處理。腳本使它可以通過使啓用擴展默認工作流程:

  • 自定義處理階段
  • 連接到其他的OCR / ICR引擎
  • 使用第三方圖像增強工具
  • 使用自定義的驗證客戶端
  • 連接到簽名匹配和其他外部模塊

通過使用Web Service API,FlexiCapture可以作為一個自動文檔分類和數據捕捉模組能輕鬆地被集成到不同的商業應用方案和工作流中。