執行 OCR (文字識別) Plug-in
這個主題敘述使用 OCR Plug-in,於文件影像頁中辨識文字,並將其轉換為文字資料的方法。活頁夾以相同方式操作。
執行 OCR (文字識別) 的方法
程式
1.
在 Desk 選擇文件,點選工具列或任務工具列的 [OCR(文字辨識)] Plug-in 按鈕。
備註
任務工具列的[實用功能(版本9)]標籤的[執行OCR並轉換成Word文件]是在
[OCR進階設定]對話方塊中將[輸出形式]設定為[Word(*.docx)]的按鈕。
2.
按一下 [設定]。
3.
指定需要的設定。若需要,按一下 [OCR 詳細設定] 以設定特定的資訊。
[OCR 進階設定] 對話框隨即出現。
4.
選擇您所要的選項,然後按一下 [確定]。
[OCR (文字識別) 設定] 對話框隨即出現。
5.
按一下 [確定]。
[OCR (文字識別)] 對話框隨即出現。
6.
按一下 [開始]。
將開始進行處理,並於 [OCR (文字識別)] 對話框中顯示處理進度。
中止OCR處理後,中止時,處理文件將恢復至其原始狀態。無法恢復已經處理的文件。
在
OCR進階設定]對話方塊中選中[指定區域並辨識]時,將顯示[指定區域並辨識]對話方塊。按一下[版面分析],開始自動分析版面,或手動指定區域之後,按一下[開始辨識]。
勾選 [OCR 進階設定] 對話框中的 [顯示 OCR 處理進度] 時,則會出現顯示辨識過程的以下對話框。
備註
- 您也可以對唯讀資料夾中的文件或活頁夾執行 OCR 處理。
- 在處理 OCR 期間,您無法操作 Desk 中的文件。
- 之前的辨識結果將被新的辨識結果覆寫並捨棄。
- 一次可辨識的字元數在 2 萬個字元以內。超過 2 萬個字元時將出現錯誤,處理被中止。此時,如果在進行 OCR 處理之前去除雜點、或在 [指定區域並辨識] 對話框將雜點和影像部分從區域去掉,有時可以正常處理。
- 執行中發生錯誤時,顯示訊息。根據錯誤的內容,會中止處理或進入下一頁或下一份文件。頁面或文件中被跳過的資訊將在處理過程完成後於 [OCR] 對話框的 [狀態] 中顯示。
以下情況將中止處理。
- 磁碟的可用空間不足
- 記憶體不足
- 發生 OCR 軟體錯誤
- 如果是禁止寫入的檔案
- 註解會附加到頁面中
(僅限於設定[自動旋轉頁面至可閱讀的方向]時)
- 禁止文件編輯和轉載的DocuWorks文件時
- 有密碼保護的PDF文件時
- PDF 文件夾時
- DocuWorks檔案和PDF文件以外時
指定辨識區域
您可以指定要處理的 OCR 區域。
勾選 [OCR 進階設定] 對話框中的 [指定區域並辨識],然後啟動 OCR Plug-in。
程式
1.
啟動OCR(文字辨識)時,會出現 [指定區域並辨識]對話框。
如果要自動指定辨識區域,則按一下[版面分析]。
在顯示的文檔影像中,自動顯示框。
如果手動指定辨識區域,則在影像上拖拽創建框。
自動或手動創建框後,選擇該框並且拖拽時,可以移動該框的位置或變更該框的尺寸。
2.
按一下 [開始]。
儲存辨識結果
勾選 [OCR 進階設定] 對話框的 [輸出至檔案] 標籤中的 [將辨識結果輸出為檔案],然後啟動 OCR Plug-in。
檔案格式可以儲存為文字、RTF、Excel、Word 和 CSV。