執行 OCR (文字識別) Plug-in

這個主題敘述使用 OCR Plug-in，於文件影像頁中辨識文字，並將其轉換為文字資料的方法。活頁夾以相同方式操作。

執行 OCR (文字識別) 的方法

程式

1.

在 Desk 選擇文件，點選工具列或任務工具列的 [OCR(文字辨識)] Plug-in 按鈕。

會顯示 [OCR] 對話框。

備註

任務工具列的[實用功能(版本9)]標籤的[執行OCR並轉換成Word文件]是在[OCR進階設定]對話方塊中將[輸出形式]設定為[Word(*.docx)]的按鈕。

2.

按一下 [設定]。

會顯示 [OCR (文字識別) 設定] 對話框。

3.

指定需要的設定。若需要，按一下 [OCR 詳細設定] 以設定特定的資訊。

[OCR 進階設定] 對話框隨即出現。

4.

選擇您所要的選項，然後按一下 [確定]。

[OCR (文字識別) 設定] 對話框隨即出現。

5.

按一下 [確定]。

[OCR (文字識別)] 對話框隨即出現。

6.

按一下 [開始]。

將開始進行處理，並於 [OCR (文字識別)] 對話框中顯示處理進度。

中止OCR處理後，中止時，處理文件將恢復至其原始狀態。無法恢復已經處理的文件。

在 OCR進階設定]對話方塊中選中[指定區域並辨識]時，將顯示[指定區域並辨識]對話方塊。按一下[版面分析]，開始自動分析版面，或手動指定區域之後，按一下[開始辨識]。

勾選 [OCR 進階設定] 對話框中的 [顯示 OCR 處理進度] 時，則會出現顯示辨識過程的以下對話框。

備註

您也可以對唯讀資料夾中的文件或活頁夾執行 OCR 處理。
在處理 OCR 期間，您無法操作 Desk 中的文件。
之前的辨識結果將被新的辨識結果覆寫並捨棄。
一次可辨識的字元數在 2 萬個字元以內。超過 2 萬個字元時將出現錯誤，處理被中止。此時，如果在進行 OCR 處理之前去除雜點、或在 [指定區域並辨識] 對話框將雜點和影像部分從區域去掉，有時可以正常處理。
執行中發生錯誤時，顯示訊息。根據錯誤的內容，會中止處理或進入下一頁或下一份文件。頁面或文件中被跳過的資訊將在處理過程完成後於 [OCR] 對話框的 [狀態] 中顯示。
以下情況將中止處理。

磁碟的可用空間不足
記憶體不足
發生 OCR 軟體錯誤

若發生下列狀況，則會移到下一頁或處理文件：

如果是禁止寫入的檔案
註解會附加到頁面中
(僅限於設定[自動旋轉頁面至可閱讀的方向]時)
禁止文件編輯和轉載的DocuWorks文件時
有密碼保護的PDF文件時
PDF 文件夾時
DocuWorks檔案和PDF文件以外時

指定辨識區域

您可以指定要處理的 OCR 區域。
勾選 [OCR 進階設定] 對話框中的 [指定區域並辨識]，然後啟動 OCR Plug-in。

程式

1.

啟動OCR(文字辨識)時，會出現 [指定區域並辨識]對話框。
如果要自動指定辨識區域，則按一下[版面分析]。

在顯示的文檔影像中，自動顯示框。
如果手動指定辨識區域，則在影像上拖拽創建框。
自動或手動創建框後，選擇該框並且拖拽時，可以移動該框的位置或變更該框的尺寸。

2.

按一下 [開始]。

儲存辨識結果

勾選 [OCR 進階設定] 對話框的 [輸出至檔案] 標籤中的 [將辨識結果輸出為檔案]，然後啟動 OCR Plug-in。
檔案格式可以儲存為文字、RTF、Excel、Word 和 CSV。