[OCR(文字認識)設定]ダイアログボックス
OCR処理の設定をします。
[OCR(文字認識)]ダイアログボックスの[設定]をクリックする、または[プラグイン設定]ダイアログボックスで、[OCR(文字認識)]プラグインを[現在のプラグインメニュー]に追加するときに表示されるダイアログボックスです。
[OCR(文字認識)]ダイアログボックスの[設定]をクリックする、または[プラグイン設定]ダイアログボックスで、[OCR(文字認識)]プラグインを[現在のプラグインメニュー]に追加するときに表示されるダイアログボックスです。
[処理が正常終了した場合ダイアログを閉じる]
OCRプラグインの処理が正常終了した場合に、[OCR(文字認識)]ダイアログボックスを閉じるかどうかを設定します。
初期値は、チェックマークが付いていません。
初期値は、チェックマークが付いていません。
[前処理のみ実行する(OCR処理は行いません)]
OCR処理を行わないで、前処理だけを行うかどうかを設定します。
初期値は、チェックマークが付いていません。
初期値は、チェックマークが付いていません。
[前処理]
[読める方向にページを自動回転する]
文字を読める方向にページを自動回転するかしないかを設定します。
初期値は、チェックマークが付いていません。
初期値は、チェックマークが付いていません。
補足
- 前処理を実行する場合は、処理ページにOCR(文字認識)処理で読み取ったテキストがあっても、削除されません。
- リンク、OLE、日付印、タイトル、日時、雲形、グループ化したアノテーションのあるページは、回転できません。
[OCR処理のオプション設定]
OCRに関する設定をします。この処理は、OCRに渡すイメージに対して行われるので、元のファイルには反映されません。
補足
[カラーイメージに対するOCR処理]で[カラーのままOCR処理する]を選択した場合、[OCRに渡すイメージのノイズ除去をする]と[強度]は設定できません。
[OCRに渡すイメージのノイズ除去をする]
イメージのノイズ除去をするかしないかを設定します。カラーイメージの場合は、白黒に2値化してからノイズを除去します。
初期値はチェックマークが付いています。
初期値はチェックマークが付いています。
[強度]
ノイズ除去の強度を設定します。初期値は[ふつう]です。
[カラーイメージに対するOCR処理]
カラー、およびグレースケールイメージをOCR処理するときに、認識率と速度のどちらを優先するかを指定できます。
[白黒に変換して認識率を優先する]は、白抜きの文字や淡い色の文字、背景の上にレイアウトされた文字などの文字認識に有効です。ただし、[白黒に変換して速度を優先する]よりもOCR処理に時間がかかることがあります。
[カラーのままOCR処理する]を選択するとOCR対象のイメージをカラーで読み込み、出力形式が[RTF (*.rtf)]、[Excel (*.xlsx)]、または[Word (*.docx)]に設定されている場合、イメージをカラーで出力します。
初期値は、[白黒に変換して速度を優先する]です。
[白黒に変換して認識率を優先する]は、白抜きの文字や淡い色の文字、背景の上にレイアウトされた文字などの文字認識に有効です。ただし、[白黒に変換して速度を優先する]よりもOCR処理に時間がかかることがあります。
[カラーのままOCR処理する]を選択するとOCR対象のイメージをカラーで読み込み、出力形式が[RTF (*.rtf)]、[Excel (*.xlsx)]、または[Word (*.docx)]に設定されている場合、イメージをカラーで出力します。
初期値は、[白黒に変換して速度を優先する]です。
[OCRの詳細設定]
OCRの詳細な設定をします。
DocuWorksの内蔵OCRを使用している場合は、[OCRの詳細設定]ダイアログボックスが表示されます。
WinReader PROを使用している場合は、[メディアドライブ WinReader PROの設定]ダイアログボックスが表示されます。
DocuWorksの内蔵OCRを使用している場合は、[OCRの詳細設定]ダイアログボックスが表示されます。
WinReader PROを使用している場合は、[メディアドライブ WinReader PROの設定]ダイアログボックスが表示されます。
[処理するページ]
処理するページを指定します。
初期値は、[全ページ]です。
初期値は、[全ページ]です。
[PDFの処理]
PDF文書のOCR処理方法を選択します。OCR処理の結果は、新たに生成されるPDF文書に書き出されます。元の文書には書き出されません。
[全ページをイメージに変換してOCR処理を行う]
PDF文書の全ページをイメージ化したPDFファイルを生成し、そのファイルに対してOCR処理を実行します。生成されるPDFファイルは、元のファイル名に枝番が付いたファイル名になります。
処理対象のPDF文書に以前実行したOCR処理結果が書き込まれている場合、破棄されます。
処理対象のPDF文書に以前実行したOCR処理結果が書き込まれている場合、破棄されます。
[ページ内のイメージ部分にのみOCR処理を行う]
PDF文書内のイメージを抽出してOCR処理します。テキスト部分はOCR処理の対象になりません。
処理対象のPDF文書に以前実行したOCR処理結果が書き込まれている場合、新たなOCR処理結果が追記されます。
処理対象のPDF文書に以前実行したOCR処理結果が書き込まれている場合、新たなOCR処理結果が追記されます。