OCR(文字認識)
Q.1
DocuWorksのOCR(文字認識)を実行したら、文章の一部に英文が含まれる場合の認識結果が思わしくありません。また、英単語間のスペースが取り除かれた認識結果となります。対処方法を教えてください。
A.1
本来、OCR認識処理技術は、日本語と英語で大きく異なります。日本語OCR認識処理で英文を認識しても、十分な認識精度は得られないことをご承知ください。日本語の文章の一部に英語を含むような原稿の場合は、[OCR(文字認識)プロパティ]ダイアログボックスで[空白文字を挿入する]にチェックマークを付けてください。認識結果の英単語間にスペースが挿入されます。
Q.2
TIFFやJPEGなどのイメージファイルをDocuWorks Printerに印刷して作成したDocuWorks文書では、OCR処理を実行できないのはなぜですか?
A.2
元はイメージファイルであっても、DocuWorks Printerに印刷するとOCR認識できないDocuWorks文書になります。TIFF 、JPEG、およびBMPファイルは、Deskウィンドウへのドラッグ&ドロップ、または[ファイル]メニューの[ファイルの取り込み]を選択してDocuWorks文書に変換すれば、OCR処理を実行できます。
Q.3
OCR認識と同時に、認識した結果をファイルに書き出すには?
A.3
次の手順で書き出します。
1.
[OCR(文字認識)]ダイアログボックスの[詳細設定]をクリックします。
2.
[OCRの詳細設定]ダイアログボックスの[ファイル出力]をクリックします。
3.
[認識結果をファイルとして出力する]にチェックマークを付け、出力形式やファイルの保存先などを設定します。
4.
[OK]をクリックします。