[領域を指定して認識]ダイアログボックス

[OCRの詳細設定]ダイアログボックスで、[領域を指定して認識する]にチェックマークを付けてOCR(文字認識)処理を行った場合に、表示されるダイアログボックスです。DocuWorksの内蔵OCRを使用している場合に表示されます。
OCR処理するページのプレビューが表示され、ページ上のOCR処理をする範囲を、自動、または手動で指定します。
補足
[ページ内のイメージ部分にのみOCR処理を行う]を指定してPDF文書を処理する場合、ページ全体のプレビューは表示されないで、OCR処理の対象になるイメージだけが表示されます。

[レイアウト解析]

OCRエンジンによる自動レイアウト解析をします。クリックすると、下のウィンドウで表示されている文書に、認識枠が表示されます。続いて行うOCR処理のときに、この枠の中が文字認識されます。
すでにレイアウト解析が行われているページに対して、このボタンをクリックした場合は、枠の中の領域に対してレイアウト解析が行われます。
補足
  • 認識枠は、手動で指定することもできます。自動レイアウト解析をしたあとに、手動で認識枠を変更することもできます。
  • 枠を追加するには、下のウィンドウでマウスをドラッグして、矩形の枠を描きます。
  • 枠を移動するには、枠の上でマウスをクリックして選択してから、移動したい位置にドラッグ&ドロップします。
  • 枠のサイズを変更するには、枠の上でマウスをクリックして選択してから、枠の線上にマウスを置いてドラッグします。
  • 枠を削除するには、枠の上でマウスをクリックして選択してから、[削除]をクリックします。

[削除]

選択している認識枠を削除します。

[すべての認識枠を削除]

表示されているすべての認識枠を削除します。

[拡大(+)]、[縮小(-)]

ウィンドウに表示されているページの表示倍率を変更します。設定できる範囲は、等倍、1/2、1/4、1/8、1/16の5段階です。

[開始]

OCR処理を開始します。認識枠が指定されている場合は、その枠の中だけを文字認識します。枠が1つも指定されていない場合は、自動レイアウト解析が行われてから、文字認識を開始します。

[中止]

OCR処理を中止します。このボタンをクリックすると、中止していいかどうかを確認するメッセージが表示されます。

[このページ以降にも適用する]

現在表示しているページで指定した認識枠を、これ以降のページにも適用してOCRを行います。以降のページに対してOCR処理を開始すると、[領域を指定して認識]ダイアログボックスは表示されません。