[OCR高级设置] 对话框

单击 [OCR 的详细设置] 或者 [OCR(文字识别) 设置] 对话框[环境设置] 对话框的 [DocuWorks Desk 的设置] 中的 [扫描读入] 中的 [OCR 的详细设置] 时,显示此对话框。使用内置 OCR 时,会显示此对话框。
使用该对话框可指定 OCR 的设置。

[常规] 选项卡

[识别模式]

选择识别速度以及识别准确性的优先度。
默认值为 [标准]。

[识别语言]

设置要识别的语言的种类。
初期值的DocuWorks显示语言为[英文]。
补充
如果要将显示语言设置为中文(简体字)或中文(繁体字),则需勾选[简体中文]和[繁体中文]。

[插入空白字符]

该项目在[识别语言]仅选择了[日语]的情况下,才有效。勾选之后,如果原稿上有空格以及格式标记,则会插入空白字符。
在识别英语的情况下,总是在单词与单词之间自动插入空白字符。
默认值为勾选。

[输出单字节字母数字字符和符号]

该项目在[识别语言]仅选择了[日语]的情况下,才有效。勾选之后,则会输出原稿的单字节字母数字字符和符号。
默认值为勾选。

[文档版面]

[文档类型]

指定要识别原稿的文档类型。
初始值为[自动检测]。

[列]

指定识别原稿的列。
默认值为[自动检测]。

[显示OCR处理的进度]

显示识别过程。
默认情况下,该复选框处于选中状态。

[指定区域并识别]

指导是否设置页面的识别区域。选中此复选框时,将显示 [指定区域并识别] 对话框,从中可以指定识别区域。
通过OCR(文字识别)的自动版面分析功能,在部分变更区域指定时也可使用。

[执行自动倾斜修正]

对文档进行倾斜修正,为 OCR(文字识别)做准备。文档中不反映倾斜修正结果。
默认情况下,该复选框处于选中状态。

[输出到文件] 选项卡

在单击 [环境设置] 对话框的 [DocuWorks Desk 的设置] 中的 [扫描读入] 中的 [OCR 的详细设置] 时所显示的对话框中,不显示此选项卡。

[输出识别结果为文件]

以指定的格式将 OCR 结果保存到文件中。
默认情况下将清除该复选框。

[输出格式]

指定将 OCR 结果保存为文件时的文件格式。
默认设置为 [RTF (*.rtf)]。

[保存选项]

[图像输出]

输出在进行 OCR 处理时被指定为图形的部分。在 [输出格式] 中选择 [RTF (*.rtf)]/[Excel (*.xlsx)]/[Word (*.docx)] 时,不能选择此项。
默认情况下,该复选框处于选中状态。

[重制版面]

再现版面。在 [输出格式] 中选择 [RTF (*.rtf)] 时可以指定此项。不选中此复选框将仅输出纯文本并保留字符大小。如果选中 [图像输出] 复选框,则将图像输出到页面的最后。
默认情况下,该复选框处于选中状态。

[带边框输出]

将识别结果中含有的边框输出到文件中。[输出格式]选择了[RTF (*.rtf)]或[Word (*.docx)]时,在勾选了[重制版面]的情况下,可以指定该设置。
默认值为勾选。
补充
未被设置的网格线等将被作为下划线(underline)和"表格区域"输出。
表格区域的网格线,无论是否勾选,都将被输出。
所谓“表格区域”是指将[常规]选项卡的[文档版面的文档类型]设置为[自动检测]或[表格]的情况下,作为表格进行识别的区域。

[保存文件的位置]

  • [在OCR处理时指定]
    完成文档所有页面的 OCR 处理时,显示 [另存为] 对话框。请设置用于保存文件的文件夹。
    但是,如果在[文件输出单位]选择了[按页输出],则会在每1页的OCR识别处理结束时,跳出[另存为]对话框。
    默认情况下,该复选框处于选中状态。
  • [保存在指定文件夹中]
    将文件保存到以前指定的文件夹中。
    文件名就是处理对象文档的文件名,但删除了其中的扩展名,同时增加了所指定输出格式对应的扩展名。
    如果在[文件输出单位]选择了[按页输出],则会在每1页的OCR识别处理结束时,将文件保存到指定的文件夹。从第2页开始,变为在[环境设置]对话框的[DocuWorks Desk设置]的[文档操作]的[文档末尾的分隔符][文档名末尾的数字位数]中所设置的文件名。

[文件输出单位]

  • [按文档输出]
    对于文档,1对1输出文件。
    默认值为勾选。
  • [按页输出]
    对于文档,其每一页输出一个文件。