[OCR(文字识别)设置] 对话框
使用该对话框可指定 OCR 的设置。
单击 [OCR(文字识别)] 对话框中的 [设置],或将 OCR 插件增加到 [插件工具的设置] 对话框的 [当前的插件菜单] 中后,会显示此对话框。
单击 [OCR(文字识别)] 对话框中的 [设置],或将 OCR 插件增加到 [插件工具的设置] 对话框的 [当前的插件菜单] 中后,会显示此对话框。
[处理正常结束时关闭对话框]
成功完成 OCR 的处理后关闭 [OCR(文字识别)] 对话框。
默认情况下将清除该复选框。
默认情况下将清除该复选框。
[仅执行预处理 (不进行OCR处理)]
设定是否不进行OCR处理,仅实施预处理。
默认情况下将清除该复选框。
默认情况下将清除该复选框。
[预处理]
[使页面自动旋转至可阅读的方向]
设定是否自动将页面旋转到方便阅读的方向。
默认情况下将清除该复选框。
默认情况下将清除该复选框。
补充
- 实施预处理时,即使处理页面中存在通过 OCR(文字识别) 处理读取的文本,也不会被删除。
- 含有链接、OLE、日期印、Received印、标题、日期和时间、云状、编组的注释的页面无法旋转。
[OCR 处理的选项设置]
进行OCR相关设置。由于该处理对转至OCR的图像进行,因此不会反映至原文件。
补充
在 [对于彩色图像的 OCR 处理] 中选择 [彩色执行OCR处理] 的情况下,无法设置 [去除输出到 OCR 的图像噪声] 和 [强度]。
[去除输出到 OCR 的图像噪声]
指定是否去除图像的噪声。对于彩色图像,变为黑白两色后再去除噪声。
默认情况下,该复选框处于选中状态。
默认情况下,该复选框处于选中状态。
[强度]
设置噪声去除的强度。默认值为 [正常]。
[对于彩色图像的 OCR 处理]
对彩色和灰阶图像进行 OCR 处理时,可以指定识别率优先还是速度优先。
[转换为黑白并优先识别] 在识别反白的字符及颜色淡的字符,以及背景上的字符等时有效。但与[转换为黑白并速度优先]相比,它的OCR处理时间会长一些。
如果选择[彩色执行OCR处理],则将以彩色模式读入OCR的处理对象图像,输出格式设置为[RTF (*.rtf)]、[Excel (*.xlsx)]或 [Word (*.docx)]时,将以彩色格式输出图像。
默认值为 [转换为黑白并速度优先]。
[转换为黑白并优先识别] 在识别反白的字符及颜色淡的字符,以及背景上的字符等时有效。但与[转换为黑白并速度优先]相比,它的OCR处理时间会长一些。
如果选择[彩色执行OCR处理],则将以彩色模式读入OCR的处理对象图像,输出格式设置为[RTF (*.rtf)]、[Excel (*.xlsx)]或 [Word (*.docx)]时,将以彩色格式输出图像。
默认值为 [转换为黑白并速度优先]。
[OCR 的详细设置]
进行 OCR 的详细设置。
显示 [OCR高级设置] 对话框。
显示 [OCR高级设置] 对话框。
[处理页]
指定要执行 OCR 的页面。
默认值为 [所有页]。
默认值为 [所有页]。
选择PDF文档的OCR处理方法。OCR处理结果写入到新生成的PDF文档中。不会写入到原文档中。
[将所有页面转换为图像并执行OCR]
将PDF文档的页面全体图像化,生成PDF文件,对该文件执行OCR处理。生成的PDF文件的文件名为原文件名加上编号。
处理对象的PDF文档中写入有以前执行的OCR处理结果时,该OCR处理结果将被废弃。
处理对象的PDF文档中写入有以前执行的OCR处理结果时,该OCR处理结果将被废弃。
[仅对页面中的图像部分执行OCR]
抽出PDF文档内的图像进行OCR处理。文本部分非OCR处理对象。
处理对象的PDF文档中写入有以前执行的OCR处理结果时,将追记新的OCR处理结果。
处理对象的PDF文档中写入有以前执行的OCR处理结果时,将追记新的OCR处理结果。