[OCR 상세설정] 대화 상자
[OCR(문자인식) 설정] 대화 상자의
[OCR 상세 설정], [환경 설정] 대화 상자의 [DocuWorks Desk
설정]에 있는 [스캔 불러오기]의 [OCR 상세설정]을 클릭하면 표시되는 대화 상자입니다.
DocuWorks의 내장 OCR을 사용하고 있는 경우에 표시됩니다.
OCR(문자 인식)처리의 상세한 설정을 합니다.
DocuWorks의 내장 OCR을 사용하고 있는 경우에 표시됩니다.
OCR(문자 인식)처리의 상세한 설정을 합니다.
[일반] 탭
[인식모드]
인식의 속도, 인식률의 우선도를 선택합니다.
초기값은 [표준]입니다.
초기값은 [표준]입니다.
[인식 문자]
[인식 언어]
인식할 수 있는 언어의 종류를 설정합니다.
초기값은 DocuWorks의 표시 언어와 [영어]입니다.
초기값은 DocuWorks의 표시 언어와 [영어]입니다.
보충
표시 언어가 중국어(간체) 또는 중국어(번체)인 경우는 [중국어(간체)]와 [중국어(번체)]가 선택됩니다.
[공백 문자 삽입]
[언어]에서 [일본어]만 선택한 경우에 유효한 항목입니다. 선택한 경우에는 원고에 스페이스나 탭이 있는 경우에 공백 문자를 삽입합니다.
영어를 인식하는 경우에는 항상 단어와 단어 사이에 자동으로 공백 문자를 삽입합니다.
초기값으로 이 상자가 선택 됩니다.
영어를 인식하는 경우에는 항상 단어와 단어 사이에 자동으로 공백 문자를 삽입합니다.
초기값으로 이 상자가 선택 됩니다.
[영숫자 및 기호를 1byte 문자로 출력]
[언어]에서 [일본어]만 선택한 경우에 유효한 항목입니다. 선택한 경우에는 원고의 영숫자 및 기호를 1byte 문자로 출력합니다.
초기값으로 이 상자가 선택 됩니다.
초기값으로 이 상자가 선택 됩니다.
[문서 레이아웃]
[문서 종류]
문서를 구성하는 요소를 지정합니다.
초기값은 [자동인식 레이아웃]입니다.
초기값은 [자동인식 레이아웃]입니다.
[열]
인식하는 원고의 열을 지정합니다.
초기값은 [자동 감지]입니다.
초기값은 [자동 감지]입니다.
[OCR 처리 진행을 표시]
OCR 처리를 진행 경과를 표시합니다.
초기값은 체크되어 있습니다.
초기값은 체크되어 있습니다.
[부분영역을 지정하여 인식]
페이지의 인식 영역을 지정 여부를 설정합니다. 지정하는 경우는 문자 인식처리의 도중에 [영역을 지정하여 인식] 대화 상자가 표시되어 인식 영역을 지정할 수 있습니다. OCR(문자 인식)의 자동 레이아웃 분석 기능에 의해 영역 지정을 부분적으로 변경하는 경우에도 이용할 수 있습니다.
[자동 deskew(S)를 수행]
인식을 위한 전처리로 기울기 보정 여부를 설정합니다. 기울기 보정의 결과는 문서에는 반영하지 않습니다.
초기값은 체크되어 있습니다.
초기값은 체크되어 있습니다.
[파일로 출력] 탭
이 탭은 [환경 설정] 대화 상자의 [DocuWorks Desk 설정]에 있는 [스캔 불러오기]에서 [OCR 상세설정]을 클릭하여 표시되는 대화 상자에서는 표시되지 않습니다.
[파일로써 인식결과를 출력한다]
OCR의 인식결롸를 지정 파일 형식으로 파일로 저장합니다.
초기값은 체크되어 있지 않습니다.
초기값은 체크되어 있지 않습니다.
[출력 형식]
인식결과를 파일로 출력할 때의 파일 형식을 지정합니다.
초기값은 [RTF (*.rtf)]입니다.
초기값은 [RTF (*.rtf)]입니다.
[저장 옵션]
[이미지 출력]
OCR 처리시에 이미지의 영역과 범위를 출력합니다. [출력 형식]에서 [RTF (*.rtf)] / [Excel (*.xlsx)] / [Word (*.docx)]를 선택한 경우에 지정할 수 있습니다.
초기값은 체크되어 있습니다.
초기값은 체크되어 있습니다.
[레이아웃 재연]
텍스트 상자를 이용하여 레이아웃을 재연합니다. [출력 형식]에서 [RTF (*.rtf)] 또는 [Word (*.docx)]를 선택한 경우에 지정할 수 있습니다. 체크되어 있지 않는 경우는 글자 크기를 유지한 일반 텍스트가 출력됩니다. 이 때, [이미지 출력]이 체크되어 있지 않은 경우는 이미지는 페이지 마지막에 출력됩니다.
초기값은 체크되어 있습니다.
초기값은 체크되어 있습니다.
[테두리 출력]
인식 결과에 포함되는 테두리를 파일로 출력합니다. [출력 형식]에서 [RTF (*.rtf)] 또는 [Word (*.docx)]를 선택한 경우에, [레이아웃 재연]으로 선택한 경우에 지정할 수 있습니다.
초기값은 체크되어 있습니다.
초기값은 체크되어 있습니다.
보충
밑줄(언더라인)이나 "표 영역"으로 설정되어 있지 않은 테두리선 등이 출력됩니다. 표 영역의 테두리는 선택 여부에 관계 없이 출력됩니다.
"표 영역"이란, [일반] 탭의 [문서 레이아웃]을 [자동인식 레이아웃] 또는 [표]로 지정한 경우에 표로 인식되는 영역을 말합니다.
"표 영역"이란, [일반] 탭의 [문서 레이아웃]을 [자동인식 레이아웃] 또는 [표]로 지정한 경우에 표로 인식되는 영역을 말합니다.
[파일이 저장되어 있는 경우]
- [OCR 처리를 지정할 때]
한 문서의 모든 페이지의 OCR 처리가 완료된 후, [다른 이름으로 저장] 대화 상자가 표시됩니다. 출력 파일의 저장할 장소를 지정합니다.
단, [파일 출력 단위]에서 [페이지별 출력]을 선택한 경우는 한 페이지의 OCR 인식처리가 완료될 때 마다 [다른 이름으로 저장] 대화 상자가 표시됩니다.
초기값은 체크되어 있습니다. - [지정된 폴더에 저장]
미리 지정한 폴더에 파일을 저장합니다.
파일 이름은 처리 대상 문서의 파일 이름에서 확장자를 제거한 문자열에, 지정된 출력 포맷의 확장자가 붙은 파일 이름이 됩니다.
[파일 출력 단위]에서 [페이지별 출력]을 선택한 경우는 1페이지의 OCR 인식 처리가 완료될 때마다 지정 폴더에 파일이 저장됩니다. 2페이지 이후는 [환경 설정] 대화 상자의 [DocuWorks Desk 설정]에 있는 [문서 조작]의 [문서 이름 말미에 구분 문자]와 [문서 이름 말미에 있는 숫자의 자리수]에서 설정한 파일 이름입니다.
[파일 출력 단위]
- [문서 파일별 출력]
문서 1 파일에 대해 1 파일 출력합니다.
초기값은 체크되어 있습니다. - [페이지별 출력]
문서 1 페이지에 대해 1 파일 출력합니다.