OCR(문자인식) 플러그인에 관하여

이미지 데이터의 문자는 그 상태로는 선택하거나 복사할 수 없습니다. OCR(문자인식) 플러그인을 사용하여 텍스트 데이터로 변환하면 그 결과를 검색하거나 복사할 수 있습니다.
OCR(문자 인식) 플러그 인에서는 다음 파일을 OCR 처리할 수 있습니다.
  • DocuWorks 파일 이름의 이미지 페이지
  • PDF 문서
여러 파일을 선택하여 처리할 수 있습니다. DocuWorks 파일과 PDF 문서를 동시에 선택할 수도 있습니다.
여기에서는 내장 OCR에 대하여 설명합니다.
설치 시에 OCR 엔진을 설치하지 않을 경우에는, 내장 OCR을 OCR 플러그인에서 이용할 수 없습니다.
OCR을 이용하면 다음과 같은 조작들을 수행할 수 있습니다.
  • 처리시에 문자를 인식하기 쉽게 하기 위해, 노이즈 제거 및 기울기 보정을 하도록 설정할 수 있습니다. 노이즈 제거 및 기울기 보정 결과는 처리 후의 문서에는 반영되지 않습니다.
  • 처리 중에 인식 처리의 경과를 표시할 수 있습니다.
  • 인식 영역을 설정할 수 있습니다.
  • 컬러 및 그레이 스케일의 이미지를 처리할 때 인식률과 속도 중 어느 것이 우선하는지 선택할 수 있습니다. 두 가지 색상(흑백) 이미지 페이지는 항상 속도를 우선으로 처리됩니다. 인식률을 우선한 처리는 채우기 없음 문자나 흐린 색의 문자, 배경 위에 레이이웃된 문자 등의 문자 인식에 유효합니다. 하지만 이런 경우, OCR 처리를 수행하는 것이 속도 우선인 경우보다 시간이 더 소요됩니다.
  • 인식한 결과를 텍스트 형식, RTF 형식, Excel 형식 및 CSV 형식의 파일로 저장할 수 있습니다.
보충
OCR 처리는 Viewer에서도 할 수 있습니다. 또한, Viewer에서는 OCR 결과를 편집할 수 있습니다.