본문 바로가기

알PDF OCR, PDF/이미지 파일 속에 있는 문자와 텍스트를 글자로 변환해서 추출하는 방법, PDF/그림 파일을 한글 HWP 파일로 바꾸기, 문자 인식 기능 활용한 텍스트 변환

1. PDF 파일을 한글 문서인 HWP로 변환하기

PDF 파일을 한컴오피스인 아래한글 파일인 HWP로 변환하는 것은 알PDF 프로그램을 실행한 후 'HWP 변환'을 클릭하면 쉽게 변환이 된다.

2. 그림 속 텍스트를 문자로 추출하는 기능 OCR(문자인식) 기능

하지만 문서를 편집하지 못하게 이미지 파일, 그림 파일 자체를 PDF 파일로 만든 경우에는 글자가 있는 것처럼 보이지만 자체가 그림 파일이서 한글파일로 변환해도 글자가 추출되지 않는다. 특히 표와 같은 경우는 추출이 되기도 하고 안되기도 하니 OCR 기능이 나날이 향상되기를 기다려야 한다.

 

3. 종이 문서 속 글자를 스캐너로 스캔하기

 

과거 스캐너로 문서를 스캔할 때 종이 문서의 글자를 텍스트로 추출하는 방법과 비슷하다. 글자의 윤곽을 컴퓨터가 인식해서 텍스트로 인식하는데 일부 문자는 다른 글자로 인식하는 경우도 있다. 이미 오래 전에 나왔던 기능인데 현재는 많이 기능이 향상되었다고 볼 수 있다.

-----------------------------

★ 유튜브 설명 동영상(한컴오피스2022)

 

https://youtu.be/L8e4T_xkW3U

* 입력 - 그림 - 그림에서 글자 가져오기, 그림을 오피스 문서로 변환하기, PDF 파일을 오피스 문서로 변환하기

-----------------------------

1. 알PDF를 다운 받아 설치한다. OCR 기능은 사용을 할 경우에만 추가로 다운로드를 제공한다.

 

http://www.altools.co.kr/Download/ALPDF.aspx?utm_source=altoolsweb&utm_medium=product&utm_campaign=ALPDF

 

2. 알PDF를 실행한 후 문서를 연다. 

3. 상단메뉴 중 'OCR'을 클릭한다. 

OCR이 설치되어 있지 않은 채로 설치되기 때문에 추가로 OCR을 다운받아 설치해야 한다. 용량이 100메가가 넘어 다운과 설치가 오래 걸린다. OCR 기능은 문자 인식 기능으로 이미지 형태로 된 문서나 그림과 사진 및 이미지 등에서 텍스트를 자동 인식해서 추출해내는 기능이다.

 

4. 문자인식 언어를 선택한 후 확인을 누른다. 

 

5. 변환, 추출 과정이 좀 오래 걸리니 참을성 있게 기다린다. 하지만 최근에는 속도가 많이 향상이 된 느낌이다.

 

 

6. 추출과 변환이 완료되면 엑셀처럼 새로운 파일이 아래 그림처럼 새탭에 생긴다.

 

추출과 변환이 끝나면 원본 파일 옆에 새로운 파일 이름에 _OCR.pdf 확장자가 바뀌는데 일단 저장하고 변환을 하라고 자꾸 말하는데 무시해도 되기는 한데 일단 파일을 원하는 폴더에 저장하는 것을 추천한다.

 

7. 상단 메뉴의 'HWP 변환하기' 클릭한다. 

 

 

8. 한글파일로 변환하기 전 원본 PDF 파일을 저장해야 한다. 무조건...

 

 

9. 저장 후 변환 창의 하단, '변환'을 클릭한다.

 

 

10. 변환이 완료된 후 '출력 폴더'를 클릭해 변환된 한글파일 HWP를 확인한다.

 

 

11. 표 같은 경우 전체가 표로 한글파일로 추출되는 경우도 있고 행만 따로 추출되는 경우도 있다. 아직은 완벽하지 않다.

--------------------------------

OCR(이미지 문자 인식) 그림 파일 텍스트 한글 추출하기 변환하기, 문자로 바꾸기

한글 배포용 문서, 수정하기 문서 변환기, 편집

PDF 용량 줄이기, HWP 변환, PDF 편집, 합치기 분할엑셀 JPG PPT

Pdf Hwp 변환, ezPDF Editor3.0, Pdf파일 Hwp파일로, 이지피디에프에디터

pdf hwp ocr 변환, 한글2018 프로그램으로 문자인식, 이미지 글자 추출