무료 ocr로 이미지의 텍스트를 추출하는 방법

2018. 10. 13. 20:12 / 서기랑

 사진이나 이미지 등의 그림 파일을 보면 그 안에 글자 있는 경우가 있다.

 이렇게 그림파일에 있는 글자는 텍스트가 아니기 때문에 문서 프로그램으로는 수정이나 복사가 불가능한데 어차피 보는 것뿐이라면 상관은 없지만 수정이나 복사가 필요한 경우라면 상황이 달라질 것이다.


이미지의 텍스트를 추출하는 방법

 그림 파일에 있는 글자를 텍스트로 추출하기 위해서는 ocr 프로그램을 사용하면 된다.

 하지만 대충 찾아보면 유료이거나 무료라고 해도 프로그램을 설치해야 하는 경우가 대부분인데 어차피 사용할 일이 많다면 무료 프로그램을 찾아서 설치하고 사용해도 되지만 설치 없이 간단하게 사용하기를 원한다면 구글 드라이버와 문서를 사용하면 된다.


 우선 구글 드라이버에 로그인하고 '새로 만들기 - 파일 업로드'로 텍스트를 추출하고 싶은 그림 파일을 업로드하도록 하자.

 구글 드라이브 바로가기

구글 드라이브 파일 업로드


 그다음 업로드한 그림 파일에서 마우스 우클릭 후 나타나는 메뉴에서 '연결 앱 - Google 문서'를 클릭.

 (한마디로 구글 드라이버에 이미지를 업로드하고 구글 문서로 연결하여 연다고 보면 된다.)

구글 문서로 이미지 열기


 구글 문서가 열리면 문서 안에 그림 파일과 그 아래에 이미지로 된 글자가 텍스트로 추출되어 있는 것을 볼 수 있을 것이다.


 참고로 스샷을 보면 사진을 샤진으로 잘못 추출한 부분이나 가져오기에서 기를 추출하지 못한 것을 볼 수 있는데 이는 글자 폰트가 특이하기 때문에 그런 것이지 인식률이 낮아서 그런 것은 아니며 이미지의 글자만 선명하다면 문제없이 추출이 잘되는 것을 확인할 수 있다.

 (웬만한 프로그램보다 훨씬 잘된다.)