이미지 파일 몇 백 장 한번에 텍스트화하기

코딩을 하다 보면 이미지 내의 정보를 디지털화하여 데이터베이스에 저장하거나,

외국어로 작성된 논문 파일의 자료를 번역해야 할 일이 많습니다.

그럴 때 이미지에서 텍스트를 추출하는 OCR 기술이 필요한데요.

별도의 프로그램 설치 없이도 OCR 서비스를 이용할 수 있는 사이트들이 있어 소개해드리려고 합니다.


--------------------------------------------------------------------------------------


혹시 텍스트를 추출하고자 하는 파일이 하나가 아니고

수십 수백 장 단위여도 걱정하실 필요 없습니다.

하나의 파일로 묶어서 업로드하시면 됩니다!


이때 활용할 수 있는 것이 Adobe Acrobat 사이트(https://bit.ly/4dSlU1o)인데,

로그인하지 않고도 무료로 PDF 병합 기능을 활용할 수 있어요 :)


합치고자 하는 파일들을 선택해 업로드만 해주면

클릭 한번 만에 아주 빠른 속도로 병합 작업이 진행됩니다.


하나의 PDF 파일로 합쳐진 이미지들을 

OCR 서비스 사이트에 업로드하시기만 하면 

여러 장의 이미지를 하나의 문서로 텍스트화시키는 것도 전혀 문제 없습니다 :)


만약 이미 Adobe Acrobat을 사용하고 계신 경우라면 여기에서도 OCR 서비스를 제공하고 있기 때문에, 사실 다른 사이트를 찾을 필요가 없어서 활용해보시는 것도 좋겠네요!


--------------------------------------------------------------------------------------


그럼 OCR 기능을 이용할 수 있는 사이트 3곳을 소개해드리겠습니다.


  1. i2OCR (http://www.i2ocr.com/free-online-korean-ocr)

i2OCR은 33개 언어를 인식할 수 있다는 장점이 있습니다.


  1. img2txt (https://img2txt.com/en)

img2txt를 이용하면 직관적이고 간단한 방법으로 이미지를 텍스트로 변환할 수 있습니다. 또한 텍스트를 추출하는 과정에서 원하는 언어로 번역도 가능하다는 장점이 있습니다.


  1. onlineocr (https://www.onlineocr.net/)

onlineOCR은 46가지 언어 인식을 지원하며, 처리 가능한 파일 형식도 PDF, JPEG, GIF, PNG, BMP 등 다양합니다.


세 사이트 모두 언어를 한국어로 설정할 수 있고,

사이트 내에서 빠르게 OCR 기능을 활용할 수 있으니,

필요하실 때 유용하게 쓰시길 바랍니다.


다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 8월 21일 오전 3:44

댓글 0