Amazon Bedrock의 파운데이션 모델을 활용한 효과적인 PDF 파싱을 위한 프롬프트 엔지니어링 기법 | Amazon Web Services
Amazon Web Services
PDF는 문서 공유와 보전에는 편리하지만, 내부 데이터를 추출하고 가치 있는 인사이트를 도출하기에는 다양한 기술적 접근이 고려되어야 합니다. PDF 파일에서 데이터를 추출할 때, 추출 대상이 스캔 된 이미지인 경우 일반적으로 광학 문자 인식(Optical Character Recognition, OCR) 기술이 사용됩니다. 그러나 PDF 파일은 텍스트 뿐만 아니라 이미지, 테이블, 차트 등 다양한 요소로 구성되어 있어 OCR 기술만으로는 데이터 추출에 한계가 있습니다.
이러한 경우, GenAI를 활용하여 PDF 파일의 컨텍스트를 이해하고 중요 정보를 추출하는 방식을 고려해 볼 수 있습니다.
주요 프롬프트 엔지니어링 기법은 다음과 같습니다:
작업 설명 (Task Description)
예시 제공 (Few-shot Prompting)
XML 태그 활용 (XML Tag Prompting)
반복적인 질의 (Iterative Querying)
결과 재순환 (Result Recycling)
프롬프트 엔지니어링 기법을 활용하여 실제 프롬프트를 개발하는 경우, 아래와 같은 라이프 사이클을 가지게 됩니다.
테스트 사례 확인: 프롬프트 개발의 첫 단계로, 테스트할 사례를 정의하고 확인 합니다.
예비 프롬프트: 초기 프롬프트를 작성하는 단계 입니다.
사례별 프롬프트 테스트: 작성된 프롬프트를 다양한 사례에 적용하여 테스트 합니다.
프롬프트 구체화: 테스트 결과를 바탕으로 프롬프트를 더욱 구체화하고 개선합니다.
프롬프트 완성: 최종적으로 프롬프트를 완성하는 단계 입니다.
자세한 내용은 아래 블로그를 확인하세요!
https://aws.amazon.com/ko/blogs/tech/amazon-bedrock-claude3-parsing/
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 8월 6일 오전 8:32
1. 우리가 하는 많은 일이 처음입니다. 외부에서도 경험한 사람이 없는 일입니다.
흔히들 브랜딩을 고객 관점에서 생각하지만, 진짜 강력함은 내부에서 시작되고 완성됩니다. 구성원으로부터 시작되는 강력한 브랜드 구축 방법론을 ‘인터널 브랜딩’이라고 하는데요. 여기에는 회사의 가치와 비전, 미션을 직원들의 일상적 행동과 태도로 실천하고 일치시키는 모든 과정이 포함됩니다.
... 더 보기프리미어리그를 비롯한 유럽 축구리그에는 한국에서 뛰는 모든 축구 선수들의 연봉을 합한 것보다 수십 배가 넘는 돈을 버는 선수들이 즐비하다. 이런 일이 왜 가능할까?
... 더 보기리더의 역할은 방향을 제시하고 조직을 이끄는 것이다. 의사결정을 내리는 데 지나치게 시간을 끌거나 아예 결정을 피하는 리더가 있다. 이런 리더가 있는 조직은 점차 무기력해지고 성장의 기회를 놓치게 된다. 여러 가지 단점이 있지만, 가장 큰 단점은 직원들을 게으르게 만든다.
... 더 보기1. 당신 자신을 믿어라. 결코 모방하지 마라.