Claude3의 경제 분석
https://www.youtube.com/watch?v=sjL6Gl6ZIqs AutoGPT, BabyAGI와 같이 다수의 llm agent을 활용하는 시스템에 웹페이지를 시각적으로 인식하는 기능을 추가한 것 같네요. 거기에 Claude3는 경제나 의료 도메인에 더욱 집중해서 훈련되었다고 하니 영상에서 볼 수 있는 것처럼 준수한 성능을 보인 것 같습니다. 하지만 여러가지 의문도 드는데요. 1) 단계별로 나눠진 작업 수행 성능 예를 들어, GDP 상위 10개국의 향후 10년 동안의 GDP 예측치를 수집 및 분석하고, 하위 3개국에 대해서 경제, 사회, 정치, 문화 등의 측면에서 그 이유에 대한 복합적인 분석을 하라, 라는 작업을 지시했을 때 과연 얼마나 주제에 맞고 정확한 답을 낼 지 궁금합니다. 2) 경제, 의료 외의 영역에서의 성능 3) 영어 외의 언어로 된 지시문/웹페이지 이해 역량 작년 AutoGPT류의 서비스들이 처음 등장했을 때, 간단한 웹 검색에서 막혀서 시간을 낭비한 기억이 있습니다. 그래서 실제로 얼마나 활용할 수 있을 지에 대해서는 신중해지네요.