Paper page - ROCKET-1: Master Open-World Interaction with Visual-Temporal Context Prompting
huggingface.co
시각-시간적 컨텍스트 프롬프팅: Minecraft 정복! 새로운 에이전트 아키텍처의 탄생
이 논문에서는 시각-시간적 컨텍스트 프롬프팅이라는 새로운 계층적 에이전트 아키텍처를 제안합니다. 이 아키텍처는 개방형 세계 상호 작용의 과제를 해결하기 위해 고안되었으며, 특히 시각적 관찰과 시간적 맥락을 활용하여 저수준 정책 모델과 고수준 추론기(예: 대규모 언어 모델) 간의 효율적인 의사 소통을 가능하게 합니다. Minecraft 환경에서 수행된 실험에서는 이 접근 방식을 사용하여 학습된 에이전트가 기존 방법으로는 달성할 수 없었던 복잡한 작업을 완료할 수 있음이 입증되었습니다. 이러한 결과는 제안된 프레임워크가 개방형 세계 환경에서 구현된 의사 결정을 위한 유망한 방향임을 시사합니다.
https://huggingface.co/papers/2410.17856
더 이상 어려운 심전도 해석은 없다! PULSE가 선사하는 정확하고 빠른 진단
이 논문은 심전도(ECG) 이미지 해석을 위해 특별히 설계된 새로운 다중 모드 대규모 언어 모델(MLLM)인 PULSE를 소개합니다. 이 모델은 100만 개 이상의 샘플을 포함하는 새로운 대규모 ECG 이미지 명령어 튜닝 데이터 세트인 ECGInstruct에서 미세 조정되었습니다. ECGInstruct는 다양한 ECG 관련 작업을 다루며 다양한 데이터 소스에서 가져온 것입니다. 저자들은 또한 9개의 서로 다른 데이터 세트에서 4가지 주요 ECG 이미지 해석 작업을 다루는 새로운 평가 벤치마크인 ECGBench를 제시합니다. 실험 결과, PULSE는 여러 도메인 내 및 도메인 외 데이터 세트에서 최첨단 성능을 달성하여 독점 MLLM과 오픈 소스 MLLM 모두를 능가하는 것으로 나타났습니다. 특히 PULSE는 도메인 외 데이터 세트에서 GPT-40에 비해 평균 정확도가 15%에서 30% 향상되었습니다. 이 연구는 임상 응용 분야에서 ECG 이미지 분석 및 해석을 개선하기 위한 MLLM을 사용할 수 있는 가능성을 강조합니다.
https://huggingface.co/papers/2410.19008
[아이펠 11기] AI 입문부터 활용까지! AI개발자 과정! AI학교 아이펠 11기 모집 중: https://bit.ly/aiffel_online_11th
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 10월 28일 오전 7:12
초중고딩 어렸을 적 과학시간에 석유와 석탄이 만들어지는 원리와 과정을 배울 때마다 이해가 되지 않아서 그냥 외웠었다. 석유는 공룡을 비롯 동물이 죽어서 만들어지고 석탄은 식물이 죽어서 만들어진다고 배웠는데, 석탄이야 식물이 워낙 많았고 죽으면 자연스럽게 땅에 묻히니 그럴 수도 있겠다 이해가 되었지만, 석유는 아무리 생각해도 말이 안되었다. 동물이 화석이 될 확율이 극도로 낮다는 점을 생각하면 동물이 한꺼번에 같은 장소에서 갑자기 많이 죽어서 결국 석유까지 될 확율은 매장되어 있는 석유량을 볼 때 더 말이 안된다고 생각했기 때문이다. 그래서 배울 때마다 당시 과학선생님들께 이해가 안된다고 질문을 드렸으나 속시원한 답을 들어본 적은 없었다. 그렇게 10대에 그 궁금증을 묻고 지금까지 잊고 살았다. 그러다 우연히 생각나서 찾아보니...
비행기가 나는 과학적 원리와 마찬가지로 과학자들조차 속 시원하게 설명하기 어려운 질문 중 하나라고 한다. 많은 학설 중 다수의 과학자와 전문가들이 동의하는 하나는 바다 미생물 이론인데, 이 이야기는 들으면서 고개가 끄덕여질 정도로 납득이 되더라.
... 더 보기사람들이 요즘 AI, ChatGPT에게 의존하여 사고력이 저하되고 있다는 이야기가 많이 나온다.
두뇌 발달에 안 좋으니, 80년대에 계산기 쓰지마라, 90년대에 컴퓨터 쓰지마라, 2000년대에 엑셀 팡션 쓰지마라, 2010년에 스마트폰 쓰지마라는 말과 같다는 생각이다.
제
... 더 보기