The Path to Medical Superintelligence | Microsoft AI
Microsoft AI
MAI-DxO, NEJM 난제 85% 해결한 의료 AI 오케스트레이터
마이크로소프트 AI 팀이 6월 30일 공개한 블로그 ‘The Path to Medical Superintelligence’ 에서 복잡한 진단 과제를 해결하기 위해 ‘Microsoft AI Diagnostic Orchestrator(MAI-DxO)’를 선보였습니다. MAI-DxO는 다양한 LLM을 가상의 다학제 진료팀처럼 조율해 단계별로 질문·검사를 선택하며 최종 진단에 이르는 ‘순차 진단’ 능력을 평가합니다. 연구진은 NEJM 증례 304건을 변환한 새 벤치마크(SD Bench)에서 MAI-DxO+o3 조합이 85.5 % 정확도로 경험 많은 의사 21명의 20 %를 크게 넘어섰고, 검사비도 더 낮았다고 보고했습니다. 특히 오케스트레이터가 비용 상한을 설정해 과잉 검사 위험을 줄인 점이 돋보입니다. 팀은 실제 임상 검증을 거쳐 환자 자가관리와 의사 의사결정을 지원하는 ‘의료 슈퍼지능’ 플랫폼으로 발전시키겠다고 밝혔습니다.
https://microsoft.ai/new/the-path-to-medical-superintelligence/
VMoBA, 3D 블록 어텐션으로 비디오 확산 세 배 빠르게
베이징대와 콰이쇼우 연구팀이 6월 30일 공개한 논문 ‘VMoBA: Mixture-of-Block Attention for Video Diffusion Models’는 장시간·고해상도 비디오 생성의 병목이던 Full 어텐션을 대체할 희소 어텐션을 제안했습니다. 연구진은 사전 학습된 비디오 트랜스포머를 분석해 시·공간 국소성, 쿼리 중요도, 헤드 집중도의 차이를 확인하고, 블록을 레이어마다 1D-2D-3D로 재분할하는 재귀 파티션, 쿼리-글로벌 블록 선택, 누적 유사도 임계 선택을 결합했습니다. 새 기법은 720p 76K 토큰 시퀀스에서 훈련 FLOPs를 2.92배, 지연 시간을 1.48배 단축하면서도 VBench에서 Full 어텐션보다 높은 성능을 보였고 , 추론 단계에서도 2.40배 FLOPs·1.35배 속도 향상을 달성하며 품질 손실을 완화했습니다. 연구진은 코드를 공개하며 “VMoBA가 더 긴 시퀀스와 모바일 장치에 최적화된 비디오 확산 모델 개발을 가속할 것”이라고 밝혔습니다.
https://github.com/KwaiVGI/VMoBA
실무 중심 AI 전문가 양성과정 아이펠 9월개강 사전신청하기 https://bit.ly/3STjPtT
다음 내용이 궁금하다면?
이미 회원이신가요?
2025년 7월 1일 오전 8:24
나는 종종 생산성을 올리기 위한 각종 개발 툴은 물론, 라이브러리나 소스 코드를 구매하기도 한다.
소스 코드의 경우 실제로 써먹지 못하는 경우도 상당수 되긴 하지만, 그래도 구성이나 코드를 보면서 배우는게 있기 때문에 학습 비용이라고 생각하고 가끔 구매하는 편이다.
앞으로의 코테는 설명을 주고 코드를 짜라고 하는 것이 아니라, 코드를 주고 설명을 하라는 것이 유효할 것이다.
내 경우는 이미 그렇게 하고 있는데, 요구사항을 주고 개발을 요청. 결과물이 요구사항대로 개발이 잘 되었다면, 다음 단계로 제출한 코드를 리뷰하며 설명을 요청한다.
데
... 더 보기