Papers with Code - Starcraft
Paperswithcode
https://paperswithcode.com/task/starcraft
SOTA의 다양한 벤치마크를 보던 중에, 되게 반가우면서 의외의 태스크를 보게 되었습니다. 바로 대표적인 RTS 게임인 'Starcraft'에 대한 모델과 지표입니다~! 돌이켜보니 지금 AI 열풍의 시발점이 되었던 딥마인드의 알파고 이후로, AI 모델을 스타크래프트에 반영하겠다는 계획을 들었던 기억이 났습니다.
실제 찾아본 바에 따르면, 딥마인드는 2017년 Alpahstar 라는 모델을 발표하였으며 무려 MMR 5~6000(상위 1%)의 성적을 달성 했습니다. 또한 컨트롤과 정보 습득에 대해서도 제한을 하여 유저와 유사하도록 구현하고자 했습니다. 하지만 막상 게임을 이기는 방식들을 보면 다양한 전략 보다 사람이 구현하기 힘든 정밀한 컨트롤 차이가 주요하게 작용했습니다.
개인적으로 이러한 이유는 모델의 학습 방식에 한계라고 생각합니다. '게임' 태스크는 대표적인 '강화 학습' 프로세스를 활용하는 분야이며, 학습을 위해 자원 채취, 유닛 이동 등을 일종의 '미니 게임'으로 분해하여 가르쳤다고 합니다. 그래서 실제 AI의 플레이 영상을 보면 일정한 유닛 구성으로 유사한 플레이를 반복하는 양상을 보게 됩니다.
결국 알파고 때와 달리 기대했던 참신한 플레이를 보여주지 못한 채 알파스타 프로젝트는 마감되었습니다. 지금은 개인적인 차원에서 연구가 되고 있지만 '강화 학습'이라는 전략이 위축되어 주목 할만한 연구는 없는 듯 합니다. 최근 딥마인드가 발표한 단백질 구조, 신소재 개발 모델들을 보면, 지금의 AI 연구는 '잘하게 만들고 싶은 분야를 찾기보다 AI가 잘 할 수 있는 분야'를 찾는게 핵심이 아닌가 싶습니다 : )
## 게임 플레이 영상 및 시연
https://www.youtube.com/watch?v=cUTMhmVh1qs
다음 내용이 궁금하다면?
이미 회원이신가요?
2023년 12월 10일 오후 1:09
이
... 더 보기추
... 더 보기