알파고 이후 구글은 알파스타라는 AI로 스타크레프트 2 게임을 학습시켰다. 그리고 최고 등급인 그랜드마스터(상위 0.2%)에 올랐다. 알파스타가 100개의 유닛을 동시에 컨트롤하는 탈인간적 능력으로 프로게이머를 이겼다고 생각한다면 오산이다. 그것은 계산기가 단순연산을 인간보다 빨리하는 것과 다를 바 없다. 구글은 공정한 게임을 위해 인간이 스타크레프트 게임을 하는 방식과 동일한 조건을 두었다(분당 입력 속도 제한). 구글이 올해 1월 공개한 게임 플레이 영상을 보면 차이가 나는 부분은 탈인간적인 엄청난 컨트롤 영역이 아니라 상대방이 어떤 전략을 펴는지 정보를 획득하고, 그것에 적합한 전략을 세우는 능력이다. 정보를 파악하고 전략을 세우는 것은 투자와 사업에서 제일 중요한 역량이다. 그래서 알파스타의 빠른 발전은 의미가 있다. 1월에 공개한 영상에서 알파스타가 상대한 프로게이머는 최상위 프로게이머는 아니어서 알파스타의 실력이 엄청나다고 말하긴 어렵다. 프로게이머의 세계에서 약간의 실력 차이만으로도 한쪽이 한 판도 못 이길 정도의 결과의 큰 차이가 생기기 때문이다. 하지만 올해 1월 이후 인간이 191년이 게임한 것과 같은 추가 학습을 쌓은 알파스타는 현존하는 최고의 게이머 'Serral'을 뛰어 넘을수도 있겠다. 세랄은 최상위 프로게이머를 상대로 30연승을 한 적이 있을 정도로 압도적인 프로게이머다. 둘의 대결이 성사되길 기대해 본다. "미시적 전략을 위해서 연구진은 알파스타는 스타크래프트2의 개발사인 블리자드가 인공지능 연구그룹에 공개한 기존 플레이어들의 게임 기록을 학습했다. 딥마인드의 수석 과학자 데이비드 실버는 이번주 언론인터뷰에서 “휴먼 데이터는 기본적으로 사람들이 사용하는 전략을 학습하도록 도와준다”며 “이를 통해 어떻게 지상 유닛과 공중 유닛을 사용하는 기본적 개념을 학습했고 이후 알파스타는 스스로를 상대로 게임을 시작해 다양한 전략을 구사하며 점점 자체 업그레이드되었다”고 말했다. 알파스타는 스스로를 상대로 1억2000만번 게임을 플레이했는데, 게임시간을 기준으로 환산하면 191년이 걸리는 기간이다. 알파스타는 인간의 게임 데이터를 통해서 학습했지만, 기본적 능력을 습득한 뒤에는 인간 기준 191년 걸리는 자체 대결을 통해 스스로를 업그레이드했다. 생물학적 시간을 사는 사람으로서는 습득이 불가능한 방법이다."

알파스타, 어떻게 '스타2' 최고수 올랐나

Naver

알파스타, 어떻게 '스타2' 최고수 올랐나

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2019년 11월 1일 오전 8:46

댓글 0