딥마인드, AI 강화학습에 신기원 '뮤제로' 공개
Zdnet
< 알파고의 진화는 뮤제로로 계속된다 > 딥마인드가 알파고(AlphaGo) > 알파고제로(AlphaGo Zero) > 알파제로(AlphaZero)에 이어 '뮤제로(MuZero)'라는 또 다른 걸출한 인공지능(AI) 알고리즘을 세상에 내놨다. 인공지능(AI)의 한 분야인 강화학습 발전에 신기원을 이뤘고, 범용AI(일반지능AI)에 한발 더 다가섰다는 평가다. 특히 '뮤제로'는 이전 알파고들과 달리 게임 규칙을 모르는 상태(사전에 규칙을 알려주지 않은)에서 강화학습을 사용해 바둑과 체스, 쇼기(일본 장기)를 정복(마스터)했을 뿐 아니라 한발 더 나아가 알파제로가 하지 못한 아타리게임까지 마스터했다. '뮤(Mu)는 라틴어로 산이라는 뜻이다. '뮤제로'가 또 하나의 산을 넘었다는 의미로 보인다. BBC 등 외신에 따르면 딥마인드는 '뮤제로'를 지난 23일(현지시각) 국제학술지 ‘네이처’에 발표했다. 딥마인드는 "뮤제로의 파워풀한 러닝과 플래닝 알고리즘은 로보틱스, 산업 시스템, 게임의 룰이 알려지지 않은 다른 복잡한 현실 환경 문제를 해결하는데 신기원을 열 것"이라고 설명했다. 특히, 딥마인드는 유튜브의 동영상 압축에 뮤제로를 적용하는 방법을 꾀하고 있다. 동영상 압축 효율을 높이면 유튜브 운영에 들어가는 비용을 줄일 수 있기 때문이다.
2020년 12월 27일 오후 1:09