초대형 AI 언어모델 이해 위해 뭉친 세계 과학자 - MIT Technology Review
MIT Technology Review
커리어리 친구들, MIT Technology Review 뉴스레터에서 초거대 AI 언어 모델 이해를 위해 뭉쳤다는 기사를 전달하면서 다음과 같이 요약했습니다. 인공지능의 복잡한 신경망 속에서 어떤 일이 벌어지는지 알기 어렵습니다. 분명히 결과는 (많은 경우) 훌륭하게 나오는데 그 이유는 알 수 없는 경우가 많습니다. 거대한 인공지능 모델은 테크 대기업이 투자를 쏟아 부어 만들기 때문에 외부에서 그 안을 들여다보기도 어렵습니다. 이에 맞서 세계의 과학자들이 오픈 소스 방식으로 대규모 AI 언어 모델 구축에 나섰습니다. AI 언어 모델을 보다 정확하게 이해하기 위한 노력입니다. 다시 말해, 세계 수백 명의 과학자들이 너무 늦기 전에 AI 언어모델이라는 강력한 신기술을 이해하기 위해 손을 잡았습니다. 얼마 전 국내에서도 네이버가 2040억개의 파라미터를 학습한 초대규모 AI 언어 모델 '하이퍼클로바(HyperClova)'를 선보였습니다. 1750억개의 파라미터로 학습한 GPT-3보다 큰 모델입니다. LG전자와 SK텔레콤도 초대규모 AI 개발 계획을 밝힌 바 있습니다. 구글은 최근 열린 개발자 행사 I/O에서 대화 형식으로 사용자 질문에 답하는 람다(LaMDA)라는 초거대 대화형 AI 시스템을 공개했습니다. 한편, 초거대 AI 언어 모델에 대한 기대가 커지고 있지만, 한편에선 이들 AI 모델이 인터넷에 만연한 편견(bias)을 학습해 이를 확대재생산하지 않을까 우려하고 있습니다. 이들 AI 모델 내부에서 어떤 과정을 거쳐 우리가 접하는 결과가 나오는지 알 기 어렵다는 점도 곤란한 점입니다. 하지만 소수 대형 테크 기업 아니면 이런 AI 모델을 만들 수 없기 때문에 외부에서 검증도 어렵습니다. 이런 문제를 해결하기 위해 개방형 연구에 나선 과학자들이 있습니다. 허깅페이스(HuggingFace)라는 스타트업의 커뮤니티 주축이 된 오픈소스 AI 언어모델 구축 작업 '빅사이언스 프로젝트'에 세계 500여 명의 연구자들이 참여하고 있습니다. 이들이 만드는 모델은 외부 연구자들이 인공지능 연구에 활용할 수 있으며, 모델 구축의 모든 과정을 자세히 문서화해 모델이 생성하는 결과에 영향을 미친 요인을 쉽게 찾을 수 있게 할 계획이라고 하는데, 자세한 기사 내용은 아래의 URL을 참조해 주세요!
2021년 6월 9일 오전 2:09