<스탠퍼드 알파카와 파라미터 크기 상관성>
커리어리 친구들, 제가 어제 페북 타임라인에 스탠퍼드 대학교에서 발표한 오픈소스로 구성된 알파카를 설치하고 테스트한 결과를 올렸는 데, 한 지인이 “인공지능에서 왜 파라미터 크기가 중요한지”에 대해 물으셔서 그것에 대한 답변을 여러분들과 공유하고자 합니다. 결론적으로 말해서, LLM (Large Language Model)과 같은 AI 모델에서 파라미터의 크기는 모델의 학습 능력, 표현력과 일반화의 향상을 들 수 있습니다. 🌸 모델의 학습 능력: 파라미터의 수가 많을수록 모델은 더 복잡한 패턴과 관계를 학습할 수 있습니다. 이는 더 복잡한 문제를 해결하고, 더 높은 성능을 달성하는 데 도움이 됩니다. 🌸 표현력: 파라미터가 많은 모델은 더 많은 정보를 저장하고, 더 다양한 기능을 표현할 수 있습니다. 이는 특히 자연어 처리와 같은 복잡한 작업에서 중요한데, 많은 언어적 세부사항과 문맥적 정보를 처리하는 데 도움을 줍니다. 🌸 일반화: 파라미터가 충분히 많은 모델은 새로운 데이터에 대해 더 잘 일반화할 수 있습니다. 모델이 학습 데이터 외의 실제 세계 상황에서 잘 작동하도록 돕습니다. 그래야 다음의 올 새 문장(NSP)에 대해 잘 예측할 수 있습니다. 그러나, 파라미터의 수가 많을수록 모델의 크기와 복잡성이 증가하여 컴퓨팅 리소스 요구사항도 증가합니다. 이로 인해 학습 시간이 늘어나고, 모델을 실행하거나 배포하는 데 필요한 리소스도 증가합니다. 따라서 파라미터의 수는 성능과 컴퓨팅 리소스 사이의 균형을 유지하며 조정해야 합니다. 참고로 알파카는 메타의 오픈소스 라마를 기반하여 7B, 13B, 33B, 65B 개의 파라미터 크기를 가지고 있습니다. 저는 M1 Pro 의 16기가 램을 가지고 있어서 7B(70억개), 13B(130억개) 까지 테스트를 해 보았습니다. 그리고 한글 데이타셋인 KoAlpaca는 워크로드 중입니다. 방식이 좀 달라 환경 차이로 몇 가지 에러가 나서 성공하면 다음번에 또 공유하겠습니다! 이제는 누구나 자기 PC에서 거대 언어 모델을 동작할 수 있는 시대가 열렸습니다 :) 알파카: https://crfm.stanford.edu/2023/03/13/alpaca.html 소스: https://github.com/tatsu-lab/stanford_alpaca