새로운 소식이 넘치는 ‘GTC 2025’ 하이라이트 - NVIDIA Blog Korea
NVIDIA Blog Korea
일단, R1이 뛰어난 모델은 맞다. 하지만, o1을 뛰어넘느냐면 그렇진 않다. 어떤 면에서는 낫고, 어떤면에서는 크게 떨어진다.
다른 모델들에 비해 OpenAI의 모델들이 뛰어난 이유는 그 성능이 다방면에 걸쳐 안정적이라는데에 있다. 이는 내부적으로 훌륭한 평가셋을 가지고 있기 때문일 것이다.
그리고 이것이 아직 학습 데이터와 알고리즘이 다음 레벨로 진입하지 않은 현재, OpenAI의 가장 큰 해자라고 본다.
작은 리소스와 모델로 높은 성능을 보인다는 것도, OpenAI 역시 밖으로 내보내는 모델은 그 차이가 크지 않을 것으로 예상한다.
DeepSeek의 의미는 그 성능보다 오픈소스 생태계가 의미있게 작동한 사례라는 것이다. 아직 Llama도 DeepSeek도 진정한 오픈소스라고 하기는 조금 미묘하긴 하지만, Common Crawl, Llama, 그리고 기타 수많은 공개된 알고리즘들을 통해 오픈소스 생태계가 상업적 회사들을 압도하기 시작한 사례.
Compiler부터 OS, DB까지 IT의 근간이 되는 소프트웨어들은 기업용의 폐쇄된 제품에서 시작하더라도 오픈소스가 그 뒤를 따라잡고 어느 순간 오픈소스가 그 시장을 정복하는게 거의 법칙처럼 자리잡고 있다.
이전에도 Llama의 확장인 Alpaca, Vicuna 등이 채팅 모델의 지평을 넓혔었는데, 이번엔 DeepSeek가 생각 모델의 지평을 넓힌 것이다.
앞으로 더 큰 자원이 필요한 문제가 있을 수 있지만, 그 문제는 아마 당분간은 메타가 풀어서 그 결과를 공개할 것으로 보이므로 오픈소스 AI의 발전이 수그러들 일은 없을 것으로 보인다.
즉, 앞으로 거의 모든 회사에서 LLM 모델을 직접 보유하는 것으로 차별화 될 일은 크지 않을 것이다. 남은건 목적에 맞는 튜닝 역량, 효율적인 서빙, 그리고 서빙 인프라이다.
그리고 DeepSeek는 이런 방향을 더욱 분명하게 해 준 하나의 사례라는 것이 성능보다 더 의미있는 부분이다.
다음 내용이 궁금하다면?
이미 회원이신가요?
2025년 1월 26일 오후 3:00
2
... 더 보기커리어리 질문글에도 보면 일주일에 한번씩은 “ML Engineer, Data Scientist가 되고 싶은데 어떤 것부터 공부를 해야할지 모르겠다.” 는 질문이 자주 올라옵니다. 비슷한 질문이 계속 올라오는 이유는 정해진 답이 없기 때문이라고 생각합니다. 너무나도 다양한 방식으로 ML Engineer가 될 수 있기 때문에 처음 입문을 하시는 분들은 오히려 어떤 방향으로 나아갈지 몰라 갈팡질팡 하시는 것이죠.
... 더 보기다
... 더 보기