📝 DeepSeek R1에 대해서

일단, R1이 뛰어난 모델은 맞다. 하지만, o1을 뛰어넘느냐면 그렇진 않다. 어떤 면에서는 낫고, 어떤면에서는 크게 떨어진다.


다른 모델들에 비해 OpenAI의 모델들이 뛰어난 이유는 그 성능이 다방면에 걸쳐 안정적이라는데에 있다. 이는 내부적으로 훌륭한 평가셋을 가지고 있기 때문일 것이다.


그리고 이것이 아직 학습 데이터와 알고리즘이 다음 레벨로 진입하지 않은 현재, OpenAI의 가장 큰 해자라고 본다.


작은 리소스와 모델로 높은 성능을 보인다는 것도, OpenAI 역시 밖으로 내보내는 모델은 그 차이가 크지 않을 것으로 예상한다.


DeepSeek의 의미는 그 성능보다 오픈소스 생태계가 의미있게 작동한 사례라는 것이다. 아직 Llama도 DeepSeek도 진정한 오픈소스라고 하기는 조금 미묘하긴 하지만, Common Crawl, Llama, 그리고 기타 수많은 공개된 알고리즘들을 통해 오픈소스 생태계가 상업적 회사들을 압도하기 시작한 사례.


Compiler부터 OS, DB까지 IT의 근간이 되는 소프트웨어들은 기업용의 폐쇄된 제품에서 시작하더라도 오픈소스가 그 뒤를 따라잡고 어느 순간 오픈소스가 그 시장을 정복하는게 거의 법칙처럼 자리잡고 있다.


이전에도 Llama의 확장인 Alpaca, Vicuna 등이 채팅 모델의 지평을 넓혔었는데, 이번엔 DeepSeek가 생각 모델의 지평을 넓힌 것이다.


앞으로 더 큰 자원이 필요한 문제가 있을 수 있지만, 그 문제는 아마 당분간은 메타가 풀어서 그 결과를 공개할 것으로 보이므로 오픈소스 AI의 발전이 수그러들 일은 없을 것으로 보인다.


즉, 앞으로 거의 모든 회사에서 LLM 모델을 직접 보유하는 것으로 차별화 될 일은 크지 않을 것이다. 남은건 목적에 맞는 튜닝 역량, 효율적인 서빙, 그리고 서빙 인프라이다.


그리고 DeepSeek는 이런 방향을 더욱 분명하게 해 준 하나의 사례라는 것이 성능보다 더 의미있는 부분이다.

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2025년 1월 26일 오후 3:00

댓글 0

    함께 읽은 게시물

    일 잘하는 사람은 AI를 어떻게 쓸까?

    

    ... 더 보기

    [데이터 분석가가 프로그래밍을 할 줄 알아야 하는 이유]

    데이터 분석에서 데이터를 수집하고 정리하는 과정인 [데이터 전처리]는 업무 시간의 최대 80%를 차지할 정도로 시간이 많이 걸리는 일입니다. 하지만 프로그래밍을 할 줄 아는 데이터 분석가는 아래와 같은 능력을 통해 문제를 효율적으로 해결할수 있습니다. 1. 효율적인 데이터 수집 및 전처리 데이터 분석을 위해서는 먼저 데이터를 수집하고 데이터를 전처리해야 합니다. 이 때 프로그래밍을 사용하면 로우 데이터(Raw Data)를 수집, 집계, 또는 요약하는 복잡한 데이터 전처리 과정을 효율적으로 수행할 수 있... 더 보기

    🎯 유튜브에 100번째 코딩 테스트 문제 풀이 영상을 올렸습니다!

    ... 더 보기

    달레의 코딩 테스트

    www.youtube.com

    달레의 코딩 테스트

    훌륭한 데이터 분석가란 어떤 사람인가?

    ‘훌륭한 데이터 분석가란 어떤 사람인가?’에 대해

    ... 더 보기

    조회 1,582