Gaurav Sen
www.youtube.com
Dropbox의 AI 부사장이라는 사람이 또 DeepSeek에 대해서 엄한 설명을 했나보군.
그 글에서 나온 것들은 대부분 다 이미 옛날부터 당연히 적용하고 있는 것들이고, Dropbox의 AI를 담당하는 사람이 쓴 글이라고는 놀라울 정도로 진짜 중요한 내용이 없음.
일단 기술적으로 가장 중요한 건 SFT 대신 RL(GRPO)을 핵심적인 훈련 기법으로 썼다는 것임.
싸게 만들었다는 것도, 싸다는 것도 진짜 너무 모르고 하는 말인데, 그냥 다른 모델들 몇 개만 찾아봐도 알 수 있다. 그런 사례는 말하기도 귀찮을 정도로 너무 많음.
더불어 지금 대부분 추진하는 하드웨어 인프라 투자는 학습이 아니라 추론, 즉 서비스용임. 이미 추론용으로는 DeepSeek 정도의 사이즈를 사용하는게 대세임.
그리고 설레발치는게 맞다 하더라도, 싸진다 -> 많이 쓴다 -> 공급이 더 필요하다. 이것이 진리임. 수요가 줄어든다는 잘못된 예측임.
전통적으로 소프트웨어 산업은 공급 비용이 제로가 될 때까지 가격을 떨어뜨리라는게 성공 전략의 골든룰임.
다음 내용이 궁금하다면?
이미 회원이신가요?
2025년 1월 28일 오전 5:33
Next.js 까보기: "쓸 줄 아는 개발자"에서 "알고 쓰는 개발자로" 강의를
... 더 보기