Dropbox의 AI 부사장이라는 사람이 또 DeepSeek에 대해서 엄한 설명을 했나보군.


그 글에서 나온 것들은 대부분 다 이미 옛날부터 당연히 적용하고 있는 것들이고, Dropbox의 AI를 담당하는 사람이 쓴 글이라고는 놀라울 정도로 진짜 중요한 내용이 없음.


일단 기술적으로 가장 중요한 건 SFT 대신 RL(GRPO)을 핵심적인 훈련 기법으로 썼다는 것임.


싸게 만들었다는 것도, 싸다는 것도 진짜 너무 모르고 하는 말인데, 그냥 다른 모델들 몇 개만 찾아봐도 알 수 있다. 그런 사례는 말하기도 귀찮을 정도로 너무 많음.


더불어 지금 대부분 추진하는 하드웨어 인프라 투자는 학습이 아니라 추론, 즉 서비스용임. 이미 추론용으로는 DeepSeek 정도의 사이즈를 사용하는게 대세임.


그리고 설레발치는게 맞다 하더라도, 싸진다 -> 많이 쓴다 -> 공급이 더 필요하다. 이것이 진리임. 수요가 줄어든다는 잘못된 예측임.


전통적으로 소프트웨어 산업은 공급 비용이 제로가 될 때까지 가격을 떨어뜨리라는게 성공 전략의 골든룰임.

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2025년 1월 28일 오전 5:33

댓글 0

    함께 읽은 게시물

    진나라는 어떻게 통일 왕조가 되었나

    중국 전국시대에 객경(客卿) 제도가 있었다. 다른 나라의 인재를 데려와 국가의 요직에 앉히는 것이다. 심지어 국무총리에 해당하는 자리에 외국의 인재를 앉히기도 했다. 말하자면, 미국인을 대한민국의 총리에 임명하는 셈인 것이다.

    ... 더 보기

    조회 576


    이력서 노션으로 절대 쓰지 마세요.

    (다시 돌아온 노션 이력서 절기)

    ... 더 보기

     • 

    댓글 1 • 저장 9 • 조회 3,141


    ⟪커피챗 중독자의 커피챗 후기⟫

    ... 더 보기

    What is YEJI doing? : 네이버 블로그

    blog.naver.com

    What is YEJI doing? : 네이버 블로그