GPT API의 추론 속도를 이용해 모델 사이즈를 유추할 수 있다는 아이디어로 각 GPT 모델들의 사이즈를 유추해봤습니다. (@tomgoldsteincs) 사이즈가 알려져 있는 davinci 모델
GPT API의 추론 속도를 이용해 모델 사이즈를 유추할 수 있다는 아이디어로 각 GPT 모델들의 사이즈를 유추해봤습니다. (@tomgoldsteincs) 사이즈가 알려져 있는 davinci 모델이 175B라는 것을 기준으로 계산을 해 보았더니 다음과 같이 나왔습니다. • gpt-4: 484B • gpt-4 turbo: 140B • gpt-3.5-turbo: 117B • gpt-3.5-turbo-instruct: 76B • text-davinci-001: 70B 퀀타이제이션 등 모델별로 다른 최적화 기법을 사용하고 있을 수 있고, 서버 상황에 따라 속도가 다를 것이기 때문에 정확한 것은 아니고 재미정도로 보시는게 좋겠습니다. 그보다 멋진 일은, 이러한 계산을 GPT-4를 이용해 한 세션 내에서 쉽게 해결할 수 있게 되었다는 점 입니다. 이 결과는 @tomgoldsteincs님이 제시한 결과를 이용하고 아이디어를 더해 계산을 한 것인데요. 첨부 사진을 보시면 이미지 인식과 코드 생성을 한 세션 내에서 복합적으로 사용해 결과를 내는 것을 보실 수 있습니다. 정말 미래가 또 한 발짝 다가온 느낌이네요.