gpt-3.5-turbo 모델 사용시 temperature 를 “0”으로 설정해도 결과가 일정하지 않다. 그리고 어떤 경우는 성능이 더 좋아지고, 어떤 경우는 성능이 더 나빠지기도 한다. 이건 gp
gpt-3.5-turbo 모델 사용시 temperature 를 “0”으로 설정해도 결과가 일정하지 않다. 그리고 어떤 경우는 성능이 더 좋아지고, 어떤 경우는 성능이 더 나빠지기도 한다. 이건 gpt-4 도 비슷하다. 그리고 gpt-4 를 사용할 때 생성 속도가 gpt-3.5-turbo 와 큰 차이가 나지 않는 경우가 높은 비율로 있다. 이와 함께 몇가지 다른 정황을 보면 이런 합리적인(?) 추측을 해 볼 수 있는데, gpt-4 는 조금씩 다른 경향을 가진 gpt-3.5-turbo 모델을 조합하여 추론하는 것이고, gpt-3.5-turbo 는 이 모델 중의 하나로 추론을 하는 것이 아닐까? gpt-4 는 라우팅을 통해 모델 중 하나를 쓰기도 하고, 컨텍스트 길이와 필요한 성능에 따라 모델 두 세개 정도를 조합 혹은 병합해서 쓰는 것이 아닐까?