DALL-E 3 의 놀라운 점 첫번째는 글자를 쓴다는 것이고, 두번째는 설명을 이해한다는 것이다. (놀랍지만 놀랍지 않게도 GPT-4V의 리버스 버전이라고 할 수 있겠다) 사실 미드저니도 사실상 가능한 키워드의 조합이지 완전히 글을 그림으로 묘사하는 형태는 아니다. 그런데 DALL-E 3 는 이제 거의 묘사글을 묘사하는 수준으로 완전히 다음 레벨에 도달했다. LLM 같은 단계를 거쳤는데, 성능이 잘 나오는 키워드와 지시를 찾는 것이 엔지니어링의 한 단계인 초기 단계에서, 해당 단계를 고려하지 않아도 더 일반적으로 사용할 수 있는 단계에 도달했다. GPT-4, GPT-4V도 그렇고, ChatGPT도 그렇고, OpenAI는 이렇게 반드시 거쳐야 할 필요한 단계를 점진적으로 정복하는 목표를, 어떻게 저렇게 잘 설정할 수 있었을까? 나는 기술보다 이것이 OpenAI의 진정한 핵심역량이 아닌가 싶고 또한 가장 궁금한 부분이다.

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2023년 10월 5일 오전 9:50

댓글 0