개발자
안녕하세요. 컴퓨터 비전 분야 쪽으로 공부하고 있는 학부생입니다. LLM의 발전으로 향후 멀티모달 분야 (text2image, text2video) 등이 핫해질 것 같아 대학원에서 멀티모달 관련 연구를 해보고 싶습니다. 이를 위해 멀티모달 공부를 미리 해보고자 하는데요. 현재 CLIP이라는 논문까지는 읽어본 상황입니다. 더 나아가 어떤 논문을 읽어보는 것이 좋을지, 멀티모달 흐름을 잘 알 수 있게 하는 참고자료나, 연구주제가 있을까요? 읽어주셔서 감사합니다.
답변 0
첫 답변을 기다리고 있어요.
지금 가입하면 모든 질문의 답변을 볼 수 있어요!
현직자들의 명쾌한 답변을 얻을 수 있어요.
이미 회원이신가요?
지금 가입하면 모든 질문의 답변을 볼 수 있어요!