Community

커리어리 친구들, 국내 AI 트렌드에 대해 한 눈에 알아볼 수 있는 AI 허브의 웹진이 나왔습니다. 그중에서 KAIST AI 의 주재걸 교수의 3D 영상 데이터셋의 구축 현황 및 필요성에 대해 한

커리어리 친구들, 국내 AI 트렌드에 대해 한 눈에 알아볼 수 있는 AI 허브의 웹진이 나왔습니다. 그중에서 KAIST AI 의 주재걸 교수의 3D 영상 데이터셋의 구축 현황 및 필요성에 대해 한 눈에 볼 수 있어서 추천드립니다. 인공지능 분야 중 컴퓨터 비전 분야는 2012년 ILSVRC1)(ImageNet Large Scale Visual Recognition Challenge) 챌린지에서 우승을 차지한 AlexNet을 시작으로, CNN2)(Convolutional Neural Network)의 놀라운 성능에 힘입어 비약적인 발전을 이루어 내었습니다. 기본적으로 컴퓨터 비전 분야에서는 영상 데이터를 일반적인 카메라를 통해 수집되는 형태인 (R, G, B) 픽셀값으로 이루어진 2차원의 균일격자(regular grid) 구조인 경우가 대부분입니다. 그러나 이러한 2차원 영상 데이터는 우리가 사는 3차원 세계를 특정 방향으로 투영한 형태라는 측면에서 인공지능 모델이 실제 3차원 형태를 가지는 다양한 물체를 완전히 이해하고 처리하는 데에는 한계가 있습니다. 가령 정면에서의 얼굴 이미지만을 학습한 인공지능 모델은 인간의 뒤통수가 어떤 모습을 하고 있는지 전혀 알지 못합니다. 이 같은 한계를 극복하기 위해 3차원 영상 데이터를 수집하고, 이를 인공지능 모델 학습에 활용하고자 하는 시도가 최근 컴퓨터 비전 분야 연구의 주된 흐름 중 하나로 자리 잡고 있습니다.

알림

알림이 없습니다