๐ ์์นด AIํ์ Applied Research Scientist๋ ์ด๋ค ์ผ์ ํ๋์? ๐ ์ด ๊ธ์ ์ถ์ฒํ๋ ์ด์ - ๋ฐ์ดํฐ, AI ์ ๊ณ์ ์ง๊ตฐ๋ค์ ๋ชจ๋ ๋ค ๋ค๋ฅด๊ฒ ์ ์ํ๊ณ ์์ต๋๋ค - 3~4
๐ ์์นด AIํ์ Applied Research Scientist๋ ์ด๋ค ์ผ์ ํ๋์? ๐ ์ด ๊ธ์ ์ถ์ฒํ๋ ์ด์ - ๋ฐ์ดํฐ, AI ์ ๊ณ์ ์ง๊ตฐ๋ค์ ๋ชจ๋ ๋ค ๋ค๋ฅด๊ฒ ์ ์ํ๊ณ ์์ต๋๋ค - 3~4๋ ์ ์ ๋ฐ์ดํฐ ์ฌ์ด์ธํฐ์คํธ๋ผ๋ ์ง๊ตฐ์ด ์ฐ๊ตฌํ๋ ์ญํ ๋ก ๋์์ผ๋ ์์๋ Research Scientist๋ผ๋ ์ด๋ฆ์ผ๋ก ์ฌ์ฉ๋๊ณ ์์ต๋๋ค - ์ค๋ฆฌ์ฝ๋ฐธ๋ฆฌ์ ํ์ฌ๋ฅผ ๋ณด๋ฉด Applied Research Scientist๋ผ๋ ์ด๋ฆ์ผ๋ก ์ฑ์ฉ ๊ณต๊ณ ๋ฅผ ๋ด๋ ๊ฒฝ์ฐ๋ ์กด์ฌํฉ๋๋ค - ์์นด์์๋ Applied Research Scientist ์ง๊ตฐ์ ์ด๋ป๊ฒ ์ ์ํ๋์ง ์ ๋ฆฌํ ๊ธ์ ๋๋ค - ๋ฏธ๋ฌํ๊ฒ ๋ค๋ฅธ ๊ด์ ์ ๊ฐ์ง๊ณ ์๋๋ฐ, ์ด ๊ธ์ ํตํด ์ง๊ตฐ์ ๋ํ ์ดํด๋ฅผ ์ ํ ์ ์์ผ๋ฉด ์ข๊ฒ ๋ค์-! โ ๋ด์ฉ ์์ฝ - AI์ ๊ด๋ จ๋ ์ง๋ฌด์๋ ๋ฌด์์ด ์์๊น? - Research Scientist - Applied Research Scientist - Machine Learning Engineer - Data Scientist Research Scientist: ์ด๋ป๊ฒ SOTA๋ฅผ ๋ฐ์ด๋์ ์ ์์๊น? - Research Scientist๋ AI์ ๊ด๋ จ๋ ์์ฒ ๊ธฐ์ ์ ์ฐ๊ตฌํ๋ ํฌ์ง์ - Research Scientist๋ Public Benchmark Dataset์์ ์ด์ ์ฐ๊ตฌ๊ฐ ๋ฌ์ฑํ ์ต๊ณ ์ฑ๋ฅ (State-of-the-Art; SOTA)๋ฅผ ๋์ด์๋ ๊ธฐ๋ฒ์ ์ฐ๊ตฌํ๊ณ , ์ด์ SOTA์ ํ๊ณ์ ์ ๋ณด์ํ๋ ๊ธฐ๋ฒ์ ์ฐ๊ตฌ - Research Scientist์ Research Questions - Gradient Descent๋ฅผ ๊ธฐ๋ฐ์ผ๋ก Learning Objective๋ฅผ ๋ฌ์ฑํ๋ ๊ฒ์ด ์๋๋ผ, ์ธ๊ฐ์ฒ๋ผ Reasoning์ ํ๋ AI๋ฅผ ๋ง๋ค ์๋ ์์๊น? - ์ด๋ฏธ์ง๋ฅผ ์ดํดํ๋ ์ฌ๋ฌ Neural Networks Architecture๊ฐ ์๋๋ฐ, ํน์ ํ ํจํด์ bias ๋์ง ์๊ณ ๋ ์ธ๊ฐ์ฒ๋ผ ์ด๋ฏธ์ง๋ฅผ ์ดํดํ๋(ํน์ ์ธ๊ฐ๋ณด๋ค ๋ ๋ฐ์ด๋๊ฒ) ๊ตฌ์กฐ๋ ์์๊น? - ์ต๊ทผ์ ์ ์๋ Language Model (BERT, RoBERTa, S-BERT ๋ฑ)๋ณด๋ค ๋ ์ธ๊ฐ์ฒ๋ผ (ํน์ ์ธ๊ฐ๋ณด๋ค ๋ ๋ฐ์ด๋๊ฒ) ์ง์์ ์ดํดํ๋ ๋ชจ๋ธ์ ์์๊น? Applied Research Scientist: ์ฐ๋ฆฌ ๋น์ฆ๋์ค ๋๋ฉ์ธ์ ๋ฌธ์ ๋ฅผ ์ด๋ป๊ฒ ํ ์ ์์๊น? - Applied Research Scientist๋ ํน์ ๋น์ฆ๋์ค ๋๋ฉ์ธ์ ๋ฌธ์ ๋ฅผ ํ ์ ์๋ AI๋ฅผ ์ฐ๊ตฌํ๊ณ , ์ฐ๊ตฌ๋ ๋ชจ๋ธ์ ๋ฐฐํฌํ๋ ์ผ์ ์ํํ๋ ํฌ์ง์ - Applied Research Scientist๋ Public Benchmark์ Real-world์ ์ฐจ์ด๋ฅผ ๊ณ ๋ฏผํ๋ฉด์, SOTA ๊ธฐ๋ฒ์ด ์ฐ๋ฆฌ ๋๋ฉ์ธ์์ ์ ์๋๋์ง (ํน์ ์ ์ ๋๋์ง)๋ฅผ ํ์ ํ๊ณ , ์ ์๋ ์ฌ๋ฌ ๊ธฐ๋ฒ๋ค์ ์ต์ ํํ๊ฑฐ๋ ์๋ก์ด ๊ธฐ๋ฒ์ ๋์์ธํ๊ธฐ๋ ํฉ๋๋ค. - Applied Research Scientist์ Research Questions - ๋ ผ๋ฌธ A๋ ImageNet, SUN, Place 365์์ ๋์ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋๋ฐ, ์ฐ๋ฆฌ ๋๋ฉ์ธ์์๋ ์ฑ๋ฅ์ด ๋์ง ์์๋ฐ, ๊ทธ ์ด์ ๊ฐ ๋ญ์ง? ์ฐ๋ฆฌ ๋ฐ์ดํฐ์ Public Benchmark์๋ ์ด๋ค ์ฐจ์ด๊ฐ ์์ด์ ๊ทธ๋ด๊น? - ์ฐ๋ฆฌ ๋๋ฉ์ธ์์ ๋ค๋ฃจ๋ ๋ฐ์ดํฐ๋ Public Benchmark๋ค๊ณผ๋ ๋๋ฌด ๋ค๋ฅธ๋ฐ, ์ฐ๋ฆฌ ๋๋ฉ์ธ์์ ์ ๋์ํ๋ ์๋ก์ด Neural Architecture๋ฅผ ๋์์ธํด ๋ณผ๊น? - ๋ชจ๋ธ B๊ฐ ๋ฐฐํฌ๋์์ ๋ ๋ฎ์ Overhead๋ฅผ ๋ฌ์ฑํ๋ ค๋ฉด ์ฝ๋๋ฅผ ์ด๋ป๊ฒ ๋ฆฌํฉํ ๋ง ํด์ผ ํ ๊น? ๋ชจ๋ธ์ ๋ค์ด๊ฐ๋ Input์ ์ด๋ป๊ฒ ์ค๊ณํ๊ณ , Inference ๊ฒฐ๊ณผ๋ ์ด๋ค ํ ์ด๋ธ์ ์ด๋ป๊ฒ ์ ์ฌํ์ง? Machine Learning Engineer: AI ๋ชจ๋ธ์ ์ด๋ป๊ฒ ํจ๊ณผ์ ์ผ๋ก ๊ตฌํํ๊ณ ์๋น์คํ ์ํฌ๊น? - Machine Learning Engineer๋ AI ๋ชจ๋ธ์ ๊ฐ๋ฐ๊ณผ ์๋น์ค์ ๋ ๋ฌด๊ฒ๋ฅผ ๋๊ณ ์๋ ํฌ์ง์ - Machine Learning Engineer์ Research Questions - ๋งค ์คํ์ ์ฌ์ฉ๋ ๋ฐ์ดํฐ ์ ๊ณผ ๋ชจ๋ธ์ ์ํคํ ์ฒ, Weight ํ์ผ๋ค์ด ๊ด๋ฆฌ๊ฐ ์ด๋ ค์ด๋ฐ, ์ด๋ฅผ ์ข ํจ๊ณผ์ ์ผ๋ก ๊ด๋ฆฌํ ์ ์๋ ๋ฐฉ๋ฒ์ด ์์๊น? - Pytorch๋ก ์์ฑ๋ ๋ชจ๋ธ์ด ๋นํจ์จ์ ์ธ ๊ฒ ๊ฐ์. ํ๋ก๋์ ์ ๋ค์ด๊ฐ๋ ค๋ฉด ๋ Overhead๋ฅผ ๋ฎ์ถฐ์ผ ํ ๊ฒ ๊ฐ์๋ฐ, Tensorflow๋ก ์ด๋ฅผ ๋ณํํด ๋ณผ ์ ์์๊น? - GPU์ ๊ฐ์๋ ๋ง์๋ฐ ๊ทธ ์ฑ๋ฅ์ 100% ์ฌ์ฉํ์ง๋ ๋ชปํ๋ค. ์ต๋ํ ํจ์จ์ ์ผ๋ก GPU ์์์ ์ฌ์ฉํ ์๋ ์์๊น? Data Scientist: ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ด๋ค Action์ ํ ์ ์์๊น? - Data Scientist๋ ๋น์ฆ๋์ค ๋๋ฉ์ธ์์ ๋ฐ์ํ ๋ค์ํ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๋ ํฌ์ง์ - Data Scientist์ Request Questions - (Business) ์ด๋ฒ ์ฃผ๋ง์ ๊ฐ๋จ์ญ 10๋ฒ ์ถ๊ตฌ ์์นด ์กด์ ์์ฝ ๊ฑด์ ์ผ๋ง๋ ๋ ๊น? - (Business) 2022๋ ์ ์์ธ์ ์ํ๊ตฌ์ ๋ช ๋์ ์ฐจ๋์ ๋ฐฐ์ฐจํ๋ฉด ๋ ๋น ๋งค์ถ์ด ์ผ๋ง๋ ๋ ๊ฒ์ผ๋ก ์์ธกํ ์ ์์๊น? - (Business) ๊ฐ์ฅ ์ ์ ๋งค์ถ์ด ๋์ฌ ์ง์ญ์ ๋ฐ์ดํฐ์ ๊ธฐ๋ฐํด ์ฐพ์์ฃผ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ด๋ป๊ฒ ๋ง๋ค ์ ์์๊น? - (Product) ์์นด์ Funnel ์ค ๊ฐ์ฅ ์ ํ์จ์ด ๋ฎ์ ๋ถ๋ถ์ ์ด๋์ผ๊น? ๊ทธ ๋ถ๋ถ์ ๊ฐ์ ํ๊ธฐ ์ํด์๋ ์ด๋ค Action์ ํ ์ ์์๊น? ์ด๋ค ์คํ์ ์งํํ๋ฉด ์ด์ ๋ํ ๊ฒฐ๋ก ์ ์ป์ ์ ์์๊น? - (Product) ์๋ก์ด ๊ธฐ๋ฅ ๊ฐ๋ฐ์ ์์ํ๋ ค๊ณ ํ๋๋ฐ, ์ด ๊ธฐ๋ฅ ๊ฐ๋ฐ์ด ์ฑ๊ณตํ๋ค๊ณ ๋ณด๋ ค๋ฉด ์ด๋ค Metric์ ๊ฒฐ์ ํด์ผ ํ ๊น? ๊ทธ Metric์ ๋ณด๊ธฐ ์ํด ์ด๋ค ์ฑ, ์น ๋ฐ์ดํฐ๋ฅผ ๋ก๊น ํด์ผํ ๊น ์๋ก์ด ๊ธฐ๋ฅ์ AB Test ํ๋ ค๊ณ ํ ๊ฒฝ์ฐ, ์ด๋ค ๋ฐฉ๋ฒ์ผ๋ก ์ค๊ณํ ์ ์์๊น? - (Product) ์๋ก์ด ๊ธฐ๋ฅ์ด ์ถ์๋ ์ดํ์ ์ฑ๊ณต์ ์ธ์ง ํ์ธํ๊ธฐ ์ํด ๋์๋ณด๋๋ ์ด๋ป๊ฒ ๊ตฌ์ฑํด์ผ ํ ๊น? ์์นด AIํ์ด ํ๋ ์ผ - Vision Domain - ์ฌ์ ์ ๊ฒฝ์ฐจ๋ ์คํ ์ฐจ์ ์ํ์ง ์๋๋ค๊ณ ํ๋จํ๋ฉด์ (Out-of-Distribution Detection), ๊ธฐ์กด ๋ถ๋ฅ๊ธฐ์ ์ฑ๋ฅ์ ์ ์งํ ์๋ ์์๊น์? (Open-Set Recognition) - ์๋ชป๋ ์์ธก์ ์ํํ์ ๋๋ less-confident ํ๊ฒ ํ๋ฆฌ๊ณ , ์ณ์ ์์ธก์ ๋ํด์๋ more confident ํ๊ฒ ๋ง์ถ๋๋ก ํ ์๋ ์์๊น์? (Calibration) ์ค๋ฌด์์๋ ๋ชจ๋ธ์ ์์ธก ๊ฒฐ๊ณผ๋ฟ๋ง ์๋๋ผ, ๋ชจ๋ธ์ด ํ์คํ๊ฒ ์์ธกํ ๊ฑด๋ค์ ๋จผ์ ๊ฒํ ํ๊ณ ์ ํ๋๋ฐ, ์ด ํ์ ์ ์ ๋๋ฅผ ์ด๋ป๊ฒ ์ ์ธก์ ํ ์ ์์๊น์? - NLP Domain - ๊ณ ๊ฐ์ด ํ์๋ก ํ๋ ์๋ฃจ์ ์ด ๊ฐ๊ธฐ ๋ค๋ฅธ๋ฐ, ์ด ๋ฌธ์๋ค์ ํ๋์ Intent๋ก ๋ฌถ์ ์ ์์๊น์? ํน์ ํ ๋ฌธ์ฅ์ ์ฌ๋ฌ ๊ฐ์ง ๋ฌธ์ ๊ฐ ์์ฌ์์ ๋๋ ์ด๋ป๊ฒ ์ฒ๋ฆฌํ ์ ์์๊น์? (Multi-Labeled Sample) - ์ฌ์ ์ ์ ์ํด๋ Intent์์ ๋ฒ์ด๋ ๋ฌธ์๋ ์ด๋ป๊ฒ ์๋ตํด์ผ ํ ๊น์? (Unknown Intent Detection) Vision ๋๋ฉ์ธ์์์ ๋ง์ฐฌ๊ฐ์ง๋ก, ๊ณ ๊ฐ์ ๋ฌธ์์ ๋ํด ์์ธกํ Intent์ ๋ํ Confidence๋ฅผ ์ด๋ป๊ฒ ์ธก์ ํ ์ ์์๊น์?