๋ฐ์ดํฐ ๊ธฐ๋ฐ ํ๋ก๋ํธ ๊ฐ๋ฐ์ ๋น๊ฒฐ: Product Data Science
Medium

๐ [๋ฐ์ดํฐ ๊ธฐ๋ฐ ํ๋ก๋ํธ ๊ฐ๋ฐ์ ๋น๊ฒฐ: Product Data Science] ๐ก ์ํฉํธ ๊ณต์ ์ฐ์ โํ๋ก๋ํธ ๋ฐ์ดํฐ ๋ถ์ ๋ฐ ํ์ฉโ ์ ๋ํด์ ์ ์์์ผ ํ ๊น? ์์ด๋ก๋ Product Data Science ๋ก ํํํ๋ค. ๋ฐ๊พธ์ด ๋งํด์ โํ๋ก๋ํธ ๊ฐ๋ฐ์์์ ๋ฐ์ดํฐ์ ์ญํ โ ์ผ๋ก ๋ณผ ์ ์๋ค. ์ด๋ ํ๋ก๋ํธ ์กฐ์ง์ ์ํฉํธ ๊ณต์์์ ์ฃผ์ํ ๊ตฌ์ฑ ์์๋ก์ ๊ธฐ๋ฅํ๋ค. ํ๋ก๋ํธ ๊ฐ๋ฐ์์์ ๋ฐ์ดํฐ์ ์ญํ ์ ์ ์ดํดํ๊ณ ํ์ฉํ๋ ์ฌ๋ ร๋ฐ์ดํฐ ๊ธฐ๋ฐ ํ๋ก๋ํธ ๊ฐ๋ฐ์ ์ค์ํ๋ ๋ฌธํ = ์ํฉํธ ๊ณต์์ ๊ตฌ์ฑ ์์๋ฅผ ๋ค์ฌ๋ค ๋ณด์. ๋จผ์ , ํ๋ก๋ํธ ๊ฐ๋ฐ์์์ ๋ฐ์ดํฐ์ ์ญํ ์ ์ ์ดํดํ๊ณ ํ์ฉํ๋ ์ฌ๋์ ์ด๋ค ์ฌ๋์ธ๊ฐ? Product Analyst, Product Data Scientist, Product Data Engineer ๋ฑ์ ์ง๋ฌด๋ค์ด ์๋ค. ์ด๋ฐ ์ฌ๋๋ค์ ์๋ฏธํ ๊น? ์๋๋ค. ์ฌ์ค ์ ๊ณต์์ ์์ด์ ์ง๋ฌด๋ ์๊ด์ด ์๋ค. ์ด์ฐจํผ ๋ฐ์ดํฐ๋ ๋๊ตฌ๋ ํ์ฉํ ์ ์๋ค. ํ๋ก๋ํธ ๊ฐ๋ฐ์์ ๋ฐ์ดํฐ๋ฅผ ํตํด ํ ์ ์๋ ์ผ์ ์์ญ์ ๋ํด ๋ช ํํ ์ธ์งํ๊ณ ์๋ ์ฌ๋, ๋ ๋์๊ฐ์๋ ๋ ธ๋ ฅ์ ํตํด ํ์ฉํ๊ณ ๋ฌธํ๋ฅผ ๋ฐ๊ฟ๋๊ฐ ํ์ด ์๋ ์ฌ๋์ ์๋ฏธํ๋ค. ๋ฐ์ดํฐ ๊ธฐ๋ฐ ํ๋ก๋ํธ ๊ฐ๋ฐ์ ์ค์ํ๋ ๋ฌธํ ์์ ์ ์ํ ๊ตฌ์ฑ ์์๋ก โ์ ์ดํดํ๋ ๊ฒ' ์ ๋นํด, ์ดํดํ ๊ฒ์ ๊ธฐ๋ฐ์ผ๋ก ์ค๋ฌด์์ ๊ฐ์น์ ๋ฌธํ๋ฅผ ๋ง๋๋ ๊ฒ์ ํจ์ฌ ๋ ์ด๋ ต๋ค. Bottom-up์ผ๋ก๋ Cross-functional Team์ผ๋ก ์์ ์กฐ์ง์ผ๋ก ์ผํ ๋, ๊ต์ก๊ณผ ํ์ ์ ํตํด ๋น๊ต์ ์ผ๋ก ์ํฅ์ ๋ฏธ์น๊ธฐ ์ฝ๋ค. ๋ฐ๋๋ก Top-down์ผ๋ก ๋ฆฌ๋์ญ๊ณผ ํจ๊ป ์ ๋ฌด ํ๋ก์ธ์ค๊ฐ ์กํ ์๋ ์๋ค. ์ด๋ ๋ฐฉํฅ์ด๋ ๋ฌธํ๊ฐ 0์ผ ๊ฒฝ์ฐ, ์ฌ๋์ด ๋ ธ๋ ฅํด๋ ์ํฉํธ๋ ๋ด๊ธฐ ์ด๋ ต๋ค. ๐ก ๋ฐ์ดํฐ ๊ธฐ๋ฐ ํ๋ก๋ํธ ๊ฐ๋ฐ์ ์ด๋ป๊ฒ ์ ์ํ ์ ์์๊น? ๋ฐ์ดํฐ ๊ธฐ๋ฐ ํ๋ก๋ํธ ๊ฐ๋ฐ์ ์ธ๊ธฐ๊ฐ ๋ง์ ํค์๋์ด๋ฉด์, ์ด์ ์ค์ธ ์ปค๋ฎค๋ํฐ์์๋ ๋น์ ์ผ๋ก ์ผ๊ณ ์๋ ๋ด์ฉ์ด๋ค. ํ์๊ฐ ์ผ์ ํ๋ฉฐ ์ ๋ฌด์์ ์ ํํ๋ ๊ฒ๋ค์ ๋ช ์ํ๋ค. ๋ฐ๊ฟ๋งํ๋ฉด โํ๋ก๋ํธ ๊ฐ๋ฐ์์ ๋ฐ์ดํฐ๊ฐ ํ์ฉ๋ ์ ์๋ ์์ญโ์ ๋ํด์ ์ ์ํ ๋ด์ฉ์ด๋ค. ํ๋ก๋ํธ์ ์์ด์์ ์ถ์ ์ด๋ฒคํธ ์ ํ๋ก ๋ฐ์ดํฐ๊ฐ ํ์ฉ๋์ด์ผ ํ๋ ์์ญ๋ค์ด ์๊ณ , ํ๋ก๋ํธ ์กฐ์ง์ ๋ชฉํ๋ฅผ ๋ฌ์ฑํ๊ธฐ ์ํด ์ถ์ ์ด๋ฒคํธ์ ๋ณ๊ฐ๋ก ๊พธ์คํ ๋ฐ์ดํฐ๊ฐ ํ์ฉ๋์ด์ผ ํ๋ ์์ญ์ด ์๋ค. [1] Extracting Opportunities : ์ ์ ํ๋์ ๋ถ์ํ์ฌ ํ๋ก๋ํธ๋ก ํ์ด๋ผ ์ ์๋ ๊ธฐํ๋ฅผ ๋ฐ๊ตดํ๋ค. ์ด ๋ถ๋ถ์ ๋ฐ์ดํฐ๋ฅผ ํตํด์ ํ ์๋ ์๊ณ , ์ ์ ์ธํฐ๋ทฐ, ์คํ ์ด ๋ฆฌ๋ทฐ๋ฅผ ํตํด์๋ ํ ์ ์๋ค. ๊ฒฐ๊ตญ ๊ฐ์ค์ ์ธ์ฐ๋ ๊ฒ์ธ๋ฐ, ์ ๋๊ณผ ์ ์ฑ์ ํ์ด ํฉ์ณ์ง ๋ ํนํ ๋ ๋ช ํํด์ง๋ค. ์ ์ฌ์ ์ธ ๊ธฐํ (Emergent Behaviors)๋ฅผ ๋ฐ๊ตดํ๋ค๊ณ ๋ณผ ์ ์๋ค - ์ ์ ํ๋ ๋ถ์ (User Behavior Analytics) [2] De-risking : ํ๋ก๋ํธ ๊ฐ๋ฐ์ ๋ง์ ๋ฆฌ์์ค๋ฅผ ํ์๋ก ํ๋ค. ๋ฆฌ์์ค๋ฅผ ๋ค์ด๊ธฐ ์ , ํ๋ก๋ํธ ๊ฐ๋ฐ์ ์์ด์์ ๋ฆฌ์คํฌ๋ฅผ ์ค์ฌ์ฃผ๊ธฐ ์ํด ๋ฐ์ดํฐ๊ฐ ํ์ ๋ณดํค ์ ์๋ค. De-risking์ ์์ด์๋ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ง ์๋ ๋ฐฉ๋ฒ๋ ์กด์ฌํ๋ค. ์ํฉ์ ๋ง๊ฒ ํ์ฉํ๋ ๊ฒ์ด ์ข๋ค. - ์ ์ ํ๋ ๋ถ์ (User Behavior Analytics) - ์คํ ์ค๊ณ (Experiment Design) - ์์ต ๊ณ์ฐ (Cost & Benefit Analysis) - ํจ๊ณผ ์ถ์ฐ์ ํตํ ์ฐ์ ์์ ์ ๋ ฌ (Impact Projection & Prioritizing) [3] Measuring : ํ๋ก๋ํธ ๊ฐ๋ฐ์ ์ ์ธก์ ํ๋ฉด์ ๋์๊ฐ๋ ๊ฒ์ด ์ค์ํ๋ค. ๊ทธ๋ฅผ ์ํด ๋ฐ์ดํฐ๋ฅผ ์ธก์ ํ๊ณ , ์์งํ๊ณ , ๋ถ์์ ํ๊ธฐ ์ํ ๋๊ตฌ์ ํ๊ฒฝ์ ๊ฐ์ถ๋ ๊ฒ์ ๊ธฐ๋ฐ์ด ๋์ด์ผ ํ๋ค. ์ค์ ๋ก ์๊ฐ์ด ์ ๋ง ๋ง์ด ๋๋ ๋ถ๋ถ์ด๊ธฐ๋ ํ๋ค. ๋ํ ๋ฌด์์ ์ธก์ ํ ๊ฒ์ธ์ง๊ฐ ๋ช ํํด์ผ ํ๊ธฐ์ ์งํ ์ ์๊ฐ ๊ฐ๋ฐ ์ด์ ์ ํ๋์ด์ผ ํ๋ค. ์ถ์ ์ดํ์๋, ์ถ์์ ํจ๊ณผ๋ฅผ ๋ถ์ํ๊ธฐ ์ํ ๋จ๊ณ์์ ์ธ๊ณผ๊ด๊ณ๋ฅผ ์ถ๋ก ํ๋ ๋ฐฉ์์ด ์ฌ์ฉ๋๋ค. - ๋ฐ์ดํฐ ์์ง (Data Instrumentation) - ์งํ ์ ์ (Defining Metrics) - ์คํ ๊ฒฐ๊ณผ ๋ถ์ (Experiment Result Analysis) - ๋น์คํ ๊ฒฐ๊ณผ ๋ถ์ (Quasi-experiment Result Analysis) [4] Connecting the Cycles : ํ๋ก๋ํธ ์กฐ์ง์ ๋ชฉํ ์งํ๋ฅผ ๋๊ณ ๊ฐ์ ํ๊ธฐ ์ํด ์์ ๊ฐ๋ฐ ์ฌ์ดํด๋ค์ ๋ฐ๋ณตํ๋ฉฐ ์ฑ์ฅ์ผ๋ก ๋์๊ฐ๋ค. ์งํ๋๋ ์์ ๊ฐ๋ฐ ์ฌ์ดํด๋ค์ด ์ง์ ํต์ ๊ฐ ๊ฐ๋ฅํ ํ๋๋ค์ ํด๋นํ๋ฉฐ โOutput metricโ์ ์ํฅ์ ๋ผ์น๋ ํต์ ๊ฐ๋ฅํ 'Input metricโ์ ์ง์คํ๋๋ก ํ๋ ๊ฒ์ด๋ค. - ์งํ ์๊ณ ์ ๋ฆฝ (Defining Metric Relationships, Hierarchy) - ์งํ ๊ฐ๋ฐ (Metric Development) [5] Monitoring : ์งํ๋ฅผ ์ ์ํ๋ค๋ฉด, ์งํ์ ๋ง๋ ์ ์ ํ ์ค๋๋ฅผ ๋์ด ๊พธ์คํ ์ง์ผ ๋ณด์์ผ ํ๋ค. ์ ๋ฆฝํ ์งํ ์๊ณ์ ๋ง๊ฒ ๋์๋ณด๋๋ฅผ ๊ตฌํํ๋ ๊ฒ, ์งํ์ ํธ๋ ๋๋ฅผ ํด์ํ๋ ๊ฒ, ๊ทธ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์คํ ๊ฐ๋ฅํ ๊ธฐํ๋ฅผ ๋ชจ์ํด์ผ ํ๋ค. - ์ ํ ๋์๋ณด๋ (Product Dashboard) - ์งํ ํธ๋ ๋ ๋ฐ ๋ณ๋ ํด์ (Interpreting the KPI) - ์คํ ๊ฐ๋ฅํ ์ธ์ฌ์ดํธ ๋์ถ (Actionable Insights) ๐ก ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค์ ์ญํ ์ ์ด๋์ ๊ฐ์ฅ ์ ๋ฐํ๋ ์ ์์๊น? ์ค๋ฌด์ ๊ณ์ ๋ถ๋ค์ ๋ค๋ค ์๊ณ ๊ณ์๊ฒ ์ง๋ง, ์์์ ์ธ๊ธํ ์ ๋ฌด์์์ ๋ง์ ๋ถ๋ถ์ ๋ค์์ ๊ธฐ์ ๋ค์ด ์๋ํ๋ ์๋ฃจ์ ์ ์ ๊ณตํ๊ณ ์๋ค. Modern Data Stack์์ ๋ ์์ธํ ํ์ธํ ์ ์๋ค. Product Analytics๋ ์์๋ก ์๋์ ๊ฐ์ ์ ๋ฃ ์๋น์ค, ์คํ์์ค ์๋น์ค๋ค์ด ์๋ค. ๋ฐ์ดํฐ ํ์ฉ์ ์๋ํ๋ ํด์ ํตํด์ ํจ์จ์ ์ผ๋ก, ์กฐ์ง ๋ด์ ์ ํ๋ ์ ์๋ค. ์๋ฃจ์ ๋์ ์ ํ์ฉํ๊ฑฐ๋, ์ฌ๋ด ๊ฐ๋ฐํ๋ ๊ฒ์ด ๋ฐฉ๋ฒ์ด๋ค. ์ด๋ค ๋ฐฉ์์ด๋ ๊ถ๊ทน์ ์ผ๋ก๋ ์๋ํ๋ ํด๊ณผ ๋ฌธํ ์ ํ๋ฅผ ํตํด์ ์กฐ์ง ๊ตฌ์ฑ์ ๋ชจ๋๊ฐ ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์์ฌ๊ฒฐ์ ์ ํ ์ ์๋ ๋ฏธ๋๊ฐ ๋ค๊ฐ์ฌ ๊ฒ์ด๋ค. ์กฐ์ง ๋ด์ ๋ฐ์ดํฐ ํ์ฉ ์ ํ๋๋ ๊ฒ ๋ํ ๋ฐ์ดํฐ ์กฐ์ง์ผ๋ก์์ ์๋ฌด์ด๋ค. ๊ทผ๋ฐ ์ ๋ฌด๋ก ํ๋ก๋ํธ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๋ ์ฌ๋๋ค์ ์ด๋ป๊ฒ ๋ฐฅ๋ฒ์ด๋ฅผ ์ด์ด๊ฐ ๊ฒ์ธ๊ฐ? ํด์ผ๋ก ๋์ฒด๋ ์ ์๋ ์ญํ ์ ์ ํ๋ ์ฌ๋์ด๋ผ๋ฉด, ์ฅ๊ธฐ์ ์ผ๋ก ๊ฒฝ์๋ ฅ์ด ์์๊น? ํ์ฌ ์๊ฐํ๊ณ ์๋ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค๊ฐ ๊ฐ์ฅ ๋ฐํ๋ ์ ์๋ ์์ญ์ ์๋์ ๊ฐ๋ค. - ์ ์ ํ๋ ๋ถ์ (User Behavior Analytics) - ์คํ ๊ฒฐ๊ณผ ๋ถ์ (Experiment Result Analysis) - ๋น์คํ ๊ฒฐ๊ณผ ๋ถ์ (Quasi-experiment Result Analysis) - ์งํ ๊ฐ๋ฐ (Metric Development) - ๊ทธ ์ธ๋ก ์ค์ํ ๊ฒ, ๋ถ์ ๊ฑฐ๋ฒ๋์ค ์ฒด๊ณ ์๋ฆฝ ๋ฐ ๊ต์ก (Data Governance) ์๋ก ์ ์ ํ๋ ๋ถ์์ ๊ฒฝ์ฐ, ์ฝํธํธ ๋ถ์ ๋ฐ ์ธ๊ทธ๋ฉํ ์ด์ ์ ํตํด์ ๊ฐ๋จํ๊ฒ ์งํ๋ ์ ์๋ค. ํ์ง๋ง ๋ฐ์ดํฐ์ ๋ณต์ก๋๊ฐ ๋์์ง์๋ก ๊ณ ๋ํ๋ ๊ธฐ์ ์ ๋ํ ๋์ ์ด ํ์ํ ๊ฒ์ด๋ค. ๋ฐ๋ผ์ ์๋ก์ด ๊ธฐ๋ฒ๋ค์ ๊ณ์ํด์ ๋ฐฐ์ฐ๊ณ ์ ์ฉํด๋ณด๋ ์๋๊ฐ ํ์ํ๋ค๊ณ ๋ฏฟ๋๋ค. ์์๋ก ์๋์ ๊ฐ์ ์๋ฃ๋ค์, ๊ณ์ ๋ฐ๊ตดํ๊ณ ๋ฐฐ์์ผ ํ๋ค. ๐ก ํด์ธ ํ๋ก๋ํธ ๋ฐ์ดํฐ ๋ถ์ ์ง๋ฌด์ ์งํ FAANG์ Product ์์ญ Data Scientist JD์์๋ ๊ณตํต์ ๋ค์ด ๋ฐ๊ฒฌ๋๋ค. - ํ๋ก๋ํธ ์ ๋ต์ ๊ฐ๋ฐํ๋ ๋ฐ์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉ๋๋๋ก ํ๋ ๊ฒ - ํ๋ก๋ํธ์ ์ฑ๊ณต์ ์ธก์ ํ๋ ๊ฒ - ํ๋ก๋ํธ ๊ฐ๋ฐ์ ์์ด์์ ๋ ๋ฒ๋ฅผ ์ ์ํ๊ณ ๋ก๋๋งต์ ๊ทธ๋ ค๋ด๋ ๊ฒ ... ๋๋ณด๊ธฐ ์ํด์๋ ๋งํฌ๋ฅผ ํด๋ฆญํด์ฃผ์ธ์.
2022๋ 2์ 12์ผ ์ค์ 3:04
ํ์ง์๋ค์ '์ง์ง ์ธ์ฌ์ดํธ'๊ฐ ๋ด๊ธด ์ ๊ณ ์ฃผ์ ์์์ ๋ฐ์๋ณด์ธ์.
์ปค๋ฆฌ์ด๋ฆฌ | ๊ฐ๋ฐ์๋ฅผ ์ํ ์ปค๋ฆฌ์ด SNS