๐ [A/B ํ ์คํธ ์งํ ์ ๋์น ์ ์๋ ๋ถ๋ถ๋ค] ๋ฐ์ดํฐ ์ฌ์ด์ธํฐ์คํธ๋ค์ ๋ฐ๋์ A/B ํ ์คํธ๋ฅผ ํ ๋ interference, endogeneity issues ๋ฑ์ผ๋ก ์๊ธธ ์ ์๋ ์ํ์
๐ [A/B ํ ์คํธ ์งํ ์ ๋์น ์ ์๋ ๋ถ๋ถ๋ค] ๋ฐ์ดํฐ ์ฌ์ด์ธํฐ์คํธ๋ค์ ๋ฐ๋์ A/B ํ ์คํธ๋ฅผ ํ ๋ interference, endogeneity issues ๋ฑ์ผ๋ก ์๊ธธ ์ ์๋ ์ํ์ ๋ํด ์ธ์งํ๊ณ ์์ด์ผ ํ๋๋ฐ์. ์ด๋ฒ ๊ธ์์๋ ์ฌ๋ฌ๊ฐ์ง ๊ณ ๋ ค์ฌํญ๋ค ์ค์์ interference์ ์ํ์ฑ๊ณผ ์์๋ฅผ ๋ณด์ฌ์ฃผ๋ฉฐ ์ด๋ป๊ฒ ํด์ผ interference๋ฅผ ํผํ๋ A/B ํ ์คํธ๋ฅผ ๊ตฌ์ฑํ ์ ์๋์ง ๋ค๋ฃน๋๋ค. โญ๏ธ Interference due to shared resource ์ฐ๋ฒ์ ๊ฐ์ ๊ณต์ ์ฐจ๋ ์ ์ฒด๊ฐ ์๋ค๊ณ ๊ฐ์ ํ์ ๋ ์ด ์ ์ฒด๋ ์ฐจ๋์ ๋ถ๋ฅด๋๋ฐ๊น์ง ๊ฑธ๋ฆฌ๋ ์คํญ์ ์ค์ด๋ ค๋ ์๋๋ฅผ ํ์๊ณ , ๊ทธ์ ๋ํด A/Bํ ์คํธ๋ฅผ ์งํํ๋ค๊ณ ๊ฐ์ ํด๋ณด๊ฒ ์ต๋๋ค. ์ด ๊ฒฝ์ฐ ํ๊ฐ์งํ๋ก ํน์ ์๊ฐ ๋ด์ ํ ๊ธฐ์ฌ์๊ฒ ์ผ๋ง๋ ๋ง์ ์น์ฐจ๊ฐ ์ผ์ด๋ฌ๋์ง๋ฅผ ์ ํ์ต๋๋ค. ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค ํ์ ๋ด์์ ์๋ ๊ธฐ์ฌ๋ค ์ค ๋๋คํ๊ฒ ์คํ๊ตฐ / ๋์กฐ๊ตฐ์ ๋ถ๋ฆฌํ์๊ณ 2์ฃผ๋์ A/B ํ ์คํธ๋ฅผ ์งํํ์์ต๋๋ค. ๊ทธ๋ฆฌ๊ณ ํ์ 2์ฃผ ๋์ ํ๊ฐ์งํ ๊ด๋ จ ๋ก๊ทธ๋ค์ ์์งํ๊ณ 2-sample t-test๋ฅผ ์งํํ๊ตฌ์. ๊ฒฐ๊ณผ์ ๋ํ ํต๊ณ์น๊ฐ ๋์จ ํ์ ํ์ p-value๊ฐ ์ ์๋ฏธํ๋ค๊ณ ํ๋จํ๊ณ , ์๋ก์ด UI๊ฐ ๊ธฐ์ฌ๋ค์ด ๋ ๋ง์ ์น๊ฐ์ ํ์ฐ๊ณ ๋ ๋ง์ ๋์ ๋ฒ๊ฒ ํด์ค๋ค๊ณ ์ฃผ์ฅํ์ต๋๋ค. ์ฌ๋ฌ๋ถ์ด ๋งค๋์ ๋ผ๊ณ ๊ฐ์ ํ์ ๋, ์ด๋ฐ ๊ฒฐ๊ณผ๋ฅผ DSํ์ ํตํด ๋ค์๊ณ ์ด์ ์ค์ ๊ฐ๋ฐํ์ ์ด ์๋ก์ด UI๋ฅผ ์ ์ฉํด์ผํ๋ค ํน์ ์๋๋ค๋ผ๋ ๊ฒฐ์ ์ ๋ด๋ ค์ค์ผ ํฉ๋๋ค. ์ฌ์ค ์ด๋ฐ ์์๋ ์ผ๋ฐ์ ์ธ A/B ํ ์คํธ ์ธํฐ๋ทฐ ๋ฌธ์ ์ ๋ค๋ฅด์ง ์๋๋ฐ์. ์ฐ๋ฆฌ๋ ์ด ์คํ๊ฒฐ๊ณผ๋ก ์ด๋ ํ ๊ฒฐ๋ก ๋ ๋ด๋ฆด ์ ์๋๋ฐ, ๊ทธ ์ด์ ๋ ๋ฐ๋ก ๋ ๊ทธ๋ฃน (์คํ๊ตฐ/๋์กฐ๊ตฐ) ์ด์ ์๋ค์ด ๋ด์์ด๋ผ๋ ๊ฐ์ ์ฅ์์ ์๊ณ ๊ทธ๋ค์ ์์ฅ์ ๊ณต๊ธ๊ณผ ์์๋ฅผ ๊ณต์ ํ๊ณ ์๊ธฐ ๋๋ฌธ์ ๋๋ค. ๋ง์ฝ ์๋ก์ด UI๊ฐ ์ ์ฉ๋ ๊ธฐ์ฌ๋ค์ด ์ด๋์ ๋ดค๋ค๋ฉด ๊ทธ๋ค์ ์์ฅ์ ์์์ ์ํฅ์ ์ฃผ์์ ๊ฒ์ ๋๋ค. ๊ฒฐ๋ก ์ ์ผ๋ก ๋์กฐ๊ตฐ์ ์ํ ๊ธฐ์ฌ๋ค์ ์๋์ ์ผ๋ก ์ ์ ์น๊ฐ๋ค์ ์์๋ก ๊ฐ์ง๊ณ ์์์ ๊ฒ์ด๊ณ ํ์๋ณด๋ค ์ ์ ์น๊ฐ์ ํ์ ์ ๊ฒ์ ๋๋ค. ์์ฝ์ปจ๋ฐ ์ด ๊ฒฝ์ฐ์ ๊ด์ฐฐ๋ ์คํ๊ตฐ ํจ๊ณผ๋ ์ค์ ์คํํจ๊ณผ ๋๋น ๊ณผ์ฅ๋ ์ธก๋ฉด์ด ์๊ณ , ๊ทธ๋์ ์ฐ๋ฆฌ๋ ์ค์ ์คํํจ๊ณผ๊ฐ ํต๊ณ์ ์ผ๋ก ์ ์๋ฏธํ์์ง ์ ๋ฐฉ๋ฒ์ด ์์ต๋๋ค. โญ๏ธ The idea of Interference ์์ ์์๋ฅผ ํตํด ์๋ง interference์ ๋ํ ๋๋ต์ ์ธ ๊ฐ๋ ์ ์ดํดํ์ จ์ํ ๋ฐ์. ์ด ๊ฐ๋ ์ ๋ณธ์ง์ ๋ช ํํฉ๋๋ค. ๋ค์์ ์คํ๊ตฐ ๊ทธ๋ฃน์ด ์ฃผ์ด์ก์ ๋ ํ ๊ทธ๋ฃน์ ํ๋์ด ๋ค๋ฅธ ๊ทธ๋ฃน์ ํ๋์ ์ํฅ์ ์ค๋ค ์ด๊ฒ์ด ๋ฐ๋ก ์์ ์์์์ ๋๋ฌ๋ ๋ฌธ์ ์ ๋๋ค. ๋ ๋ง์ ์น๊ฐ์ด ํ ๊ทธ๋ฃน์ ๊ธฐ์ฌ์๊ฒ๋ก ๊ฐ๋ค๋ฉด ๋ค๋ฅธ ๊ทธ๋ฃน์ ๊ธฐ์ฌ์๊ฒ๋ ์๋์ ์ผ๋ก ์ ์ ์น๊ฐ๋ค์ด ๊ฐ ์ ๋ฐ์ ์๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค. โญ๏ธ Types of interference ์ผ๋ฐ์ ์ผ๋ก interference๋ ๋ ๊ฐ์ง ๋ฐฉ์์ผ๋ก ๋ฐ์ํ๋๋ฐ์. 1. Indirectly Connection Indirectly connection์ ๋ ๊ฐ์ ์ ์ ๊ตฐ์ด ์ ์ฌ๋ณ์๋ ๊ณต์ ๋ ๋ฆฌ์์ค ๋๋ฌธ์ ์ฐ๊ฒฐ๋์ด ์๋ ๊ฒฝ์ฐ์ ๋ฐ์ํฉ๋๋ค. ์คํ๊ตฐ๊ณผ ๋์กฐ๊ตฐ์ด ๊ฐ์ ๊ณ ๊ฐ ํ์ ๊ณต์ ํ๊ธฐ์ ์์์ ๋ค๋ค๋ ์์๊ฐ ์ ํํ๊ฒ ์ด indirect connection์ ์์์ ๋๋ค. Sub-user experimentation unints ๋ํ ์ด ์์ ์ค ํ๋๋ผ๊ณ ๋ณผ ์ ์๋๋ฐ์ : ์๋ก์ด UI๋ฅผ ์ ์ฉํ๋ ๊ฒ์ ๋ํ ์คํ์ด ์ํ๋์๊ณ ์คํ ๋จ์๊ฐ ์ ์ ๋ ๋ฒจ์ด ์๋ ํ์ด์ง๋ทฐ ๋ ๋ฒจ์ ์๋ค๊ณ ๊ฐ์ ํด๋ณด๊ฒ ์ต๋๋ค. ์ด ๊ฒฝ์ฐ์ ์ ์ ๋ ์ ์ฌ๋ณ์์ด๋ฉฐ ์คํ๊ตฐ/๋์กฐ๊ตฐ์ ์ฐ๊ณ๋์ด ์๊ณ , ๊ทธ ๊ฒฐ๊ณผ ๋ ๋ฒ์ ์ UI๋ ๊ฐ์ ์ ์ ์๊ฒ ๋ ธ์ถ๋ ์๊ฐ ์๊ธฐ์ ์คํ ๊ฒฐ๊ณผ๋ฅผ ์ ๋ขฐํ์ง ๋ชปํ๊ฒ ๋ง๋ค ์ ์์ต๋๋ค. 2. Direct Connection ๋ฐ๋๋ก Direct connection์ ๋ ๋จ์๊ฐ ๊ฐ์ ์์ ๋คํธ์ํฌ์ ์ํ๊ฑฐ๋ ๋ฌผ๋ฆฌ์ ์ธ ์ ์ ์ด ์๋ ๊ฒฝ์ฐ ๋ฐ์ํ ์ ์์ต๋๋ค. ๊ทธ๋ ๊ธฐ์ LinkedIn ์์ง๋์ด๋ง ํ์์๋ interference๋ฅผ ๋คํธ์ํฌ ํจ๊ณผ๋ผ๊ณ ๊ฐ์ฃผํฉ๋๋ค. Saint-Jacques(2019)์ ์์๋ฅผ ํ๋ฒ ๋ณด๊ฒ ์ต๋๋ค : ์์ํด๋ณด์. ๋ด ์น๊ตฌ๊ฐ ์คํ ํ๊ฒ์ด ๋์๊ณ ๊ทธ ์คํ์ ํตํด ๋ด ์น๊ตฌ๋ ๋ ๋์ ๋ฉ์์ง ๊ฒฝํ์ ๊ฐ์ง๊ฒ ๋์๋ค. ๊ทธ๋ ์ง๋ง ๋๋ ํ๊ฒ์ด ์๋์๊ณ , ๋ด ๋ฉ์์ง ๊ฒฝํ์ ๋ณํํ์ง ์์๋ค. ๊ทธ๋ฌ๋ ๋ด ์น๊ตฌ์ ๋ณด๋ค ๋์ ๊ฒฝํ์ ๋ ๋ง์ ์๊ฐ์ ๋ฉ์์ง๋ฅผ ๋ณด๋ด๋๋ฐ ์ฌ์ฉํ๊ฒ ๋ง๋ค์๊ณ ๋ ์น๊ตฌ์ด๊ธฐ์ ๋ ๋ง์ ์๊ฐ์ ๋ฉ์์ง์ ์ฌ์ฉํ๊ฒ ๋๋ค. ๊ทธ ๊ฒฐ๊ณผ ๋๋ ์คํ์ ์ํ์ง ์์์ง๋ง ๋ด ์น๊ตฌ๋ก ์ธํด ์ฌ์ฉ๋์ด ๋๊ฒ ๋์๊ณ ์ด๋ ์คํ์ ์ํฅ์ ๋ฏธ์น๊ฒ ๋๋ Interference๋ฅผ ๋ฐ์์ํจ๋ค. โญ๏ธ Identify interference when designing an experiment Interference ๋ ๊ฐ์ ๊ธฐ๋ฐ ํ ์คํธ์์ bias error๋ฅผ ๋ฐ์์ํค๊ณ ์ ์ฒด ์คํ๊ฒฐ๊ณผ๋ฅผ ์ ๋ขฐํ์ง ๋ชปํ๊ฒ ๋ง๋ญ๋๋ค. ์ด๋ฐ ์ด์๋ฅผ ํผํ๊ธฐ ์ํด์ ๊ทน๋จ์ ์ธ ์ผ์ด์ค๋ฅผ ๊ณ ๋ คํด๋ณด๊ฒ ์ต๋๋ค. ๋ง์ฝ ์คํ๊ตฐ์ ์ ์ฉ๋ ๋ณํ๊ฐ ์ค์ ํ๊ฐ์งํ๋ฅผ 10๋ฐฐ ์์น์ํจ๋ค๊ณ ํ๋ฉด ๋์กฐ๊ตฐ์๋ ๊ทธ ์ํฅ์ด ๋ฏธ์น ๊น์? ๋ง์ฝ ์ํฅ์ ๋ฏธ์น๋ค๊ณ ํ๋ฉด, Interference๊ฐ ๋ฐ์ํ ์ ์๊ณ ์๋์ ์๋ฃจ์ ์ ์ฐธ๊ณ ํ์๋ฉด ์ข์ ๊ฒ ๊ฐ์ต๋๋ค. ๊ฐ๋ฅํ ํ ๊ฐ์ง ํด๊ฒฐ์ฑ ์ randomisation unit์ ๋ณ๊ฒฝํ๋ ๊ฒ์ ๋๋ค. ๋ง์ฝ interference์ด ์ง๋ฆฌ์ ์ธ ๋จ์๋ก๋ถํฐ ๊ธฐ์ธํ๋ค๋ฉด ์ฐ๋ฆฌ๋ ์ง์ญ๋จ์ ๋๋คํ๋ฅผ ์งํํด์ผ ํ๊ตฌ์. ์๋ฅผ ๋ค์ด Vaver and Koehler (2011)์ ๊ด์ฌ ์ง๋ฆฌ์ง์ญ (์: ๊ตญ๊ฐ)๋ฅผ ์ผ๋ จ์ ์ง์ญ๋ค๋ก ๋ถํ ํ๋ ์คํ์ ์ค๊ณํ๊ณ , ๊ทธ๋ฆฌ๊ณ ๊ฐ ์ง์ญ์ ๋๋คํ๊ฒ ์คํ๊ตฐ๊ณผ ๋์กฐ๊ตฐ์ ํ ๋น๋์์ต๋๋ค. ๋ ผ๋ฌธ์ ์๋ค์ ๋ํ ์คํ๊ตฐ๊ณผ ๋์กฐ๊ตฐ ์ง์ญ์ ๋ฐธ๋ฐ์ค๋ฅผ ๋ง์ถ๊ธฐ ์ํด ๋ธ๋ญ ๋๋คํ์ ๊ฐ์ ๊ฒ์ ์งํํ ์๋ ์์์ ์ ์ํ์ต๋๋ค. ๋น์ทํ๊ฒ ์์ ๋คํธ์ํฌ์ ๊ด์ ์์ ๊ฐ์ญ ๊ฐ๋ฅ๋์ ๋ฐ๋ผ ๋คํธ์ํฌ ๋ ธ๋๋ค์ ํด๋ฌ์คํฐ๋ฅผ ๊ตฌ์ฑํ ์ ์๊ณ , ์ด ํด๋ฌ์คํฐ๋ฅผ ์คํ์ ๋จ์๋ก ์ผ์ ์ ์์ต๋๋ค. ์์ ๋ฐฉ์๊ณผ๋ ๋ค๋ฅด๊ฒ ๋๋คํ ๊ณผ์ ์์ ์๊ฐ ๊ฐ๊ฒฉ์ ์ฌ์ฉํ ์๋ ์์ต๋๋ค. ์ด ๊ณผ์ ์์ ์๊ฐ์ ์ธ ์์ธ (์ฃผ์ค/์ฃผ๋ง ๋ฑ) ์ ๊ณ ๋ คํ๋ ๊ฒ์ ์์ด์๋ ์๋๋ฉฐ paired t-test๋ ๋ถ์ฐ์ ์ค์ผ ์ ์๋ ์ข์ ๋ฐฉ๋ฒ์ ๋๋ค. ๊ทธ๋ ์ง๋ง ์คํ๊ตฐ์ด ๋ณ๊ฒฝ๋ ๋๋ง๋ค bias-varience tradeoff๋ ์ฌ์ ํ ์กด์ฌํ๋ค๋ ๊ฒ์ ์ธ์งํด์ผ ํฉ๋๋ค. ๋ณด๋ค ๊ตฌ์ฒด์ ์ธ ๋ ๋ฒจ์ธ ์ ์ ์ ๊ฐ์ ๋ ๋ฒจ์ interference ํจ๊ณผ๋ก ๋ถ์ฐ์ ์ค์ด์ง๋ง ํธํฅ์ด ์ปค์ง๋ ํ์์ด ์๊ธธ ์ ์์ต๋๋ค. ๋ฐ๋๋ก ์๊ฐ ๊ฐ๊ฒฉ์ด๋ ์ง์ญ ๋ฑ๊ณผ ๊ฐ์ ๋ณด๋ค ์ผ๋ฐ์ ์ธ ๋ ๋ฒจ์์๋ ํธํฅ์ ์ ๊ฒ ์ง๋ง ๋ณด๋ค ํฐ ๋ถ์ฐ์ ๊ฐ์ง๊ฒ ๋ฉ๋๋ค. (๊ทธ๋ฃน ๋ด ๋ถ์ฐ ๋๋ฌธ) ๋ ์์ธํ๊ฒ๋ ๋ณธ๋ฌธ์์ ํ์ธํด๋ณด์ธ์ :)