변성윤

머신러닝 엔지니어, Engineering Manager

그랩의 실험 의사 결정 엔진

GrabX Decision Engine
- 실험 전 조언, 실험 후 분석, 기타 고급 도구를 포함한 다양한 기능이 존재
- 그랩의 실험 문화와 수준을 강화하는 방법을 살펴봄
배경
- 그랩의 실험 플랫폼은 매주 수천 가지의 실험을 테스트
  - 실험이 증가하며 데이터 기반의 증거 기반 의사 결정을 위해 신뢰할 수 있고 확장 가능한 실험 도구가 필요해짐
  - 이전엔 자동화된 실험 분석을 소개했음. 하지만 그랩에선 실험을 수동으로 분석하는 경향이 있는 것을 발견
이런 방식의 문제점
- 상황에 맞는 툴킷이 부족. 다양한 요구에 맞춰 다양한 실험 설계를 실행할 수 있도록 지원해야 함
  - 실험 설계에 대한 온라인 자료는 대부분 Two Side 마켓의 미묘한 차이를 다루지 않고, 특정 실험의 제약 조건을 고려하지 않음
- 표준화된 프로세스 부족
  - 잘못 설계된 실험, 부적절한 평가 방법, 최적의 테스트 선택, 신뢰하기 어려운 추론 등. 이것들을 모니터링하고 수정하기 어려움
- 확장성 및 효율성 부족
  - 다양한 배경을 가진 사람들이 다른 접근 방식을 채택할 수 있음. 이런 방법은 이전 방식과 결이 달라 일관성 있는 프레임워크를 만드는 데엔 악영향을 미칠 수 있음
해결책
- 그랩의 내부 개발 플랫폼에 오픈소스화된 파이썬 패키지인 GrabX Decision Engine을 개발. 이 엔진의 핵심 목표는 실험 효율성과 분석의 Best Practice를 시스템화해서 각 실험에서 정확하고 신뢰할 수 있는 결론을 도출하는 것
- GrabX, 자동화된 실험 분석과 호환. 시뮬레이션 기반 캘리브레이션, 자동 설정 튜닝 등 같은 다운스트림 작업에도 사용 가능
- 실험 분석 표준화
- 협업 및 품질 향상
- DS, PA가 주로 사용자고 실험 프로세스와 관련된 모든 사람을 위해 설계되었음
기능 세부 정보
- 실험을 위한 신뢰할 수 있는 조언 기능
- 실험 후 분석 툴박스 기능
- 고급 도구
실험 설계 참고 사항
- 피험자 간(between-subject) 설계 / 피험자 내(within-subject) 설계로 구분
- 피험자 간 설계 : 앱 사용자 등을 실험 그룹으로 나누고 실험 기간 동안 다른 조건에 노출
  - 이 방법은 여러 실험에 참여할 수 있을 수 있음
  - 피험자 간 상관관계가 발생할 수 있고, 서로 연관성이 생길 수 있음
  - randomization, session 단위에 차이가 발생할 수 있음
  - pre-experiment power analysis와 post-experiment inference의 정확성에 영향을 미침
  - 표준 오차의 군집화 등이 필요함
- 피험자 내 설계 : 모든 참가자가 모든 조건 경험
  - 전후 비교를 해야하는 경우
  - 마켓플레이스에서 사용되는 설계 방법. 시간 슬라이드가 실험 단위
신뢰할 수 있는 조언자
- 피험자 간 설계 : 표본 크기를 추정하기 위함
- 피험자 내 설계 : 대신 따라야 하는 모범 사례 가이드라인 제공
- 그 외에 표본 비율 불일치(SRM) 문제가 발생할 수 있음. 실험 후 분석도 고려함
Recommended regression models
- 실험에서 일반적으로 관찰되는 confounders factor, fixed effect, heteroskedasticity을 제어하기 위해 회귀 모델 사용
- 피험자 간 설계 : 동일한 실험 단위의 반복 관측. iid
- 피험자 내 설계 : 파급 효과, 무작위 배정 불균형 등 문제가 있어서 confounder factor를 더 잘 통제해야 함.

Grab Experiment Decision Engine - a Unified Toolkit for Experimentation

Grab Tech

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 7월 28일 오후 2:24

저장 4 • 조회 1,885

함께 읽은 게시물

장홍석

스페이스오디티 부대표/CPO

8시간 전

< 좋은 질문은 틀릴 수 있는 질문이에요 >

1. 질문은 ‘대답할 수 있는 질문’이어야 하고, 그 대답은 ‘틀릴 수 있어야’ 합니다.

댓글 1 • 저장 3 • 조회 385

장홍석

스페이스오디티 부대표/CPO

20시간 전

< 무엇이 사람들을 하나로 뭉치게 하는가? >

1. 사람들을 하나의 부족으로 만들기 위해서는 단 두 가지만 있으면 된다. '통의 관심사'와 '소통 방법'이다.

댓글 1 • 저장 2 • 조회 320

석민

커리어 코치

4일 전

스스로 생각하는 힘

저장 4 • 조회 572

장홍석

스페이스오디티 부대표/CPO

하루 전

< 레이 달리오의 뇌를 복제한 인공지능의 정체 >

댓글 1 • 저장 1 • 조회 288

Annette MJ Kim

사람과 조직의 동반 성장을 위해 일해요:D

20시간 전

퇴근길 지하철에서 중년 사내와 20대 후반의 한 젊은이가 필자의 앞에 나란히 앉아 있었다. “자리가 사람을 만드는 법이지.” 중년 사내가 젊은이에게 건네는 말 한마디가 내 귀에 들려왔다. 그 순간 나는 묘한 추억에 빠져들었다.

[김인수 기자의 사람이니까 경영이다]자리가 무능한 사람을 만든다는데 - 매일경제

매일경제

저장 2 • 조회 242

권태관

NAVER 소프트웨어 엔지니어

하루 전

퇴사 부검 : 네이버를 떠나며

�

퇴사 부검 : 네이버를 떠나며

taetaetae.github.io

•

저장 8 • 조회 964

비슷한 게시물

박승규 카카오계열사에서 이것저것 만드는 개발자

심플하고 예쁜 오픈소스 ERD 도구 drawdb

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

[Target] 데이터 분석 인터뷰 문제

차은호 삼쩜삼 전략BI 리드

[서평단] 오픈소스 생태계 이야기 '오픈'

데분가 NAVER 데이터분석

삼쩜삼에서 부동소수점 다루는 방법

JY 컴린이

데이터분석 공부중인데 포폴 어떻게 해야할까요?

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

데이터 분석가의 MBTI는 바로...!

주간 인기 TOP 10

강재상 스타트업 육성, Corprate Venturing, 사업, 커리어, 작가

회사 때려치고 사업이나 한번 해볼까?

K리그 프로그래머 커피한잔 개발자

클로드 코드 Max 한 달 사용 후기

전민우 백엔드개발자

회피를 해야 할까요? 방안을 찾아야 할까요?

유용우(요우) NAVER 백엔드 개발자

사용자가 아닌 개발자를 위한 웹 개발의 시대

이양일 NaverCloud 백엔드 개발자

MCP 모르면 대체 얼마나 손해 보는 걸까?🤔

김의중 프론트엔드 개발자

Next.js 앱을 쿠버네티스에 배포하기 (feat. ArgoCD

레드버스백맨 리서처 앤 라이터

⟪토스가 만든 리서치툴, TNS⟫

골빈해커 Chief Maker

‪요 기능의 일부를 바이브 코딩으로 만들려다가 실패했는데요. 그

JOSH 솔로프리너 CEO

국내 바이브코딩 시장을 혼자 독점하고 계신 커서맛피아님을 인터뷰했

이유진 우아한 형제들 프로덕트 디자이너

생산성 수치심 (Productivity Shame) 극복하기 (1

그랩의 실험 의사 결정 엔진

댓글 0

함께 읽은 게시물

< 좋은 질문은 틀릴 수 있는 질문이에요 >

< 무엇이 사람들을 하나로 뭉치게 하는가? >

스스로 생각하는 힘

< 레이 달리오의 뇌를 복제한 인공지능의 정체 >

퇴사 부검 : 네이버를 떠나며

비슷한 게시물

주간 인기 TOP 10

추천 프로필