[통계적 유의성 검정이 절대적이지 않은 이유]

AB 테스트는 종합 대조 실험(Controlled Experiment)이며, 해석을 위해서는 통계적 가설 검정이 필요합니다. 이 과정에서 단순히 p값을 보면서 통계적으로 유의미하다/그렇지 않다 로 이분법적으로 사고하기보다는, 전반적인 가설검정 프로세스를 이해하고 이에 기반한 의사결정을 할 필요가 있습니다. 특히 p-value는 현업에서 가장 많이 오용되는 개념 중 하나인데, p-value가 작다고 해서 반드시 대립가설이 옳다고 해석할 수는 없습니다. (마찬가지로 p-value의 크기가 효과의 크기를 의미하는 것도 아니구요) AB 테스트의 기초가 되는 통계적 개념에 대해 잘 정리한 글을 발견해서 공유합니다.

창백한 푸른 점 : 네이버 블로그

blog.naver.com

창백한 푸른 점 : 네이버 블로그

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 10월 20일 오후 1:31

 • 

저장 8조회 1,246

댓글 0

    함께 읽은 게시물

    IT 회사의 업무에서, 지금까지는 디자이너와 특히 개발자가 병목이었는데, 대 AI 시대에는 기획자가 병목이 될 수도 있겠다. 조금이라도 규모가 있는 기업에서의 가장 큰 병목은 보통 의사결정자라는 것을 생각해보면 그렇다.


    즉, 실무보다 의사결정을 AI에게 맡기는 것이 병목을 해소할 수 있는 가장 확실한 방법이며, 그러므로 부장님과 사장님을 AI로 대체하는 것이야말로 인류의 번영을 위한 가장 빠른 지름길이다. (아님. 아니 맞나?!)

     • 

    저장 1 • 조회 2,204


    앱 개발 개척시대

    A

    ... 더 보기

    앱 개발 개척시대

    K리그 프로그래머

    앱 개발 개척시대

     • 

    저장 2 • 조회 861


    📰 OpenAI가 ChatGPT의 커넥터 기능을 업데이트하면서 MCP 지원을 추가했네요.

    ... 더 보기

    GraphRAG 에 대한 생각

    2000년 초반부터 온톨로지 연구를 해왔고, 관심을 갖고 있는 사람으로서 GraphRAG 에 대해 갖고 있는 생각을 적어봤습니다.

    ... 더 보기

    독일 딜리버리히어로(DH)의 올해 1분기 실적발표 컨퍼런스콜에서 마리 앤 최고재무책임자(CFO)는 전세계 자사 브랜드 12곳 중 배민의 부진을 콕 찍어 투자자들에 고개를 숙였다. 올해 1분기 아시아 지역 GMV(거래액)이 전년 대비 12% 이상 감소했다는 '어닝 쇼크'를 언급하면서다. 특히 한국을 제외한 전세계 GMV가 22% 급성장한 점과도 대비됐다.

    ... 더 보기

    성장세 꺾인 배민…IB업계선 '매각 가능성' 설왕설래

    n.news.naver.com

    성장세 꺾인 배민…IB업계선 '매각 가능성' 설왕설래

    "누가 왜 그렇게 하자고 했어요?"

    P

    ... 더 보기

    누가 왜 그렇게 하자고 했어요?

    Brunch Story

    누가 왜 그렇게 하자고 했어요?