도메인은 모르지만 인과추론은 하고 싶어
PAP
[😈데블챌 2기 1일차, 베이지안 방법론]
데이터 분석, AI 분야에 종사하다 보면, 늘 만나게 되는 과제가 있습니다. 예측 또는 인과추론 문제 입니다. 수많은 SOTA 모델이 쏟아지지만 예측 문제에 대한 해답은 쉽게 얻을 수 없습니다. 여전히 깊이 있는 통계적 지식과 데이터 도메인에 대한 이해가 필요하기 때문입니다.
하지만 어렵다 하여 외면할 순 없기에 '인과 추론'에 대한 글을 하나 공유합니다~!
'베이지안 방법론'을 다룬 저자의 게시글을 보면, 짧고 간결하게 문제에 대한 태도부터 방법론까지 자연스럽게 설명하고 있습니다.
1) 교란 변수
먼저 저자는 수 많은 관찰 변수에 대해 모든 조합을 고려하는 것은 무리가 있음을 얘기합니다. 따라서 원인과 결과 요인이 아닌 교란 요인을 구분하고자 합니다.
2) 인과 추론의 목적
인과추론의 목적이 특정 처치나 정책의 효과를 정량적으로 분석하는 것임을 지적하며, 단정적인 선형모형이 아닌 머신러닝 모형을 제시합니다.
3) 두 가지 모형
인과 추론 모형으로써 '베이지안 트리 앙상블 모형인 BART'와 '신경망 모형인 Draggonet'에 대한 설명을 남기며 글을 마무리 합니다.
통계학 기반의 게시글이며, 원하는 바를 얻어내기에 부족한 분량일 수 있습니다. 하지만 도메인에 대한 두려움을 걷어내고 '가정과 추론' 이라는 데이터 분석의 초석을 다시금 다지는데 도움이 되었습니다. : )
베이지안 이론을 좀 더 읽어보기 위한 글
https://ddiri01.tistory.com/234
https://playinpap.github.io/adjustment-for-confounding/
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 5월 27일 오후 11:53