데이터 과학에서 잘 못 사용되는 5가지 단어들
오늘(5월 28일)은 데이터 과학의 결과나 개념을 설명하면서, 잘못된 언어를 사용하는 문제(misused)에 대해서 다루고 있는 기사에 대해 공유하고자 합니다. 🥇예측(Predictive) 학습된 통계 모델에서 상당한 영향을 미치는 변수는 학습 샘플(training sample)에서만 예측할 수 있으며, 그 효과는 실제로 관련이 없을 정도로 미미할 수 있으므로 '예측적'이라고 설명하는 것은 현실을 잘못 표현한 것일 수 있습니다. 실생활에서 모델이나 변수를 예측 가능한 것으로 설명할 수 있으려면 새로운 데이터에 대한 전체 테스트 프로세스가 필요합니다. 일반적으로 예측 효과를 확인하기 위해 표본 테스트 샘플을 사용하지 않는 한 변수나 모델을 예측으로 설명하면 안됩니다. 🥈결정계수(R-squared) 일반적으로 허용되는 모델 품질 측정값인 R-제곱은 매우 작은 클래스의 선형(linear)이나 가법(additive) 모델에만 존재합니다. 그러나 사람들이 확률 모델(probabilistic model)이나 classifier가 'a high R-squared'을 갖는다고 설명하는 것을 자주 듣습니다. 간단한 일반화 선형 모델의 경우에도 전체 모델 품질을 정의하는 여러 가지 방법이 있습니다. 이러한 모델에는 적어도 5가지 유형의 "pseudo-R-squared" 메트릭이 있으며 그 결과는 매우 다르고 해석하기 어렵습니다. 여기에 ROC AUC, F1 점수 등과 같이 사용할 수 있는 모든 예측 정확도 메트릭도 있고요. 하나의 모델링 접근 방식에서 알고 있는 용어를 다른 접근 방식으로 설명하기 위해 사용하면 안 될 것입니다. 🥉공산(Odds) 확률적 모델링을 수행하면, 공산은 모델의 계수(coefficient)를 해석할 때 자연스럽게 발생하는 데요. 공산(Odds)와 확률(Probability)는 다릅니다. 모델에서 변수의 공산비(odds ratio)가 300% 일 때, 일부 사람들은 해당 변수의 증가 확률이 결과물(outcome)의 300%라고 오해하기도 합니다. 확률이 결과에 미치는 영향은 이전 확률이 무엇인지에 따라 달라집니다. 이미 매우 높다면 300%의 공산비는 거의 영향을 미치지 않습니다. 사전 확률이 매우 낮았다면 실제로 300%에 가까운 효과가 있을 것이지만 작은 경우, 300%는 여전히 작을 것입니다. 🍀 증명(Prove) 통계 테스트에서 오용되는 또 다른 단어는 증명입니다. 우리는 가설을 증명하거나 반증하지 않습니다. 우리는 귀무가설을 기각하거나 기각하지 못합니다. 12세에서 16세 사이의 남자아이와 여자아이의 평균 친구 수가 같은지 테스트하고 싶다고 가정해 보겠습니다. 우리는 해당 연령 범위의 소년과 소녀의 충분한 표본을 조사하고 모든 소년과 모든 소녀 사이에 의미 있는 친구에는 차이가 없다는 귀무 가설을 공식화합니다. 그런 다음 우리가 가지고 있는 샘플의 통계적 속성을 고려할 때 귀무 가설이 참일 가능성이 얼마나 되는지 조사합니다. 상당히 임의로 선택된 확률 막대(probability bar, alpha)를 사용하여(보통 <5%) 귀무 가설을 기각한다고 선언할 수 있습니다. 이것이 남학생과 여학생의 평균 친구 수가 다르다는 것을 증명한다고 말할 수 없습니다. 같은 수의 친구가 있을 가능성이 낮다고 말할 수도 있고, '통계 테스트는 알파 0.05에서 귀무가설을 기각했다'고 말할 수 있습니다. 증명이란 100% 확실성을 의미하며 샘플로 작업할 때는 거기에 도달할 수 없습니다. 🖐️ 통계적 검정력(Statistical Power) 많은 사람들이 어떤 것이 통계적 검정력이 높거나 낮다고 말하는 것을 들었지만, 일반적으로 그들이 실제로 의미하는 것은 낮거나 높은 p-value 또는 높거나 낮은 표본 크기(size)입니다. 통계적 검정력이 무엇인지 정의할 수 있는지 스스로에게 물어보십시오. 통계적 검정력은 귀무가설을 기각하고 실제로 대립가설이 참일 확률입니다. 기본적으로 귀무 가설의 기각이 얼마나 신뢰할 수 있는지 또는 신뢰할 수 있는지에 대한 척도입니다. 그것은 p-value보다 훨씬 더 많은 것에 의존하며 샘플 크기, alpha 및 effect 크기의 'holy trinity(삼위일체')를 사용하여 계산됩니다. 알파가 더 높거나 샘플 크기가 더 작은 결과가 더 큰 통계적 검정력을 갖는 것은 전적으로 가능합니다(실제로도 일반적입니다). 원본 기사 링크는 아래와 같습니다. 감사합니다🌈 [Source Link] https://keith-mcnulty.medium.com/five-annoyingly-misused-words-in-data-science-328236c9967c