7 Principles Every Data Scientist Should Follow
Medium
훌륭한 데이터 과학자가 되려면 어떻게 해야 할까요? 관련해서 유용한 기사 공유합니다.😃 (출처: Medium)
<모든 데이터 과학자가 따라야 할 7가지 원칙>
#1. 불확실성 수용
통계는 불확실성을 정량화하는 데 뿌리를 두고 있습니다. 불확실성을 수용한다는 것은 데이터와 분석의 한계를 인정하고, 가능한 결과의 범위를 이해하며, 신뢰 구간, 예측 구간, 확률론적 모델링을 통해 이러한 불확실성을 정량화하는 것을 의미합니다.
#2. 데이터에 대해 비판적으로 생각
비판적 사고는 데이터의 출처, 품질 및 완전성에 의문을 제기하는 것을 포함합니다.
잠재적인 편향, 누락된 데이터 및 질문에 답하기 위한 데이터의 적절성을 고려합니다.
통계 모델과 분석의 기초가 되는 가정을 항상 면밀히 조사합니다.
#3. 컨텍스트 이해
통계 분석은 진공 상태에서 존재하는 것이 아니고, 데이터가 존재하는 상황은 데이터의 수집과 분석, 해석을 알려줍니다.
의미 있는 분석과 실행 가능한 통찰을 위해서는 영역과 데이터의 특성, 그리고 해결해야 할 문제를 이해하는 것이 중요합니다.
#4. 상관관계는 원인이 아니다.
상관관계와 인과관계의 차이를 인식하는 것은 타당한 결론을 내리는 데 필수적입니다.
항상 잠재적 교란 요인을 고려하고 가능한 한 통제된 실험을 통해 인과관계를 탐구하세요.
#5. 조사 결과의 신뢰성에 대한 질문
결과의 신뢰성과 안정성에 항상 의문을 제기합니다. 여기에는 p-값을 비판적으로 평가하고 효과 크기를 이해하며 결과의 재현성을 고려해야 합니다. 통계적 유의성이 항상 실질적인 유의성을 의미하는 것은 아닙니다.
#6. 복잡성에 대한 단순성
간단한 모델부터 시작해서 필요한 경우에만 복잡성을 추가합니다. 복잡한 모델은 과적합을 초래하고 데이터의 기본 패턴을 이해하기 어렵게 만들 수 있습니다.
잘 이해되고 해석 가능한 단순한 모델이 약간 더 정확하지만 불투명한 모델보다 더 가치 있는 경우가 많습니다.
#7. 통계적 유의성 vs 실제적 중요성
통계적 의미와 실제적 의미를 구분하는 것은 매우 중요합니다. 어떤 결과가 통계적으로 중요할 수는 있지만 실제적으로 중요하지는 않습니다.
결과가 주는 현실적 의미를 고려하여 항상 당신의 결과를 현실 세계의 맥락에서 해석하세요.
원본 기사 링크는 아래와 같습니다. Twitter 분석 사례의 예는 원본 기사를 통해 확인하실 수 있습니다. 감사합니다.🙏
[Source Link] https://medium.com/bitgrit-data-science-publication/7-principles-every-data-scientist-should-follow-53cdde88fc69
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 4월 30일 오전 12:24