데이터 과학자가 따라야 하는 7가지 원칙

훌륭한 데이터 과학자가 되려면 어떻게 해야 할까요? 관련해서 유용한 기사 공유합니다.😃 (출처: Medium)


<모든 데이터 과학자가 따라야 할 7가지 원칙>


#1. 불확실성 수용

  • 통계는 불확실성을 정량화하는 데 뿌리를 두고 있습니다. 불확실성을 수용한다는 것은 데이터와 분석의 한계를 인정하고, 가능한 결과의 범위를 이해하며, 신뢰 구간, 예측 구간, 확률론적 모델링을 통해 이러한 불확실성을 정량화하는 것을 의미합니다.


#2. 데이터에 대해 비판적으로 생각

  • 비판적 사고는 데이터의 출처, 품질 및 완전성에 의문을 제기하는 것을 포함합니다.

  • 잠재적인 편향, 누락된 데이터 및 질문에 답하기 위한 데이터의 적절성을 고려합니다.

  • 통계 모델과 분석의 기초가 되는 가정을 항상 면밀히 조사합니다.


#3. 컨텍스트 이해

  • 통계 분석은 진공 상태에서 존재하는 것이 아니고, 데이터가 존재하는 상황은 데이터의 수집과 분석, 해석을 알려줍니다.

  • 의미 있는 분석과 실행 가능한 통찰을 위해서는 영역과 데이터의 특성, 그리고 해결해야 할 문제를 이해하는 것이 중요합니다.


#4. 상관관계는 원인이 아니다.

  • 상관관계와 인과관계의 차이를 인식하는 것은 타당한 결론을 내리는 데 필수적입니다.

  • 항상 잠재적 교란 요인을 고려하고 가능한 한 통제된 실험을 통해 인과관계를 탐구하세요.


#5. 조사 결과의 신뢰성에 대한 질문

  • 결과의 신뢰성과 안정성에 항상 의문을 제기합니다. 여기에는 p-값을 비판적으로 평가하고 효과 크기를 이해하며 결과의 재현성을 고려해야 합니다. 통계적 유의성이 항상 실질적인 유의성을 의미하는 것은 아닙니다.


#6. 복잡성에 대한 단순성

  • 간단한 모델부터 시작해서 필요한 경우에만 복잡성을 추가합니다. 복잡한 모델은 과적합을 초래하고 데이터의 기본 패턴을 이해하기 어렵게 만들 수 있습니다.

  • 잘 이해되고 해석 가능한 단순한 모델이 약간 더 정확하지만 불투명한 모델보다 더 가치 있는 경우가 많습니다.


#7. 통계적 유의성 vs 실제적 중요성

  • 통계적 의미와 실제적 의미를 구분하는 것은 매우 중요합니다. 어떤 결과가 통계적으로 중요할 수는 있지만 실제적으로 중요하지는 않습니다.

  • 결과가 주는 현실적 의미를 고려하여 항상 당신의 결과를 현실 세계의 맥락에서 해석하세요.


원본 기사 링크는 아래와 같습니다. Twitter 분석 사례의 예는 원본 기사를 통해 확인하실 수 있습니다. 감사합니다.🙏

[Source Link] https://medium.com/bitgrit-data-science-publication/7-principles-every-data-scientist-should-follow-53cdde88fc69


7 Principles Every Data Scientist Should Follow

Medium

7 Principles Every Data Scientist Should Follow

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 4월 30일 오전 12:24

 • 

저장 7조회 1,875

댓글 0