분석의 6단계 & 주의점
분석의 6단계 1. 문제인식 - 자신의 업무나 관심있는 현상에서 문제를 인식해 그것을 해결하고자 하는 것으로 시작. - 문제가 무엇인지, 왜 이 문제를 해결해야하는지, 문제를 해결해 무엇을 달성할지 명확히 하는 것이 가장 중요 → 자신이 관심 있는 문제 중 문제의 시급성과 계량적 분석의 적용 가능성에 따라 우선순위를 정한다. 방송이나 뉴스 중 사회적으로 중요하고 홍미있는 이슈도 문제로 삼을 수 있다. 2. 관련 연구조사 - 문제와 직,간접적 관련 지식을 조사하면 문제와 관련된 주요 요소(변수)를 파악할 수 있다. - 변수는 2개 이상의 값을 가지면서 변하는 수로 사람,상황,행위 등의 속성attrubute을 나타내는데, 지능지수, 나이, 방안온도, 시험성적,애국심, 팀응집력 등이 그 예다. → 문제와 관련된 지식을 찾는 것은 문제의 핵심에 접근하기 위해, 즉 관련된 변수를 확인하고 확인된 변수 간의 일반적 관계를 파악하기 위해 매우 중요하다. 3. 모형화(변수선정) - 문제(연구대상)을 의도적으로 단순화한 것으로, 문제와 본질적으로 관련된 변수만 추려서 재구성하는 단계. - 우리가 인식한 문제는 대부분 복잡하므로(변수가 많으므로) 단순화할(변수의 수를 줄일)필요가 있다. 따라서 문제의 그 특성을 잘 대표하는 결정적 요소만 추려서 주요 변수로만 나타낸다면 분석이 좀더 단순해진다. → 관련 변수를 모두 파악했다면, 문제 해결에 중요한 영향을 미치지 않는 변수를 하나씩 제거해가기. 같은 현상이라도 목적에 따라 모형이 달라진다. 장난감 기차를 만든다면 기차의 축적이 중요하지만 기차의 경제성을 따지는 모델이라면 수송량, 속도, 연료소비율등이 중요한 변수가 될 것. 4. 자료수집(변수측정) - 변수가 선정되면 변수를 측정해야한다. 자료data는 변수의 측정치를 모은 것. - 인식된 문제는 모형화해서 주요 변수로 재구성되고 측정이라는 과정을 거치면 자료가 된다. - 2차자료(다른 사람이 이미 수집,정리한 자료)를 이용할 수 있다 (통계정, 공공기관 연구소 등) - 2차 자료에서 자신이 선정한 변수의 측정치를 구할 수 없는 경우 조사자가 관찰, 설문조사, 실험을 해서 직접 자료를 수집한다 (1차자료) → 문제의 성격, 변수의 특성, 시간이나 비용의 제한 조건을 고려해 관찰, 설문조사, 실험 중 어느 방법을 선택해서 구체적으로 어떻게 측정할지 고민해야한다. 5. 자료분석 - 자료가 수집되면 자료를 분석해야한다. - 나열된 숫자에서 변수 간 규칙적 패턴, 즉 변수 간 관련성을 파악하는 것. - 도표, 그래프부터 정교한 통계적 모형까지 문제의 성격이나 복잡성에 따라 다양한 기법이 사용된다. →변수간의 일관된 패턴을 찾는 것. 어떤 기법을 써서 자료를 분석할지는 전 단계(문제 인식단계)에서 정해진다. 집단 간 차이를 비교해야하는 문제라면 집단비교기법, 변수간 관계와 영향을 따져야 하는 문제라면 상관관계나 회귀분석 같은 기법을 사용 6. 결과제시 - 변수 간 관련성이 파악되면 그 결과가 의미하는 바를 해석해 의사결정자에게 구체적으로 조언하는 것으로 분석과정이 마무리. → 통계를 그래픽으로 나타내는 기법과 용어를 배우고, 데이터 시각화도 도움이 된다. 출처 : 빅데이터 사용설명서, 김진호