시계열 분석에서 '정상성'이란?

요즘 저는 시계열 예측 모형을 공부하고 업무에서 활용해보려 하고 있는데요! 시계열 모델에서 필수로 공부해야할 '정상성'에 대해 아주 잘 정리해놓은 글이 있어서 공유드립니다! (저도 매우 큰 도움을 받았어요! 저자분에게 감사드립니다) 간단히 정리하자면 * '정상성'은 '일정하여 늘 한결같은 성질'을 의미합니다 * 그리고 통계적인 시계열 모델(ex. ARIMA)에서 필수적으로 '정상성 가정'을 하지요! * 즉, 가지고 있는 데이터의 모형이 정상성을 만족해야 한다는 것인데 * 통계 모델이기 때문에 통계에서 '일정하여 늘 한결같은 성질'은 1) 평균이 일정하고 2)분산의 폭이 일정하다(분산의 폭이 무한으로 발산하지 않음) 을 의미합니다. * 이게 무슨 의미냐? 라고 할 수 있지만 시계열 데이터를 시각화 하였을 때 1) 계절성이 없고 2) 일정한 추세(우상향, 우하향)가 없고 3) 분산이 일정함 이 세 가지를 만족하면 정상성이라고 할 수 있지요! * 즉, 내가 가지고 있는 시계열 데이터가 정상성을 만족하는지는 시각화를 통해, 그리고 통계적 검정을 통해 알 수 있습니다 * 결론적으로는 정상화를 만족하지 않는다면 정상화를 만족하게 만들고(차분, 로그 변환) 시계열 예측 모델링을 진행해야 한다는 것! 이 모든 것이 python 과 R의 statsmodel 라이브러리에서 코드 몇 줄로 끝나지만 원리를 알고 하는 것과 그렇지 않은 것은 하늘과 땅 차이네요! 저자의 원문은 훨씬 더 좋은 글이니 읽어보시길 권해드립니다 :) 더 자세히 공부하고 싶으시다면 Forecasting: Principles and Practice 책을 추천드립니다! (Forecasting: Principles and Practice 링크: https://assaeunji.github.io/statistics/2021-08-08-stationarity/)

시계열 분석에서 '정상성'이란?

알림