개발자

시계열 데이터를 예측하는 원리

2023년 07월 18일조회 1,498

주가 데이터를 예측하는 과정에서 궁금증이 발생했습니다. 기존에 arima모형을 통해 배운 것은 시간이라는 변수를 놓고 모형을 적합시키고, 예측했습니다. 그런데, lstm 모형을 보니, 독립변수로 시간뿐만 아니라 시가, 고가, 저가, 거래량 등 다양한 변수가 들어갑니다. 학습이야 시킬 수 있지만, 예측하기 위해서는 미래의 시가, 고가, 저가, 거래량이 필요하다고 생각하는데, 어떻게 예측값이 출력되는지 궁금합니다. 또한 decision tree, regression, randomforest도 위와 같은 변수들을 더 넣어서 주가 예측에 사용할 수 있는지 궁금합니다. 답변 남겨주시면, 정말 감사드리겠습니다 🙇‍♂️

이 질문이 도움이 되었나요?
'추천해요' 버튼을 누르면 좋은 질문이 더 많은 사람에게 노출될 수 있어요. '보충이 필요해요' 버튼을 누르면 질문자에게 질문 내용 보충을 요청하는 알림이 가요.
profile picture
익명님의 질문

답변 5

인기 답변

손정현님의 프로필 사진

안녕하세요! 흥미로운 주제인것 같아서 잠깐 글을 읽어봤는데 ARIMA의 경우는 과거 데이터를 기반으로 미래 데이터를 예측하는 알고리즘이라고 합니다. 시간에 따른 특정 종목의 값이 기록된 과거 데이터가 있다면 ARIMA 모델을 사용해서 미래 값을 예측할 수 있네요. Autoregression (AR), Integrated (I), Moving Average (MA)를 사용해서 예측하는 것 같아요. AR - 과거 값을 기반으로 미래 값 예측 I - 데이터 정상화를 위한 미분 값 적용 MA - 이동 평균 값 적용 제가 이해한 바로는 위 과정을 적절히 적용한게 ARIMA 기법이고 보다 정확한 내용은 제가 참고했던 블로그 링크 첨부할게요 :) - https://neptune.ai/blog/arima-sarima-real-world-time-series-forecasting-guide 또한 decision tree, regression, random forest 기법들도 시계열 예측에 사용은 가능한 것으로 알고 있습니다.

profile picture

익명

작성자

2023년 07월 19일

답변 감사합니다 🙇‍♂️ 주신 정보 토대로 공부해봐야겠어요 :)

인기 답변

김주혁님의 프로필 사진

안녕하세요 말씀해주신 arima 모델에 대해서 잘 알지는 못하지만, LSTM 관련하여 간단히 답변해 드리겠습니다. LSTM은 RNN의 발전된 형태로, RNN이 그렇듯 시간 T에서의 데이터를 예측할 때 시간 T의 정보뿐만 아니라 T-1, T-2, T-3 등의 이전 시간의 정보를 사용할 수 있습니다. 이런 특성 때문에 시계열 데이터에서 RNN 등의 모델이 효과적인 것입니다. 예측값이 어떻게 출력되는지 라는 질문이 조금은 모호하나, LSTM의 학습 과정에 대해 여쭤보시는 것 같아 간단히 설명드리겠습니다. 예를 들어, 지난 24시간의 데이터를 바탕으로 하여 현재의 주가를 예측하고 싶을 수 있습니다. 이를 위해 LSTM의 훈련 데이터를 24시간 단위로 끊어 생성합니다. 예시로 한 시간에 하나의 데이터(거래량, 고가, 저가 등 포함)가 생성된다면, LSTM은 24개의 데이터를 입력받아 하나의 출력값(이 경우에는 주가입니다)을 출력할 수 있게 훈련됩니다. 00시 부터 24개의 데이터, 01시부터 24개의 데이터, 02시 부터의 데이터 등 적절하게 학습 데이터셋을 구성하여 훈련시킨다면, 이후 지난 24개의 데이터를 입력받아 현재 알 수 없는 주가를 예측할 수 있겠습니다. 또한, 말씀해주신 결정 트리나 랜덤 포레스트 또한 주가 예측에 사용할 수 있습니다. 시간 관련된 변수를 적절히 전처리하면 되겠습니다. 하지만 시계열 데이터 관련해서는 주로 RNN 계열의 모델 또는 트랜스포머 모델을 쓰는 것 같습니다.

인기 답변

임태규님의 프로필 사진

안녕하세요, 1. 예측 관련 내용은 hidden state cell 부분을 읽어보시면 됩니다. lstm 이나 recurrent layer는 학습하는동안 이전 시간의 state에서 다음 시간의 state로 전이행렬, hidden state에서 변수들간의 변환행렬을 학습합니다. 2. 통계적 변수들을 추출하여 학습 변수로 사용합니다. Time series statistical feature extraction 찾아보시면 관련 논문들이 많이 있습니다

Supernova님의 프로필 사진

말이 예측이지 사실상 과거 패턴이 반복된다는 전제 하에 현재 주가에서 가장 확률이 높은 가격을 제시 하는 알고리즘입니다 과거 패턴이 반복되지도 않거니와 반복된다고 해도 어차피 표준편차 내 어디에 주가가 위치할지도 확률 상 결정되므로 거의 쓸모가 없습니다

커리어리 AI 봇님의 프로필 사진

주가 데이터를 예측하기 위한 모델에 대해 알아보겠습니다. 1. ARIMA 모델: ARIMA는 AutoRegressive Integrated Moving Average의 약자로, 시계열 데이터의 자기회귀(AutoRegressive)와 이동평균(Moving Average)을 모델링하는 방법입니다. ARIMA 모델은 과거의 시계열 데이터만을 사용하여 미래 값을 예측합니다. 따라서, 독립변수로는 시간 자체만을 사용하게 됩니다. 2. LSTM 모델: LSTM(Long Short-Term Memory)은 장기 의존성을 학습할 수 있는 순환 신경망(RNN)의 한 종류입니다. LSTM 모델은 시계열 데이터의 패턴을 학습하여 미래 값을 예측합니다. 독립변수로는 시간뿐만 아니라 시가, 고가, 저가, 거래량 등 다양한 변수를 사용할 수 있습니다. LSTM은 과거의 입력 데이터와 해당 시점의 출력 데이터를 함께 사용하여 예측합니다. 3. Decision Tree, Regression, Random Forest: 이러한 알고리즘들도 주가 예측에 사용될 수 있습니다. 독립변수로는 시간, 시가, 고가, 저가, 거래량 등 다양한 변수들을 사용할 수 있습니다. 이 알고리즘들은 주어진 입력 변수의 패턴을 기반으로 예측 모델을 학습하고, 새로운 입력에 대한 예측 값을 출력합니다. 주가 예측 모델에서는 다양한 변수를 사용하여 예측을 수행하는 것이 일반적입니다. 시간, 시가, 고가, 저가, 거래량 등 다양한 변수들은 주가에 영향을 미칠 수 있는 요인들이기 때문에 종합적으로 모델에 반영하는 것이 유용할 수 있습니다. 이러한 알고리즘들은 입력 변수와 출력 변수 간의 관계를 학습하여 예측을 수행하므로, 주가 예측에도 적용될 수 있습니다. 주가 예측 모델링은 복잡하고 도전적인 과제이며, 다양한 요인을 종합적으로 고려하여 모델을 구성해야 합니다. 또한, 주가 예측은 불확실성이 높은 예측 작업이므로 모델의 성능 평가와 추가적인 전문적인 지식이 필요합니다. 이러한 작업에는 심층적인 연구와 경험이 필요하므로, 주식 시장 예측에 대한 전문가의 도움을 받는 것이 좋습니다.

커리어리 AI 봇의 답변을 평가해 주세요!

지금 가입하면 모든 질문의 답변을 볼 수 있어요!

현직자들의 명쾌한 답변을 얻을 수 있어요.

또는

이미 회원이신가요?

목록으로

지금 가입하면 모든 질문의 답변을 볼 수 있어요!