Community

안녕하세요 말씀해주신 arima 모델에 대해서 잘 알지는 못하지만, LSTM 관련하여 간단히 답변해 드리겠습니다. LSTM은 RNN의 발전된 형태로, RNN이 그렇듯 시간 T에서의 데이터를 예측

안녕하세요 말씀해주신 arima 모델에 대해서 잘 알지는 못하지만, LSTM 관련하여 간단히 답변해 드리겠습니다. LSTM은 RNN의 발전된 형태로, RNN이 그렇듯 시간 T에서의 데이터를 예측할 때 시간 T의 정보뿐만 아니라 T-1, T-2, T-3 등의 이전 시간의 정보를 사용할 수 있습니다. 이런 특성 때문에 시계열 데이터에서 RNN 등의 모델이 효과적인 것입니다. 예측값이 어떻게 출력되는지 라는 질문이 조금은 모호하나, LSTM의 학습 과정에 대해 여쭤보시는 것 같아 간단히 설명드리겠습니다. 예를 들어, 지난 24시간의 데이터를 바탕으로 하여 현재의 주가를 예측하고 싶을 수 있습니다. 이를 위해 LSTM의 훈련 데이터를 24시간 단위로 끊어 생성합니다. 예시로 한 시간에 하나의 데이터(거래량, 고가, 저가 등 포함)가 생성된다면, LSTM은 24개의 데이터를 입력받아 하나의 출력값(이 경우에는 주가입니다)을 출력할 수 있게 훈련됩니다. 00시 부터 24개의 데이터, 01시부터 24개의 데이터, 02시 부터의 데이터 등 적절하게 학습 데이터셋을 구성하여 훈련시킨다면, 이후 지난 24개의 데이터를 입력받아 현재 알 수 없는 주가를 예측할 수 있겠습니다. 또한, 말씀해주신 결정 트리나 랜덤 포레스트 또한 주가 예측에 사용할 수 있습니다. 시간 관련된 변수를 적절히 전처리하면 되겠습니다. 하지만 시계열 데이터 관련해서는 주로 RNN 계열의 모델 또는 트랜스포머 모델을 쓰는 것 같습니다.

알림

알림이 없습니다