🧐 딥러닝 초보들이 흔히하는 실수 : 주식가격 예측 AI 📈

[😈데블챌 2기 11일차, 시계열 모델의 함정]


딥러닝, 특히 시계열 모형에 대한 관심을 갖게 되었다면 '주식 AI 프로젝트'를 봤을 확률이 높습니다. 실제로 RNN, LSTM, Transformer.. 등 여러 딥러닝 모델들을 활용한 프로젝트들이 소개되어 있고, 대표적인 분석 대상이 주식 데이터 이기도 합니다. 오늘은 간단하지만 놓치기 쉬운 시계열 모델의 함정에 대한 컬럼을 준비해 보았습니다~!


  • "내일 주식가격은 오늘 주식가격과 똑같을 것이다"

    수많은 딥러닝 기법들을 보다 보면, 거의 시장 가격과 동일한 예측 그래프를 그린 경우들이 많습니다. 복잡한 딥러닝 기법의 승리일까요? 그래프를 자세히 살펴보면, 그저 오늘의 데이터가 내일로 옮겨간 형태로 예측이 되어 있습니다. 이러한 현상이 발생한 이유는 모델이 오늘(과거)의 값과 내일(예측)의 값이 동일하다는 형태로 학습되었기 때문입니다. 딥러닝 모델은 Loss(예측-실제값)를 최소화 하는 형태로 진행되기 때문에, 과거의 값을 입력 데이터로 쓰는 시계열 모델에서 이러한 현상이 자주 발생합니다.


  • 몇 가지 해결책

    • 주식 가격이 시퀀스(시계열) 데이터로만 다루는게 맞는지 고려

    • 가격이 아닌 다른 결과를 예측하는 모델

    • 가격이 아닌 다른 변수를 입력하는 모델

    • 시계열의 stationary(정상성) 고려


평소 시니컬한 강의 스타일로 유명하신 유튜버, 코딩애플님의 컬럼을 가져와 보았습니다 ㅎ

사실 주식 문제는 경제, 통계 분야에서 전통적인 시계열 기법으로 오랫동안 다뤄온 과제입니다. 그만큼 많은 기법들이 존재하고, 머신러닝은 그 중 하나의 접근법이라 할 수 있습니다.


  • 몇 가지 기법

    • 준거 기준으로 나이브 모형(과거=미래)을 활용

    • 백테스팅 데이터의 다각화

    • 포인트 추정이 아닌 구간 추정(범위로 예측)


개인적으로 시계열 분석에서 염두에 두는 부분을 추가 해보았습니다. 물론, 여러가지 기법에도 불구하고 과거 데이터를 통한 가격 예측(퀀트 투자)에 대한 논란들이 많습니다. 그럼에도 엄연히 투자 회사, 대표적으로 르네상스 테크놀로지와 같은 유력 회사들은 수학적 모형으로 시장을 분석하고 있습니다.


전 시계열 분석 및 통계에 대한 지식이 부족하기에, 시계열 태스크에 대해 이야기하기 조심스럽습니다. 하지만 딥러닝 모델들은 복잡한 통계 모형들에 대한 이해가 다소 부족하더라도, 시계열 데이터의 추세와 패턴을 분석하는데 유용한 도구가 될 것이라 생각합니다. 가격이라는 '정답'이 아닌 데이터라는 '이야기'에 초점을 맞춘다면 더욱 그렇지 않을까 싶습니다 : )


## 본문과 관련된 아티클

https://codingapple.com/unit/deep-learning-stock-price-ai/

(칼럼) 딥러닝 초보들이 흔히하는 실수 : 주식가격 예측 AI

Codingapple

(칼럼) 딥러닝 초보들이 흔히하는 실수 : 주식가격 예측 AI

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 6월 7일 오후 1:20

댓글 0

    함께 읽은 게시물

    간만에 재밌게 읽은 기술 포스트

    ... 더 보기

    무진장 힘들었지만 무진장 성장한 개발 이야기

    Medium

    무진장 힘들었지만 무진장 성장한 개발 이야기

    길은 잃은 이력서

    

    ... 더 보기

    6년간의 토이프로젝트 여정을 마무리하며 - 기술블로그 구독서비스 회고록

    ... 더 보기

    6년간의 토이프로젝트 여정을 마무리하며 - 기술블로그 구독서비스 회고록

    taetaetae.github.io

    6년간의 토이프로젝트 여정을 마무리하며 - 기술블로그 구독서비스 회고록

     • 

    댓글 1 • 저장 9 • 조회 2,160