주가 예측 모델에 대한 고찰

반응형

주가 예측 모델에 대한 고찰

 

주가는 어떻게 움직이는가?

 

에 대한 고찰을 안고 지난 몇 년간 꽤 많은 방법으로 마켓 알파를 낼 수 있는 방법을 고민했고 그중 인공지능을 활용하여 주가를 예측하는 모델을 구현하는 여정을 복기하여 기록한다.

  대학원 연구과제가 기업가치 평가가 주제였었다. 학계에서는 소위 기본적 분석이라고 하는 재무제표에 기반한 기업가치평가에 권위 있는 기관의 산업 성장 예측치 및 기업 가이던스를 projection 하는 것이 주류다. 이 역시 여러 가지 모델 및 Tool이 있고 각각 장단이 있다.

 

  가령 이런 것이다.

  • 이익이나 현금흐름을 모수로 하는 현금흐름할인(DCF), 주가수익비율(PER) 등은 개업한 지 얼마 되지 않아 이익을 내지 못하는 혁신 성장 기업의 가치를 산정하지 못한다.
  • 배당할인모형(DDM)은 배당하지 않는(재투자율이 높던, 배당 여력이 없던) 기업의 가치를 산정할 수 없다.
  • 주가매출비율(PSR)은 성숙기에 진입한 사업을 영위하는 기업과 초기 산업에 속해있는 기업의 가치 산출이 서로 상이하며 이후 가장 중요한 수익(실적)이 보장되지 않는다.

  이런 단점들을 차치하더라도 치명적인 약점은 이런 숫자들이 확정되는 시점은 3개월 단위이며 후행한다는 점이다. (주식투자는 미래에 투자하는 것임에도 불구하고...)

  물론 소위 시장 컨센서스라고 하는 평가대상이 되는 기업이 발표한 가이던스와 리서치, 통계 자료를 이용해 산출하는 애널리스트들의 롤링 전망치들을 평균해 실적을 가늠하고 추적하기는 하나 실적 발표 시즌에는 여지없이 어닝 쇼크와 서프라이즈가 난무하며 이는 '평가 모형', '예측 모형'이라기보다는 가격 합의 프로세스이다.

  결국은 미래에 대한 엄청난 통찰력과 적당한 행운이 따라야 주가 예측이 맞아떨어지는 것이며 이런 통찰력과 행운은 모두에게 돌아오는 것이 아니므로 포트폴리오를 만들어 리스크헷징을 할 수 밖에 없다.

 

주가 예측 모델에 대한 고찰

 

주가는 실적을 따라가는가?


라는 질문에 대해 가장 많이 듣는 대답은 "'결국'은 실적에 수렴한다" 일 것이다. 수렴과 발산을 한다면 이격이 발생해있는 시간이 더 많다는 것인데 이것이 장기투자의 근거가 되는 대전제이다. 장기투자는 단기투자보다 더 먼 미래를 볼 수 있는 통찰력과 좀 더 많은 행운이 있어야 한다.

  그렇다면 기업의 실적은 어제, 오늘, 내일이 크게 차이 나지 않을 텐데 매일같이 수% 씩 움직이는 이유는 왜일까?

효율적 시장 가설과 같은 몇가지 가설과 노이즈이며 브라운 진자운동과 유사하다, 확률적 분포를 따른다고 설명하나 기술적 분석은 이를 다른 시각으로 접근한다.

 

 

그렇다면 기술적 분석을 이용하면 '모델화' 할 수 있을까?

  많은 투자자들이 기술적 분석과 기술적 지표를 이용해 system trading을 한다. 기술적 분석의 가장 큰 약점은 학문적 근거가 없다는 것이다. 상관관계를 보여도 그것을 설명할 인과관계가 없다는 것이다. 그렇다면 상관관계는 높을까? 많은 연구를 보면 그 상관관계는 0.6을 넘지 못한다. 그럼에도 불구하고 기술적 지표를 이용해 수익을 내는 트레이더들이 있다. 심지어 이를 모델화한 알고리즘 역시 있다. 하지만 이 알고리즘 역시 각각 시장 상황에 맞는 알고리즘이 따로 있다. 시장 상황에 맞게 알고리즘을 갈아 끼워야 한단 소리이다.

 

주가 예측 모델에 대한 고찰

 

No Silver Bullet!!

모든 상황에 맞는 해결책은 없다

 

 

  가령 이런 것이다.

  • 박스권 장세에서는 볼린저 밴드나 앤빌롭 지표를 켜놓고 트레이딩 하면 발끝에서 사서 머리끝에서 팔 수 있다.
  • 장세가 좋아 지속적으로 상승하는 장에서는 상대강도지수(RSI)나 이동평균선 이격도만 잘 보면 고점에 팔고 눌림목에 다시 잡아 주름주름 다 발라먹을 수 있다.

  시장에 알려진 수백 수천개의 기술적 지표, 그리고 이들의 조합한다 하더라도 KRX300이나 S&P 500 종목을 다 깔아놓고 과거 20년 전부터 백테스트를 돌리면 거래비용 때문에 손실을 내거나, 수익을 내더라도 마켓을 이기지 못한다.

 

  나는 기본적 분석이든 기술적 분석이든 이들을 비판하는 것이 아니다. 당 project는 엘도라도를 찾는 모험가와 같이, 보물섬을 찾는 해적과 같이, silver bullet에 대한 위대한 여정이며, 구구절절하게 설명하지 않아도 되는 확률 높은 모델을 향한 연구이다.

  그간 많은 시행착오를 겪었으나 수학적인 모델을 만들어 그 누구보다 가장 높은 track record를 기록 중인 제임스 사이먼스와 그의 르네상스 테크놀로지의 존재가 어느 정도 가능성이 있다는 것을 반증한다고 생각했으며 여러 가지 방법으로 모델화를 시도해 보았다.

  이 중에 back test 결과가 가장 좋았던 모델은 평균 적중률은 약 70%이며 현재 pilot를 운영 중이다. 해당 문서는 모델을 구현하는 기술과 그 기능에 초점을 맞추며 실적은 Track Record에 기록할 생각이다.

  사용한 기술 스택 및 인프라는 다음과 같다.

  • Server : Oracle Cloud
  • DB : Oracle 자율 운영 DB
  • 개발 언어 : Python
  • Web : Plotly Dash​

 

자, 이제 시작한다.

반응형