네이버 증권이던 증권사 앱이던 그들이 제공하는 종목별 정보, 가격, 거래량, 매매주체, 공매도.. 이 모든 데이터의 원천이 어디일까? 대부분 한국거래서(KRX)에서 제공되는 데이터들이다. 한국거래소에서는 정보데이터시스템(이름이 이상하긴 하지만) 이란 걸로 꽤 괜찮은 데이터 세트를 일반에 공개하고 있다.
들어가보면, 지수, 주식, ETP, 채권, 파생상품 등 거래소에서 거래되는 대부분 상품에 대한 데이터들을 제공하고 있다.
나의 경우는 종목별 상장일, 시총, 거래량 등을 excel이나 csv 파일로 다운 받아 어떤 종목을 대상으로 training 할지, test 데이터로 할지를 판단할 때 사용했다.
이 외에도 종목별 EPS, PER, PBR 그리고 배당 정보도 제공하는데 시장 컨센서스가 반영된 추정(forward) EPS 및 PER도 제공한다. 그리고 무려 지수(KOSPI 200, KRX 300 등에 대한)의 PER, PBR, 배당수익률도 구성종목의 PER, PBR, 배당수익률을 계산하여 제공해 준다.
그리고 채권, ETF, ETN, ELW, 옵션, 선물에 대한 데이터도 제공되며 투자자별 거래내역, 공매도 내역 등 증권사 앱에서 볼 수 있는 대부분의 데이터들이 바로 한국거래소에서 제공되는 데이터 들이다.
이런 데이터들은 대부분 실시간으로 제공되며 공매도 실적이나, 투자주체와 같이 전산화가 미비한 항목들은 거래일 오후 6시 이후 업데이트 된다.
한국거래소 정보데이터시스템을 소개하는 이유는 파이썬에서 이 데이터들을 끌어다 쓸 수 있기 때문이다. 이어서 다음 포스팅에서는 pykrx라는 패키지를 이용해 이 데이터들을 가져와 보겠다.