본문 바로가기

backup

[HFT 시스템 트레이딩]자기상관관계 분석1

기초 통계에 이어서 데이타의 특성을 좀 더 통계적으로 분석을 해보도록 하겠습니다.


이어서할 분석은 자기상관관계분석입니다.


자기상관관계분석은 시계열 분석에서 많이 쓰이는 분석으로


다음과 같은 의미를 가집니다.


먼저 자기상관관계계수를 구하여서 양의 값이 나왔다고 한다면, 앞의 관측 값이 증가하였다면 그 다음 관측 값도 증가하고, 반대로 앞의 관측 값이 감소하였다면, 그 다음 관측 값도 감소한다는 것입니다.


주식이나 다른 금융에서 데이타에서 만약 자기 상관관계 분석 결과 양의 값이 나왔다고 한다면 추세를 따라서 계속 증가하는 경향이 있다는 뜻이 됩니다.







반대로 자기 상관관계분석을 하여서 그 값이 음이 나왔다고 한다면 앞의 관측값이 증가한 방향에서 반대 방향으로 그 다음 관측값이 움직인다는 뜻입니다. 왔다갔다 한다는 뜻이죠.






만약 자기 상관관계분석 결과 그 값이 0이라고 한다면 앞의 관측값과 전혀 상관이 없이 그 다음 값이 나타난다는 것입니다.






자기상관관계분석은 금융데이타 시계열분석에서 많이 쓰이는 것 중 하나입니다.


간단하게 수식을 알아보죠, 먼저 자기상관관계말고 그냥 상관관계에 대한 식은 다음과 같습니다.





상관관계는 correlation 인데 corr이라고 표현을 한 것은 X, Y의 상관관계라는 뜻이고, cov 는 convariance의 약자로 공분산을 의미합니다. 즉 공분산에서 각각의 표준편차를 곱한뒤에 나누는 것이죠.




자기상관관계에 대한 식은 다음과 같습니다.




위에 상관관계에서 각각 다른 두 집합의 공분산을 구하고 표준편차를 구하여서 도출을 하였다면, 자기상관관계에서는 두 집합은 어차피 같은 집합이므로 표준편차의 값이 같아지므로 아래의 분모가 표준편차의 제곱 즉 분산이 되네요.

그리고 위의 공분산은 같은 집합이지만, 몇번째 데이타인지만 다르네요. 보통  바로 직전의 데이타와의 공분산을 구하여서 많이 쓰게 됩니다.


데이타 분석을 통해서 자기상관관계가 양의 값으로 나타나면 추세추종 전략이 유리하고, 만약 자기상관관계분석에서 음의 값으로 나타난다면 마켓메이킹이나 마틴게일 등의 전략이 유리하게 됩니다. 자기상관관계분석에서 값이 0에 가깝게 나타났다면 주가 예측이라는 것 자체가 불가능한 랜덤이라는 말이 됩니다.


다음 글에서는 기초통계때 처럼 one way로 데이타를 한번에 읽으면서 바로 자기상관관계분석을 하는 법을 다루도록 하겠습니다.