시간 계열 분석에 대한 초보자 가이드

저자:선함, 2019-03-30 11:17:42에서 제작, 업데이트:

지난 몇 년 동안 우리는 자산 가격에서 악용 가능한 패턴을 식별하는 데 도움이되는 다양한 도구를 조사했습니다. 특히 기본적인 경제학, 통계 기계 학습 및 베이지안 통계 등을 고려했습니다.

이 모든 것은 데이터 분석에 대한 훌륭한 현대 도구이지만, 업계의 대다수의 자산 모델링은 여전히 통계적 시간 계열 분석을 사용합니다. 이 기사에서는 시간 계열 분석이 무엇인지, 그 범위를 설명하고 다양한 빈도에 기술을 적용하는 방법을 배울 것입니다. 금융 데이터.

타임 시리즈 분석이란 무엇인가요?

첫째, 시간 계열은 어떤 간격에 걸쳐 시간에 따라 순차적으로 측정되는 어떤 양으로 정의됩니다.

가장 넓은 형태로, 시간 계열 분석은 과거에 일련의 데이터 포인트에 무슨 일이 있었는지 추론하고 미래에 무슨 일이 일어날지 예측하려고 노력하는 것입니다.

그러나, 우리는 시간대 시리즈에 양적 통계적 접근 방식을 취하게 될 것입니다. 우리의 시간대 시리즈는 무작위 변수들의 연속의 실현이라고 가정함으로써. 즉, 우리는 이러한 변수들이 도출된 하나 이상의 통계적 분포를 기반으로 우리의 시간대 시리즈에 대한 근본적인 생성 과정이 있다고 가정할 것입니다.

시간 계열 분석은 과거를 이해하고 미래를 예측하려고 노력합니다. 이러한 무작위 변수들의 순서는 디스크리트 타임 스토카스틱 프로세스 (DTSP) 로 알려져 있다. 양적 거래에서는 일련들 사이의 근본적인 관계를 추론하거나 거래 신호를 생성하기 위해 미래의 값을 예측하기 위해 이러한 DTSP에 통계 모델을 적합하게 시도하는 것에 관심을 갖는다.

일반적으로, 금융 세계의 외부를 포함한 시간 시리즈는 종종 다음과 같은 특징을 포함합니다.

  • 트렌드 - 트렌드는 시간 계열에서 일관된 방향 움직임이다. 이러한 트렌드는 결정적 또는 스토카스틱이 될 것입니다. 전자는 트렌드에 대한 근본적인 논리를 제공 할 수 있으며 후자는 설명 할 가능성이없는 일련의 무작위 특징입니다. 트렌드는 종종 금융 계열, 특히 상품 가격에 나타나며 많은 상품 거래 자문자 (CTA) 펀드는 거래 알고리즘에서 정교한 트렌드 식별 모델을 사용합니다.
  • 계절 변동 - 많은 시간 계열에는 계절 변동이 있습니다. 이것은 특히 비즈니스 판매량이나 기후 수준을 나타내는 계열에 해당됩니다. 양적 금융에서는 특히 성장 계절 또는 연간 온도 변동 (자연가스와 같은) 과 관련된 상품의 계절 변동을 종종 볼 수 있습니다.
  • 일련의 의존성 (Serial Dependence) - 시간 계열, 특히 금융 계열의 가장 중요한 특성 중 하나는 일련의 상관관계이다. 이것은 시간적으로 서로 가까운 시간 계열 관측이 상관관계에 있는 경향이 있을 때 발생합니다. 변동성 클러스터링은 양적 거래에서 특히 중요한 일련의 상관관계의 한 측면이다.

양적 금융 에서 시간 계열 분석 을 어떻게 적용 할 수 있습니까?

양적 연구자로서 우리의 목표는 통계적 시간대 방법을 사용하여 트렌드, 계절 변동 및 상관관계를 식별하고 궁극적으로 추론 또는 예측에 기반한 거래 신호 또는 필터를 생성하는 것입니다.

우리의 접근 방식은 다음과 같습니다.

  • 예측 및 예측 미래 가치 - 성공적인 거래를 위해서는 적어도 통계적 의미에서 미래의 자산 가격을 정확하게 예측해야합니다.
  • 시뮬레이션 시리즈 - 일단 우리가 금융 시간 시리즈의 통계적 특성을 식별하면 미래의 시나리오를 시뮬레이션하는 데 사용할 수 있습니다. 이것은 거래 수, 예상 거래 비용, 예상 수익 프로파일, 인프라에 필요한 기술적 및 금융 투자 및 궁극적으로 특정 전략 또는 포트폴리오의 위험 프로파일 및 수익성을 추정 할 수 있습니다.
  • 인퍼 관계 - 시간 계열과 다른 양적 값 사이의 관계를 식별하면 필터링 메커니즘을 통해 거래 신호를 향상시킬 수 있습니다. 예를 들어, 외환 쌍의 스프레드가 입찰/수요 양과 어떻게 변하는지 추론 할 수 있다면 거래 비용을 줄이기 위해 광범위한 스프레드를 예측하는 기간에 발생할 수있는 모든 유망 거래를 필터 할 수 있습니다.

또한 우리는 특정 행동을 정당화하기 위해 우리의 시간 시리즈 모델에 표준 (고전적 / 빈도주의자 또는 베이지안) 통계 테스트를 적용 할 수 있습니다. 주식 시장의 체제 변화와 같은.

타임 시리즈 분석 소프트웨어

현재까지 우리는 거의 독점적으로 C ++와 파이썬을 거래 전략 구현에 사용했습니다. 이 두 언어 모두 전체 거래 스택을 작성하기 위한 1급 환경입니다. 둘 다 많은 라이브러리를 포함하고 그 언어 내에서만 거래 시스템의 끝에서 끝까지 구축을 허용합니다.

불행히도, C ++ 및 파이썬은 광범위한 통계 라이브러리를 가지고 있지 않습니다. 이것은 그들의 결점 중 하나입니다. 이러한 이유로 우리는 시간 시리즈 연구를 수행하는 수단으로 R 통계 환경을 사용할 것입니다. 시간 시리즈 라이브러리, 통계 방법 및 간단한 플롯 기능의 사용 가능성으로 인해 R는 작업에 적합합니다.

우리는 문제를 해결하는 방식으로 R를 배우게 될 것입니다. 새로운 명령어와 문법을 필요에 따라 도입 할 것입니다. 다행히도 인터넷에서 R에 대한 매우 유용한 튜토리얼이 많이 있습니다.

퀀트스타트 시간 계열 분석 로드맵

통계학 학습, 경제학 및 바이에스 분석에 관한 이전 기사들은 대부분 소개적 성격이었고 현대적이고 고주파 가격 정보에 대한 이러한 기술의 응용을 고려하지 않았습니다.

위의 기술 중 일부를 더 높은 주파수 데이터에 적용하기 위해서는 우리의 연구를 통일할 수 있는 수학적 틀이 필요합니다. 시간 시리즈 분석은 그러한 통일을 제공하며 통계적 설정 내에서 개별 모델을 논의 할 수 있습니다.

결국 우리는 아래와 같은 방법과 함께 바이에스 도구와 기계 학습 기술을 사용하여 가격 수준과 방향을 예측하고 필터로 작용하여 "제도 변화"를 결정합니다. 즉, 우리의 시간 계열이 기본 통계적 행동을 변경했을 때를 결정합니다.

우리의 시간 계열 로드맵은 다음과 같습니다. 아래의 각 주제는 자신의 기사 또는 기사 집합을 구성합니다. 일단 이러한 방법을 깊이 조사하면 고주파 데이터를 검사하기위한 복잡한 현대 모델을 만들 수 있습니다.

  • 시간 시리즈 소개 - 이 문서에서는 시간 시리즈 분석의 영역, 그 범위 및 금융 데이터에 어떻게 적용될 수 있는지 설명합니다.
  • 상관관계 - 시간 시리즈 모델링의 절대적으로 기본적인 측면은 일련 상관관계 개념이다. 우리는 그것을 정의하고 시간 시리즈 분석의 가장 큰 함정 중 하나를 설명 할 것입니다.
  • 예측 - 이 섹션에서는 예측의 개념, 즉 특정 시간 계열에 대한 미래 방향 또는 수준을 예측하고 실제로 수행되는 방법을 고려할 것입니다.
  • 스토카스틱 모델 - 우리는 지오메트릭 브라운 운동과 스토카스틱 변동성으로 사이트에서 옵션 가격 분야에서 스토카스틱 모델을 고려하는 데 약간의 시간을 보냈습니다. 우리는 흰 소음과 자가 회귀 모델을 포함한 다른 모델을 살펴볼 것입니다.
  • 회귀 - 데이터에서 결정적 (스토카스틱과 달리) 추세가 있을 때 회귀 모델을 사용하여 추출을 정당화 할 수 있습니다. 선형 및 비선형 회귀를 모두 고려하고 일련 상관 관계를 고려할 것입니다.
  • 정지 모델 - 정지 모델은 일련의 통계적 특성 (즉 평균과 변수) 이 시간에 일정하다고 가정합니다. 우리는 이동 평균 (MA) 모델을 사용할 수 있으며, 또한 자동 회귀 모델과 결합하여 ARMA 모델을 형성 할 수 있습니다.
  • 비정형 모델 - 많은 금융 시간 계열이 비정형이며, 즉 평균과 변수가 다양합니다. 특히 자산 가격은 종종 높은 변동성을 가지고 있습니다. 이러한 계열을 위해 우리는 ARIMA, ARCH 및 GARCH와 같은 비정형 모델을 사용해야합니다.
  • 다변수 모델링 - 우리는 과거 퀀트스타트에서 다변수 모델을 고려해 왔는데, 즉 평균 역전 주식 쌍을 고려했을 때다. 이 섹션에서는 공동 통합을 더 엄격하게 정의하고 추가 테스트를 살펴볼 것입니다. 또한 벡터 오토레그레시브 (VAR) 모델을 고려할 것입니다.
  • 상태 공간 모델 - 상태 공간 모델링은 엔지니어링에서 사용되는 현대 제어 이론의 오랜 역사를 빌려서 빠르게 변하는 매개 변수 (선적 회귀에서 두 개의 공동 통합 자산 사이의 β 기울기 변수) 를 모델링 할 수 있습니다. 특히 유명한 칼만 필터와 숨겨진 마르코프 모델을 고려 할 것입니다. 이것은 시간 시리즈에서 베이지안 분석의 주요 용도 중 하나입니다.

더 많은