Guide du débutant pour l'analyse des séries temporelles

Auteur:La bonté, Créé: 2019-03-30 11:17:42, mis à jour:

Au cours des dernières années, nous avons examiné divers outils pour nous aider à identifier des modèles exploitables dans les prix des actifs.

Bien qu'il s'agisse de grands outils modernes pour l'analyse des données, la grande majorité des modèles d'actifs dans l'industrie utilisent encore l'analyse statistique des séries temporelles.

Qu'est-ce que l'analyse des séries temporelles?

Premièrement, une série temporelle est définie comme une quantité mesurée séquentiellement dans le temps sur un intervalle.

Dans sa forme la plus large, l'analyse des séries chronologiques consiste à déduire ce qui est arrivé à une série de points de données dans le passé et à tenter de prédire ce qui lui arrivera dans le futur.

Cependant, nous allons adopter une approche statistique quantitative des séries temporelles, en supposant que nos séries temporelles sont des réalisations de séquences de variables aléatoires. c'est-à-dire que nous allons supposer qu'il existe un processus générateur sous-jacent pour nos séries temporelles basé sur une ou plusieurs distributions statistiques à partir desquelles ces variables sont tirées.

L'analyse des séries temporelles tente de comprendre le passé et de prédire l'avenir. Une telle séquence de variables aléatoires est connue sous le nom de processus stochastique en temps discret (DTSP). Dans le trading quantitatif, nous essayons d'adapter des modèles statistiques à ces DTSP pour déduire les relations sous-jacentes entre les séries ou prédire les valeurs futures afin de générer des signaux de trading.

Les séries chronologiques en général, y compris celles qui ne sont pas liées au monde financier, comportent souvent les caractéristiques suivantes:

  • Une tendance est un mouvement directionnel cohérent dans une série temporelle. Ces tendances seront soit déterministes ou stochastiques. La première nous permet de fournir une justification sous-jacente à la tendance, tandis que la seconde est une caractéristique aléatoire d'une série que nous ne pourrons probablement pas expliquer. Les tendances apparaissent souvent dans les séries financières, en particulier les prix des matières premières, et de nombreux fonds de Commodity Trading Advisor (CTA) utilisent des modèles d'identification de tendance sophistiqués dans leurs algorithmes de trading.
  • Variation saisonnière - De nombreuses séries chronologiques contiennent des variations saisonnières. Cela est particulièrement vrai dans les séries représentant les ventes d'entreprises ou les niveaux climatiques.
  • Dépendance sérielle - L'une des caractéristiques les plus importantes des séries temporelles, en particulier les séries financières, est celle de la corrélation sérielle.

Comment appliquer l'analyse des séries temporelles dans la finance quantitative?

Notre objectif en tant que chercheurs quantitatifs est d'identifier les tendances, les variations saisonnières et la corrélation en utilisant des méthodes de séries chronologiques statistiques, et finalement générer des signaux de trading ou des filtres basés sur des inférences ou des prédictions.

Notre approche sera de:

  • Prévoir et prédire les valeurs futures - Pour négocier avec succès, nous devrons prédire avec précision les prix futurs des actifs, au moins au sens statistique.
  • Série de simulation - Une fois que nous avons identifié les propriétés statistiques des séries chronologiques financières, nous pouvons les utiliser pour générer des simulations de scénarios futurs. Cela nous permet d'estimer le nombre de transactions, les coûts de négociation attendus, le profil de rendement attendu, l'investissement technique et financier requis dans les infrastructures, et donc en fin de compte le profil de risque et la rentabilité d'une stratégie ou d'un portefeuille particulier.
  • Les relations d'inférence - L'identification des relations entre les séries temporelles et d'autres valeurs quantitatives nous permet d'améliorer nos signaux de trading grâce à des mécanismes de filtration. Par exemple, si nous pouvons inférer comment l'écart dans une paire de devises varie avec le volume de l'offre/demande, alors nous pouvons filtrer toutes les transactions prospectives qui peuvent survenir dans une période où nous prévoyons un large écart afin de réduire les coûts de transaction.

En outre, nous pouvons appliquer des tests statistiques standard (classiques/frequentistes ou bayésiens) à nos modèles de séries chronologiques afin de justifier certains comportements, tels que le changement de régime sur les marchés actions.

Logiciel d'analyse des séries temporelles

À ce jour, nous avons presque exclusivement utilisé C ++ et Python pour notre mise en œuvre de la stratégie de trading. Ces deux langages sont des environnements de première classe pour écrire une pile de trading entière. Ils contiennent tous deux de nombreuses bibliothèques et permettent une construction de système de trading de bout en bout uniquement dans ce langage.

Malheureusement, C++ et Python ne possèdent pas de bibliothèques statistiques étendues. C'est l'une de leurs lacunes. Pour cette raison, nous utiliserons l'environnement statistique R comme un moyen de mener des recherches sur les séries temporelles. R est bien adapté pour le travail en raison de la disponibilité de bibliothèques de séries temporelles, de méthodes statistiques et de capacités de traçage simples.

Nous apprendrons R de manière à résoudre des problèmes, en introduisant de nouvelles commandes et syntaxe selon les besoins.

Carte de route pour l'analyse des séries chronologiques QuantStart

Les articles précédents sur les sujets de l'apprentissage statistique, de l'économétrie et de l'analyse bayésienne, ont pour la plupart été de nature introductive et n'ont pas examiné les applications de ces techniques à l'information moderne sur les prix à haute fréquence.

Pour appliquer certaines des techniques ci-dessus aux données à fréquence plus élevée, nous avons besoin d'un cadre mathématique dans lequel unifier nos recherches.

Finalement, nous utiliserons des outils bayésiens et des techniques d'apprentissage automatique en conjonction avec les méthodes suivantes afin de prévoir le niveau et la direction des prix, d'agir comme des filtres et de déterminer changement de régime, c'est-à-dire déterminer quand nos séries chronologiques ont changé leur comportement statistique sous-jacent.

Notre feuille de route de séries chronologiques est la suivante. Chacun des sujets ci-dessous constituera son propre article ou un ensemble d'articles. Une fois que nous aurons examiné ces méthodes en profondeur, nous serons en mesure de créer des modèles modernes sophistiqués pour examiner les données à haute fréquence.

  • Introduction aux séries chronologiques - Cet article décrit le domaine de l'analyse des séries chronologiques, sa portée et la façon dont elle peut être appliquée aux données financières.
  • Corrélation - Un aspect absolument fondamental de la modélisation des séries temporelles est le concept de corrélation sérielle.
  • Prévisions - Dans cette section, nous examinerons le concept de prévision, c'est-à-dire la prédiction de l'orientation ou du niveau futur pour une série temporelle particulière, et la façon dont il est réalisé dans la pratique.
  • Modèles stochastiques - Nous avons passé un certain temps à examiner les modèles stochastiques dans le domaine des prix des options sur le site, à savoir avec le mouvement géométrique brownien et la volatilité stochastique.
  • Régression - Lorsque nous avons des tendances déterministes (par opposition aux tendances stochastiques) dans les données, nous pouvons justifier leur extrapolation en utilisant des modèles de régression.
  • Modèles stationnaires - Les modèles stationnaires supposent que les propriétés statistiques (à savoir la moyenne et la variance) de la série sont constantes dans le temps.
  • Modèles non stationnaires - De nombreuses séries financières sont non stationnaires, c'est-à-dire qu'elles ont des moyennes et des variances variables. En particulier, les prix des actifs ont souvent des périodes de forte volatilité. Pour ces séries, nous devons utiliser des modèles non stationnaires tels que ARIMA, ARCH et GARCH.
  • Modélisation multivariée - Nous avons considéré des modèles multivariés sur QuantStart dans le passé, à savoir lorsque nous avons considéré des paires d'actions inversant la moyenne. Dans cette section, nous définirons plus rigoureusement la cointégration et examinerons d'autres tests pour elle. Nous examinerons également les modèles autorégressifs vectoriels (VAR) [à ne pas confondre avec Value-at-Risk!].
  • La modélisation de l'espace d'état emprunte une longue histoire de la théorie de contrôle moderne utilisée en ingénierie afin de nous permettre de modéliser des séries temporelles avec des paramètres variables rapidement (comme la variable de pente β entre deux actifs cointégrés dans une régression linéaire).

Plus de