Nécessité de tester les données hors échantillon dans les stratégies de quantification

Auteur:Le petit rêve, Créé: 2018-01-26 12:11:58, mis à jour: 2019-07-31 18:03:38

Big Data en temps réel. La nécessité de tester les données hors échantillon dans les stratégies de quantification.

img

  • N°:01

    La vie humaine, de l'enfance à l'âge adulte, de l'âge adulte à l'âge adulte, est en fait un processus continu de faire des erreurs, de les corriger et de les répéter, et presque personne ne peut en faire exception. Peut-être que vous avez fait beaucoup d'erreurs qui semblent maintenant très inférieures; ou peut-être que vous avez manqué de nombreuses occasions de monter dans le train, comme: l'immobilier, l'Internet, la monnaie numérique, etc.

    C'est alors que l'auditeur dit: "Je n'aurais pas dû le faire"... " Si... Je vais... "

    J'ai eu cette question pendant longtemps et je n'ai pas pu m'en débarrasser, mais je l'ai compris plus tard. En fait, ce n'est pas quelque chose à craindre, car à ce moment-là, chaque choix, bon ou mauvais, nous éloignerait des résultats prédéfinis et nous conduirait vers l'inconnu; et notre réflexion, en dehors des données historiques, ouvre simplement la perspective de Dieu.

  • N°:02

    J'ai vu de nombreux systèmes de trading où le taux de réussite peut atteindre plus de 50% lors du retraitement. Avec un taux de victoire aussi élevé, il est possible de gagner et de perdre plus de 1: 1. Mais, sans exception, ces systèmes, une fois mis en jeu, sont essentiellement perdants. Il y a de nombreuses raisons qui entraînent des pertes, notamment, en retraitant, par inadvertance, en regardant de droite à gauche, en ouvrant le point de vue de Dieu.

    img

    Cependant, la transaction est une chose complexe qui, en retrospective, est très claire, mais si nous ne prenons pas l'axe de la perspective de Dieu et retournons au début, nous ne savons toujours pas ce qui se passe.

  • N° de référence:

    Mais comment tirer le meilleur parti possible de ces données limitées pour une vérification complète des stratégies de transaction dans une situation où les données sont limitées? Il existe généralement deux méthodes: la vérification par repoussement et la vérification croisée.

    Le principe de base de l'examen de propulsion est de former le modèle avec les données historiques plus longues précédentes, d'examiner le modèle avec les données relativement plus courtes suivantes, puis de déplacer constamment la fenêtre de récupération des données vers l'arrière, en répétant les étapes de la formation et de l'examen.

    img

    Les données de formation: 2000-2001; les données de test: 2002; 2° les données de formation: 2001-2002; les données de test: 2003; Les données de formation: 2002-2003, les données de test: 2004; Les données de formation: de 2003 à 2004, les données de test: de 2005; 5 Les données sur la formation: de 2004 à 2005, les données sur les tests: de 2006;

    Il y a des gens qui ont été tués.

    Enfin, les résultats des tests (de 2002, 2003, 2004, 2005, 2006...) sont statistiquement analysés pour évaluer de manière globale les performances de la stratégie.

    Le schéma ci-dessous explique de manière intuitive le principe de l'examen par repoussement:

    img

    Le graphique ci-dessus montre les deux méthodes d'inspection par repoussement.

    La première: chaque fois que vous testez, les données sont plus courtes et le nombre de tests est plus élevé. Le deuxième type: chaque fois, les données de test sont plus longues et le nombre de tests est plus petit.

    Dans les applications pratiques, il est possible de faire plusieurs tests en modifiant la longueur des données de test pour déterminer la stabilité du modèle face aux données non stables.

  • N°:04

    Le principe de base de l'examen croisé est de diviser l'ensemble des données en N parties, de s'entraîner à chaque fois avec une partie N-1 et de s'examiner avec le reste.

    img

    Les années 2000 à 2003 sont divisées par année en quatre parties. Le processus de vérification croisée est le suivant: 1, Données de formation: 2001-2003, données de test: 2000; 2° Les données de formation: 2000-2002, les données de test: 2003; 3 Les données de formation: 2000, 2001, 2003, les données de test: 2002; Les données de formation: 2000, 2002 et 2003, les données de test: 2001.

    img

    Comme le montre le graphique ci-dessus, le principal avantage de la vérification croisée est de tirer pleinement parti des données limitées, chaque donnée de formation étant également des données de test. Mais il existe également des inconvénients évidents lorsque la vérification croisée est appliquée à la vérification des modèles de stratégie:

    Les résultats des tests de modèles sont souvent peu fiables lorsque les données de prix ne sont pas stables. Par exemple, pour s'entraîner avec des données de 2008 et pour tester avec des données de 2005, il est probable que l'environnement du marché de 2008 ait beaucoup changé par rapport à 2005, de sorte que les résultats des tests de modèles ne sont pas fiables.

    2°, comme dans le premier cas, dans le cas des tests croisés, il n'est pas logique de former un modèle avec les données les plus récentes et de tester un modèle avec les données les plus anciennes.

  • N° de référence:

    En outre, lors de l'examen des modèles de stratégies quantifiées, les problèmes de chevauchement de données sont rencontrés dans les tests de propulsion et les tests de croisement.

    img

    Lors du développement des modèles de stratégie de négociation, la plupart des indicateurs techniques sont basés sur des données historiques de certaine longueur. Par exemple, si un indicateur tendanciel est utilisé pour calculer des données historiques sur les 50 derniers jours, et que le jour de négociation suivant, l'indicateur est calculé avec les 50 jours précédents, les données des deux indicateurs sont identiques pendant 49 jours, ce qui entraîne une variation de l'indicateur qui n'est pas évidente tous les deux jours adjacents.

    img

    Les effets de la superposition des données sont les suivants:

    1, les changements lents dans les résultats des prévisions du modèle entraînent des changements lents dans les titres, ce que nous appelons souvent la latence des indicateurs.

    2, certaines valeurs statistiques ne sont pas disponibles pour les tests de résultats du modèle, et les résultats de certains tests statistiques sont peu fiables en raison de la séquence causée par la répétition des données.

  • N°:06

    Une bonne stratégie de transaction devrait être rentable à l'avenir. Les tests hors échantillon, en plus de détecter objectivement la stratégie de transaction, permettent d'économiser plus efficacement le temps des clients.

    Dans la plupart des cas, il est très dangereux de s'engager en combat en utilisant directement les paramètres optimaux de l'ensemble des échantillons.

    Si toutes les données historiques avant le moment de l'optimisation des paramètres sont distinguées, divisées en données intra-échantillon et extra-échantillon, les paramètres sont optimisés à l'aide des données intra-échantillon, puis les données extra-échantillon sont utilisées pour les tests extra-échantillon, l'erreur peut être détectée, tout en vérifiant si la stratégie optimisée s'applique aux marchés futurs.

  • N°:07

    Comme pour les transactions, nous n'avons jamais la possibilité de traverser le temps et de prendre une décision correcte pour nous-mêmes, sans aucune erreur. Si nous avons la main de Dieu ou la capacité de traverser le futur, nous ne pouvons pas être testés, et nous devons vérifier nos stratégies dans les données historiques.

    Cependant, même avec une histoire de données volumineuses, l'histoire semble extrêmement pauvre face à un avenir sans fin et imprévisible. Ainsi, les systèmes de trading basés sur l'histoire, poussés vers le haut et vers le bas, finiront par couler avec le temps.

    img

  • N°:08

    Nous (inventeurs de Quantitative Trading Platforms) avons pour objectif de changer le cercle de la quantité actuel, sans produits, avec des échanges fermés et des escrocs, pour créer un cercle de la quantité plus pur.

    img

    Partager est une attitude, mais c'est plus une sagesse!

Les hôtes sont en ligne Par Hukybo


Plus de