[Nouveauté de l'arbitrage statistique de couverture neutre] (Édition Fantasy Pure-Alpha)


Date de création: 2023-10-22 10:33:25 Dernière modification: 2025-10-01 23:24:07
Copier: 0 Nombre de clics: 11861
avatar of 作手君TradeMan 作手君TradeMan
3
Suivre
933
Abonnés

Nouveauté de l’arbitrage statistique de couverture neutre

-0 Stratégie d’arbitrage statistique de couverture neutre avec exposition longue et courte

Bonjour, chers traders. Après plusieurs mois de débogage, d’optimisation et d’itération, je suis heureux que cet arbitrage statistique de couverture neutre ait atteint un niveau relativement stable et puisse être diffusé à tous. Il s’agit d’une stratégie de marché neutre basée sur une couverture long-short. Dans le même compte, vous pouvez prendre une position longue sur un panier de produits et une position courte sur un panier de produits, avec des valeurs longues et courtes égales. Dans le but d’éviter le risque systémique bêta du marché, des méthodes statistiques sont utilisées pour trouver diverses combinaisons de paires long-short afin d’obtenir une stratégie d’arbitrage à faible risque avec des bénéfices alpha stables. Cette stratégie présente une bonne expérience de détention, une faible corrélation avec le marché, une exposition neutre à long et à court terme et aucun risque d’événements cygnes noirs extrêmes tels que 312519. Au contraire, elle sera un grand succès dans une telle période où le marché est mal évalué et complètement chaotique. Exceptionnel. Cette stratégie sera expliquée en détail ci-dessous.

Hello~Welcome come to my channel!

Bienvenue à tous les traders sur ma chaîne. Je suis Zuoshoujun, un développeur quantitatif, qui développe des stratégies de trading full-stack telles que CTA & HFT & Arbitrage. Grâce à la plateforme FMZ, je partagerai davantage de contenu lié au développement quantitatif sur ma chaîne quantitative et travaillerai avec tous les traders pour maintenir la prospérité de la communauté quantitative.

Pour plus d’informations, visitez ma chaîne ~ Je vous attends ici【La Cabane Quantitative du Créateur】

1. Introduction et explication de l’arbitrage statistique

La stratégie d’arbitrage statistique est une stratégie de trading qui exploite la relation de prix entre différents paniers de matières premières. Cette stratégie est basée sur des principes statistiques. Elle analyse les tendances historiques des prix et les corrélations entre plusieurs variétés, trouve les différences de prix entre elles et utilise ces différences pour négocier. Historiquement, les stratégies d’arbitrage statistique ont été largement utilisées sur les marchés boursiers. Les premières stratégies d’arbitrage statistique étaient principalement réalisées entre actions, par exemple entre sociétés pétrolières ou sociétés de télécommunications. Ces stratégies reposent souvent sur l’hypothèse d’une corrélation sectorielle et visent à réaliser un arbitrage en achetant des actions sous-évaluées et en vendant des actions surévaluées.

À mesure que le marché se développe, les stratégies d’arbitrage statistique se sont progressivement étendues à d’autres marchés financiers, tels que les contrats à terme sur matières premières, les changes et les crypto-monnaies. Sur ces marchés, il est possible de trouver différentes combinaisons de paniers corrélées et d’utiliser les différences de prix pour effectuer des transactions d’arbitrage. La logique de cette stratégie repose sur le principe de retour à la moyenne. Lorsque les prix de plusieurs combinaisons de paniers s’écartent de leurs fourchettes statistiques, il existe une tendance à la régression. Sur la base de cette tendance, on peut vendre un panier de produits à des prix élevés et acheter un panier de produits à des prix bas lorsque l’écart de prix est important, afin de se protéger contre les erreurs de prix temporaires sur le marché. De cette façon, vous pouvez tirer profit de la diffusion de plusieurs combinaisons de paniers appariés.

2. Avantages et inconvénients de l’arbitrage statistique

avantage:

  • Réduire le risque de marché : les stratégies d’arbitrage statistique reposent sur des transactions d’arbitrage entre les différences entre les paniers de matières premières. Par rapport aux transactions sur une seule matière première, elles diversifient les risques et réduisent l’impact des fluctuations du marché sur les stratégies. Réduction des risques systémiques du marché.
  • Rendements stables : les stratégies d’arbitrage statistique effectuent des transactions d’arbitrage de régression basées sur des erreurs de tarification du marché à court terme et présentent des caractéristiques de rendement plus stables par rapport aux stratégies directionnelles. Par rapport aux stratégies directionnelles, elle produit un risque plus faible, une volatilité plus faible et des rendements plus stables.
  • Peut s’adapter à différents environnements de marché : les stratégies d’arbitrage statistique peuvent fonctionner dans différents environnements de marché, car cette stratégie de trading a moins à voir avec la directionnalité du marché.

défaut:

  • Les données historiques ne peuvent refléter que les relations passées et ne peuvent pas représenter pleinement l’avenir, il existe donc certains risques. La construction de stratégies d’arbitrage statistique utilisera un grand nombre de tests statistiques et effectuera une exploration combinée et corrélative des produits du panier sur la base de données historiques volumineuses. Ces stratégies peuvent changer à l’avenir et comportent certains risques extrêmes.
  • Il est difficile d’évaluer avec précision le temps nécessaire pour ramener le marché à l’équilibre en tenant compte des erreurs de prix et des déséquilibres à court terme. Si le temps de transaction est trop long, le coût d’utilisation des fonds sera également très élevé.
  • Capacités d’analyse de données et de création de modèles très exigeantes : les stratégies d’arbitrage statistique nécessitent une analyse et une modélisation approfondies des données statistiques telles que la corrélation et la cointégration entre différentes combinaisons de paniers, et nécessitent des capacités élevées d’analyse de données et de création de modèles.
  • Exécution de la transaction et risque de liquidité : Puisqu’il s’agit d’une transaction de couverture multi-produits, le prix d’exécution et le volume des transactions peuvent être affectés par différents produits, et il existe un risque d’exécution de la transaction. Une conception de stratégie et une mise en œuvre d’architecture plus sophistiquées sont nécessaires.

3. Le contenu principal de cet arbitrage statistique Alpha

1. Surveillez toutes les données produit en temps réel, effectuez des analyses de Big Data et créez des combinaisons de paniers de produits longs et courts.

Plus précisément, un panier combiné sera construit : par exemple, s’il y a 6 variétés A, B, C, D, E et F, chacune peut être divisée en 2 groupes, avec 3 variétés dans chaque groupe, pour construire un panier combinaison. Parallèlement, un arbitrage indiciel sera construit : certaines industries et certains secteurs seront divisés en deux, deux nouveaux indices de marché seront construits, puis une analyse statistique des données sera réalisée sur ces deux indices.

2. Vérifiez la corrélation entre les combinaisons de paniers longs et courts.

La corrélation fait référence au degré d’association entre deux ou plusieurs variables. Il est utilisé pour mesurer la relation entre le changement d’une variable et le changement d’une autre variable, ce qui permet de déterminer s’il existe une relation correspondante ou de prédire l’impact du changement d’une variable sur une autre variable. Le coefficient de corrélation est une méthode courante pour mesurer la corrélation. Parmi les méthodes courantes, on trouve le coefficient de corrélation de Pearson et le coefficient de corrélation de rang de Spearman. Le coefficient de corrélation de Pearson est utilisé pour évaluer la relation entre deux variables continues, tandis que le coefficient de corrélation de rang de Spearman est utilisé pour évaluer la relation entre deux variables ordinales. La plage du coefficient de corrélation est[-1, 1], où -1 indique une corrélation négative, 1 indique une corrélation positive et 0 indique aucune corrélation. Plus le coefficient de corrélation est proche de -1 ou de 1, plus la corrélation est forte ; plus il est proche de 0, plus la corrélation est faible. La formule mathématique du coefficient de corrélation est la suivante (en prenant le coefficient de corrélation de Pearson comme exemple) :

r = cov(X, Y) / (std(X) * std(Y))。

Parmi eux, r est le coefficient de corrélation, cov est la covariance, std est l’écart type, et X et Y représentent respectivement deux variables. Lors des tests de corrélation, une approche courante consiste à calculer la signification statistique du coefficient de corrélation. Les tests d’hypothèse peuvent généralement être utilisés pour déterminer si le coefficient de corrélation est significatif. L’hypothèse nulle du test d’hypothèse est qu’il n’y a pas de corrélation entre les variables. Les statistiques du coefficient de corrélation sont calculées pour déterminer s’il faut rejeter l’hypothèse nulle.

3. Testez la cointégration du portefeuille panier long-short.

La cointégration fait référence à la relation à long terme entre deux ou plusieurs variables de séries chronologiques, c’est-à-dire que leur combinaison linéaire est stable. Par rapport à la corrélation, la cointégration accorde plus d’attention à la relation d’équilibre à long terme plutôt qu’à la simple corrélation à court terme. Lorsqu’ils s’écartent de cette relation d’équilibre, il existe un mécanisme de correction pour ramener l’écart à une plage raisonnable. Le concept de cointégration a été proposé pour la première fois par Spiegelman (S.G.Engle) et Granger (C.W.J.Granger) en 1987 pour résoudre le problème de régression parasite dans l’analyse des séries chronologiques. Le problème de régression erronée est dû à l’existence possible de racines unitaires entre les variables. Les racines unitaires font apparaître la relation de régression entre les variables comme significative à court terme, mais il n’existe pas de relation d’équilibre réelle à long terme.

La théorie de la cointégration commence par analyser la non-stationnarité des séries temporelles et explore la relation d’équilibre à long terme impliquée par les variables non stationnaires. Si les variables impliquées sont stationnaires après une différence de premier ordre, et qu’une combinaison linéaire de ces variables est stationnaire, alors il y a cointégration entre ces variables. La cointégration est utilisée pour caractériser la relation stationnaire entre deux ou plusieurs séries. Chaque séquence peut être non stationnaire individuellement, et les moments de ces séquences, tels que la moyenne, la variance ou la covariance, changent avec le temps, tandis que la séquence de combinaison linéaire de ces séries temporelles peut avoir la propriété de ne pas changer avec le temps. Lorsque deux prix d’actifs sont cointégrés, leur combinaison linéaire aura la propriété de revenir à la moyenne. La formule mathématique de la cointégration est la suivante (en prenant deux variables de séries temporelles comme exemple) :

Y_t = β_0 + β_1 * X_t + ε_t

Parmi eux, Y_t et X_t représentent les valeurs observées de deux variables de séries temporelles, β_1 est le coefficient de régression et ε_t est le terme d’erreur. S’il existe une relation de cointégration entre Y_t et X_t, alors la combinaison linéaire des deux variables sera stable, c’est-à-dire que ε_t est stationnaire. Satisfait la distribution normale avec une moyenne de 0. Lors du test de cointégration, un test de stabilité est généralement nécessaire. Les méthodes couramment utilisées sont le test de Johansen et le test d’Engle-Granger. Le test de Johansen est basé sur la méthode des valeurs propres et peut tester directement la relation de cointégration entre plusieurs variables. Le test en deux étapes d’Engle-Granger est basé sur la méthode d’estimation MCO modifiée (moindres carrés ordinaires) et convient pour tester la relation de cointégration entre deux variables.

4. Cette stratégie permettra de tester la relation de cointégration des séries temporelles pour un grand nombre de combinaisons. Les critères spécifiques sont les suivants :

  • La série temporelle des prix d’un panier de portefeuille unique est un vecteur intégral unique du premier ordre, c’est-à-dire que la série temporelle des prix n’est pas stationnaire (a une tendance claire). Utilisez la racine unitaire ADF pour tester la stationnarité du temps de prix à plusieurs périodes.
  • La série de différences de premier ordre (c’est-à-dire la dérivée) des combinaisons de paniers individuels est stationnaire. Test de racine unitaire ADF pour la série temporelle de prix à deux paniers. La racine unitaire ADF est utilisée pour tester la stationnarité des différences de premier ordre des deux séries temporelles de prix du panier.
  • Une certaine combinaison linéaire de séries de prix combinées dans le temps est stationnaire, c’est-à-dire que le résidu de l’équation linéaire construite avec les deux séries est stationnaire. Pour deux séquences du même ordre, une régression MCO est effectuée et la stationnarité des résidus est testée.
  • Nous ne répéterons pas ici d’autres tests statistiques et analyses de données. Nous effectuerons une analyse statistique à grande échelle, détaillée et complète sur tous les produits de l’ensemble du marché.

5. Effectuer un grand nombre de tests d’indice de Hurst.

L’exposant de Hurst est utilisé pour mesurer la mémoire à long terme d’une série chronologique afin de déterminer les caractéristiques de retour à la moyenne de la série. La valeur de l’indice Hurst varie entre 0 et 1, avec des valeurs proches de 0,5 indiquant une marche aléatoire et des valeurs proches de 1 indiquant une tendance persistante. Principe : L’indice de Hurst estime le degré de mémoire à long terme d’une séquence en calculant la relation entre la plage d’écart des sous-séquences qui se chevauchent de la séquence et leur longueur. Formule mathématique : Une méthode pour calculer l’indice de Hurst consiste à utiliser la relation entre la plage d’écart et la longueur des sous-séquences qui se chevauchent pour établir la relation correspondante des marches aléatoires. L’exposant de Hurst peut être estimé à l’aide d’un ajustement de régression linéaire entre la plage de dispersion et la longueur des sous-séquences qui se chevauchent.

6. Estimation de la demi-vie de retour moyenne.

La demi-vie de retour à la moyenne est une mesure utilisée pour estimer le temps nécessaire à une série de prix pour revenir à sa moyenne. Plus la demi-vie est petite, plus le taux de retour moyen est rapide. Principe : La demi-vie de retour à la moyenne est estimée en ajustant un modèle de moyenne mobile exponentielle convergente (EMA). Lorsque l’écart d’une série de prix par rapport à la moyenne dépasse la demi-vie, on peut considérer qu’il existe un risque de retour à la moyenne. Formule mathématique : La formule de calcul de la demi-vie de réversion moyenne est la suivante :

(H = -\frac{\ln(0.5)}{\ln(\frac{P_t}{Pt - P{t-1}})})

Méthode de vérification : vous pouvez calculer l’EMA de la série de prix, puis calculer la demi-vie en fonction de l’EMA.

7. Élaborez des stratégies de trading basées sur de grandes quantités de données statistiques.

Pour faire simple, les combinaisons de produits du panier sont filtrées en fonction du tri de l’indice Hurst, les paramètres statistiques pertinents sont estimés en fonction de la demi-vie de retour à la moyenne et la combinaison de stratégies de trading est construite en fonction de la cointégration. Plus de détails ne seront pas décrits .

Supposons que x et y sont les séries temporelles de prix du panier d’actifs X et du panier Y respectivement. La relation de cointégration entre les deux peut être exprimée comme suit : Lny = a + blnx + c, où c est le terme résiduel, qui est stable et satisfait la moyenne de 0. La distribution normale.

Après le test de cointégration, il existe une relation de cointégration entre les prix temporels des actifs X et Y, l’écart type du terme résiduel c est σ et la constante λ est sélectionnée comme valeur limite.

  • Lorsque lny-(a+blnx) > λσ, le prix du panier Y est relativement surévalué et le prix du panier X est relativement sous-évalué, donc achetez le panier X et vendez le panier Y ;
  • Lorsque lny-(a+blnx) < -λσ, le prix du panier X est relativement surévalué et le prix du panier Y est relativement sous-évalué, donc achetez le panier Y et vendez le panier X ;
  • Lorsque la différence de prix lny-(a+blnx) revient dans une certaine plage, telle que [-0,5λσ, 0,5λσ], fermez la position ;

8. Quelques caractéristiques.

La version actuelle est relativement complète, incluant des échanges de marché quasi complets et ultra-puissants, l’estimation des tendances à haute fréquence des tâches de trading et des prix du marché pour obtenir des avantages de transaction Maker-Taker à haute fréquence, et la couverture de queue de produits uniques après une probabilité à long terme Vérification des avantages. La protection, l’enregistrement local ultime de chaque ordre, l’opération de couverture mixte avec d’autres stratégies, etc. ne seront pas développés.

4. Quelques performances historiques (statistiques de tranches au niveau de la minute, données de coût du preneur de 50 000 après estimation du prix réel de la transaction)

[Nouveauté de l’arbitrage statistique de couverture neutre] - Supernova

[Nouveauté de l’arbitrage statistique de couverture neutre] (Édition Fantasy Pure-Alpha)

[Nouveauté de l’arbitrage statistique de couverture neutre] (Édition Fantasy Pure-Alpha)

[Nouveauté de l’arbitrage statistique de couverture neutre] (Édition Fantasy Pure-Alpha)

[Nouveauté de l’arbitrage statistique de couverture neutre] (Édition Fantasy Pure-Alpha)

5. Espérons une coopération et des échanges, ainsi qu’un apprentissage et des progrès communs

[Nouveauté de l’arbitrage statistique de couverture neutre] - Supernova

Données sur les pièces de monnaie tierces

[Nouveauté de l’arbitrage statistique de couverture neutre] (Édition Fantasy Pure-Alpha)

Toute stratégie a sa méthodologie et ses conditions de marché qui déterminent si elle est adaptée ou non. Par exemple, la stratégie de retour à la moyenne est basée sur des théories telles que la marche aléatoire du marché, et la stratégie de tendance du momentum est basée sur diverses théories de la finance comportementale et sur l’existence de fluctuations à queue épaisse sur le marché. Il est important de comprendre ses principes et de s’adapter à ses fluctuations en fonction de ses caractéristiques. Dans le même temps, les utilisateurs de stratégies doivent faire attention au fait que les profits et les pertes proviennent de la même source. Des rendements plus élevés s’accompagnent toujours de risques plus élevés. Les stratégies matures ont leurs avantages et leurs inconvénients. Elles doivent être utilisées de manière raisonnable et tirer parti de leurs points forts et éviter leurs points faibles. Ils doivent savoir ce qui est bien et ce qui est mal et savoir s’ils sont adaptés au marché. Une performance complète, en toute confiance et sans surprises.

La quantification n’est pas une machine à mouvement perpétuel, ni omnipotente, mais elle doit être la direction du trading futur et mérite d’être apprise et utilisée par chaque trader ! Tous les traders sont invités à signaler leurs lacunes, à discuter ensemble, à apprendre et à s’améliorer ensemble, à surfer sur les vagues du marché turbulent et à aller de l’avant.

● Cette stratégie est assez unique et très différente des tendances traditionnelles, des grilles, des hautes fréquences, de l’arbitrage, etc. Elle a une capacité limitée et est principalement autogérée. Les grands utilisateurs et les investisseurs institutionnels sont invités à communiquer et à apprendre.

● Plus de projets de coopération : Nous maintenons une attitude de coopération ouverte et gagnant-gagnant envers tous les individus et institutions ayant des besoins. Nous attendons avec impatience vos discussions et une coopération personnalisée en fonction de vos besoins, préférences en matière de risque, etc.

Si vous avez une plus grande tolérance au risque, préférez les profits et les pertes à court terme et avez besoin de trading à court terme, vous pouvez consulter une autre stratégie stable à haute fréquence avec un rendement mensuel de 3 à 50 % et aucun risque de liquidation: [Grille de création de marché de couverture à haute fréquence Nouvelle] (Version de la machine d’extraction de création de marché HFT)

Si vous disposez d’un montant important de fonds, vous pouvez consulter un autre système de trading CTA composé de grande capacité et de moyenne et basse fréquence, qui est en trading réel depuis 1 000 jours sans aucun obstacle. Il s’agit du système de combinaison de stratégies CTA avec la plus longue période de publication, une grande stabilité et une forte universalité, afin d’atteindre une croissance stable à moyen et long terme : 【Nouveau système de trading CTA composé】(Édition publique multi-facteurs + multi-variétés + multi-stratégies)

✱ Coordonnées (bienvenue pour discuter et apprendre ensemble) WECHAT: haiyanyydss Telegram: https://t.me/JadeRabbitcm Plus d’informations utiles ➔ La Maison Quantitative du Trader https://www.fmz.com/market-offer/512 ✱Fully automatic CTA & HFT & Arbitrage trading system @2018 - 2024