avatar of 发明者量化-小小梦 发明者量化-小小梦
Suivre Messages privés
4
Suivre
1271
Abonnés

Lecture quantitative incontournable : que sont exactement les données Tick ? Pourquoi est-il si difficile de trouver des données de trading fiables ?

Créé le: 2016-11-02 19:33:56, Mis à jour le: 2016-11-02 19:48:20
comments   0
hits   12005
  • ### Ce que sont les tick data

Tick Data n’est pas un mystère en soi, c’est que l’échange vous envoie les ordres d’achat et de vente contenus dans le livre d’ordre actif de chaque action (ou option future) que vous avez commandé, mais qui n’a pas été synthétisé.

**举例说明:**
  某天的市场一开始的时候苹果股票的order book(委托挂单)清空(这里不进行auction period的探讨):
  1. 接着来了第一个卖家:1000@100 :
  这时候交易所会发给你一个message,告诉你是苹果股票有人想以100块钱卖出1000股,
  那么这个order就先挂在了order book上,成为卖一。

  卖:1000@100


  2. 第二个卖家来了,他想卖得更高: 1000@101:
  这时候交易所会发给你另一个message,告诉你是苹果股票有人卖的价格比你差,于是排序在更上面,卖二。

  卖:1000@101

  1000@100


  3. 刚才的第一个卖家后悔了,cancel了他的order:1000@100撤消了,那么交易所会有message告诉你,
  现在只剩一个1000@101(卖一)。但是你可能需要自己编程处理这种remove掉一个tick的情况。

  卖:1000@101


  4. 终于有买家来了... 500@90 , 这个价格是不会成交的,因为买家低于现在的最佳卖价:101,
  那么order book里面会继续存着这个order,同时会发送一个tick告诉市场上的其他人,有买单了:

  卖:1000@101

  买:500@90


  5. 继续,接着有一位买家以101块钱买入1000股,等于要把目前的bestoffer 1000@101给match - 撮合了,那么你是不会收到这个最新的bid: 101@1000 的,
  因为它会进入matching engine的瞬间跟对面的best offer 撮合了,tick table的一个规则: bid offer 永远不会cross,
  否则要么是数据商的bug,要么是交易所的bug。现在,你只会收到一个告诉你delete the best offer的message,那么tick table长这样:

  买:500@90

  Les données de tick sont si simples que le marché reproduirait le processus. Mais ce qui est plus gênant:

    1. les ticks sont souvent envoyés en UDP, imaginez que si le marché boursier est très actif, le volume de données est très important, il y a des cas d’erreur de paquetage dans UDP, comment gérer. Il y a eu des mises à jour de ticks folles, mais il faut aussi garder le cache de mises à jour en micro secondes, peut-être pour trier (voir le protocole de l’échange), et l’envoyer au front end.
    1. comment accélérer le traitement des données de tick en temps réel, sinon la quantité de données est si importante qu’une fois retardée, vous ne pourrez plus suivre le rythme des ticks en temps réel jusqu’à ce que votre programme se bloque.
    1. comment éviter que certaines situations spéciales ne causent un bug, une fois qu’une tick n’est pas validée, alors la tick table suivante est fausse:)

** De même, il y a un problème de compréhension des ticks: les ticks diffèrent d’un marché à l’autre, comme c’est le cas pour les marchés boursiers des pays développés, qui sont envoyés en temps réel ((il y a un nouvel ordre et dans le niveau d’envoi d’un tick, par exemple, la Bourse de Tokyo n’envoie que 8 niveaux de tick, alors vous ne pouvez pas voir le full tick, car il peut y avoir plus de 100 niveaux, si beaucoup de gens négocient)) Les ticks sont des millièmes de seconde, c’est une capture d’écran (snapshot), les ticks sont des millièmes de seconde, c’est une capture d’écran (snapshot), les ticks sont des millièmes de seconde, c’est une capture d’écran (snapshot), les ticks sont des millièmes de seconde, c’est une capture d’écran (snapshot), les ticks sont des millièmes de seconde, c’est une capture d’écran (snapshot), les ticks sont des millièmes de seconde (snapshot), les ticks sont des millièmes de seconde (snapshot), les ticks sont des millièmes de seconde (snapshot), les ticks sont des millièmes de seconde (snapshot), les ticks sont des millièmes de seconde (snapshot), les ticks sont des millièmes de seconde (snapshot), les ticks sont des millièmes de seconde (snapshot), les ticks sont des millièmes de seconde (snapshot), les ticks sont des millièmes de seconde (snapshot)

(Ce billet a été compilé par Quantity Trader)

  • ### Deux: Quelques détails sur les données de snapshot et les données d’échange

   Pour les données de tick à haute fréquence à l’étranger, il existe un processus complet de données d’ordre, de sorte que vous pouvez utiliser ces données d’ordre pour restaurer les données de snapshot.

Les deux plus grandes actions et les quatre plus grandes futures du pays sont théoriquement des données instantanées. Par exemple, les champs de données typiques comprennent: Prix d’ouverture Prix le plus élevé Prix le plus bas Prix le plus récent Coût de transaction Coût de transaction Ici, le prix le plus bas est le prix le plus bas depuis le début de la transaction jusqu’à maintenant, en supposant que vous ayez les détails de chaque transaction, en fait, cette donnée peut être calculée en utilisant max (min), donc les données de tick à l’étranger n’ont généralement pas ce champ. Il existe trois types d’opérations en temps réel offertes par les bourses de change, à savoir les transactions en temps réel, les transactions en temps réel et les transactions en temps réel. Un snapshot est une photo du marché toutes les 3 secondes (à la bourse profonde, à la bourse supérieure, 5 secondes) et envoie ensuite des photos de situation telles que le cours actuel, le plus élevé, le plus bas, le volume et le montant de la transaction. Comme la photo est prise toutes les 3 secondes, nous ne savons pas ce qui se passe sur le marché pendant ces 3 secondes. La transaction par atome est une transaction par atome réelle. Cependant, cette donnée est également une tranche de 3 secondes et n’est pas en temps réel. Par exemple, une transaction de 1,5 seconde n’est envoyée qu’à la 3e seconde. Les données de l’annuaire de commande, qui ne contient que les 50 premiers annuaires de niveau 2, ne sont pas toutes des annuaires. (Ce billet a été compilé par Quantity Trader)

Il y a typiquement plusieurs catégories de causes de différences dans les données.

  • 1. La façon dont les données sont enregistrées Par exemple, les données de niveau 1 pour les actions, les bourses publient un fichier dbf qui enregistre les dernières données sur l’état de toutes les valeurs mobilières, le fichier dbf est constamment mis à jour automatiquement. Donc, le fournisseur de données ou la personne qui enregistre les données doit lire ce fichier à intervalles réguliers, puis mettre toutes les données dans la base de données, mais comme la fréquence de mise à jour des données par les bourses n’est pas une valeur unique, afin de ne pas manquer les données, la meilleure façon est que vous lisez plus souvent que la fréquence de mise à jour. C’est une règle qui fait que vous voyez moins de données sur des titres qui ne sont pas activement échangés que sur des titres qui sont activement échangés, moins de données sur les futures à long terme que sur les futures à court terme, et des problèmes de synchronisation des cadres horaires.

  • 2. Problèmes de maintenance Personne ne peut garantir qu’il n’y aura pas de panne de réseau. Si une panne de réseau, une erreur de machine, une erreur de programmation, etc. survient, les données de l’échange seront manquées. Selon le mécanisme de données décrit ci-dessus, il n’y a en fait aucun lien logique entre les données de niveau 1 T et T + 1, en supposant que vous ne puissiez pas les découvrir à partir des données elles-mêmes.

  • 3. Erreur de données causée par le programme Certaines erreurs plus inhabituelles, comme le fait que le prix de certains types d’actions soit anormal, vide, etc., peuvent être causées par des erreurs dans le programme d’enregistrement des données. Pourquoi cela se produit-il? Il y a de nombreuses raisons pour cela, et nous savons que cela peut se produire. Il est donc en principe difficile d’avoir des données fiables à 100%, il est nécessaire de les vérifier et de les nettoyer, et c’est une tâche fastidieuse, et la mise en place des règles dépend aussi de l’expérience individuelle.