avatar of 发明者量化-小小梦 发明者量化-小小梦
konzentrieren Sie sich auf Private Nachricht
4
konzentrieren Sie sich auf
1271
Anhänger

Quantitative Pflichtlektüre: Was genau sind Tick-Daten? Warum ist es so schwer, zuverlässige Handelsdaten zu finden?

Erstellt in: 2016-11-02 19:33:56, aktualisiert am: 2016-11-02 19:48:20
comments   0
hits   12005
  • ### Was ist Tick Data?

Tick Data selbst ist kein Geheimnis, sondern die Tatsache, dass die Börse Ihnen die Kauf- und Verkaufsanweisungen in jedem Aktien- oder Futures-Options-Aktivordernbuch schickt, in dem Ihr Auftrag noch auf der Börse ist, aber nicht synthetisiert wurde.

**举例说明:**
  某天的市场一开始的时候苹果股票的order book(委托挂单)清空(这里不进行auction period的探讨):
  1. 接着来了第一个卖家:1000@100 :
  这时候交易所会发给你一个message,告诉你是苹果股票有人想以100块钱卖出1000股,
  那么这个order就先挂在了order book上,成为卖一。

  卖:1000@100


  2. 第二个卖家来了,他想卖得更高: 1000@101:
  这时候交易所会发给你另一个message,告诉你是苹果股票有人卖的价格比你差,于是排序在更上面,卖二。

  卖:1000@101

  1000@100


  3. 刚才的第一个卖家后悔了,cancel了他的order:1000@100撤消了,那么交易所会有message告诉你,
  现在只剩一个1000@101(卖一)。但是你可能需要自己编程处理这种remove掉一个tick的情况。

  卖:1000@101


  4. 终于有买家来了... 500@90 , 这个价格是不会成交的,因为买家低于现在的最佳卖价:101,
  那么order book里面会继续存着这个order,同时会发送一个tick告诉市场上的其他人,有买单了:

  卖:1000@101

  买:500@90


  5. 继续,接着有一位买家以101块钱买入1000股,等于要把目前的bestoffer 1000@101给match - 撮合了,那么你是不会收到这个最新的bid: 101@1000 的,
  因为它会进入matching engine的瞬间跟对面的best offer 撮合了,tick table的一个规则: bid offer 永远不会cross,
  否则要么是数据商的bug,要么是交易所的bug。现在,你只会收到一个告诉你delete the best offer的message,那么tick table长这样:

  买:500@90

  Tick-Daten sind so einfach, dass der Markt diesen Prozess wiederholen kann. Aber das Problem ist:

    1. Die Daten der Tick werden oft in UDP gesendet, denken Sie daran, dass die Datenmenge sehr groß ist, wenn die Börse sehr aktiv ist, und UDP wird Verpackungen verlieren, wie man damit umgeht. Es gab schon verrückte Tick-Updates, aber die Updates werden in einem Micro-Second-Cache gespeichert, möglicherweise sortiert (siehe Börsenprotokoll), und an die Frontend gesendet.
    1. Wie kann man die Tick-Daten in Echtzeit schneller verarbeiten, wenn die Daten so groß sind, dass man mit einer Verzögerung nicht mehr mit dem Tick-Daten in Echtzeit mithalten kann, bis sich das Programm abschaltet?
    1. Wie kann man vermeiden, dass einige spezielle Situationen einen Bug verursachen, wenn ein Ticket nicht richtig ist, dann ist die Tickettabelle hinterher falsch:)

** Ebenso gibt es Probleme mit dem Verständnis von Tick: Tick in verschiedenen Märkten unterscheidet sich von den Aktienmärkten in den entwickelten Ländern, die in Echtzeit verschickt werden. ((Es gibt neue Orders und innerhalb der Versandstufe von Tick, z. B. der Tokioter Börse, wird nur 8 Tick-Level gesendet, so dass Sie nicht den gesamten Full-Tick sehen können, da es möglicherweise mehr als 100 Level gibt, wenn viele Leute handeln)). Wie viele Millisekunden sind die inländischen Börsen, um einen Snapshot zu machen, die oberen und tiefen Börsen sind 3 Sekunden, und dann wird es an Sie gesendet, vielleicht ist das inländische Handelssystem sehr alt und kann mit der Entwicklung der IT nicht mithalten. Dann ist diese Tick-Daten nicht in Echtzeit, Sie wissen nur, dass die Tick-Daten in den ersten 100 Millisekunden und der jetzigen Tick-Veränderung so groß sind, dass möglicherweise bereits Tausende von Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick-Tick

(Dieser Artikel wurde zusammengestellt von Quantitative Trader WeChat)

  • ### 2. Was sind Snapshots und einige Details zu Börsendaten?

   Für Hochfrequenz-Tick-Daten aus dem Ausland gibt es eine vollständige Prozedur für die Orderdaten, so dass Sie diese Orderdaten nutzen können, um die Snapshot-Daten wiederherzustellen.

Die beiden größten Aktien und die vier größten Futures sind theoretisch Schnappschüsse. Eröffnungspreis Höchstpreis niedrigster Preis neuester Preis Umsatzvolumen Umsatzvolumen Hier ist der höchste (niedrigste) Preis der höchste (niedrigste) Preis, der von der Eröffnung bis zur aktuellen Transaktion stattgefunden hat. Angenommen, Sie haben detaillierte Details zu jeder Transaktion, die in der Tat mit max (min) berechnet werden kann, so dass die tick-Daten im Ausland in der Regel dieses Feld nicht enthalten. Es gibt drei Arten von Live-Trading, die von den beiden Börsen angeboten werden: Schnappschüsse und Überweisungen. Ein Schnappschuss ist ein Schnappschuss des Marktes, der alle 3 Sekunden gemacht wird (die tiefen Börsen, die oberen Börsen sind 5 Sekunden), und dann ein Foto des aktuellen Preises, des Höchst- und Tiefstpreises, des Umsatzes und der Umsatzsumme gesendet wird. Da das Schnappschuss alle 3 Sekunden gemacht wird, wissen wir nicht, was während dieser 3 Sekunden auf dem Markt passiert. Eine Transaktion pro Sekunde ist eine echte Transaktion pro Atom. Diese Daten werden jedoch auch in einer Reihe von 3 Sekunden gesendet und sind nicht in Echtzeit. Zum Beispiel wird eine Transaktion, die in 1,5 Sekunden stattfindet, erst in 3 Sekunden gesendet. In Level 2 gibt es nur die ersten 50, die ein Kauf-und-Einkauf-Verfahren durchführen, nicht alle. (Dieser Artikel wurde zusammengestellt von Quantitative Trader WeChat)

Typischerweise gibt es verschiedene Arten von Unterschieden in den Daten.

  • 1. Wie die Daten erfasst werden Wenn man beispielsweise die Level1-Daten von Aktien nimmt, veröffentlicht die Börse eine dbf-Datei, die den aktuellen Zustand aller Wertpapiere aufzeichnet. Die dbf-Datei wird ständig automatisch aktualisiert. Der Datenanbieter oder die Person, die die Daten aufzeichnet, muss diese Datei dann gelesen und alle Daten in die Datenbank eingeben, aber da die Häufigkeit, mit der die Börse die Daten aktualisiert, nicht ein einziger Wert ist. Es gibt eine Regel, die besagt, dass Sie weniger Daten über nicht-aktiv gehandelte Wertpapiere als über aktiv gehandelte Wertpapiere sehen, dass Sie weniger Daten über langfristige Futures als über kurzfristige Wertpapiere sehen und dass die Zeitspanne nicht synchron ist.

  • 2. Betriebs- und Wartungsprobleme Niemand kann garantieren, dass das Netz nicht ausfällt. Wenn das Netz ausfällt, Maschinenfehler oder Programmierfehler auftreten, werden die Daten der Börse nicht abgespielt. Nach den oben beschriebenen Datenmechanismen gibt es für die Level-1-Daten T und T + 1 keine logische Verbindung.

  • 3. Datenfehler durch das Programm Einige der ungewöhnlichsten Fehler, wie z. B. die Angabe, dass die Preise für bestimmte Arten von Aktien abweichend oder leer sind, können durch Fehler in der Aufzeichnungsmethode verursacht werden. Warum? Es gibt viele Gründe dafür, und wir wissen, dass sie auftreten können. Es ist daher prinzipiell schwierig, 100% zuverlässige Daten zu haben, es ist notwendig, die Daten zu überprüfen und zu bereinigen, und es ist eine langweilige Angelegenheit, die Regeln hängen auch von der individuellen Erfahrung ab.