Tick Data - это не тайна, это то, что биржа отправляет вам активный ордер на каждую акцию (или фьючерсные опционы) в книге покупок и продаж (то есть ваши заказы все еще находятся на бирже, но не были синтезированы).
**举例说明:**
某天的市场一开始的时候苹果股票的order book(委托挂单)清空(这里不进行auction period的探讨):
1. 接着来了第一个卖家:1000@100 :
这时候交易所会发给你一个message,告诉你是苹果股票有人想以100块钱卖出1000股,
那么这个order就先挂在了order book上,成为卖一。
卖:1000@100
2. 第二个卖家来了,他想卖得更高: 1000@101:
这时候交易所会发给你另一个message,告诉你是苹果股票有人卖的价格比你差,于是排序在更上面,卖二。
卖:1000@101
1000@100
3. 刚才的第一个卖家后悔了,cancel了他的order:1000@100撤消了,那么交易所会有message告诉你,
现在只剩一个1000@101(卖一)。但是你可能需要自己编程处理这种remove掉一个tick的情况。
卖:1000@101
4. 终于有买家来了... 500@90 , 这个价格是不会成交的,因为买家低于现在的最佳卖价:101,
那么order book里面会继续存着这个order,同时会发送一个tick告诉市场上的其他人,有买单了:
卖:1000@101
买:500@90
5. 继续,接着有一位买家以101块钱买入1000股,等于要把目前的bestoffer 1000@101给match - 撮合了,那么你是不会收到这个最新的bid: 101@1000 的,
因为它会进入matching engine的瞬间跟对面的best offer 撮合了,tick table的一个规则: bid offer 永远不会cross,
否则要么是数据商的bug,要么是交易所的bug。现在,你只会收到一个告诉你delete the best offer的message,那么tick table长这样:
买:500@90
Процесс Tick Data настолько прост, что его можно повторить на рынке. Но более неприятным является то, что:
** Также есть проблема с пониманием тика: тик на разных рынках отличается от того, что было сказано выше, это фондовый рынок в развитых странах, который продвигается в режиме реального времени ((Если есть новый ордер и в пределах уровня отправки тика, например, Токийская биржа отправляет только 8 уровней тика, то вы не можете увидеть весь полный тик, потому что может быть более 100 уровней, если много людей торгуют)) Сколько миллисекунд у внутренней биржи, чтобы снять снимок, на верхней бирже - 3 секунды, а затем отправить вам, возможно, что система внутренней торговли очень старая, не вписывается в развитие ИТ. Тогда эти данные о тике не являются реальными, вы только знаете, что тик! В предыдущих 100 миллисекундах и в настоящее время изменения тика такие, что между ними могут быть тысячи тиков.
(Этот текст был составлен компанией Quantitative Trader WeChat ID:quantcity)
Для высокочастотных tick-данных из-за рубежа существует полный процесс заказа, поэтому вы можете использовать эти заказа для восстановления данных snapshot.
Например, типичные поля данных включают: Открытие цены Самая высокая цена Самая низкая цена Самая свежая цена Объем сделки Объем сделки Здесь максимальная (низкая) цена - это максимальная (низкая) цена, которая была с момента открытия и до настоящего времени. Предположим, что у вас есть подробные данные о каждой сделке. Фактически, данные можно вычислить с помощью max (минус), поэтому в данных о тиках за рубежом обычно нет этого поля. В настоящее время существуют три вида операций в режиме реального времени, которые предлагают биржи: операционная, операционная и поручительная. Скриншот - это фотография рынка каждые 3 секунды (на глубокой бирже, на верхней бирже - 5 секунд), а затем отправляется фотография текущей цены, максимума, минимума, объема торгов, суммы торгов и т. Д. Поскольку фотография делается каждые 3 секунды, мы не знаем, что происходит на рынке в течение этих 3 секунд. Каждая сделка - это реальная атомная сделка. Однако эта информация также передается в течение 3 секунд, и не является реальной. Например, сделка, которая произошла в 1,5 секунды, была отправлена только в 3 секунды. В данном случае мы используем только первые 50, а не все. (Этот текст был составлен компанией Quantitative Trader WeChat ID:quantcity)
Типичные причины, вызывающие различия в данных
1. Метод записи данных Например, если мы возьмем данные о уровне 1 акций, то биржа выпускает dbf-файл, в котором записываются последние данные о состоянии всех ценных бумаг, и dbf-файл постоянно обновляется автоматически. Таким образом, поставщик данных или человек, записывающий данные, должен будет читать этот файл через некоторое время, а затем помещать все данные в базу данных, но поскольку частота обновления данных биржей не является единственным значением, чтобы не пропустить данные, лучший способ - это читать их чаще, чем он обновляет их. Из-за такого правила вы видите меньше данных о неактивных торгах, чем о активных, меньше данных о долгосрочных фьючерсах, меньше данных о неактивных, и так далее.
2. Проблемы с эксплуатацией Никто не может гарантировать, что сеть не будет отключена. Если произойдет отключение сети, ошибка машины, ошибка программы и т. Д., Вы пропустите трансляцию данных биржи. Согласно механизму данных, описанному выше, на самом деле нет никакой логической связи между данными уровня 1 и моментами T и T + 1, предполагая, что отсутствие невозможно обнаружить из самих данных, поэтому большое количество отсутствий на самом деле вызвано этими причинами, и их невозможно исправить!
3. Программные ошибки Некоторые более необычные ошибки, например, что цены на определенные типы акций являются необычными, пустыми и т. д., могут быть вызваны ошибками в программе записи данных. Почему это происходит? Поэтому, в принципе, очень сложно иметь 100% достоверные данные, проверка и очистка данных необходимы, это утомительно, и создание правил зависит от личного опыта.