Стратегия высокочастотных торгов на основе машинного обучения

Автор:Маленькие мечты, Создано: 2016-11-16 16:52:38, Обновлено: 2016-11-16 16:55:18

Стратегия высокочастотных торгов на основе машинного обучения

  • Первая теория

    Торговые механизмы на рынке ценных бумаг могут быть разделены на два типа: рынок, управляемый предложениями, и рынок, управляемый заказами. Рынок, управляемый заказами, обеспечивает ликвидность через посредников, а рынок, управляемый заказами, обеспечивает ликвидность через ограничительные предложения.

    imgДиаграмма рынка, управляемого заказами

    • (I) Оригинальное описание списка заказов по цене

      Исследование ордерных книг относится к категории исследований микроструктуры рынка. Теория микроструктуры рынка использует в качестве источника своих идей теорию цен и теорию поставщиков в микроэкономике, а в анализе ее основных вопросов - торговли финансовыми активами и процессов и причин их формирования - использует различные теории и методы, такие как общий баланс, локальный баланс, предельная прибыль, предельные затраты, рыночная непрерывность, теория запасов, игровая теория, информационная экономика и другие.

      С точки зрения прогресса исследований за рубежом, область микроструктуры рынка, представленная в OHara, большая часть теорий основана на рынках торговли ("т.е. рынках, управляемых предложениями), таких как модели инвентаря и информационные модели и т. д. За последние годы на реальных торговых рынках заказное движение постепенно заняло верхнее место, но исследования, посвященные заказному движению рынков, были относительно незначительными.

      Внутренние фондовые и фьючерсные рынки являются рынками, управляемыми заказами. Ниже приведены скриншоты с рынка, сделанные на уровне 1 по Фьючерсному договору IF1312. Не так много информации, полученной непосредственно сверху, основная информация включает в себя цену покупки, цену продажи, количество покупки и количество продажи. В некоторых научных статьях за рубежом, и соответствующие ордерные книги имеются информационные книги, включая самые подробные данные сбора заказов, включая количество заказов, цены, которые были сделаны, типы заказов, и т. д.

      imgРисунок 2 Фьючерсные основные контракты на фондовом индексе

    • 2) Прогресс в исследовании высокочастотных сделок с книгой заказов

      В основном существуют два метода динамического моделирования ордерных книг: классический метод измерения и метод машинного обучения. Метод измерения является классическим основным методом исследования, например, MRR-разбивка для анализа разницы в ценах, Huang и Stoll-разбивка, ACD-модель продолжительности заказов и логистическая модель для прогнозирования цен.

      Академические исследования в области машинного обучения также очень активны в финансовой сфере, например, 2012 год. Forecasting trends of high_frequency KOSPI200 index data using learning classifiers. Это распространенная исследовательская идея, которая использует распространенные показатели технического анализа (MA, EMA, RSI и т. д.), чтобы внедрить классификационные методы машинного обучения для прогнозирования рынка.

  • Второе, применение машинного обучения в высокочастотных операциях с ордерными книгами

    • (I) Архитектура системы

      Ниже изображена системная архитектура типичных машинных обучающихся торговых стратегий, включающая в себя несколько основных модулей: данные ордерной книги, обнаружение характеристик, моделирование и проверка, а также торговые возможности.

      imgРисунок 3 Архитектура системы моделирования ордерных книг на основе машинного обучения

    • 2) Поддержка вектора

      В 1970-х годах Вапник и др. начали создавать более совершенную теоретическую систему статистической теории обучения (SLT, Statistical Learning Theory), которая используется для изучения статистических закономерностей и характера методов обучения в условиях ограниченной выборки, создает хорошую теоретическую основу для проблем машинного обучения с ограниченной выборкой и лучше решает практические проблемы, такие как малые образцы, нелинейность, высокомерные числа и локальные крайности. В 1995 году Вапник и др. четко выдвинули новый универсальный метод обучения, поддерживающий векторное движение (SVM, Support Vector Machine).

      SVM развивается из оптимальной классификационной сверхплоскости при линейных делящихся условиях. Для двух типов классификационных задач набор тренировочных образцов устанавливается как ((xi,yi), i=1,2...l, l - число индивидуумов тренировочной выборки, xi - тренировочная выборка, yi принадлежит к {-1+,1} - классовым маркировкам входящей выборки xi ((ожидаемый выход).

      Оптимальная классификационная сверхплоскость не только позволяет правильно разделить все образцы, но и максимально увеличить разрыв между ними, который определяется как сумма минимального расстояния между тренировочным набором данных и этой классификационной сверхплоскостью. Оптимальная классификационная сверхплоскость означает наименьшее среднее расхождение в классификации тестовых данных.

      Если существует сверхплоскость в пространстве с движными измерениями:

      F ((x) = w*x+b=0

      Для того, чтобы отделить эти два типа данных, эта сверхплоскость называется интерфейсом деления. Здесь w * x - это внутреннее пространство двух векторов w и x в пространстве движённых векторов.

      Если интерфейс разделен:

      w*x+b=0

      Интерфейс, который позволяет максимально увеличить расстояние между двумя ближайшими к нему образцами, называется наиболее преимущественным интерфейсом.

      imgРисунок 4 SVM бинарный наиболее оптимальный интерфейс

      Упорядочение уравнений оптимальных интерфейсов позволяет сделать расстояние между двумя типами образцов

      img

      Так что для любого образца,

      img

      Для получения оптимального интерфейса, помимо выполнения вышеперечисленных формул, необходимо свести к минимуму.

      Таким образом, математическая модель проблемы SVM:img

      SVM в конечном итоге становится наиболее оптимизированной задачей планирования, а научные исследования сосредоточены на быстром решении, распространении в многоклассы, применении практических проблем и т. д.

      SVM был первоначально разработан для проблем с двумя классами, но в соответствии с требованиями современных практических приложений был расширен до проблем с многоклассами. Существующие алгоритмы многоклассов включают одно-по-одному, одно-по-одному, корректировку ошибок, DAG-SVM и многоклассный SVM-классификатор.

    • (iii) Извлечение показателей с книги заказов

      В качестве примера рынка фондовых фьючерсов Level-1 ордерная книжка включает в себя основные показатели, такие как цена покупки, цена продажи, объем покупки, объем продажи, а также может выводить такие показатели, как глубина, склон, относительная дифференциация, другие показатели, такие как объем владения, объем торгов, ключевые значения и т. д., в общей сложности 17 показателей, как показано в таблице ниже.

      Таблица 1 База показателей, основанная на книге заказов на рынке Level

      img

    • (IV) Динамические характеристики и возможности торговли в книге заказов

      С микроскопической точки зрения рынка существуют два способа измерения ценового движения в короткие сроки, один из которых является промежуточным движением цены, а другой - ценовым пересечением дифференциации. В данной статье мы выберем более простой и понятный промежуточный движение цены.

      img

      В соответствии с размером изменения средней цены ΔP в книге заказов в Δt, она делится на три категории.

      Ниже приведен график распределения среднего движения цены основных контрактов IF1311 на 29 октября, с данными рынка 32400 тиков в день.

      В случае Δt=1 tick абсолютные значения изменения средней цены 0.2 примерно 6000 раз, изменения абсолютных значений 0.4 примерно 1500 раз, изменения абсолютных значений 0.6 примерно 150 раз, изменения абсолютных значений 0.8 примерно 50 раз, изменения абсолютных значений больше 1 примерно 10 раз.

      В случае Δt=2tick абсолютные значения изменения средней цены 0.2 примерно 7000 раз, изменения абсолютных значений 0.4 примерно 3000 раз, изменения абсолютных значений 0.6 примерно 550 раз, изменения абсолютных значений 0.8 примерно 205 раз, изменения абсолютных значений больше 1 примерно 10 раз.

      Мы считаем, что абсолютные значения изменений больше, чем 0,4, что является потенциальной возможностью торговли. При Δt = 1 тика, около 1700 возможностей в день; при Δt = 2 тика, около 4000 возможностей в день.

      img

      Рисунок 5 IF1311 Распределение изменений средней цены на 29 октября ((Δt=1 tick)

      img

      Рисунок 6 IF1311 Распределение изменений средней цены на 29 октября ((Δt=2 tick)

  • Третье: стратегические доказательства

    Поскольку обучение модели SVM в условиях большой выборки является более сложным и длительным, мы выбрали исторические отраслевые данные с относительно коротким периодом, чтобы проверить эффективность модели.

    • 1) Проверка эффективности модели

      Цикл данных: рыночные данные о контрактах IF1311 в октябре;

      Принятие значения Δt: чем меньше Δt, тем больше требований к деталям сделки, когда Δt = 1 тик, трудно получить прибыль в фактической сделке. Для сравнения эффекта модели, здесь, соответственно, принимается значение 1 тик, 2 тик, 3 тик;

      Показатели оценки модели: точность выборки, точность проверки, время прогнозирования.imgТаблица 2 Эффект прогнозирования 1 тика с данными 1 тика

      imgТаблица 3 прогнозирует эффект от тика 2 с данными 1 tick

      imgТаблица 4 Эффект прогнозирования 2 tick с данными 2 tick

      Из данных трех таблиц выше мы можем сделать следующие выводы: Максимальная точность составляет примерно 70%, а если она достигает 60%, то она может быть преобразована в торговую стратегию.

    • 2) Стратегическая имитация прибыли

      Например, 31 октября мы проводим симуляторную торговлю, в которой фиксированная стоимость сделки на фондовом фьючерсе обычно составляет 0.26/10000, и мы предполагаем, что количество сделок не ограничено, предположим, что цена на одну сделку составляет 0.2 пункта, и количество одиночных покупок составляет 1 руку.

      Таблица 5 Аналитические стратегии по состоянию на 31 октябряimg

      В течение дня было совершено 605 сделок, включая процедуры, было совершено 339 сделок с прибылью, выигрышный процент 56%, чистая прибыль 11814.99 юаней.

      Теоретическая цена сдвига составляет 14520 юаней, и эта часть является ключом к стратегическому боевому действию. Если подробности сдвига контролируются более тщательно, то можно уменьшить цену сдвига и увеличить чистую прибыль.

      Рисунок 7: Прибыль аналогичной стратегии на 31 октябряimg

Оригинальное заявление: Автор статьи, перевод с указанием источника.


Больше

Эван1987Ходвин учится изучать ордеры