Lista de pedidos basada en aprendizaje automático estrategias de operaciones de alta frecuencia

El autor:Un sueño pequeño., Creado: 2016-11-16 16:52:38, Actualizado: 2016-11-16 16:55:18

Lista de pedidos basada en aprendizaje automático estrategias de operaciones de alta frecuencia

  • La teoría del tiempo

    El mecanismo de negociación del mercado de valores se puede dividir en dos tipos: el mercado impulsado por la oferta y el mercado impulsado por la orden, el primero depende de los operadores para proporcionar liquidez, el segundo proporciona liquidez a través de la oferta de precios limitados, y las transacciones se forman a través de las ofertas de compra y venta por encargo de los inversores. El mercado de valores de China es un mercado impulsado por la orden, que incluye el mercado de acciones y el mercado de futuros.

    imgDiagrama 1 del mercado impulsado por las órdenes

    • (a) Presentación del libro de pedidos de precios limitados

      El estudio del libro de pedidos pertenece a la categoría de investigación de la estructura microscópica del mercado, y la teoría de la estructura microscópica del mercado utiliza la teoría de precios y la teoría de los fabricantes en microeconomía como fuente de ideas, y en el análisis de sus problemas centrales, el equilibrio general, el equilibrio local, los beneficios marginales, los costos marginales, la continuidad del mercado, la teoría de las existencias, la teoría de juegos, la economía de la información y otros métodos.

      Desde el progreso de la investigación en el extranjero, el campo de la estructura microscópica del mercado está representado por OHara, y la mayoría de las teorías se basan en el mercado comercial (es decir, el mercado impulsado por la oferta), como el modelo de inventario y el modelo de información, etc. En los últimos años, el mercado de transacciones reales ha ido tomando un lugar cada vez más importante, pero hay menos investigación dedicada al mercado impulsado por la orden.

      Los mercados de valores y futuros nacionales pertenecen a los mercados impulsados por las órdenes. La siguiente imagen es una captura de pantalla del libro de pedidos de nivel 1 del contrato de futuros de índices de valores IF1312. No hay mucha información obtenida directamente de arriba, la información básica incluye un precio de compra, un precio de venta, una cantidad de compra y una cantidad de venta. En algunos artículos académicos en el extranjero, y el libro de pedidos correspondiente, también hay un libro de información, incluyendo los datos más detallados de toma de pedidos, incluyendo el volumen de pedidos, el precio realizado, el tipo de pedidos de cada pedido, etc.

      imgGráfico 2 Compromiso principal de futuros de índices de acciones Livro de pedidos de nivel 1

    • (B) Los avances en el estudio de la transacción de alta frecuencia en el libro de pedidos

      El modelo dinámico de la libreta de pedidos tiene dos métodos principales: el método clásico de la economía de la medición y el método de aprendizaje automático. El método de la economía de la medición es uno de los métodos de investigación clásicos de la corriente principal, como la descomposición de MRR para el análisis de diferencias de precios, la descomposición de Huang y Stoll, el modelo de ACD para la duración de los pedidos y el modelo logístico para la predicción de precios.

      La investigación académica sobre el aprendizaje automático en el campo financiero también es muy activa, como el estudio de 2012 Forecasting trends of high_frequency KOSPI200 index data using learning classifiers. El estudio de 2012 es una idea común que utiliza indicadores comunes de análisis técnico (MA, EMA, RSI, etc.) para introducir métodos de clasificación de aprendizaje automático para hacer predicciones de mercado.

  • Aplicaciones del aprendizaje automático en las transacciones de alta frecuencia de libros de pedidos

    • (a) Arquitectura del sistema

      El siguiente gráfico es la arquitectura del sistema de una estrategia de negociación típica de aprendizaje automático, que incluye datos de libros de pedidos, descubrimiento de características, construcción y verificación de modelos y varios módulos principales de oportunidades de negociación.

      imgFigura 3 Arquitectura del sistema basado en el aprendizaje automático para la modelación de libros de pedidos

    • (B) Presentación de la máquina de vectores compatible

      En la década de 1970, Vapnik y otros comenzaron a desarrollar un sistema teórico comparativamente completo de teoría del aprendizaje estadístico (SLT, Statistical Learning Theory), que se utiliza para estudiar las leyes estadísticas y la naturaleza de los métodos de aprendizaje en casos de muestras limitadas, estableciendo un buen marco teórico para los problemas de aprendizaje de máquinas de muestras limitadas, que resuelven mejor problemas reales como muestras pequeñas, no lineales, números de alta dimensión y extremos locales. En 1995, Vapnik y otros propusieron claramente un nuevo método de aprendizaje general que apoya la vectorización de la máquina de soporte (SVM, Support Vector Machine).

      El SVM se desarrolló a partir de superplanas de clasificación óptima en el caso de divisibilidad lineal. Para los dos tipos de problemas de clasificación, el conjunto de muestras de entrenamiento se configura como ((xi,yi), i = 1,2... l, l es el número de individuos de la muestra de entrenamiento, xi es la muestra de entrenamiento, yi pertenece a {-1+,1} es el marcado de clase de la muestra de entrada xi (la salida esperada).

      El superplano de clasificación óptimo no solo separa correctamente todas las muestras (por ejemplo, el error de entrenamiento es 0), sino que también puede hacer que el margen entre las dos clases sea mayor, definido como la suma de la distancia mínima del conjunto de datos de entrenamiento al superplano de clasificación. El superplano de clasificación óptimo significa el menor error de clasificación promedio en los datos de prueba.

      Si existe un superplano en el espacio vectorial de dimensiones d:

      F ((x) = w * x + b = 0

      Para poder separar los dos tipos de datos anteriores, el superplano se llama interfaz de división. Aquí w * x es el interior de los dos vectores w y x en el espacio de vectores en d dimensiones.

      Si la interfaz está dividida:

      w*x+b=0

      La interfaz que puede hacer que la distancia entre las dos clases de muestras más cercanas a la interfaz sea la mayor se llama interfaz de la interfaz de la interfaz.

      imgDiagrama de la interfaz de la clasificación de SVM en las categorías binarias.

      La homogeneización de las ecuaciones de interfaz óptima permite que las distancias entre dos clases de muestras

      img

      Así que para cualquier muestra,

      img

      Para obtener la mejor interfaz, además de satisfacer la fórmula anterior, también se debe minimizar.

      Por lo tanto, el modelo matemático del problema SVM es:img

      El SVM finalmente se convirtió en un problema de planificación optimizado, y el foco de investigación del mundo académico se centró principalmente en la solución rápida, la difusión a múltiples categorías, la aplicación de problemas prácticos, etc.

      El SVM fue propuesto originalmente para problemas de clasificación binaria, y según las necesidades actuales de aplicación, se ha ampliado a problemas de multiclasificación. Los algoritmos multiclasificadores existentes incluyen uno-para-mucho, uno-para-uno, codificación de errores, DAG-SVM y el clasificador SVM de clase i.

    • (iii) extracción de los indicadores del libro de pedidos

      Por ejemplo, en el mercado de futuros de índices de acciones de nivel 1, el libro de pedidos incluye principalmente indicadores básicos como precio de compra, precio de venta, volumen de compra y volumen de venta, y puede derivar indicadores como profundidad, inclinación, diferencias de precio relativas, otros indicadores incluyen volumen de tenencia, volumen de transacción, margen, etc., un total de 17 indicadores, como se muestra en la tabla siguiente. También se pueden introducir indicadores de análisis técnico comunes como RSI, KDJ, MA, EMA, etc.

      Tabla 1 Base de indicadores basados en el libro de pedidos de nivel

      img

    • (iv) Características de movilidad del libro de pedidos y oportunidades de transacción

      Desde el punto de vista microscópico del mercado, hay dos maneras de medir la movilidad de los precios en el corto plazo, una es la movilidad de los precios intermedios y la otra es el cruce de diferencias.

      img

      Según la magnitud de la variación de la ΔP en el precio intermedio en la libreta de pedidos en Δt, se divide en tres categorías.

      El siguiente gráfico muestra la distribución de la movilidad de los precios intermedios de los principales contratos IF1311 el 29 de octubre, con 32400 ticks diarios.

      En el caso de Δt = 1 tick, el cambio absoluto del precio intermedio de 0.2 es de aproximadamente 6000 veces, el cambio absoluto de 0.4 es de aproximadamente 1500 veces, el cambio absoluto de 0.6 es de aproximadamente 150 veces, el cambio absoluto de 0.8 es mayor a 50 veces y el cambio absoluto de 1 es mayor a aproximadamente 10 veces.

      En el caso de Δt = 2 ticks, el cambio absoluto del precio intermedio de 0.2 es de aproximadamente 7000 veces, el cambio absoluto de 0.4 es de aproximadamente 3000 veces, el cambio absoluto de 0.6 es de aproximadamente 550 veces, el cambio absoluto de 0.8 es de aproximadamente 205 veces, y el cambio absoluto es mayor o igual a 1 es de aproximadamente 10 veces.

      Consideramos que el valor absoluto de la variación es mayor que 0.4 cuando es igual a 0,4 y es una oportunidad de negociación potencial. En el caso de Δt = 1 tick, hay aproximadamente 1700 oportunidades por día; en el caso de Δt = 2 ticks, hay aproximadamente 4000 oportunidades por día.

      img

      Figura 5 IF1311 Diagrama de cambios en el precio medio el 29 de octubre ((Δt=1 tick)

      img

      Figura 6 IF1311 Diagrama de cambios en el precio medio el 29 de octubre ((Δt=2 tick)

  • La tercera prueba estratégica.

    Debido a la alta complejidad de la capacitación y el largo tiempo de capacitación del modelo SVM en casos de grandes muestras, elegimos datos históricos de mercado con un lapso de tiempo relativamente corto para verificar la eficacia del modelo, con los datos de mercado de nivel 1 del contrato IF1311 en octubre.

    • (1) Prueba de los efectos del modelo

      Ciclo de datos: datos del mercado de los contratos IF1311 en octubre;

      Para comparar los efectos del modelo, aquí se valoran 1 tick, 2 tick y 3 tick, respectivamente.

      Los indicadores de evaluación del modelo: exactitud de la muestra, exactitud de la prueba, tiempo de predicción.imgTabla 2 El efecto de un tick en la predicción de datos de 1 tick

      imgTabla 3 para predecir el efecto del tick 2 con datos de 1 tick

      imgTabla 4 El efecto de las predicciones de 2 ticks con datos de 2 ticks

      De los datos de las tres tablas anteriores, podemos llegar a las siguientes conclusiones: La máxima precisión es de aproximadamente 70%, y la precisión de 60% se puede traducir en una estrategia de negociación.

    • (2) Las ganancias de la estrategia de simulación

      Por ejemplo, si realizamos una operación simulada el 31 de octubre, la tasa de negociación de futuros de acciones de las instituciones es generalmente de 0.26/10000, y asumimos que el número de operaciones no tiene límite, suponiendo que el precio del movimiento unilateral sea de 0.2 puntos por cada operación, y que el número de manos sueltas sea de 1 mano.

      Tabla 5 Estrategias de simulación de las transacciones del 31 de octubreimg

      El número de transacciones durante el día fue de 605, incluidas las operaciones, el número de ganancias fue de 339, con una tasa de ganancia del 56%, y el beneficio neto fue de 11814.99 yuanes.

      El precio de giro teórico es de 14.520 yuanes, y esta parte es clave para la estrategia real. Si los detalles de la orden se controlan con más precisión, se puede reducir el precio de giro y aumentar los beneficios netos. Si el control de los detalles de la orden no es adecuado o si el mercado fluctúa de manera irregular, el precio de giro será mayor, mientras que los beneficios netos disminuirán, por lo que el éxito de las operaciones de alta frecuencia a menudo depende de la ejecución de los detalles.

      Diagrama 7 Las ganancias de las estrategias simuladas el 31 de octubreimg

Declaración de origen: Este artículo fue escrito por el autor, y se puede traducir indicando la fuente.


Más.

Eván1987Goodwin, está aprendiendo a estudiar las órdenes de los bajos precios