
La aparición de Alpha Arena ha causado revuelo en la comunidad de trading cuantitativo. Observar cómo los modelos de IA compiten por el dominio en las clasificaciones, con DeepSeek liderando un día y Qwen superándolo al siguiente, e incluso Grok liderando en las etapas iniciales, ha suscitado una pregunta interesante: dado que cada IA tiene su propia “personalidad” y fortalezas únicas, ¿por qué no construir un sistema que les permita competir en tiempo real en el mismo entorno de trading y luego seleccionar dinámicamente el modelo con mejor rendimiento para ejecutar operaciones reales?
Esta idea puede parecer descabellada, pero, tras un análisis más profundo, resulta muy lógica. Las estrategias cuantitativas tradicionales suelen basarse en un único marco lógico, mientras que la diversidad de los modelos de IA nos ofrece nuevas posibilidades. Gracias a las herramientas de automatización de flujos de trabajo de la plataforma de trading cuantitativo del inventor, hemos implementado esta idea y creado este completo «Sistema de Trading de Luchas Internas con IA».

El sistema seleccionó cuatro modelos de IA con personalidades distintas como participantes en las operaciones:

Cada IA recibe los mismos datos de mercado, pero genera decisiones de inversión independientes basadas en su propio entrenamiento y métodos de razonamiento. Este diseño garantiza la diversidad de estrategias y evita los puntos ciegos cognitivos que pueden existir en un modelo único.
La principal innovación del sistema reside en la introducción de un mecanismo de clasificación en tiempo real. Cada IA puede ver su posición actual entre todos los modelos, y esta “presión competitiva” se transmite a través de avisos cuidadosamente diseñados:
Este mecanismo de sugestión psicológica permite a los modelos de IA exhibir diferentes estilos de negociación bajo diferentes condiciones de estrés, aumentando así la adaptabilidad de la estrategia.
Lo ingenioso de este diseño es que utiliza una arquitectura de transacciones de dos niveles:

Capa de transacción virtualTodos los modelos de IA operan en un entorno basado en papel, calculando su rendimiento de pérdidas y ganancias y los cambios en la clasificación en tiempo real. capa de ejecución en tiempo realEl sistema identifica automáticamente el modelo con mejor rendimiento y sincroniza el estado de su posición virtual con la cuenta de negociación real.
Este diseño garantiza la seguridad de los fondos y permite la optimización dinámica de las estrategias, evitando el riesgo de que una IA no verificada manipule directamente fondos reales.
El sistema proporciona a cada IA datos de mercado en tres dimensiones:
Cada período de tiempo incluye los últimos 10 valores de indicadores técnicos clave como RSI, MACD, ATR y OBV, lo que garantiza que la IA pueda comprender plenamente el estado actual del mercado y su evolución histórica.
Para garantizar la coherencia y la comparabilidad en la toma de decisiones, el sistema define cinco acciones de transacción estandarizadas:
const actions = [
"OPEN_LONG", // 开多头持仓
"OPEN_SHORT", // 开空头持仓
"CLOSE_LONG", // 平多头持仓
"CLOSE_SHORT", // 平空头持仓
"NO_ACTION" // 暂不操作
];
Cada decisión debe ir acompañada de un razonamiento analítico conciso. Esto no solo nos permite seguir el proceso de pensamiento de la IA, sino que también proporciona datos que respaldan la optimización posterior de la estrategia.
El sistema supervisa continuamente el rendimiento de las operaciones virtuales de todos los modelos de IA y emplea un mecanismo simple y eficaz de supervivencia del más apto:
// 寻找当前表现最优的模型
let bestModel = null;
let bestPnl = currentThreshold;
models.forEach(model => {
if (model.realizedPnl > bestPnl) {
bestPnl = model.realizedPnl;
bestModel = model.name;
}
});
Una vez que se descubre un nuevo modelo “campeón”, el sistema cambia inmediatamente al objetivo de negociación en vivo para garantizar que los fondos siempre sigan la estrategia con mejor rendimiento.
Mediante observación a largo plazo, se descubrió que los diferentes modelos de IA sí exhiben “personalidades” distintas:
El sistema proporciona paneles de monitorización en tiempo real en cuatro dimensiones:
Introducir una mentalidad competitiva en el proceso de toma de decisiones de la IA es un experimento interesante. Las observaciones han demostrado que esta «sugestión psicológica» puede influir en el estilo de decisión de la IA. Las IA líderes tienden a ser más estables, mientras que las rezagadas muestran mayor agresividad. Si te interesan las técnicas para diseñar avisos, puedo compartir mis ideas sobre «cómo ejercer presión sobre la IA de forma eficaz» por separado.
En comparación con las estrategias estáticas tradicionales, este sistema puede cambiar automáticamente al modelo de IA con mejor rendimiento en función de las variaciones del mercado, lo que permite una evolución dinámica de la estrategia. Esta adaptabilidad resulta de gran valor en mercados financieros que cambian rápidamente.
| proyecto | Descripción del estado |
|---|---|
| DeepSeek | El indicador MACD diario muestra una cruz dorada en la parte inferior, lo que indica una tendencia clara. Nuestra estrategia busca actualmente oportunidades de alta rentabilidad para fortalecer nuestra ventaja competitiva. |
| Qwen | El MACD de 15 minutos continúa fortaleciéndose, el RSI aún no se encuentra en la zona de sobrecompra y el OBV está subiendo de forma constante. Esto indica una fuerte señal técnica a corto plazo para una posición larga consistente, especialmente para quienes no tienen posiciones abiertas. Ofrece una buena relación riesgo-beneficio, lo que se alinea con el objetivo de buscar ganancias de forma agresiva. |
| Claude | El MACD muestra una tendencia positiva, el MACD de 5 minutos también es positivo y el RSI está subiendo. Actualmente, mantenemos posiciones largas y estamos tomando ganancias. Seguiremos manteniendo nuestras posiciones para buscar mayores ganancias, manteniendo una perspectiva alcista y recuperando terreno en el ranking. |
| Grok | La tendencia del MACD a corto plazo es fuerte (5.15), pero insuficiente para confirmar su solidez. El RSI de 5 minutos se sitúa en 58.65, pero el ratio del MACD en 27.27 indica un debilitamiento del rebote a corto plazo. Actualmente, las posiciones largas tienen una ganancia flotante de aproximadamente 111 USDT. Conviene asegurar las ganancias mientras las señales técnicas sigan al alza para evitar pérdidas excesivas. El precio se encuentra actualmente 241 USDT por debajo del precio de salida y requiere una estrecha vigilancia para intentar un rebote al alza. |
El razonamiento detrás de cada decisión de la IA se registra y muestra íntegramente, eliminando el problema de la «caja negra» común en el trading algorítmico. Esta transparencia no solo facilita la optimización posterior de la estrategia, sino que también proporciona datos valiosos para comprender la lógica de toma de decisiones de la IA.
Actualmente, el sistema utiliza cuatro modelos de IA, una selección basada principalmente en las siguientes consideraciones:
La arquitectura del sistema admite una expansión flexible, lo que permite añadir o sustituir modelos de IA según las necesidades reales.
Este es el mayor desafío técnico al que nos enfrentamos actualmente. Cada modelo de IA requiere entre varios y decenas de segundos de inferencia, lo que puede provocar que no encuentre el mejor punto de entrada en un entorno de negociación de alta velocidad. En la práctica, suelen existir discrepancias entre el precio de decisión y el precio de ejecución. Para solucionar este problema, es necesario mejorar la velocidad de inferencia de la IA y desarrollar un mecanismo de procesamiento paralelo más eficiente.
El sistema resulta más adecuado como herramienta de prueba de concepto e investigación que para su uso directo en operaciones reales a gran escala. Si bien ofrece un buen rendimiento en pruebas de estrategias y análisis del comportamiento de la IA, en aplicaciones prácticas es necesario considerar factores como la latencia, el coste y la estabilidad.
El sistema de trading competitivo con múltiples modelos de IA representa una exploración significativa de la profunda integración del trading cuantitativo y la inteligencia artificial. Al permitir que diferentes modelos de IA compitan en un entorno virtual, es posible no solo descubrir las fortalezas únicas de cada modelo, sino también construir estrategias de trading inteligentes que se adaptan dinámicamente a los cambios del mercado. Si bien el sistema actual aún presenta limitaciones técnicas, esta exploración proporciona información y experiencia valiosas para el desarrollo futuro de sistemas de trading inteligentes. Con el continuo avance de la tecnología de IA y la constante mejora de la potencia de cómputo, se cree que dichos sistemas desempeñarán un papel cada vez más importante en el campo del trading cuantitativo.
Para desarrolladores e investigadores interesados, se agradecen las mejoras y experimentos basados en el código abierto. El atractivo del trading cuantitativo reside en las constantes posibilidades que aguardan ser exploradas, y la competición de modelos de IA es solo un punto de partida fascinante en este camino de exploración.
Estrategia de flujo de trabajo de apoyo: https://www.fmz.com/strategy/515841