Necessidade de testes de dados fora da amostra para estratégias de quantificação

Autora:Sonhos pequenos, Criado: 2018-01-26 12:11:58, Atualizado: 2019-07-31 18:03:38

Big Data em tempo real. A necessidade de testar dados fora da amostra como estratégias de quantificação.

img

  • NO:01

    A vida de uma pessoa, de criança a velha, de velha a velha, é um processo contínuo de erros, correções e erros, quase ninguém pode ser excepcional. Talvez tenha cometido muitos erros, que agora parecem ser de baixo nível; ou talvez tenha perdido muitas oportunidades de embarque, como: imobiliário, internet, moeda digital, etc...

    Até que o ouvinte diz: "Eu não deveria ter"... "Se... eu fizesse"...

    Eu tinha essa questão, que não conseguia desvendar por muito tempo, mas que só percebi mais tarde. Na verdade, não era algo para ser temido, porque naquela época cada escolha, seja ela certa ou errada, nos levaria para longe de um resultado predeterminado e para um desconhecido; e nossa reflexão, apenas fora dos dados históricos, abria a perspectiva de Deus.

  • NO:02

    Eu vi muitos sistemas de negociação, onde a taxa de sucesso pode ser superior a 50% no retorno. Com uma taxa de sucesso tão alta, também pode haver uma taxa de ganho e perda superior a 1: 1. No entanto, sem exceção, esses sistemas, uma vez aplicados ao quadro real, são basicamente perdedores. Há muitas razões que causam perdas, entre elas, quando o retorno, inadvertidamente, olhando de direita para esquerda, abre a perspectiva de Deus.

    img

    No entanto, a transação é uma coisa tão confusa que a retrospectiva é incrivelmente clara, mas se não levarmos o ângulo da perspectiva de Deus e voltarmos ao começo, ainda não sabemos o que aconteceu. Isso atinge as limitações dos dados históricos e da questão das raízes da quantificação.

  • NO:03

    No entanto, como fazer o melhor uso possível dos dados limitados para fazer uma verificação completa das estratégias de negociação, quando os dados são limitados?

    Os princípios básicos do teste de repetição são: treinar o modelo com um período de dados históricos mais longo, e depois testá-lo com dados relativamente curtos, movendo continuamente para trás a janela de dados, repetindo os passos de treinamento e teste.

    img

    1, dados de treinamento: 2000-2001, dados de testes: 2002; 2, dados de treinamento: 2001-2002, dados de testes: 2003; 3, dados de treinamento: 2002-2003, dados de testes: 2004; 4. Dados de treinamento: 2003-2004; dados de testes: 2005; 5, dados de treinamento: 2004-2005, dados de testes: 2006;

    A partir de agora, o país vai continuar a sofrer.

    Por fim, os resultados dos testes de 2002, 2003, 2004, 2005, 2006... são estatísticos para avaliar o desempenho da estratégia.

    O gráfico a seguir mostra uma explicação intuitiva do princípio do teste de repulsão:

    img

    O gráfico acima mostra os dois métodos de verificação de repulsão.

    A primeira: cada vez que o teste é feito, os dados são mais curtos e o número de testes é maior. O segundo tipo é o de testes mais longos e menos repetidos.

    Em aplicações práticas, pode-se fazer vários testes, alterando o comprimento dos dados do teste, para determinar a estabilidade do modelo em relação a dados não estáveis.

  • NO:04

    Os princípios básicos do teste cruzado são: dividir todos os dados em N partes, treinar com N-1 delas e testar com o restante.

    img

    Divide os anos de 2000 a 2003 em quatro partes por ano. O processo de verificação cruzada é o seguinte: 1, dados de treinamento: 2001-2003, dados de testes: 2000; 2, dados de treinamento: 2000-2002, dados de testes: 2003; 3, dados de treinamento: 2000, 2001, 2003, dados de teste: 2002; 4. Dados de treinamento: 2000, 2002, 2003, dados de testes: 2001.

    img

    Como mostrado no gráfico acima, o maior benefício do teste cruzado é aproveitar ao máximo os dados limitados, cada dado de treinamento também é um dado de teste. Mas há desvantagens visíveis quando o teste cruzado é aplicado ao teste do modelo de estratégia:

    1, Quando os dados de preços não são estáveis, os resultados dos testes do modelo são frequentemente pouco confiáveis. Por exemplo, se for treinado com dados de 2008 e testado com dados de 2005, é provável que o ambiente do mercado em 2008 tenha mudado muito em relação a 2005, então os resultados dos testes do modelo não são confiáveis.

    2, semelhante ao primeiro, no teste cruzado, se o modelo de treinamento for usado com os dados mais recentes e o modelo de teste for usado com os dados mais antigos, isso não faz muito sentido em si.

  • NO:05

    Além disso, quando se verifica um modelo de estratégia quantitativa, tanto a verificação de propulsão quanto a verificação de cruzamento enfrentam problemas de sobreposição de dados.

    img

    Quando se desenvolve um modelo de estratégia de negociação, a maioria dos indicadores técnicos são baseados em dados históricos de certa duração. Por exemplo, se um indicador de tendência é usado para calcular os dados históricos dos últimos 50 dias e, no dia seguinte, o indicador é calculado com os dados dos 50 dias anteriores, então os dados dos dois indicadores são idênticos por 49 dias, o que resulta em mudanças pouco visíveis no indicador a cada dois dias próximos.

    img

    A sobreposição de dados pode causar os seguintes efeitos:

    1, a mudança lenta nos resultados do modelo de previsão leva a mudanças lentas de posicionamento, que é o que costumamos chamar de atraso do indicador.

    2, Alguns valores estatísticos para testes de resultados do modelo não estão disponíveis e os resultados de alguns testes estatísticos não são confiáveis devido à correlação de sequências causada pela repetição de dados.

  • NO:06

    Uma boa estratégia de negociação deve ser lucrativa no futuro. Testes fora da amostra, além de detectar objetivamente a estratégia de negociação, economizam mais tempo e eficiência.

    Na maioria dos casos, é muito perigoso entrar em combate direto usando os parâmetros ótimos de todas as amostras.

    Se todos os dados históricos anteriores ao momento da otimização forem separados, divididos em dados dentro e fora da amostra, e os dados dentro da amostra forem usados para a otimização de parâmetros e para testes fora da amostra, esse erro pode ser eliminado, além de verificar se a estratégia otimizada se aplica a mercados futuros.

  • NO:07

    Assim como as transações, nós nunca poderemos atravessar o tempo para tomar uma decisão correta para nós mesmos, sem nenhum erro. Se houver uma mão de Deus ou a capacidade de atravessar o futuro, então, sem testes, vamos fazer transações diretas online, e o poço de sal pode estar cheio. E eu, como um mortal, tenho que testar nossas estratégias em dados históricos.

    No entanto, mesmo com uma história de grandes volumes de dados, a história parece ser extremamente escassa diante de um futuro infinito e imprevisível. Assim, um sistema de negociação baseado na história, empurrado de cima para baixo, acabará afundando com o tempo. Porque a história não pode ter um futuro infinito.

    img

  • NO:08

    Nós (inventores de Quantificação) pretendemos mudar o atual círculo de quantificação, sem barganhas, fechamentos de trocas e fraudes, para criar um círculo de quantificação mais puro.

    img

    Compartilhar é uma atitude, mas é mais uma sabedoria!

Localização: Autor Hukybo


Mais.