O mínimo de duas vezes o par de regressões lineares

Autora:Sonhos pequenos, Criado: 2016-12-18 11:36:26, Atualizado: 2016-12-18 11:41:31

O mínimo de duas vezes o par de regressões lineares


  • Primeira introdução

    Durante esse tempo, aprendi a fazer o jogo, e aprendi o jogo de regresso logístico do jogo do capítulo 5, o que me fez sentir bastante cansado. A origem do jogo, desde o jogo de regresso logístico até o jogo de regresso linear do jogo, até o jogo de duplicado mínimo do jogo. Finalmente, o jogo foi configurado para o jogo de duplicado mínimo do jogo de matemática avançada (a sexta edição. O quadrado mínimo por quadrado é uma implementação do método de construção de fórmulas experimentais em problemas de otimização. Conhecer seu funcionamento é útil para entender o quadrado de aprendizagem do quadrado de regressão Logistic e o quadrado de vectores de suporte ao quadrado.

  • 2o Conhecimento de fundo

    O contexto histórico do surgimento do quadratico mínimo do quadratico é interessante.

    Em 1801, o astrônomo italiano Giuseppe Piazzi descobriu o primeiro asteroide, a estrela do vale. Após 40 dias de observações, o asteroide perdeu a posição devido ao seu trajeto para trás do Sol. Cientistas de todo o mundo começaram a procurar a estrela usando os dados de observações de Piazzi, mas não encontraram nenhum resultado com base nos cálculos da maioria.

    O método de Gauss para o mínimo de duplicado foi publicado em 1809 em seu livro A Teoria do Movimento dos Órgãos Celestes, e o cientista francês Le Jeannard descobriu o mínimo de duplicado de duplicado de duplicado de duplicado de duplicado de duplicado de duplicado em 1806, mas ficou em silêncio porque não era conhecido.

    Em 1829, Gauss forneceu uma prova de que o efeito de otimização do modo mínimo de duplicação é mais forte do que outros métodos, ver Gauss-Markov.

  • Terceiro, a aplicação do conhecimento.

    O núcleo do quadrado mínimo por quadrado é garantir o quadrado e o mínimo de todos os desvios de dados.

    Suponhamos que coletemos dados de comprimento e largura de alguns navios.

    img

    Com base nesses dados, desenhamos um gráfico de pontos em Python:

    img

    O código para desenhar um gráfico de pontos é o seguinte:

    import numpy as np                # -*- coding: utf-8 -*
    import os
    import matplotlib.pyplot as plt
    def drawScatterDiagram(fileName): # 改变工作路径到数据文件存放的地方
        os.chdir("d:/workspace_ml")
        xcord=[];ycord=[]
        fr=open(fileName)
        for line in fr.readlines():
            lineArr=line.strip().split()
            xcord.append(float(lineArr[1]));ycord.append(float(lineArr[2]))
        plt.scatter(xcord,ycord,s=30,c='red',marker='s')
        plt.show()
    

    Se tirarmos os dois primeiros pontos, temos duas equações, 238, 32.4, 152, 15.5. 152a+b=15,5 328A + b é igual a 32,4 Então vamos resolver estas duas equações e obter a = 0.197, b = -14.48. Então, podemos obter um gráfico de configuração como este:

    img

    Ok, aqui vem uma nova questão, a e b são os melhores? A forma de falar profissional é: a e b são os melhores parâmetros do modelo?

    A resposta é: garantir o quadrado e o mínimo de todos os desvios de dados. Quanto ao princípio, falaremos mais tarde, primeiro vamos ver como usar essa ferramenta para calcular melhor a e b. Supondo que o quadrado de todos os dados seja M, então

    img

    O que nós vamos fazer agora é tentar minimizar M a e b.

    Então, na verdade, esta equação é uma função binária com ((a, b) como variável própria e M como variável derivada).

    Lembre-se de como o valor máximo de uma função é o valor máximo de uma função numérica em números elevados. Então nós usamos a ferramenta derivada. Então, em funções binárias, nós ainda usamos derivadas. Então, se você está tentando encontrar uma derivada para M, você tem um conjunto de equações

    img

    As equações xi e yi são conhecidas.

    É fácil encontrar a e b. Como usamos dados da Wikipedia, eu desenho uma imagem direta da resposta:

    img

    # -*- coding: utf-8 -*importnumpy as npimportosimportmatplotlib.pyplot as pltdefdrawScatterDiagram(fileName):
    # 改变工作路径到数据文件存放的地方os.chdir("d:/workspace_ml")xcord=[];
    # ycord=[]fr=open(fileName)forline infr.readlines():lineArr=line.strip().split()xcord.append(float(lineArr[1]));
    # ycord.append(float(lineArr[2]))plt.scatter(xcord,ycord,s=30,c='red',marker='s')
    # a=0.1965;b=-14.486a=0.1612;b=-8.6394x=np.arange(90.0,250.0,0.1)y=a*x+bplt.plot(x,y)plt.show()
    # -*- coding: utf-8 -*
    import numpy as np
    import os
    import matplotlib.pyplot as plt
    def drawScatterDiagram(fileName):
        #改变工作路径到数据文件存放的地方
        os.chdir("d:/workspace_ml")
        xcord=[];ycord=[]
        fr=open(fileName)
        for line in fr.readlines():
            lineArr=line.strip().split()
            xcord.append(float(lineArr[1]));ycord.append(float(lineArr[2]))
        plt.scatter(xcord,ycord,s=30,c='red',marker='s')
        #a=0.1965;b=-14.486
        a=0.1612;b=-8.6394
        x=np.arange(90.0,250.0,0.1)
        y=a*x+b
        plt.plot(x,y)
        plt.show()
    
  • Quatro, pesquisas fundamentais.

    No caso dos dados ajustados, por que é que os parâmetros do modelo devem ser optimizados com o quadrado dos dados de previsão em relação ao diferencial entre os dados reais e não com os valores absolutos e mínimos?

    A pergunta já foi respondida, veja o link.http://blog.sciencenet.cn/blog-430956-621997.html

    Pessoalmente, a explicação é muito interessante. Especialmente a hipótese: todos os pontos que se desviam de f (x) são ruidosos.

    Quanto maior o desvio de um ponto, menor a probabilidade de que ele ocorra. Então, qual é a relação entre o grau de desvio x e a probabilidade de ocorrência f (x)?

    img

    img

  • 5. Extensão

    Tudo o que foi dito acima é bidimensional, ou seja, há apenas uma variável autônoma. Mas no mundo real, o resultado final é influenciado por uma sobreposição de vários fatores, ou seja, há vários casos de variáveis autônomas.

    Para a função N metalinear em geral, é OK resolver com a matriz inversa na matriz de álgebra linear de acoplamento; como não foi encontrado um exemplo adequado temporariamente, fica aqui como um derivado.

    Naturalmente, a natureza é mais uma combinação de polígonos do que uma simples linearidade, que é um conteúdo mais elevado.

  • Referências

Trabalho original, permitido a reprodução, no momento da reprodução, certifique-se de indicar a origem original do artigo em forma de hiperlink, informações do autor e esta declaração; caso contrário, será processada pela responsabilidade legal.http://sbp810050504.blog.51cto.com/2799422/1269572


Mais.