El doble mínimo de la curva de regresión lineal

El autor:Un sueño pequeño., Creado: 2016-12-18 11:36:26, Actualizado: 2016-12-18 11:41:31

El doble mínimo de la curva de regresión lineal


  • Primero, el preámbulo.

    Durante este tiempo, aprendió a aprender la hierro, aprendiendo la hierro logística de la hierro en el capítulo 5, lo que se sintió bastante difícil. La trazabilidad, desde la hierro logística de la hierro a la hierro lineal de la hierro, a la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la hierro de la El parámetro de doble mínimo es una implementación de la fórmula de la experiencia en el problema de optimización. Conocer su funcionamiento es útil para entender el parámetro de aprendizaje del parámetro de regresión Logistic y el parámetro de aprendizaje que soporta la máquina vectorial.

  • 2 Conocimiento del contexto

    El contexto histórico de la aparición de la suma de las cuotas mínimas de cuotas es interesante.

    En 1801, el astrónomo italiano Giuseppe Piazzi descubrió el primer asteroide, la estrella del valle. Después de 40 días de seguimiento, Piazzi perdió su posición debido a que la estrella del valle se encontraba detrás del Sol. Luego, científicos de todo el mundo comenzaron a buscar la estrella del valle con los datos de las observaciones de Piazzi, pero no encontraron ninguna estrella según los resultados de la mayoría de los cálculos.

    El método de Gauss para el doble mínimo fue publicado en 1809 en su libro sobre el movimiento de los objetos celestes, mientras que el científico francés Le Jeannard descubrió el doble mínimo de Gauss de forma independiente en 1806, pero no fue conocido.

    En 1829, Gauss proporcionó una prueba de que el efecto de optimización de la doble mínima es más fuerte que otros métodos, ver Gauss-Markov.

  • El uso del conocimiento

    El núcleo de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante de la variante.

    Supongamos que recopilamos datos de longitud y anchura de algunos buques.

    img

    Con base en estos datos, dibujamos un gráfico de puntos dispares en Python:

    img

    El código para dibujar un gráfico de puntos es el siguiente:

    import numpy as np                # -*- coding: utf-8 -*
    import os
    import matplotlib.pyplot as plt
    def drawScatterDiagram(fileName): # 改变工作路径到数据文件存放的地方
        os.chdir("d:/workspace_ml")
        xcord=[];ycord=[]
        fr=open(fileName)
        for line in fr.readlines():
            lineArr=line.strip().split()
            xcord.append(float(lineArr[1]));ycord.append(float(lineArr[2]))
        plt.scatter(xcord,ycord,s=30,c='red',marker='s')
        plt.show()
    

    Si tomamos los dos primeros puntos, podemos obtener dos ecuaciones. 152 añosa + b = 15,5 328...A + b es 32.4 Así que vamos a resolver estas dos ecuaciones para obtener a = 0.197, b = -14.48. Entonces, podemos obtener un gráfico de ajuste como este:

    img

    Bueno, aquí viene una nueva pregunta, ¿qué es lo mejor de a y b? ¿Qué es lo mejor de a y b? ¿Qué es lo mejor de a y b?

    La respuesta es: garantiza el cuadrado y el mínimo de todos los desviaciones de datos. En cuanto a los principios, hablaremos más adelante, primero vamos a ver cómo usar esta herramienta para calcular mejor a y b. Suponiendo que el cuadrado de todos los datos es M, entonces

    img

    Lo que vamos a hacer ahora es hacer que M sea el mínimo de a y b.

    Entonces la ecuación es una función binaria con a, b como variable propia y m como variable derivada.

    Recordemos cómo en los números altos la función unitaria tiene un valor máximo. Utilizamos la herramienta derivada. Entonces en las funciones binarias, seguimos usando derivadas. Pero aquí el derivado tiene un nuevo nombre. Si buscamos el derivado de M, obtendremos un conjunto de ecuaciones.

    img

    En estas dos ecuaciones, x y y se conocen.

    Es muy fácil obtener a y b. Como se utiliza datos de Wikipedia, aquí dibujo una imagen adecuada directamente con la respuesta:

    img

    # -*- coding: utf-8 -*importnumpy as npimportosimportmatplotlib.pyplot as pltdefdrawScatterDiagram(fileName):
    # 改变工作路径到数据文件存放的地方os.chdir("d:/workspace_ml")xcord=[];
    # ycord=[]fr=open(fileName)forline infr.readlines():lineArr=line.strip().split()xcord.append(float(lineArr[1]));
    # ycord.append(float(lineArr[2]))plt.scatter(xcord,ycord,s=30,c='red',marker='s')
    # a=0.1965;b=-14.486a=0.1612;b=-8.6394x=np.arange(90.0,250.0,0.1)y=a*x+bplt.plot(x,y)plt.show()
    # -*- coding: utf-8 -*
    import numpy as np
    import os
    import matplotlib.pyplot as plt
    def drawScatterDiagram(fileName):
        #改变工作路径到数据文件存放的地方
        os.chdir("d:/workspace_ml")
        xcord=[];ycord=[]
        fr=open(fileName)
        for line in fr.readlines():
            lineArr=line.strip().split()
            xcord.append(float(lineArr[1]));ycord.append(float(lineArr[2]))
        plt.scatter(xcord,ycord,s=30,c='red',marker='s')
        #a=0.1965;b=-14.486
        a=0.1612;b=-8.6394
        x=np.arange(90.0,250.0,0.1)
        y=a*x+b
        plt.plot(x,y)
        plt.show()
    
  • Cuatro, la búsqueda de principios

    En el ajuste de datos, ¿por qué se debe optimizar los parámetros del modelo con el valor absoluto y mínimo en lugar del cuadrado de la diferencia entre los datos de predicción del modelo y los datos reales?

    La pregunta ya ha sido respondida, véase el enlace.http://blog.sciencenet.cn/blog-430956-621997.html

    Personalmente siento que esta explicación es muy interesante. Especialmente la hipótesis que contiene: todos los puntos que se desvían de f (x) son ruidosos.

    El mayor es el desvío de un punto, y menor es la probabilidad de que ocurra. Entonces, ¿cuál es la relación entre el grado de desviación x y la probabilidad de que ocurra f (x)?

    img

    img

  • V. Ampliar y ampliar

    Todo lo anterior es una situación bidimensional, es decir, con una sola variable propia. Pero en el mundo real, lo que afecta al resultado final es la superposición de varios factores, es decir, hay varias situaciones de variables propias.

    Para las funciones N metalineas generales, está bien buscar una matriz inversa en la matriz de álgebra lineal de acoplamiento; como no se encontró un ejemplo adecuado por el momento, se queda aquí como un derivado.

    Por supuesto, la naturaleza es más una combinación de elementos que una simple linealidad, que es un contenido superior.

  • Referencias

Trabajo original, reproducción permitida, en caso de reproducción, por favor, asegúrese de indicar el origen original del artículo en forma de hipervínculo, información del autor y esta declaración; de lo contrario, se llevará a cabo una responsabilidad legal.http://sbp810050504.blog.51cto.com/2799422/1269572


Más.