Le plus petit double de la ronde de régression linéaire

Auteur:Le petit rêve, Créé: 2016-12-18 11:36:26, mis à jour: 2016-12-18 11:41:31

Le plus petit double de la ronde de régression linéaire


  • Première remarque

    Cette période d'apprentissage de la machine à cuire, apprenant la cuisson de la cuisson à la régression logistique du chapitre 5, a été assez difficile. La trace de la source, de la cuisson à la régression logistique à la cuisson à la régression linéaire à la cuisson, puis à la cuisson à la plus petite multiplication de deux fois. Finalement, il a été configuré pour la cuisson à la plus haute multiplication de deux fois (sixième édition, sous-livre) du chapitre 9, paragraphe 10. Le quadratique est une méthode d'implémentation de la formule expérimentale dans les problèmes d'optimisation optimale. Sa compréhension est utile pour comprendre le quadratique de régression Logistic et le quadratique supporté par les machines vectorielles.

  • Deuxièmement, connaître le contexte

    Le contexte historique de l'apparition de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation est intéressant.

    En 1801, l'astronome italien Giuseppe Piazzi découvre le premier astéroïde, l'étoile de la Vallée. Après 40 jours d'observation, il perd la position de l'étoile de la Vallée en se déplaçant derrière le Soleil. Des scientifiques du monde entier commencent alors à chercher l'étoile de la Vallée à partir des observations de Piazzi, mais ils ne trouvent rien selon les calculs de la plupart des gens.

    La méthode de Gauss pour le dixième moindre est publiée en 1809 dans son ouvrage Théorie du mouvement des corps célestes, tandis que le scientifique français Le Jeannard découvre indépendamment le dixième moindre en 1806, mais ne le sait pas.

    En 1829, Gauss a fourni une preuve que l'optimisation de l'optimisation du double minimum est plus efficace que les autres méthodes, voir Gauss-Markov théorème.

  • Troisièmement, l'utilisation du savoir.

    Le noyau de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de l'équation de

    Supposons que nous ayons des données sur la longueur et la largeur de certains navires de guerre.

    img

    En utilisant ces données, nous avons dessiné un diagramme de points partagés en Python:

    img

    Le code de la carte à puces est le suivant:

    import numpy as np                # -*- coding: utf-8 -*
    import os
    import matplotlib.pyplot as plt
    def drawScatterDiagram(fileName): # 改变工作路径到数据文件存放的地方
        os.chdir("d:/workspace_ml")
        xcord=[];ycord=[]
        fr=open(fileName)
        for line in fr.readlines():
            lineArr=line.strip().split()
            xcord.append(float(lineArr[1]));ycord.append(float(lineArr[2]))
        plt.scatter(xcord,ycord,s=30,c='red',marker='s')
        plt.show()
    

    Si nous prenons les deux premiers points, nous obtenons les deux équations. 152 ansa + b = 15,5 328 autresA plus b est égal à 32.4. Donc, si vous résolvez ces deux équations, a est égal à 0.197, b est égal à -14.48. Nous pouvons alors obtenir un schéma de correspondance comme celui-ci:

    img

    Bon, une nouvelle question est posée: est-ce que a et b sont les paramètres optimaux?

    La réponse est: Garantir le carré et le minimum de toutes les variations de données. En ce qui concerne le principe, nous parlerons plus loin, nous allons voir comment utiliser cet outil pour calculer au mieux a et b. Supposons que le carré de toutes les données est M.

    img

    Nous allons maintenant essayer de réduire M à a et b. Notez que dans cette équation, nous savons que yi et xi

    En fait, l'équation est une fonction binaire avec a, b comme variable indépendante et M comme variable dépendante.

    Rappelez-vous comment, dans les nombres élevés, la fonction unitaire est extrême. Nous utilisons l'outil de la dérivée. Dans les fonctions binaires, nous utilisons toujours la dérivée. Mais ici, la dérivée a un nouveau nom. On obtient un ensemble d'équations en demandant la dérivée de M.

    img

    Dans ces deux équations, xi et yi sont connus.

    Il est facile de trouver a et b. Comme j'utilise des données de Wikipedia, j'ai dessiné une image qui correspond directement à la réponse:

    img

    # -*- coding: utf-8 -*importnumpy as npimportosimportmatplotlib.pyplot as pltdefdrawScatterDiagram(fileName):
    # 改变工作路径到数据文件存放的地方os.chdir("d:/workspace_ml")xcord=[];
    # ycord=[]fr=open(fileName)forline infr.readlines():lineArr=line.strip().split()xcord.append(float(lineArr[1]));
    # ycord.append(float(lineArr[2]))plt.scatter(xcord,ycord,s=30,c='red',marker='s')
    # a=0.1965;b=-14.486a=0.1612;b=-8.6394x=np.arange(90.0,250.0,0.1)y=a*x+bplt.plot(x,y)plt.show()
    # -*- coding: utf-8 -*
    import numpy as np
    import os
    import matplotlib.pyplot as plt
    def drawScatterDiagram(fileName):
        #改变工作路径到数据文件存放的地方
        os.chdir("d:/workspace_ml")
        xcord=[];ycord=[]
        fr=open(fileName)
        for line in fr.readlines():
            lineArr=line.strip().split()
            xcord.append(float(lineArr[1]));ycord.append(float(lineArr[2]))
        plt.scatter(xcord,ycord,s=30,c='red',marker='s')
        #a=0.1965;b=-14.486
        a=0.1612;b=-8.6394
        x=np.arange(90.0,250.0,0.1)
        y=a*x+b
        plt.plot(x,y)
        plt.show()
    
  • Quatrièmement, une enquête de fond.

    Dans le cas d'une modélisation des données, pourquoi utiliser le carré de la différence entre les données prédictives du modèle et les données réelles plutôt que les valeurs absolues et minimales pour optimiser les paramètres du modèle?

    Cette question a déjà été répondue par quelqu'un, voir le lien.http://blog.sciencenet.cn/blog-430956-621997.html

    Personnellement, j'ai trouvé cette explication très intéressante. Surtout l'hypothèse: tous les points qui s'écartent de f (x) sont bruyants.

    L'écart d'un point indique que plus le bruit est grand, plus la probabilité d'apparition de ce point est faible. Quelle relation le degré d'écart x a-t-il avec la probabilité d'apparition de f (x)?

    img

    img

  • Cinquièmement, étendre.

    Toutes les situations ci-dessus sont bidimensionnelles, c'est-à-dire qu'il n'y a qu'une seule variable autonome. Mais dans le monde réel, le résultat final est influencé par une superposition de plusieurs facteurs, c'est-à-dire qu'il y a plusieurs cas d'autonomie.

    Pour les fonctions non-linéaires en général, il est OK de chercher une matrice inverse dans une matrice d'algèbre linéaire de chaîne; comme aucun exemple approprié n'a été trouvé pour le moment, il reste ici comme une derivation.

    Bien sûr, la nature est plus une combinaison de polynômes qu'une simple linéarité, c'est-à-dire un contenu supérieur.

  • Les références

    • Le livre des mathématiques de l'enseignement supérieur (sixième édition)
    • L'algorithme de la chaîne linéaire (publié par l'Université de Pékin)
    • L'encyclopédie interactive:Le plus petit double.
    • Wikipédia: Le plus petit double
    • Le réseau scientifique:Le plus petit double?

Les œuvres originales sont autorisées à être reproduites, mais vous devez indiquer l'origine de l'article sous forme de hyperliens, ainsi que les informations sur l'auteur et la présente déclaration. Sinon, vous serez tenu responsable.http://sbp810050504.blog.51cto.com/2799422/1269572


Plus de