Минимальное двойное множение линейной регрессии

Автор:Маленькие мечты, Создано: 2016-12-18 11:36:26, Обновлено: 2016-12-18 11:41:31

Минимальное двойное множение линейной регрессии


  • Первое, предложение

    В течение этого времени, изучая кулинарные машины, я научился кулинарной логистической регрессии в главе 5, и это было довольно сложно. Я начал изучать кулинарную логистическую регрессию в главе 5 и начал изучать логистическую регрессию в главе 5, затем я начал изучать логистическую регрессию в главе 5, затем я начал изучать логистическую регрессию в главе 5, затем я начал изучать логистическую регрессию в главе 5. Масштабная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная двойная д

  • Второе, знание о происхождении

    Исторический контекст появления минимальной двойной величины единицы единиц очень интересен.

    В 1801 году итальянский астроном Джузеп Пиаци обнаружил первый астероид Голубая звезда. После 40 дней слежения Пиаци потерял местоположение голубых звезд из-за того, что голубая звезда движется к Солнцу. Впоследствии ученые по всему миру начали искать голубые звезды с помощью данных наблюдений Пиаци, но не смогли найти их по результатам большинства людей.

    Метод минимального двойного умножения, использованный Гаусом, был опубликован в 1809 году в его книге "Теория движения небесных тел", а французский ученый Леженде в 1806 году независимо обнаружил минимальное двойное умножение, но остался в тайне из-за неизвестности.

    В 1829 году Гаусс предоставил доказательство того, что оптимизация минимального двойного умножения эффективна сильнее других методов, см. Гаусс-Марковский теорема.

  • Третье: применение знаний

    Ключом к числу чисел является обеспечение квадрата и минимума всех отклонений данных.

    Предположим, что мы собираем данные о длине и ширине некоторых кораблей.

    img

    С помощью этих данных мы нарисовали точечную диаграмму с помощью Python:

    img

    Код для рисования точечной карты выглядит так:

    import numpy as np                # -*- coding: utf-8 -*
    import os
    import matplotlib.pyplot as plt
    def drawScatterDiagram(fileName): # 改变工作路径到数据文件存放的地方
        os.chdir("d:/workspace_ml")
        xcord=[];ycord=[]
        fr=open(fileName)
        for line in fr.readlines():
            lineArr=line.strip().split()
            xcord.append(float(lineArr[1]));ycord.append(float(lineArr[2]))
        plt.scatter(xcord,ycord,s=30,c='red',marker='s')
        plt.show()
    

    Если мы убрали первые две точки, мы получим две уравнения. 152a+b=15,5 328a + b = 32.4 Если мы решим эти два уравнения, мы получим a = 0.197, b = -14.48. В этом случае мы получим такой график:

    img

    Итак, вот новый вопрос: а, b - это оптимальные параметры? Профессионально говоря: а, b - это оптимальные параметры модели?

    Ответ: гарантировать квадрат и минимум всех отклонений данных. Что касается принципов, мы поговорим позже, и сначала посмотрим, как использовать этот инструмент, чтобы наилучшим образом вычислить a и b. Предположим, что квадрат всех данных и является M,

    img

    Теперь мы должны сделать M минимальными a и b. Обратите внимание, что в этом уравнении мы знаем, что мы знаем, что мы знаем, что мы знаем, что мы знаем, что мы знаем, что мы знаем, что мы знаем, что мы знаем, что мы знаем.

    В действительности это уравнение представляет собой бинарную функцию с a, b как собственной переменной, а M как зависимой переменной.

    Вспомните, как в высоких числах у однозначной функции есть предельное значение. Мы используем инструмент производных. В бинарных функциях мы продолжаем использовать производные. Но здесь производные имеют новое название. И мы получаем уравнение, когда мы просчитываем деривативы для M.

    img

    В обоих уравнениях x и y известны.

    Поскольку я использую данные из Википедии, я сразу же нарисую соответствующее изображение с помощью ответа:

    img

    # -*- coding: utf-8 -*importnumpy as npimportosimportmatplotlib.pyplot as pltdefdrawScatterDiagram(fileName):
    # 改变工作路径到数据文件存放的地方os.chdir("d:/workspace_ml")xcord=[];
    # ycord=[]fr=open(fileName)forline infr.readlines():lineArr=line.strip().split()xcord.append(float(lineArr[1]));
    # ycord.append(float(lineArr[2]))plt.scatter(xcord,ycord,s=30,c='red',marker='s')
    # a=0.1965;b=-14.486a=0.1612;b=-8.6394x=np.arange(90.0,250.0,0.1)y=a*x+bplt.plot(x,y)plt.show()
    # -*- coding: utf-8 -*
    import numpy as np
    import os
    import matplotlib.pyplot as plt
    def drawScatterDiagram(fileName):
        #改变工作路径到数据文件存放的地方
        os.chdir("d:/workspace_ml")
        xcord=[];ycord=[]
        fr=open(fileName)
        for line in fr.readlines():
            lineArr=line.strip().split()
            xcord.append(float(lineArr[1]));ycord.append(float(lineArr[2]))
        plt.scatter(xcord,ycord,s=30,c='red',marker='s')
        #a=0.1965;b=-14.486
        a=0.1612;b=-8.6394
        x=np.arange(90.0,250.0,0.1)
        y=a*x+b
        plt.plot(x,y)
        plt.show()
    
  • Четвёртое: исследование принципов

    При сборке данных, почему в качестве оптимальных параметров модели используются квадратные значения разницы между прогнозируемыми данными модели и фактическими данными, а не абсолютные и минимальные значения?

    Кто-то уже ответил на этот вопрос, см. ссылкуhttp://blog.sciencenet.cn/blog-430956-621997.html

    Лично мне это объяснение кажется очень интересным. Особенно предположение: все точки, отклоняющиеся от f (x), имеют шум.

    Чем дальше отклоняется точка, тем меньше вероятность возникновения этой точки. Так какое отношение удовлетворяет степень отклонения x к вероятности возникновения f ((x)?

    img

    img

  • В-пятых, расширение.

    Все вышеперечисленные ситуации имеют двумерность, т.е. только одну самостоятельную переменную. Но в реальном мире, что влияет на конечный результат, это наложение множества факторов, т.е. может быть несколько самостоятельных переменных.

    Для обычных N нелинейных функций вполне нормально искать обратную матрицу в кулуарах линейных алгебров; остается здесь как проводник, поскольку пока не найден подходящий пример.

    Конечно, в природе больше многообразие, чем просто линейность, что является более высоким содержанием.

  • Ссылки

Оригинальное произведение, разрешенное к копированию, при копировании обязательно укажите в форме гиперссылки, где появилось произведение, информацию об авторе и настоящее заявление; в противном случае вы будете нести юридическую ответственность.http://sbp810050504.blog.51cto.com/2799422/1269572


Больше