লিনিয়ার রিগ্রেশন এর সর্বনিম্ন দ্বিগুণ

লেখক:ছোট্ট স্বপ্ন, তৈরিঃ ২০১৬-১২-১৮ ১১ঃ৩৬ঃ২৬, আপডেটঃ ২০১৬-১২-১৮ ১১ঃ৪১ঃ৩১

লিনিয়ার রিগ্রেশন এর সর্বনিম্ন দ্বিগুণ


  • ১, প্রারম্ভ

    এই সময়ের মধ্যে মেশিনটি মেশিনটি শিখতে শিখেছিল, মেশিনটি শিখেছিল, মেশিনের 5 তম অধ্যায়ের মেশিনের লজিস্টিক রিগ্রেশন মেশিনটি শিখেছিল, এটি বেশ শক্ত লাগছিল। এই ট্র্যাকিংয়ের উত্স, মেশিনের লজিস্টিক রিগ্রেশন মেশিন থেকে মেশিনের লিনিয়ার রিগ্রেশন মেশিন পর্যন্ত, এবং মেশিনের সর্বনিম্ন দ্বিগুণ মেশিন পর্যন্ত। অবশেষে মেশিনের উচ্চতর গণিত মেশিনের (৬ষ্ঠ সংস্করণ, নীচের বই) ৯ অধ্যায়ের ১০ নং অধ্যায়ের মেশিনের সর্বনিম্ন দ্বিগুণ মেশিনের সাথে সামঞ্জস্য করা হয়েছিল, যা সর্বনিম্ন দ্বিগুণ মেশিনের পিছনে গাণিতিক নীতিটি কোথা থেকে এসেছে তা বুঝতে পেরেছিল। সর্বনিম্ন দ্বিগুণ হ'ল সর্বোত্তম অনুকূলিতকরণ সমস্যায় অভিজ্ঞতার সূত্র তৈরির একটি বাস্তবায়ন পদ্ধতি। এটির কার্যকারিতা বোঝা Logistic regression এবং support vector machine এর শেখার বোঝার জন্য সহায়ক।

  • ২। ব্যাকগ্রাউন্ড জ্ঞান

    সর্বনিম্ন দ্বিগুণ এর উৎপত্তি সম্পর্কে একটি আকর্ষণীয় ইতিহাস রয়েছে।

    ১৮০১ সালে, ইতালীয় জ্যোতির্বিজ্ঞানী জুসেপ পিয়াজি প্রথম গ্রহাণু উপগ্রহটি আবিষ্কার করেন। ৪০ দিনের ট্র্যাকিং পর্যবেক্ষণের পরে, উপগ্রহটি সূর্যের পিছনে চলে যাওয়ার কারণে পিয়াজি উপগ্রহটির অবস্থান হারিয়ে ফেলেছিলেন। তারপরে বিশ্বব্যাপী বিজ্ঞানীরা পিয়াজির পর্যবেক্ষণের তথ্য ব্যবহার করে উপগ্রহটির সন্ধান শুরু করেছিলেন, তবে বেশিরভাগ লোকের গণনার ফলাফল অনুসারে কোনও ফলাফল পাওয়া যায়নি। ২৪ বছর বয়সী গাউসও উপগ্রহের কক্ষপথ গণনা করেছিলেন। অস্ট্রিয়ান জ্যোতির্বিজ্ঞানী হাইরিচ ওলবার্স গাউসের কক্ষপথের ভিত্তিতে উপগ্রহটি পুনরায় আবিষ্কার করেছিলেন।

    গাউসের সর্বনিম্ন দ্বিগুণের পদ্ধতি ১৮০৯ খ্রিস্টাব্দে তার গ্রন্থে প্রকাশিত হয়। ফরাসি বিজ্ঞানী লেজেন্ডার স্বাধীনভাবে ১৮০৬ খ্রিস্টাব্দে সর্বনিম্ন দ্বিগুণের সূত্র আবিষ্কার করেন।

    ১৮২৯ খ্রিস্টাব্দে, গাউস প্রমাণ করেছিলেন যে সর্বনিম্ন দ্বিগুণের অপ্টিমাইজেশান কার্যকারিতা অন্যান্য পদ্ধতির চেয়ে শক্তিশালী।

  • ৩। জ্ঞানকে কাজে লাগানো

    সর্বনিম্ন দ্বিগুণ এর কেন্দ্রবিন্দু হল সমস্ত ডেটা বিচ্যুতির বর্গ এবং সর্বনিম্ন নিশ্চিত করা।

    ধরুন আমরা কিছু যুদ্ধজাহাজের দৈর্ঘ্য এবং প্রস্থের তথ্য সংগ্রহ করেছি।

    img

    আমরা পাইথনে এই তথ্যের উপর ভিত্তি করে একটি বিন্দু গ্রাফ আঁকতে পারিঃ

    img

    পয়েন্ট গ্রাফ আঁকার কোড নিম্নরূপঃ

    import numpy as np                # -*- coding: utf-8 -*
    import os
    import matplotlib.pyplot as plt
    def drawScatterDiagram(fileName): # 改变工作路径到数据文件存放的地方
        os.chdir("d:/workspace_ml")
        xcord=[];ycord=[]
        fr=open(fileName)
        for line in fr.readlines():
            lineArr=line.strip().split()
            xcord.append(float(lineArr[1]));ycord.append(float(lineArr[2]))
        plt.scatter(xcord,ycord,s=30,c='red',marker='s')
        plt.show()
    

    যদি আমরা প্রথম দুইটি বিন্দু নিই (২৩৮, ৩২.৪) (১৫২, ১৫.৫) তাহলে আমরা দুটি সমীকরণ পাব। ১৫২a+b=১৫.৫ ৩২৮a + b = 32.4 এই দুটি সমীকরণ সমাধান করুন, a = 0.197, b = -14.48 তাহলে আমরা এইরকম একটি অনুকরণ গ্রাফ পেতে পারিঃ

    img

    ঠিক আছে, নতুন প্রশ্ন হল, a, b কি সর্বোত্তম? পেশাদারদের মতে, a, b কি মডেলের সর্বোত্তম পরামিতি? এই প্রশ্নের উত্তর দেওয়ার আগে, আমরা আরেকটি প্রশ্নের সমাধান করবঃ কোন শর্তে a, b সর্বোত্তম?

    উত্তর হলঃ সব ডেটা এর বর্গ এবং সর্বনিম্ন বিচ্যুতি নিশ্চিত করা। নীতি সম্পর্কে, আমরা পরে কথা বলব, প্রথমে এই সরঞ্জামটি ব্যবহার করে সেরা a এবং b গণনা করা যায়। সব ডেটা এর বর্গ এবং M অনুমান করা হয়,

    img

    এখন আমাদের যা করতে হবে তা হল M কে a এবং b এর মধ্যে সর্বনিম্ন করা। লক্ষ্য করুন এই সমীকরণে, আমরা জানি যে yi এবং xi

    আসলে এই সমীকরণটি একটি দ্বিপদী ফাংশন যার মধ্যে a, b হল নিজের ভেরিয়েবল এবং M হল ভেরিয়েবলের কারন।

    মনে রাখবেন কিভাবে উচ্চসংখ্যার ক্ষেত্রে একক ফাংশনের জন্য সর্বোচ্চ মান হয়। আমরা মূলধারার এই সরঞ্জামটি ব্যবহার করি। তাহলে বাইনারি ফাংশনে, আমরা এখনও মূলধারার ব্যবহার করি। তবে এখানে মূলধারার একটি নতুন নাম আছে। M এর বিভাজককে জিজ্ঞাসা করলে আমরা একটি সমীকরণ পাবো।

    img

    এই দুটি সমীকরণের মধ্যে x এবং y উভয়ই জানা যায়।

    এটি একটি সহজ প্রশ্ন এবং একটি সহজ উত্তর। উইকিপিডিয়ার তথ্য ব্যবহার করে, আমি এখানে সরাসরি উত্তর দিয়ে একটি উপযুক্ত চিত্র আঁকবঃ

    img

    # -*- coding: utf-8 -*importnumpy as npimportosimportmatplotlib.pyplot as pltdefdrawScatterDiagram(fileName):
    # 改变工作路径到数据文件存放的地方os.chdir("d:/workspace_ml")xcord=[];
    # ycord=[]fr=open(fileName)forline infr.readlines():lineArr=line.strip().split()xcord.append(float(lineArr[1]));
    # ycord.append(float(lineArr[2]))plt.scatter(xcord,ycord,s=30,c='red',marker='s')
    # a=0.1965;b=-14.486a=0.1612;b=-8.6394x=np.arange(90.0,250.0,0.1)y=a*x+bplt.plot(x,y)plt.show()
    # -*- coding: utf-8 -*
    import numpy as np
    import os
    import matplotlib.pyplot as plt
    def drawScatterDiagram(fileName):
        #改变工作路径到数据文件存放的地方
        os.chdir("d:/workspace_ml")
        xcord=[];ycord=[]
        fr=open(fileName)
        for line in fr.readlines():
            lineArr=line.strip().split()
            xcord.append(float(lineArr[1]));ycord.append(float(lineArr[2]))
        plt.scatter(xcord,ycord,s=30,c='red',marker='s')
        #a=0.1965;b=-14.486
        a=0.1612;b=-8.6394
        x=np.arange(90.0,250.0,0.1)
        y=a*x+b
        plt.plot(x,y)
        plt.show()
    
  • চতুর্থত, মৌলিক অনুসন্ধান

    ডাটা ফিটনেসের ক্ষেত্রে, কেন মডেলের প্যারামিটারগুলিকে অপ্টিমাইজ করার জন্য মডেলের পূর্বাভাসের ডেটাকে প্রকৃত ডেটার সাথে পার্থক্যের বর্গক্ষেত্রের পরিবর্তে নিখুঁত মান এবং সর্বনিম্ন করা হয়?

    এই প্রশ্নের উত্তর কেউ দিয়েছে, লিঙ্ক দেখুন।http://blog.sciencenet.cn/blog-430956-621997.html

    ব্যক্তিগতভাবে আমি এই ব্যাখ্যাটি খুব আকর্ষণীয় মনে করি; বিশেষ করে এর মধ্যে থাকা অনুমানটিঃ f (x) এর সমস্ত বিচ্যুতির পয়েন্টগুলিতে শব্দ রয়েছে।

    একটি পয়েন্টের বিচ্যুতি যত বেশি হবে, শব্দটি তত বেশি হবে। তাহলে বিচ্যুতির মাত্রা x এর সাথে সম্ভাব্যতা f (x) এর সম্পর্ক কী?

    img

    img

  • ৫। সম্প্রসারণ

    উপরের সবগুলিই দ্বি-মাত্রিক, অর্থাৎ শুধুমাত্র একটি স্ব-ভেরিয়েবল। কিন্তু বাস্তব জগতে, যা চূড়ান্ত ফলাফলকে প্রভাবিত করে তা হল একাধিক কারণের উপর নির্ভরশীল, অর্থাৎ স্ব-ভেরিয়েবলের একাধিক ঘটনা।

    সাধারণ এন মেট্রো-লিনিয়ার ফাংশনগুলির জন্য, লিনিয়ার-লিনিয়ার-এলজিবারের তালের মধ্যে বিপরীত ম্যাট্রিক্সের সাথে অনুসন্ধান করা ঠিক আছে; কারণ একটি উপযুক্ত উদাহরণ অস্থায়ীভাবে পাওয়া যায় নি, এটি একটি কন্ডাক্টর হিসাবে এখানে রয়েছে।

    অবশ্যই, প্রকৃতি একটি বহুবচন সমন্বয়, সহজ রৈখিকতা নয়, যা উচ্চতর বিষয়বস্তু।

  • তথ্যসূত্র

    • উচ্চতর গণিতের পত্রিকা (৬ষ্ঠ সংস্করণ) (উচ্চতর শিক্ষা প্রকাশনা)
    • বেইজিং ইউনিভার্সিটি প্রকাশনা
    • ইন্টারেক্টিভ এনসাইক্লোপিডিয়াঃসর্বনিম্ন দ্বিগুণ
    • উইকিপিডিয়াঃ সর্বনিম্ন দ্বিগুণ
    • সাইন্স নেটঃসর্বনিম্ন দ্বিগুণ?

মূল কাজ, অনুলিপি করার অনুমতি দেওয়া হয়, অনুলিপি করার সময় দয়া করে নিবন্ধটির মূল উত্স, লেখক সম্পর্কিত তথ্য এবং এই বিবৃতিটি হাইপারলিঙ্ক আকারে চিহ্নিত করুন; অন্যথায় আইনী দায়বদ্ধতা অনুসরণ করা হবে।http://sbp810050504.blog.51cto.com/2799422/1269572


আরো