مشین لرننگ کی تین بڑی اقسام کے 6 بڑے الگورتھم کے فوائد اور نقصانات

مصنف:چھوٹا سا خواب, تخلیق: 2017-10-30 12:01:59, تازہ کاری: 2017-11-08 13:55:03

مشین لرننگ کی تین بڑی اقسام کے 6 بڑے الگورتھم کے فوائد اور نقصانات

مشین لرننگ میں ، مقصد یا تو پیش گوئی ہے (پروڈکشن) یا گروپنگ (کلسٹرنگ) ؛ اس مضمون میں پیش گوئی پر توجہ دی گئی ہے۔ پیش گوئی ان پٹ متغیرات کے ایک سیٹ سے آؤٹ پٹ متغیرات کی قدر کا اندازہ لگانے کا عمل ہے۔ مثال کے طور پر ، متعلقہ گھر کی خصوصیات کے ایک سیٹ حاصل کرنے کے بعد ، ہم اس کی فروخت کی قیمت کا اندازہ لگا سکتے ہیں۔ پیش گوئی کے مسائل کو دو بڑی اقسام میں تقسیم کیا جاسکتا ہے۔ اس کے بعد ، آئیے مشین لرننگ میں سب سے زیادہ نمایاں اور عام طور پر استعمال ہونے والے الگورتھم کو دیکھتے ہیں۔ ہم ان کو تین اقسام میں تقسیم کرتے ہیں: لکیری ماڈل ، درخت پر مبنی ماڈل ، اور اعصابی نیٹ ورکس ، جن میں سے چھ پر توجہ دی جاتی ہے:

img

ایک ، لکیری ماڈل الگورتھم: لکیری ماڈل سادہ فارمولوں کا استعمال کرتے ہوئے ، ڈیٹا پوائنٹس کے ایک سیٹ کے ذریعے بہترین فٹ ہونے والی لائنوں کو ڈھونڈتا ہے۔ یہ طریقہ 200 سال سے زیادہ کا ہے اور اعدادوشمار اور مشین لرننگ دونوں شعبوں میں وسیع پیمانے پر استعمال ہوتا ہے۔ اس کی سادگی کی وجہ سے ، یہ اعدادوشمار کے لئے مفید ہے۔ آپ جس متغیر کی پیش گوئی کرنا چاہتے ہیں اسے متغیر کے مساوات کے طور پر پیش کیا جاتا ہے جسے آپ پہلے ہی جانتے ہیں (خود متغیر) ، لہذا پیش گوئی کرنا صرف ایک متغیر کو داخل کرنا ہے اور پھر مساوات کے جوابات کا حساب لگانا ہے۔

  • 1.线性回归

    لکیری رجعت ، یا زیادہ درست طور پر ، فاریکس ٹریڈنگ کے بہترین اختیارات کیا ہیں؟ کا سب سے معیاری فارم ہے۔ لکیری رجعت رجعت کے مسائل کے ل the ، لکیری رجعت سب سے آسان لکیری ماڈل ہے۔ اس کا نقصان یہ ہے کہ ماڈل آسانی سے اوور فٹ ہوجاتا ہے ، یعنی ، ماڈل مکمل طور پر تربیت یافتہ اعداد و شمار کے مطابق ہوجاتا ہے ، اس کی قیمت پر نئے اعداد و شمار میں توسیع کرنے کی صلاحیت پر۔ لہذا ، مشین سیکھنے میں لکیری رجعت (اور منطقی رجعت جس کے بارے میں ہم بعد میں بات کریں گے) عام طور پر موڈل کیپشن ہے ، جس کا مطلب ہے کہ ماڈل کو اوور فٹ ہونے سے روکنے کے لئے کچھ سزا ہے۔

    لکیری ماڈلز کا ایک اور نقصان یہ ہے کہ چونکہ وہ بہت آسان ہیں ، لہذا جب ان پٹ متغیرات آزاد نہیں ہوتے ہیں تو وہ زیادہ پیچیدہ طرز عمل کی پیش گوئی کرنے میں آسان نہیں ہوتے ہیں۔

  • 2.逻辑回归

    منطقی رجعت درجہ بندی کے مسئلے کے لئے لکیری رجعت کی موافقت ہے۔ منطقی رجعت کے نقصانات لکیری رجعت کی طرح ہیں۔ منطقی افعال درجہ بندی کے مسئلے کے لئے بہت اچھے ہیں کیونکہ اس نے تھریڈ ویلیو اثر متعارف کرایا ہے۔

دوسرا، درخت ماڈل الگورتھم

  • فیصلہ سازی کا درخت

    فیصلے کا درخت ہر ممکنہ نتائج کی ایک تصویر ہے جس میں فیصلے کو دکھایا گیا ہے۔ مثال کے طور پر، آپ نے سلاد کا حکم دینے کا فیصلہ کیا ہے، آپ کا پہلا فیصلہ ممکنہ طور پر خام کیلے کی قسم ہے، اس کے بعد آم اور پھر سلاد کی قسم. ہم ایک فیصلے کے درخت میں تمام ممکنہ نتائج ظاہر کر سکتے ہیں.

    فیصلے کے درخت کو تربیت دینے کے لیے ہمیں ٹریننگ ڈیٹاسیٹ کا استعمال کرنے کی ضرورت ہوتی ہے اور یہ معلوم کرنا پڑتا ہے کہ مقصد کے لیے کون سی صفت سب سے زیادہ مفید ہے۔ مثال کے طور پر، دھوکہ دہی کے پتہ لگانے کے استعمال کی مثال میں، ہم یہ تلاش کر سکتے ہیں کہ ملک دھوکہ دہی کے خطرے کی پیشن گوئی کرنے میں سب سے زیادہ اثر انداز ہوتا ہے۔ پہلی صفت کے ساتھ شاخ بندی کرنے کے بعد، ہمیں دو ذیلی سیٹ ملتی ہیں، جو کہ سب سے زیادہ درست اندازہ لگانے کے قابل ہوتی ہیں اگر ہم صرف پہلی صفت کو جانتے ہوں۔ پھر ہم دوسری اچھی صفت کا پتہ لگاتے ہیں جو ان دونوں ذیلی سیٹوں کے ساتھ شاخ بندی کی جا سکتی ہے، دوبارہ تقسیم کرتے ہیں، اور اسی طرح بار بار استعمال کرتے ہیں، جب تک کہ کافی تعداد میں صفتیں موجود نہ ہوں تاکہ مقصد کی ضروریات پوری کی جا سکیں۔

  • 2، بے ترتیب جنگلات

بے ترتیب جنگل بہت سے فیصلے کے درختوں کا اوسط ہے، جن میں سے ہر ایک فیصلے کے درخت کو بے ترتیب اعداد و شمار کے نمونے کے ساتھ تربیت دی جاتی ہے۔ بے ترتیب جنگل میں ہر ایک درخت ایک مکمل فیصلے کے درخت سے کمزور ہے، لیکن تمام درختوں کو ایک ساتھ ڈالنے سے، ہم تنوع کے فوائد کی وجہ سے بہتر مجموعی کارکردگی حاصل کرسکتے ہیں۔

بے ترتیب جنگل آج مشین سیکھنے میں ایک بہت ہی مقبول الگورتھم ہے۔ بے ترتیب جنگل کی تربیت کرنا آسان ہے ، اور اس کی کارکردگی کافی اچھی ہے۔ اس کا نقصان یہ ہے کہ بے ترتیب جنگل کی پیداوار کی پیش گوئی دوسرے الگورتھم کے مقابلے میں سست ہوسکتی ہے ، لہذا جب تیز پیش گوئی کی ضرورت ہو تو ، بے ترتیب جنگل کا انتخاب نہیں کیا جاسکتا ہے۔

  • 3، گلیریٹ میں اضافہ

    گریڈینٹ بوسٹنگ ، جیسے بے ترتیب جنگلات ، کمزور اور کمزور فیصلہ سازی کے درختوں پر مشتمل ہے۔ گریڈینٹ بوسٹنگ کا سب سے بڑا فرق یہ ہے کہ گریڈینٹ بوسٹنگ میں ، درختوں کو ایک ایک کرکے تربیت دی جاتی ہے۔ ہر پچھلے درخت کو بنیادی طور پر سامنے والے درختوں کے ذریعہ غلط اعداد و شمار کی نشاندہی کرنے کی تربیت دی جاتی ہے۔ اس سے گریڈینٹ بوسٹنگ میں آسانی سے پیش گوئی کرنے والے حالات پر زیادہ توجہ دی جاتی ہے ، اور کم مشکل حالات پر زیادہ توجہ دی جاتی ہے۔

    گرڈ اپ ٹریننگ بھی تیز ہے اور بہت اچھی کارکردگی کا مظاہرہ کرتی ہے۔ تاہم ، ٹریننگ ڈیٹاسیٹ میں چھوٹی چھوٹی تبدیلیاں ماڈل میں بنیادی تبدیلیاں لا سکتی ہیں ، لہذا اس کے نتیجے میں ممکنہ طور پر سب سے زیادہ قابل عمل نتائج نہیں مل سکتے ہیں۔

تیسرا ، نیورل نیٹ ورکس الگورتھم: نیورل نیٹ ورکس ایک حیاتیاتی رجحان ہے جس میں دماغ میں ایک دوسرے کے ساتھ معلومات کا تبادلہ کرنے والے مربوط نیورون ہوتے ہیں۔ یہ خیال اب مشین لرننگ کے شعبے میں بھی لاگو کیا گیا ہے ، جسے اے این این کہا جاتا ہے۔ گہری تعلیم ایک دوسرے کے اوپر پرتوں پر مشتمل نیورل نیٹ ورکس ہے۔ این این ایک ایسے ماڈل کا ایک سلسلہ ہے جو سیکھنے کے ذریعے انسانی دماغ کی طرح علمی صلاحیتوں کو حاصل کرتا ہے۔ نیورل نیٹ ورکس بہت پیچیدہ کاموں کو سنبھالنے میں اچھی کارکردگی کا مظاہرہ کرتے ہیں ، جیسے تصویر کی شناخت۔ لیکن ، جیسے انسانی دماغ ، ٹریننگ ماڈل بہت وقت لگتا ہے اور بہت زیادہ توانائی کی ضرورت ہوتی ہے۔

بگ ڈیٹا پلیٹ فارم سے نقل کیا گیا


مزید