مشین لرننگ الگورتھم کا سفر

مصنف:چھوٹا سا خواب, تخلیق: 2017-02-25 09:37:02, تازہ کاری:

مشین لرننگ الگورتھم کا سفر

ہم نے مشین لرننگ کے مسائل کو سمجھنے کے لئے جو ہمیں حل کرنے کی ضرورت ہے.http://machinelearningmastery.com/practical-machine-learning-problems/اس کے بعد ، ہم سوچ سکتے ہیں کہ ہمیں کس قسم کے ڈیٹا کو جمع کرنے کی ضرورت ہے اور ہم کس طرح کے الگورتھم استعمال کرسکتے ہیں۔ اس مضمون میں ہم مشین لرننگ کے سب سے مشہور الگورتھم کا جائزہ لیں گے ، جن کے بارے میں ہم عام طور پر جان سکتے ہیں کہ وہ کون سے ہیں جو مددگار ثابت ہوسکتے ہیں۔ مشین لرننگ کے شعبے میں بہت سارے الگورتھم ہیں اور پھر ہر الگورتھم کے بہت سے توسیع ہیں ، لہذا کسی خاص مسئلے کے لئے صحیح الگورتھم کا تعین کرنا بہت مشکل ہے۔ اس مضمون میں میں آپ کو دو طریقے بتانا چاہتا ہوں جو حقیقت میں پائے جانے والے الگورتھم کا خلاصہ کرتے ہیں۔

  • سیکھنے کا طریقہ

    الگورتھم کو مختلف اقسام میں تقسیم کیا جاتا ہے ، اس پر منحصر ہے کہ وہ تجربات ، ماحول یا کسی بھی قسم کے ان پٹ کو کس طرح سنبھالتے ہیں۔ مشین لرننگ اور اے آئی نصاب عام طور پر پہلے اس بات پر غور کرتے ہیں کہ الگورتھم کس طرح سیکھ سکتے ہیں۔

    یہاں صرف چند اہم سیکھنے کی طرزیں یا سیکھنے کے ماڈل پر تبادلہ خیال کیا گیا ہے اور کچھ بنیادی مثالیں ہیں۔ اس طرح کی درجہ بندی یا تنظیم کا طریقہ اچھا ہے کیونکہ یہ آپ کو ان پٹ ڈیٹا کے کردار اور ماڈل کی تیاری کے عمل کے بارے میں سوچنے پر مجبور کرتا ہے اور پھر آپ کے مسئلے کے لئے بہترین کام کرنے والے الگورتھم کا انتخاب کرتا ہے تاکہ آپ کو بہترین نتائج مل سکیں۔

    مانیٹرنگ لرننگ: ان پٹ ڈیٹا کو ٹریننگ ڈیٹا کہا جاتا ہے اور اس کے معلوم نتائج یا نشان لگائے جاتے ہیں۔ مثلاً ایک ای میل اسپام ہے یا نہیں، یا ایک عرصے کے دوران اسٹاک کی قیمت۔ ماڈل پیش گوئی کرتا ہے اور اگر غلط ہو جاتا ہے تو اسے درست کیا جاتا ہے۔ یہ عمل اس وقت تک جاری رہتا ہے جب تک کہ ٹریننگ ڈیٹا کے لئے یہ کچھ صحیح معیار پر پورا نہیں اترتا ہے۔ مسئلہ کے مثالوں میں درجہ بندی اور رجعت کے مسائل شامل ہیں، الگورتھم کے مثالوں میں منطقی رجعت اور ریورس نیورل نیٹ ورک شامل ہیں۔ غیر نگرانی سیکھنا: ان پٹ ڈیٹا کو نشان زد نہیں کیا جاتا ہے اور نہ ہی نتائج کا تعین کیا جاتا ہے۔ ماڈل ڈیٹا کی ساخت اور عددی اقدار پر انڈکشن کرتا ہے۔ مسائل کی مثالوں میں ایسوسی ایشن رول لرننگ اور گروپنگ کے مسائل شامل ہیں ، اور الگورتھم کی مثالوں میں اپریوری الگورتھم اور K-mean algorithm شامل ہیں۔ نیم نگرانی سیکھنا: ان پٹ ڈیٹا نشان زد اور غیر نشان زد ڈیٹا کا ایک مرکب ہے ، کچھ پیش گوئی کے مسائل ہیں لیکن ماڈل کو ڈیٹا کی ساخت اور ساخت کو بھی سیکھنا پڑتا ہے۔ مسئلہ مثالوں میں درجہ بندی اور رجعت کے مسائل شامل ہیں ، اور الگورتھم کی مثال بنیادی طور پر غیر نگرانی سیکھنے کے الگورتھم کی توسیع ہے۔ بڑھا ہوا سیکھنا: ان پٹ ڈیٹا ماڈل کو متحرک کرتا ہے اور ماڈل کو رد عمل کا اظہار کرتا ہے۔ رائے نہ صرف سیکھنے کے عمل کی نگرانی سے حاصل ہوتی ہے بلکہ ماحول میں انعامات یا سزا سے بھی حاصل ہوتی ہے۔ مسئلہ روبوٹ کنٹرول کی مثال ہے ، اور الگورتھم کی مثالیں Q-learning اور Temporal difference learning شامل ہیں۔

    جب اعداد و شمار کے انضمام کے ساتھ کاروباری فیصلے کرنے کا اندازہ لگایا جاتا ہے تو ، زیادہ تر نگرانی اور غیر نگرانی سیکھنے کے طریقوں کا استعمال کیا جاتا ہے۔ اگلا گرم موضوع نیم نگرانی سیکھنے کا ہے ، جیسے تصویری درجہ بندی کے مسائل ، جن میں ایک بڑا ڈیٹا بیس ہوتا ہے ، لیکن صرف ایک چھوٹا سا حصہ تصاویر کو نشان زد کرتا ہے۔ بڑھا ہوا سیکھنا زیادہ تر روبوٹک کنٹرول اور دیگر کنٹرول سسٹم کی ترقی میں استعمال ہوتا ہے۔

  • الگورتھم کی مماثلت

    الگورتھم بنیادی طور پر فنکشن یا شکل کے لحاظ سے درجہ بندی کرتے ہیں۔ مثال کے طور پر ، درخت پر مبنی الگورتھم ، نیورل نیٹ ورک الگورتھم۔ یہ درجہ بندی کا ایک مفید طریقہ ہے ، لیکن یہ کامل نہیں ہے۔ کیونکہ بہت سارے الگورتھم آسانی سے دو قسموں میں تقسیم کیے جاسکتے ہیں ، جیسے لرننگ ویکٹر کوانٹائزیشن جو نیورل نیٹ ورک کی قسم کے الگورتھم اور مثال پر مبنی طریقہ دونوں ہیں۔ جیسے کہ مشین لرننگ الگورتھم کے پاس خود ہی کوئی کامل ماڈل نہیں ہے ، اسی طرح الگورتھم کی درجہ بندی کا طریقہ بھی کامل نہیں ہے۔

    اس حصے میں میں نے درجہ بندی کرنے کے لئے جو الگورتھم درج کیے ہیں جو میں سمجھتا ہوں کہ سب سے زیادہ بدیہی ہیں۔ میں نے الگورتھم یا درجہ بندی کے طریقوں کی ایک فہرست نہیں بنائی ہے ، لیکن مجھے لگتا ہے کہ یہ قارئین کو ایک جامع سمجھنے میں مدد ملتی ہے۔ اگر آپ کو کچھ معلوم ہے تو میں نے درج نہیں کیا ہے ، تبصرے میں خوش آمدید۔ اب ہم شروع کرتے ہیں!

  • رجعت

    ریگریشن (رجرجریشن تجزیہ) متغیرات کے مابین تعلقات سے متعلق ہے۔ یہ شماریاتی طریقوں کا استعمال کرتا ہے ، جس میں متعدد الگورتھم کی مثالیں شامل ہیں:

    معمولی کم مربع لاجسٹک رجسٹریشن مرحلہ وار رجعت ملٹی ویریٹی ایڈیٹیو ریگریشن سپلینز (MARS) مقامی طور پر تخمینہ لگانے والی بکھرنے والی گراف کو ہموار کرنا (LOESS)

  • مثال پر مبنی طریقے

    مثال پر مبنی سیکھنا (انٹینس بیسڈ لرننگ) ایک فیصلہ سازی کے مسئلے کا اندازہ لگاتا ہے جس میں استعمال ہونے والے مثال یا مثالیں ماڈل کے لئے بہت اہم ہیں۔ یہ طریقہ موجودہ اعداد و شمار پر ایک ڈیٹا بیس بناتا ہے اور اس میں نئے اعداد و شمار شامل کرتا ہے ، پھر مماثلت کی پیمائش کے طریقہ کار کا استعمال کرتے ہوئے ڈیٹا بیس میں ایک بہترین میچ تلاش کرنے اور پیش گوئی کرنے کے لئے کرتا ہے۔ اس وجہ سے ، اس طریقہ کار کو فاتح بادشاہ کا طریقہ کار اور میموری پر مبنی طریقہ کار بھی کہا جاتا ہے۔ اس وقت توجہ مرکوز اسٹور کردہ اعداد و شمار کی نمائش کی شکل اور مماثلت کی پیمائش کے طریقوں پر ہے۔

    k-قریبی ہمسایہ (kNN) لرننگ ویکٹر کوانٹائزیشن (LVQ) خود منظم نقشہ (ایس او ایم)

  • باقاعدگی کے طریقے

    یہ دوسرے طریقوں کا ایک توسیع ہے (عام طور پر رجعت کا طریقہ) ، جس کا توسیع آسان ماڈل کے لئے زیادہ فائدہ مند ہے اور انضمام میں بہتر ہے۔ میں نے اسے یہاں اس کی مقبولیت اور طاقت کی وجہ سے درج کیا ہے۔

    ریج رجریشن کم سے کم مطلق سکڑنے اور انتخاب آپریٹر (LASSO) لچکدار جال

  • فیصلے کے درخت سے سیکھنا

    فیصلے کے درخت کے طریقوں نے اعداد و شمار میں حقیقی اقدار پر مبنی فیصلے کا ایک ماڈل تیار کیا ہے۔ فیصلے کے درخت انڈکشن اور رجعت کے مسائل کو حل کرنے کے لئے استعمال ہوتے ہیں۔

    درجہ بندی اور رجعت کا درخت (CART) Iterative Dichotomiser 3 (ID3) (دوبارہ ڈائیکوٹمائزر 3 (ID3)) C4.5 چی مربع خودکار تعامل کا پتہ لگانے (CHAID) فیصلے کا اسٹمپ بے ترتیب جنگل ملٹی ویریٹیٹ ایڈجسٹ ریگریشن سپلینز (MARS) گریڈینٹ بڑھانے والی مشینیں (GBM)

  • بیزین

    بیزین طریقہ (Bayesian method) ایک طریقہ ہے جس میں درجہ بندی اور رجعت کے مسائل کو حل کرنے کے لئے بیزین تھیوری کا استعمال کیا جاتا ہے۔

    نادان بیز اوسطاً ایک انحصار تخمینہ (AODE) بیزیئن عقائد نیٹ ورک (بی بی این)

  • کرنل کے طریقوں

    کرنل میتھڈ میں سب سے مشہور سپورٹ ویکٹر مشینیں ہیں۔ یہ طریقہ ان پٹ ڈیٹا کو اعلی طول و عرض پر نقشہ بناتا ہے اور کچھ درجہ بندی اور رجعت کے مسائل کو زیادہ آسانی سے ماڈلنگ کرتا ہے۔

    سپورٹ ویکٹر مشینیں (SVM) ریڈیل بیس فنکشن (RBF) لکیری تفریق تجزیہ (LDA)

  • کلسٹرنگ کے طریقے

    کلسٹرنگ (انگریزی: clustering) خود ہی مسائل اور طریقوں کی وضاحت کرتی ہے۔ کلسٹرنگ کے طریقوں کو عام طور پر ماڈلنگ کے طریقوں سے درجہ بندی کیا جاتا ہے۔ تمام کلسٹرنگ کے طریقوں میں ڈیٹا کو ایک متحد ڈیٹا ڈھانچے کے ساتھ منظم کیا جاتا ہے تاکہ ہر گروپ میں سب سے زیادہ مشترک ہو۔

    K-میڈینس توقعات کی زیادہ سے زیادہ (EM)

  • ایسوسی ایشن اصول سیکھنا

    ایسوسی ایشن رول لرننگ (انگریزی: Association rule learning) اعداد و شمار کے مابین قوانین کو نکالنے کا ایک طریقہ ہے جس کے ذریعے کثیر جہتی خلائی اعداد و شمار کے بڑے پیمانے پر مابین روابط کو دریافت کیا جاسکتا ہے ، اور یہ اہم روابط تنظیموں کے ذریعہ استعمال کیے جاسکتے ہیں۔

    پہلے سے الگورتھم ایکلٹ الگورتھم

  • مصنوعی اعصابی نیٹ ورک

    مصنوعی اعصابی نیٹ ورکس (آئی این این) حیاتیاتی اعصابی نیٹ ورکس کی ساخت اور افعال سے متاثر ہیں۔ یہ پیٹرن میچنگ کی قسم میں شامل ہے ، جو اکثر رجعت اور درجہ بندی کے مسائل کے لئے استعمال ہوتا ہے ، لیکن اس میں سیکڑوں الگورتھم اور متغیرات موجود ہیں۔ ان میں سے کچھ کلاسیکی مقبول الگورتھم ہیں (میں نے گہری سیکھنے کو الگ الگ بیان کیا ہے):

    پرسیپٹرون پیچھے پھیلاؤ ہاپ فیلڈ نیٹ ورک خود منظم نقشہ (ایس او ایم) لرننگ ویکٹر کوانٹائزیشن (LVQ)

  • گہری تعلیم

    ڈیپ لرننگ (Deep Learning) ایک جدید اپ ڈیٹ ہے جو مصنوعی اعصابی نیٹ ورک کی طرف اشارہ کرتی ہے۔ روایتی اعصابی نیٹ ورک کے مقابلے میں اس میں زیادہ پیچیدہ نیٹ ورک کی تشکیل ہوتی ہے ، اور بہت سے طریقے نیم نگرانی سیکھنے سے متعلق ہوتے ہیں ، اس طرح کے سیکھنے کے مسائل میں بہت زیادہ ڈیٹا ہوتا ہے ، لیکن اس میں سے بہت کم اعداد و شمار کو نشان زد کیا جاتا ہے۔

    محدود بولٹزمین مشین (آر بی ایم) گہرے عقائد کے نیٹ ورکس (ڈی بی این) کنولولیشنل نیٹ ورک اسٹیکڈ آٹو کوڈر

  • طول و عرض میں کمی

    طول و عرض کی کمی ، جیسے گروپ بندی کا طریقہ ، اعداد و شمار میں یکساں ڈھانچے کا حصول اور استعمال کرتا ہے ، لیکن یہ اعداد و شمار کو کم معلومات کے ساتھ ضم اور بیان کرتا ہے۔ یہ اعداد و شمار کو دیکھنے یا اعداد و شمار کو آسان بنانے کے لئے مفید ہے۔

    اہم اجزاء کا تجزیہ (پی سی اے) جزوی کم سے کم مربع رجسٹریشن (PLS) سمون میپنگ کثیر جہتی اسکیلنگ (ایم ڈی ایس) پروجیکشن کا پیچھا

  • مجموعی طریقے

    Ensemble methods (مجموعی طریقے) بہت سے چھوٹے ماڈلز پر مشتمل ہوتے ہیں جو آزادانہ طور پر تربیت یافتہ ہوتے ہیں، آزادانہ نتائج اخذ کرتے ہیں اور آخر میں ایک مجموعی پیش گوئی بناتے ہیں۔ بہت سی تحقیق اس بات پر مرکوز ہوتی ہے کہ کون سے ماڈل استعمال کیے جاتے ہیں اور ان ماڈلز کو کیسے جوڑا جاتا ہے۔ یہ ایک بہت ہی طاقتور اور مقبول تکنیک ہے۔

    فروغ دینا بوٹسٹریپڈ مجموعہ (بیگنگ) ایڈابوسٹ اسٹیکڈ جنرلائزیشن (ملنگ) گریڈیئنٹ بڑھانے والی مشینیں (GBM) بے ترتیب جنگل

img

یہ ایک مثال ہے جو مجموعی طریقوں کے ساتھ فٹ بیٹھتی ہے (ویکیپیڈیا سے) ، ہر فائر فاکس گرے میں ظاہر ہوتا ہے ، اور حتمی پیش گوئی جو آخر میں تیار کی جاتی ہے سرخ ہے۔

  • دیگر وسائل

    یہ مشین لرننگ الگورتھم کا دورہ آپ کو یہ سمجھنے کے لئے تیار ہے کہ کون سے الگورتھم موجود ہیں اور کن آلات کے ساتھ منسلک ہیں۔

    ذیل میں کچھ دیگر وسائل ہیں ، براہ کرم زیادہ محسوس نہ کریں ، زیادہ سے زیادہ الگورتھم جاننے سے آپ کو زیادہ فائدہ ہوگا ، لیکن کچھ الگورتھم کے بارے میں گہری تفہیم بھی مفید ہوگی۔

    • List of Machine Learning Algorithms: یہ ویکیپیڈیا پر ایک وسائل ہے، اگرچہ یہ مکمل ہے، لیکن مجھے لگتا ہے کہ درجہ بندی اچھی نہیں ہے۔
    • مشین لرننگ الگورتھم زمرہ: یہ بھی ویکیپیڈیا پر ایک ذریعہ ہے، جو اوپر سے تھوڑا سا بہتر ہے، اور حروف تہجی کی ترتیب میں ہے۔
    • CRAN ٹاسک ویو: مشین لرننگ اور شماریاتی سیکھنے: مشین لرننگ الگورتھم کے لئے R زبان کا توسیع پیک، دیکھیں کہ آپ کو دوسروں کو کیا استعمال کر رہے ہیں کے بارے میں بہتر سمجھنے کے لئے.
    • Top 10 Algorithms in Data Mining: یہ ایک شائع شدہ مضمون ہے، جو اب ایک کتاب ہے، جس میں سب سے زیادہ مقبول ڈیٹا مائننگ الگورتھم شامل ہیں۔ ایک اور بنیادی الگورتھم کی فہرست، جو یہاں بہت کم درج کی گئی ہے، آپ کو گہری سیکھنے میں مدد ملے گی.

بیلر کالم / بائی فائی پائیتھون ڈویلپر کی طرف سے نقل کیا گیا


مزید