KNN الگورتھم پر مبنی Bayesian classifier

مصنف:چھوٹا سا خواب, تخلیق: 2017-01-14 17:23:19, تازہ کاری:

KNN الگورتھم پر مبنی Bayesian classifier

درجہ بندی کرنے والے فیصلے کرنے کے لئے ڈیزائن کردہ درجہ بندی کرنے والوں کی نظریاتی بنیادیں:

موازنہ P (ωi) x؛ جہاںωi کلاس i ہے اور x ایک ڈیٹا ہے جس کا مشاہدہ کیا گیا ہے اور درجہ بندی کی جارہی ہے ، P (ωi) x بیان کرتا ہے کہ اس ڈیٹا کے خصوصیت ویکٹر کے بارے میں معلوم ہونے کی صورت میں ، اس کا فیصلہ کرنے کا کیا امکان ہے کہ یہ کلاس i میں ہے ، جو پسماندگی کا امکان بھی بن جاتا ہے۔ بائیز فارمولے کے مطابق ، اسے اس طرح بیان کیا جاسکتا ہے:

img

ان میں سے ، P ((x) ωi) کو مشابہت کا امکان یا طبقاتی حالت کا امکان کہا جاتا ہے؛ P ((ωi) کو پیشگی امکان کہا جاتا ہے کیونکہ یہ تجربے سے متعلق نہیں ہے اور اس سے پہلے ہی معلوم ہوسکتا ہے۔

درجہ بندی کرتے وقت ، x کو دیئے جانے پر ، اس زمرے کا انتخاب کیا جاسکتا ہے جس میں P (ωi) کی سب سے زیادہ امکان ہے۔ جب P (ωi) ہر زمرے کے ساتھ موازنہ کیا جاتا ہے تو ،ωi متغیر ہے اور x مستحکم ہے۔ لہذا ، P (ωi) کو خارج کر دیا جاسکتا ہے اور اس پر غور نہیں کیا جاسکتا ہے۔

لہذا آخر میں یہ P (x) x (ωi) * P (ωi) کا حساب کتاب کرنے کا مسئلہ بن جاتا ہے۔ پیشگی امکان P ((ωi) اچھا ہے ، اگر اعدادوشمار کی تربیت ہر درجہ بندی کے تحت ظاہر ہونے والے اعداد و شمار کے تناسب کو جمع کرے۔

اس طرح کے امکانات P (x ωi) کا حساب لگانے کے لئے یہ بہت مشکل ہے کیونکہ یہ x ٹیسٹ سیٹ کا ڈیٹا ہے اور اسے براہ راست ٹریننگ سیٹ کے مطابق نہیں نکالا جاسکتا ہے۔ پھر ہمیں ٹریننگ سیٹ کے اعداد و شمار کی تقسیم کے اصولوں کا پتہ لگانے کی ضرورت ہوگی تاکہ ہم P (x ωi) حاصل کرسکیں۔

ذیل میں k قریبی ہمسایہ الگورتھم کے بارے میں بتایا گیا ہے۔

ہم ٹریننگ سیٹ کے اعداد و شمار x1، x2، xn (جن میں سے ہر ایک اعداد و شمار m طول و عرض ہے) کے مطابق ان اعداد و شمار کی تقسیم کو زمرہωi کے تحت فٹ کرنا چاہتے ہیں۔ x کو m طول و عرض کی جگہ میں کسی بھی نقطہ کے طور پر مقرر کریں، P (xωi) کو کیسے حساب کریں؟

ہم جانتے ہیں کہ جب اعداد و شمار کافی بڑے ہوتے ہیں تو تناسب کے قریب امکانات استعمال کیے جاسکتے ہیں۔ اس اصول کا استعمال کرتے ہوئے ، نقطہ x کے آس پاس کے قریب ترین نمونہ کے نقطہ کی تلاش کریں ، جس میں قسم i کا کوئی ki ہے۔ اس قسم کے نمونہ کے نقطہ کو گھیرنے والے سب سے چھوٹے سپر گول کی مقدار V کا حساب لگائیں۔ یا پھر نمونہ کے تمام اعداد و شمار میں سے کسی بھی قسم کے فرد کی تعداد کی تلاش کریں Ni:

img

آپ دیکھ سکتے ہیں کہ ہم نے جو حساب لگایا ہے وہ اصل میں x پوائنٹ پر کلاس کی حالت کی احتمال کثافت ہے۔

P (ωi) کیا ہے؟ مندرجہ بالا طریقہ کار کے مطابق، P ((ωi) = Ni/N ⋅ جہاں N نمونہ کی کل تعداد ہے۔ اس کے علاوہ ، P ((x) = k/ ((N * V) ، جہاں k اس سپر گول کو گھیرنے والے تمام نمونہ پوائنٹس کی تعداد ہے۔ N نمونہ کی کل تعداد ہے۔ تو P ((ωi x) حساب لگایا جا سکتا ہے: فارمولے میں لے لو، یہ آسان ہے:

P(ωi|x)=ki/k

مزید وضاحت کرنے کے لئے، ایک V سائز کے سپر اسکرپٹ میں، k نمونوں کو گھیر لیا جاتا ہے، جن میں سے i کلاس میں شامل ہیں؛ اس طرح، جس قسم کے نمونوں کو گھیر لیا جاتا ہے وہ سب سے زیادہ ہے، ہم اس بات کا تعین کرتے ہیں کہ یہاں x کس قسم کا ہونا چاہئے؛ یہ ایک درجہ بندی ہے جو k قریبی ہمسایہ الگورتھم کے ساتھ ڈیزائن کیا گیا ہے۔


مزید