کیا ایس وی ایم ویکٹر مشین کے ساتھ (ٹرانزیکشن) گوریلوں پر بھاگنا ممکن ہے؟

مصنف:چھوٹا سا خواب, تخلیق: 2016-11-01 11:51:41, تازہ کاری: 2016-11-01 11:53:28

کیا ایس وی ایم ویکٹر مشین کے ساتھ (ٹرانزیکشن) گوریلوں پر بھاگنا ممکن ہے؟

خواتین و حضرات، اپنی شرط لگائیں۔ آج ہم ایک اورنگو کو شکست دینے کے لئے اپنی پوری کوشش کریں گے، جسے مالیاتی دنیا میں سب سے زیادہ خوفناک حریفوں میں سے ایک سمجھا جاتا ہے۔ ہم اپنی کرنسیوں کی تجارت کی اقسام کی اگلے دن کی آمدنی کی پیش گوئی کرنے کی کوشش کر رہے ہیں۔ میں آپ کو یقین دلاتا ہوں: یہاں تک کہ اگر آپ کسی بھی قسم کی شرط کو شکست دینا چاہتے ہیں اور 50 فیصد جیتنے کا امکان رکھتے ہیں تو یہ ایک مشکل کام ہے۔ ہم ایک تیار شدہ مشین سیکھنے کے الگورتھم کا استعمال کریں گے جو ویکٹر کی درجہ بندی کی حمایت کرتا ہے۔ ویکٹر کی ایس وی ایم مشین رجعت اور درجہ بندی کے کاموں کو حل کرنے کا ایک ناقابل یقین حد تک طاقتور طریقہ ہے۔

  • SVM ویکٹر مشین کی حمایت کرتا ہے

ایس وی ایم ویکٹر مشین اس خیال پر مبنی ہے کہ ہم سپر فلیٹ کے مقابلے میں پی ڈی خصوصیت کی جگہ کی درجہ بندی کرسکتے ہیں۔ ایس وی ایم ویکٹر مشین کے الگورتھم میں ایک سپر فلیٹ اور ایک تشخیصی مارجن استعمال کیا جاتا ہے تاکہ درجہ بندی کے فیصلے کی سرحدیں بنائی جاسکیں ، جیسا کہ ذیل میں دکھایا گیا ہے۔

img

سب سے آسان صورت میں ، لکیری درجہ بندی ممکن ہے۔ الگورتھم نے فیصلہ کن حدود کا انتخاب کیا ، جس سے کلاسوں کے مابین فاصلے کو زیادہ سے زیادہ کیا جاسکتا ہے۔

آپ کو زیادہ تر مالیاتی وقت کی سیریز میں آسان ، لکیری الگ الگ سیٹوں کا سامنا کرنا پڑتا ہے۔ ایس وی ایم ویکٹر نے اس مسئلے کو حل کرنے کے لئے ایک طریقہ کار کو نافذ کیا ہے جسے نرم مارجن طریقہ کہا جاتا ہے۔

اس معاملے میں ، کچھ غلط درجہ بندی کی صورت حال کی اجازت ہے ، لیکن وہ خود ہی کام انجام دیتے ہیں تاکہ C (جس کی لاگت یا بجٹ میں غلطی کی اجازت دی جاسکتی ہے) کے ساتھ تناسب کے عوامل اور غلطیوں کو حد تک کم سے کم کرنے کے لئے فاصلے کو کم کریں۔

img

بنیادی طور پر ، مشینیں درجہ بندی کے مابین وقفے کو زیادہ سے زیادہ کرنے کی کوشش کرتی ہیں ، جبکہ اس کے C کے ذریعہ وزن میں آنے والی سزاؤں کو کم کرنے کی کوشش کرتی ہیں۔

ایس وی ایم ٹارگٹر کی ایک عمدہ خصوصیت یہ ہے کہ اس کی درجہ بندی کے فیصلے کی حدود کا مقام اور سائز صرف کچھ اعداد و شمار کے ذریعہ طے ہوتا ہے ، یعنی فیصلہ کی حدود سے قریب ترین اعداد و شمار۔ اس الگورتھم کی خصوصیات اس بات کا امکان بناتی ہیں کہ یہ دور دراز کے وقفے کے غیر معمولی اقدار کی مداخلت کا مقابلہ کرے۔ مثال کے طور پر ، اوپر دیئے گئے گراف میں ، سب سے اوپر دائیں نیلے رنگ کے نقطے ، فیصلہ کی حدود پر بہت کم اثر ڈالتے ہیں۔

کیا یہ بہت پیچیدہ ہے؟ ٹھیک ہے ، مجھے لگتا ہے کہ مزہ ابھی شروع ہوا ہے۔

ذیل کی صورت حال پر غور کریں (سرخ نقطے کو دوسرے رنگوں سے الگ کریں):

img

انسانوں کے لئے، یہ درجہ بندی کرنا بہت آسان ہے (ایک اوولف لائن بھی) ؛ لیکن مشینوں کے لئے یہ مختلف ہے۔ ظاہر ہے، یہ سیدھی لائن نہیں بن سکتی (ایک سیدھی لائن سرخ نقطوں کو الگ نہیں کر سکتی) ؛ یہاں ہم کرنل ٹرک کو آزما سکتے ہیں۔

نیوکلیئر تکنیک ایک بہت ہی ذہین ریاضیاتی تکنیک ہے جو ہمیں اعلی جہتی خلا میں لکیری درجہ بندی کے مسائل کو حل کرنے کی اجازت دیتی ہے۔ اب ہم دیکھتے ہیں کہ یہ کیسے ہوتا ہے۔

ہم دو جہتی خصوصیت کی جگہ کو تین جہتی میں تبدیل کریں گے اور درجہ بندی مکمل کرنے کے بعد دو جہتی میں واپس آئیں گے۔

ذیل میں ایک تصویر ہے جس میں اس کا نقشہ بنایا گیا ہے اور اس کی درجہ بندی کی گئی ہے:

img

عام طور پر، اگر آپ کے پاس d ان پٹ ہیں تو، آپ d ان پٹ کی جگہ سے p خصوصیت کی جگہ پر ایک نقشہ استعمال کرسکتے ہیں۔ مندرجہ بالا کم سے کم کرنے والے الگورتھم کو چلانے سے حل پیدا ہوگا، اور پھر آپ کی اصل ان پٹ کی جگہ کے p طول و عرض کے سپر فلیٹ کو واپس کریں گے۔

مذکورہ بالا ریاضیاتی حل کا ایک اہم شرط یہ ہے کہ اس پر منحصر ہے کہ خصوصیت کی جگہ میں اچھے نقطہ نمونے کے سیٹ کیسے تیار کیے جائیں۔

آپ کو صرف ان نکاتی نمونہ سیٹوں کی ضرورت ہوتی ہے تاکہ سرحد کی اصلاح کی جاسکے ، نقشہ سازی کو واضح کرنے کی ضرورت نہیں ہے ، اور ان پٹ اسپیس میں اعلی جہتی خصوصیت کی جگہ پر پوائنٹس کو نیوکلیئر فنکشن ((اور تھوڑا سا مرسر تھیوری کی مدد سے) محفوظ طریقے سے شمار کیا جاسکتا ہے۔

مثال کے طور پر، آپ کو ایک بہت بڑی خصوصیت کی جگہ میں آپ کی درجہ بندی کے مسئلے کو حل کرنا چاہتے ہیں، فرض کریں کہ یہ 100،000 طول و عرض ہے. کیا آپ کو تصور کر سکتے ہیں کہ آپ کو کتنی کمپیوٹنگ کی صلاحیت کی ضرورت ہے؟ میں اس کے بارے میں بہت شکوک و شبہات کا اظہار کرتا ہوں کہ آپ اسے انجام دے سکتے ہیں. ٹھیک ہے، جوہری اب آپ کو ان نقطہ نمونے کو شمار کرنے کی اجازت دیتا ہے، لہذا یہ کنارے آپ کی کم کثافت کے آرام دہ اور پرسکون ان پٹ کی جگہ سے آتا ہے.

  • چیلنج اور گوریلا

اب ہم جیف کی پیش گوئی کرنے کی صلاحیت کو شکست دینے کے چیلنج کا سامنا کرنے کے لئے تیار ہیں۔ آئیے جیف کو دیکھتے ہیں:

جیف کرنسی منڈیوں کے ماہر ہیں اور وہ 50 فیصد تک کی پیش گوئی کی درستگی حاصل کرنے کے لئے بے ترتیب شرط لگاتے ہیں، جس کا مطلب یہ ہے کہ اگلے تجارتی دن کی واپسی کی پیش گوئی کرنے کا اشارہ ہے۔

ہم مختلف بنیادی ٹائم سیریز استعمال کریں گے ، بشمول فوری قیمت ٹائم سیریز ، ہر ٹائم سیریز میں 10 لاگس تک کے فوائد ، مجموعی طور پر 55 خصوصیات۔

ایس وی ایم ویکٹر مشین جو ہم تیار کرنے کے لئے تیار ہیں وہ 3 ڈگری کے نچلے حصے کا استعمال کرتی ہے۔ آپ تصور کر سکتے ہیں کہ ایک مناسب نچلے حصے کا انتخاب کرنا ایک اور بہت ہی مشکل کام ہے ، تاکہ سی اور جی پیرامیٹرز کی توثیق کی جاسکے۔ 3 گنا کراس چیک ممکنہ پیرامیٹرز کے مجموعوں کے گرڈ پر چلتا ہے ، اور بہترین سیٹ کا انتخاب کیا جائے گا۔

اس کے نتیجے میں کچھ بھی حوصلہ افزا نہیں ہے:

img

ہم دیکھ سکتے ہیں کہ لکیری رجعت یا ایس وی ایم ویکٹر دونوں جیف کو شکست دے سکتے ہیں۔ اگرچہ نتائج خوش آئند نہیں ہیں ، لیکن ہم ڈیٹا سے کچھ معلومات بھی نکال سکتے ہیں ، جو اچھی خبر ہے ، کیونکہ اعداد و شمار کے شعبے میں ، مالی وقت کی ترتیب میں روزانہ کی آمدنی سب سے زیادہ مفید نہیں ہے۔

کراس تصدیق کے بعد ، ڈیٹا سیٹ کو تربیت دی جائے گی اور اس کی جانچ کی جائے گی ، ہم نے تربیت یافتہ ایس وی ایم کی پیشن گوئی کی صلاحیت کو ریکارڈ کیا ہے ، تاکہ مستحکم کارکردگی کا مظاہرہ کیا جاسکے ، ہم نے ہر کرنسی کو 1000 بار تصادفی تقسیم کیا ہے۔

img

اس طرح ، کچھ معاملات میں ، ایس وی ایم سادہ لکیری واپسی سے بہتر ہے ، لیکن کارکردگی میں بھی تھوڑا سا فرق ہے۔ مثال کے طور پر ، امریکی ڈالر اور ین میں ، ہم اوسطا 54 فیصد اشارے کی پیش گوئی کرسکتے ہیں۔ یہ کافی اچھا نتیجہ ہے ، لیکن آئیے اس پر مزید گہری نظر ڈالیں!

ٹیڈ جیف کا کزن ہے، جو یقیناً ایک گورانڈا بھی ہے، لیکن یہ جیف سے زیادہ ہوشیار ہے۔ ٹیڈ نے اپنی آنکھوں کو ٹریننگ نمونہ سیٹ پر لگایا ہے، نہ کہ کسی بے ترتیب شرط پر۔ اس نے ہمیشہ ٹریننگ سیٹ کے سب سے عام آؤٹ پٹ سے بریک سگنل دیئے ہیں۔ اب آئیے ہم ذہین ٹیڈ کو بطور معیار استعمال کریں:

img

جیسا کہ ہم نے دیکھا ہے کہ زیادہ تر ایس وی ایمز کی کارکردگی صرف اس حقیقت سے منسلک ہے کہ مشین سیکھنے کے مطابق درجہ بندی کا امکان پہلے سے کہیں زیادہ نہیں ہے۔ حقیقت یہ ہے کہ لکیری رجحانات خصوصیت کی جگہ سے کوئی معلومات حاصل نہیں کرسکتے ہیں ، لیکن اس کا مطلب یہ ہے کہ اس کی واپسی میں انٹرسیپٹ معنی خیز ہے ، اور اس حقیقت سے متعلق ہے کہ انٹرسیپٹ اور ایک مخصوص درجہ بندی کو زیادہ بہتر کارکردگی کا مظاہرہ کرتے ہیں۔

ایک چھوٹی سی اچھی خبر یہ ہے کہ ایس وی ایم ویکٹر ڈیٹا سے کچھ اضافی غیر لکیری معلومات حاصل کرنے میں کامیاب ہے، جس سے ہم اپنی پیشن گوئی کی درستگی کو 2 فیصد تک لے سکتے ہیں۔

بدقسمتی سے، ہم ابھی تک نہیں جانتے کہ یہ کیا معلومات ہوسکتی ہے، جیسے ایس وی ایم ویکٹر مشینوں کے اپنے اہم نقصانات ہیں، جو ہم واضح طور پر وضاحت نہیں کرسکتے ہیں.

مصنف: پی۔ لوپیز، کوانٹ ڈیر پر شائع ہوا ویکیپیڈیا پبلک نمبر سے نقل کیا گیاimg


مزید

سنہری9966زور آور