خواتین و حضرات، اپنی شرطیں لگائیں۔ آج، ہم سب سے بڑی کوشش کریں گے کہ ایک بندر کو شکست دی جائے، جسے مالیاتی دنیا میں سب سے زیادہ خوفناک حریفوں میں سے ایک سمجھا جاتا ہے۔ یہاں ہم اس بات کی پیش گوئی کرنے کی کوشش کر رہے ہیں کہ کس قسم کی کرنسیوں کی تجارت کی جائے گی۔ میں آپ کو یقین دلاتا ہوں کہ یہاں تک کہ ایک بے ترتیب بٹ کو شکست دینے اور 50 فیصد جیتنے کے امکانات کے ساتھ ایک چیتے کو شکست دینا بھی ایک مشکل کام ہے۔ ہم ایک مشین سیکھنے کے الگورتھم کا استعمال کریں گے جو ویکٹر کی درجہ بندی کی حمایت کرتا ہے۔ ایس وی ایم ویکٹر مشین رجعت اور درجہ بندی کے کاموں کو حل کرنے کا ایک ناقابل یقین حد تک طاقتور طریقہ ہے۔
ایس وی ایم ویکٹر مشین اس خیال پر مبنی ہے کہ ہم پی پی خصوصیت کی جگہ کے لئے ایک سپرپلین کا استعمال کرتے ہوئے درجہ بندی کرسکتے ہیں۔ ایس وی ایم ویکٹر مشین الگورتھم درجہ بندی کے فیصلے کی سرحد کو بنانے کے لئے ایک سپرپلین اور ایک شناخت مارجن کا استعمال کرتا ہے ، جیسا کہ ذیل میں دکھایا گیا ہے۔

سادہ ترین صورت میں ، لکیری درجہ بندی ممکن ہے۔ الگورتھم نے فیصلہ کن سرحد کا انتخاب کیا ، جس سے کلاسوں کے مابین فاصلہ زیادہ سے زیادہ ہوسکتا ہے۔
زیادہ تر مالیاتی ٹائم سیریز میں آپ کو سادہ ، لکیری طور پر الگ الگ سیٹ کا سامنا نہیں کرنا پڑتا ہے ، لیکن اکثر غیر الگ الگ ہوتا ہے۔ ایس وی ایم ویکٹر مشین نے ایک ایسا طریقہ لاگو کرکے اس مسئلے کو حل کیا جو نرم مارجن طریقہ ہے۔
اس معاملے میں، کچھ غلط درجہ بندی کی اجازت دی جاتی ہے، لیکن وہ اپنے آپ کو فنکشن کو انجام دیتے ہیں، تاکہ C ((قیمت یا بجٹ کی غلطی کی اجازت دی جاسکتی ہے) کے ساتھ مثبت تناسب میں فاکس اور غلطی کی حد تک فاصلے کو کم سے کم کرنے کے لئے کم سے کم کرنے کے لئے کم سے کم کریں.

بنیادی طور پر ، مشینیں درجہ بندی کے مابین زیادہ سے زیادہ وقفے کو زیادہ سے زیادہ کریں گی ، اور اس کے ساتھ ساتھ اس کی سزا کو کم سے کم کریں گی جس میں سی کی طرف سے وزن بڑھایا گیا ہے۔
ایس وی ایم درجہ بندی کرنے والے کی ایک عمدہ خصوصیت یہ ہے کہ درجہ بندی کے فیصلے کی سرحد کا مقام اور سائز صرف جزوی اعداد و شمار کے ذریعہ طے کیا جاتا ہے ، یعنی فیصلہ کی سرحد سے قریب ترین اعداد و شمار۔ اس الگورتھم کی خصوصیات اس کو دور دراز کے وقفے سے غیر معمولی اقدار کی مداخلت سے لڑنے کے قابل بناتی ہیں۔ مثال کے طور پر ، اوپر کے نقشے میں ، دائیں طرف کا نیلا نقطہ ، فیصلہ کی سرحد پر بہت کم اثر ڈالتا ہے۔
کیا یہ بہت زیادہ پیچیدہ ہے؟ ٹھیک ہے، میں سمجھتا ہوں کہ مزہ ابھی شروع ہو رہا ہے۔
مندرجہ ذیل صورتوں پر غور کریں (سرخ اور دیگر رنگوں کے نقطہ کو الگ کریں):

انسانوں کے لئے ، اس کی درجہ بندی بہت آسان ہے (ایک بیضوی لائن ہو سکتا ہے) ۔ لیکن مشینوں کے لئے ایک ہی نہیں ہے۔ یہ واضح ہے کہ یہ سیدھی لائن نہیں بن سکتی (ایک سیدھی لائن سرخ نقطوں کو الگ نہیں کرسکتی) ۔ یہاں ہم کرینل ٹرک (کیرنل ٹرک) کی کوشش کرسکتے ہیں۔
انڈرکارنیل تکنیک ایک بہت ہی ذہین ریاضی کی تکنیک ہے جو ہمیں (تکثیر جہتی) اعلی جہتی خلا میں لکیری درجہ بندی کے مسائل کو حل کرنے کی اجازت دیتی ہے۔ آئیے دیکھتے ہیں کہ یہ کیسے کیا جاتا ہے۔
ہم دو جہتی خصوصیت کی جگہ کو تین جہتی میں تبدیل کریں گے اور درجہ بندی کے بعد واپس دو جہتی میں جائیں گے۔
مندرجہ ذیل تصویر میں درجہ بندی کی گئی ہے اور اس کا نقشہ تیار کیا گیا ہے۔

عام طور پر ، اگر آپ کے پاس d ان پٹ ہیں تو ، آپ d جہتی ان پٹ کی جگہ سے p جہتی خصوصیت کی جگہ تک نقشہ سازی کا استعمال کرسکتے ہیں۔ مندرجہ بالا کم سے کم کرنے والے الگورتھم کے ذریعہ تیار کردہ حل کو چلائیں ، اور پھر اپنے اصل ان پٹ کی جگہ کو p جہتی سپر فلیٹ میں نقشہ بنائیں۔
مندرجہ بالا ریاضی کے حل کی ایک اہم شرط یہ ہے کہ اس پر منحصر ہے کہ کس طرح نمونے کے نمونے کے نمونے میں نمونے کے نمونے میں نمونے کے نمونے کو پیدا کیا جائے.
آپ کو صرف ان پوائنٹس کے نمونے کے سیٹ کی ضرورت ہوتی ہے تاکہ آپ سرحد کی اصلاح کرسکیں ، نقشہ کو واضح طور پر نقشہ سازی کی ضرورت نہیں ہے ، اور اعلی جہتی خصوصیت والے مقامات پر ان پٹ اسپیس کو بنیادی فنکشن ((اور تھوڑا سا مرسر تھیوریم کی مدد سے) کے ذریعہ محفوظ طریقے سے شمار کیا جاسکتا ہے۔
مثال کے طور پر، آپ کو ایک بہت بڑی خصوصیت کی جگہ میں آپ کی درجہ بندی کے مسئلے کو حل کرنا چاہتے ہیں، فرض کریں کہ یہ 100000 طول و عرض ہے. کیا آپ تصور کر سکتے ہیں کہ آپ کو کتنی کمپیوٹنگ کی صلاحیت کی ضرورت ہوگی؟ مجھے اس پر بہت شبہ ہے کہ آپ اسے مکمل کر سکیں گے. ٹھیک ہے، اب کورین آپ کو ان پوائنٹس کے نمونے کا حساب کرنے کی اجازت دیتا ہے، لہذا، یہ کنارے آپ کی کم کثرت سے آرام دہ اور پرسکون ان پٹ کی جگہ سے آتا ہے.
اب ہم جیف کی پیش گوئی کرنے کی صلاحیت کو شکست دینے کے چیلنج کا سامنا کرنے کے لئے تیار ہیں.
جیف کرنسی مارکیٹوں کے ماہر ہیں اور وہ بے ترتیب شرط لگانے کے ذریعے 50 فیصد کی پیش گوئی کی درستگی حاصل کر سکتے ہیں، جو اگلے ٹریڈنگ دن کی واپسی کی شرح کی پیش گوئی کرنے کا اشارہ ہے۔
ہم مختلف بنیادی ٹائم سیریز کا استعمال کریں گے، بشمول اسٹاک قیمت ٹائم سیریز، ہر ٹائم سیریز میں 10 لاگس تک کی آمدنی، مجموعی طور پر 55 خصوصیات کے ساتھ۔
ہم جس ایس وی ایم ویکٹر مشین کی تعمیر کرنے جارہے ہیں اس میں 3 ڈگری کا کور استعمال کیا گیا ہے۔ آپ سوچ سکتے ہیں کہ ایک مناسب کور کا انتخاب کرنا ایک اور بہت ہی مشکل کام ہے۔ C اور Γ پیرامیٹرز کی توثیق کرنے کے لئے ، تین گنا کراس کی توثیق ممکنہ پیرامیٹرز کے مجموعے کے گرڈ پر چلتی ہے ، اور بہترین گروپ کا انتخاب کیا جائے گا۔
نتائج اتنے حوصلہ افزا نہیں ہیں:

ہم دیکھ سکتے ہیں کہ جیف کو شکست دینے کے لئے لکیری رجعت یا ایس وی ایم ویکٹر دونوں ہی کام کرتے ہیں۔ اگرچہ نتائج پرامید نہیں ہیں ، لیکن ہم اعداد و شمار سے کچھ معلومات حاصل کرسکتے ہیں ، اور یہ اچھی خبر ہے ، کیونکہ اعداد و شمار کے مضامین میں ، مالی ٹائم سیریز کا روزانہ فائدہ سب سے زیادہ مفید نہیں ہے۔
کراس توثیق کے بعد ، ڈیٹا سیٹ کی تربیت اور جانچ کی جائے گی ، ہم تربیت یافتہ ایس وی ایم کی پیش گوئی کرنے کی صلاحیت کو ریکارڈ کرتے ہیں ، اور مستحکم کارکردگی کے ل we ، ہم ہر کرنسی کے لئے 1000 بار بے ترتیب تقسیم کو دہراتے ہیں۔

اس طرح ، کچھ معاملات میں ، ایس وی ایم سادہ لکیری رجعت سے بہتر ہے ، لیکن کارکردگی میں فرق بھی تھوڑا سا زیادہ ہے۔ مثال کے طور پر ، امریکی ڈالر کے مقابلے میں جاپانی ین کے لئے ، ہمارے اوسطا متوقع سگنل کل تعداد کا 54٪ ہیں۔ یہ ایک بہت اچھا نتیجہ ہے ، لیکن آئیے اس پر مزید گہری نظر ڈالیں!
ٹیڈ جیف کا کزن ہے اور وہ یقیناً ایک گوریلا بھی ہے، لیکن وہ جیف سے زیادہ ذہین ہے۔ ٹیڈ کی نظر تربیت یافتہ نمونے لینے والے سیٹ پر ہے، بے ترتیب شرط لگانے کی بجائے۔ اس کا بیٹنگ سگنل ہمیشہ تربیت یافتہ سیٹ کے سب سے عام نتائج سے دیا جاتا ہے۔ آئیے اب ہم ذہین ٹیڈ کو بطور بیس لائن استعمال کریں۔

جیسا کہ ہم دیکھ سکتے ہیں ، زیادہ تر ایس وی ایم کی کارکردگی صرف ایک حقیقت سے آتی ہے: مشین سیکھنا کہ درجہ بندی کا امکان نہیں ہے کہ وہ پیشگی ہو۔ حقیقت میں ، لکیری رجعت خصوصیت کی جگہ سے کوئی معلومات حاصل نہیں کرسکتی ہے ، لیکن انٹرسیپٹ ((انٹرسیپٹ)) رجعت میں معنی خیز ہے ، اور یہ حقیقت اس سے متعلق ہے کہ انٹرسیپٹ اور کسی خاص درجہ بندی میں بہتر کارکردگی کا مظاہرہ کرتے ہیں۔
ایک چھوٹی سی اچھی خبر یہ ہے کہ ایس وی ایم ویکٹر کے اعداد و شمار سے کچھ اضافی غیر لکیری معلومات حاصل کرنے کی صلاحیت ہے، جس سے ہمیں 2 فیصد کی پیش گوئی کی درستگی کا مشورہ ملتا ہے۔
بدقسمتی سے ، ہمیں ابھی تک یہ معلوم نہیں ہے کہ یہ کس قسم کی معلومات ہوسکتی ہے ، جیسے کہ ایس وی ایم ویکٹر مشین کے اپنے اہم نقصانات ہیں ، جس کی ہم وضاحت نہیں کرسکتے ہیں۔
مصنف: پی لوپیز، quantdare میں شائع
ویکیپیڈیا کے عوامی شمارے سے نقل کیا گیا
