avatar of 发明者量化-小小梦 发明者量化-小小梦
پر توجہ دیں نجی پیغام
4
پر توجہ دیں
1271
پیروکار

مقداری ضرور پڑھیں: ٹک ڈیٹا بالکل کیا ہے؟ قابل اعتماد تجارتی ڈیٹا تلاش کرنا اتنا مشکل کیوں ہے؟

میں تخلیق کیا: 2016-11-02 19:33:56, تازہ کاری: 2016-11-02 19:48:20
comments   0
hits   12005
  • ### ٹِک ڈیٹا کیا ہے؟

ٹِک ڈیٹا خود کوئی خفیہ نہیں ہے ، یہ ہے کہ ایکسچینج آپ کو ہر اسٹاک (یا فیوچر آپشنز) کی ایکٹو آرڈر بک (یعنی آپ کا حکم تبادلے میں موجود ہے ، لیکن اس کی ترکیب نہیں کی گئی ہے) میں خرید و فروخت کے بل بھیجتا ہے۔

**举例说明:**
  某天的市场一开始的时候苹果股票的order book(委托挂单)清空(这里不进行auction period的探讨):
  1. 接着来了第一个卖家:1000@100 :
  这时候交易所会发给你一个message,告诉你是苹果股票有人想以100块钱卖出1000股,
  那么这个order就先挂在了order book上,成为卖一。

  卖:1000@100


  2. 第二个卖家来了,他想卖得更高: 1000@101:
  这时候交易所会发给你另一个message,告诉你是苹果股票有人卖的价格比你差,于是排序在更上面,卖二。

  卖:1000@101

  1000@100


  3. 刚才的第一个卖家后悔了,cancel了他的order:1000@100撤消了,那么交易所会有message告诉你,
  现在只剩一个1000@101(卖一)。但是你可能需要自己编程处理这种remove掉一个tick的情况。

  卖:1000@101


  4. 终于有买家来了... 500@90 , 这个价格是不会成交的,因为买家低于现在的最佳卖价:101,
  那么order book里面会继续存着这个order,同时会发送一个tick告诉市场上的其他人,有买单了:

  卖:1000@101

  买:500@90


  5. 继续,接着有一位买家以101块钱买入1000股,等于要把目前的bestoffer 1000@101给match - 撮合了,那么你是不会收到这个最新的bid: 101@1000 的,
  因为它会进入matching engine的瞬间跟对面的best offer 撮合了,tick table的一个规则: bid offer 永远不会cross,
  否则要么是数据商的bug,要么是交易所的bug。现在,你只会收到一个告诉你delete the best offer的message,那么tick table长这样:

  买:500@90

  ٹِک کے اعداد و شمار اتنے آسان ہیں کہ مارکیٹ میں یہ عمل دہرایا جائے گا۔ لیکن اس سے بھی زیادہ پریشان کن بات یہ ہے کہ:

  • 1۔ اکثر اوقات ٹِک کا ڈیٹا یو ڈی پی کے ذریعہ بھیجا جاتا ہے ، سوچیں کہ اگر اسٹاک مارکیٹ میں تجارت بہت متحرک ہے تو ، اعداد و شمار کی مقدار بہت زیادہ ہوگی ، یو ڈی پی میں پیکیج کی کمی ہوگی ، اسے کیسے سنبھالنا ہے۔ کبھی کبھی بہت پاگل ٹِک اپ ڈیٹ ہوا ہے لیکن اس کو مائکرو سیکنڈ کی تازہ کاری کیچ میں رکھنا پڑتا ہے ، شاید ترتیب دینا پڑتا ہے (ایکسچینج پروٹوکول دیکھیں) ، اور فرنٹ ٹرم کو بھیجنا۔

  • 2۔ ریئل ٹائم ٹِک ڈیٹا کو تیز تر کیسے کیا جائے ، ورنہ ڈیٹا کی مقدار اتنی زیادہ ہے کہ ایک بار تاخیر ہونے پر ، آپ ریئل ٹائم ٹِک کی رفتار سے آگے نہیں بڑھ سکتے ، جب تک کہ آپ کا پروگرام بند نہ ہوجائے۔

  • 3۔ کچھ خاص حالات سے بچنے کے لئے کس طرح ایک مسئلے کا سبب بنتا ہے ، اگر ایک ٹِک درست نہیں ہے تو ، اس کے بعد کی ٹِک ٹیبل غلط ہے:)

** اسی طرح ، ٹک کو سمجھنے کے بارے میں بھی ایک مسئلہ ہے: مختلف مارکیٹوں میں ٹک مختلف ہے ، جیسا کہ اوپر بیان کیا گیا ہے ، ترقی یافتہ ممالک کے اسٹاک مارکیٹوں میں ، حقیقی وقت کی صورت حال میں آگے بڑھایا گیا ہے ((اگر کوئی نیا آرڈر ہے اور ٹک کی ترسیل کی سطح کے اندر ، مثال کے طور پر ٹوکیو ایکسچینج صرف 8 ٹک لیول بھیجتی ہے ، تو آپ کو پوری ٹک نہیں نظر آئے گی ، کیونکہ 100 سے زیادہ لیول ہوسکتے ہیں ، اگر بہت سے لوگ تجارت کرتے ہیں) گھریلو ٹائم ایکسچینج کتنے ملی سیکنڈ میں ایک سنیپ شاٹ (snapshot) ، اوپر کے ٹائم ایکسچینج میں گہری ٹائم ایکسچینج 3 سیکنڈ ہے، اور پھر آپ کو بھیج دیا گیا ہے، ہو سکتا ہے کہ گھریلو ٹریڈنگ سسٹم بہت پرانی ہے، آئی ٹی کی ترقی کے ساتھ نہیں رہ سکتا.

(یہ مضمون کوانٹم ٹریڈر ویکسن آئی ڈی: کوانٹمٹی کے ذریعہ مرتب کیا گیا ہے۔)

  • ### سوال نمبر 2: اسکینپ ڈیٹا اور ایکسچینج ڈیٹا کے بارے میں کچھ تفصیلات

   بیرون ملک کے ہائی فریکوئینسی ٹِک ڈیٹا کے لیے، آرڈر ڈیٹا کا ایک مکمل عمل موجود ہے، لہذا آپ ان آرڈر ڈیٹا کو استعمال کر کے اسنیپ شاٹ ڈیٹا کو بحال کر سکتے ہیں۔

ملک کے دو بڑے اسٹاک اور چار بڑے فیوچر نظریاتی طور پر سنیپ شاٹ ڈیٹا ہیں۔ مثال کے طور پر ، عام اعداد و شمار کے شعبوں میں شامل ہیں: شروع ہونے والی قیمت سب سے زیادہ قیمت سب سے کم قیمت تازہ ترین قیمت لین دین کی رقم لین دین کی رقم یہاں سب سے زیادہ (کم) قیمت ہے سب سے زیادہ (کم) قیمت کھلنے سے لے کر اب تک ہونے والی تجارت کی ، فرض کریں کہ آپ کے پاس ہر تجارت کی تفصیلات ہیں۔ دراصل ، یہ اعداد و شمار میکس (کم) کے ذریعہ اخذ کیا جاسکتا ہے ، لہذا بیرون ملک مقیم ٹک اعداد و شمار میں عام طور پر یہ فیلڈ نہیں ہوتا ہے۔ تین قسم کے لائیو ٹائم ٹرانزیکشنز ہیں ، ایکسپریس ٹرانزیکشنز اور ایک سے ایک ٹرانزیکشنز اور ٹرانسمیشنز۔ اسنیپ شاٹ ہر 3 سیکنڈ میں ایک بار ((گہری ایکسچینج ، اوپر ایکسچینج 5 سیکنڈ) مارکیٹ کی تصویر ہے ، اور پھر موجودہ قیمت ، اعلی ، کم ، تجارت کی مقدار ، تجارت کی رقم وغیرہ کی تصاویر بھیج دی جاتی ہیں۔ چونکہ یہ تصویر ہر 3 سیکنڈ میں ہوتی ہے ، لہذا اس 3 سیکنڈ کے دوران مارکیٹ میں کیا ہوتا ہے ، ہمیں نہیں معلوم۔ ہر دن کی مسلسل بولی کا وقت صبح کے ہر دو گھنٹے میں 4 گھنٹے ہوتا ہے۔ لہذا اسنیپ شاٹ کی تعداد 144003 ہے جو تقریبا 3800 بار ہے۔ صرف اسٹاک کی بات کریں تو ، روزانہ پورے مارکیٹ میں اسنیپ شاٹ ڈیٹا کی مقدار 2 جی سے زیادہ ہے۔ ایک ٹرانزیکشن ایک حقیقی ایٹم فی ٹرانزیکشن ہے۔ تاہم ، یہ اعداد و شمار بھی 3 سیکنڈ کی ایک کھیپ ہے ، اور یہ حقیقی وقت نہیں ہے۔ مثال کے طور پر ، ایک ٹرانزیکشن جو 1.5 سیکنڈ میں ہوتا ہے ، اسے 3 سیکنڈ میں بھیجا جاتا ہے۔ ٹرانسمیشن کے اعداد و شمار میں، سطح 2 میں صرف سب سے اوپر 50 خریدنے اور فروخت کرنے کے لئے ہے، تمام نہیں. (یہ مضمون کوانٹم ٹریڈر ویکسن آئی ڈی: کوانٹمٹی کے ذریعہ مرتب کیا گیا ہے۔)

اعداد و شمار میں اختلافات کی چند عام وجوہات ہیں:

  • ڈیٹا ریکارڈ کرنے کا طریقہ مثال کے طور پر ، اسٹاک کی سطح 1 کے اعداد و شمار کو لے لو ، تبادلے نے ایک ڈی بی ایف فائل شائع کی ہے جس میں تمام سیکیورٹیز کی تازہ ترین حیثیت کے اعداد و شمار درج ہیں ، ڈی بی ایف فائل مستقل طور پر تازہ کاری ہوتی ہے۔ اس کے بعد ، ڈیٹا فراہم کرنے والے یا ڈیٹا ریکارڈ کرنے والے کو ہر وقت اس فائل کو پڑھنے اور ڈیٹا بیس میں ڈالنے کی ضرورت ہوتی ہے۔ لیکن چونکہ تبادلے کے اعداد و شمار کو اپ ڈیٹ کرنے کی فریکوئنسی ایک واحد قدر نہیں ہے ، لہذا اعداد و شمار کو نہ چھوڑنے کے ل the ، بہترین طریقہ یہ ہے کہ آپ اس سے زیادہ کثرت سے پڑھیں کہ وہ کتنی بار اپ ڈیٹ کرتا ہے۔ اس طرح کا مسئلہ پیدا ہوتا ہے ، کیونکہ آپ بہت کچھ پڑھتے ہیں۔ اگر آپ ہر بار ریکارڈ کرتے ہیں تو ایک ڈیٹا بہت بڑا ہوتا ہے ، ڈیٹا کو دہرائیں۔ لہذا ہم اکثر اس طرح کا استعمال کرتے ہیں جب یہ ڈیٹا تبدیل ہوتا ہے تو میں اسے ڈیٹا بیس میں ڈالتا ہوں۔ اس اصول کی وجہ سے، آپ کو غیر فعال تجارت کے اعداد و شمار کو فعال تجارت کے اعداد و شمار سے کم دیکھنا پڑتا ہے، طویل مدتی فیوچر اعداد و شمار حالیہ سے کم ہیں، اور وقت کے ساتھ مطابقت پذیر نہیں ہیں.

  • 2۔ آپریشنل مسائل کوئی بھی اس بات کی ضمانت نہیں دے سکتا کہ نیٹ ورک بند نہیں ہوگا۔ اگر نیٹ ورک بند ، مشین کی خرابی ، پروگرام کی غلطی وغیرہ کی وجہ سے ، تبادلے کا ڈیٹا پلے آؤٹ ہوجائے گا۔ جیسا کہ پہلے بیان کیا گیا ہے ، اعداد و شمار کے طریقہ کار کے مطابق ، دراصل سطح 1 کے اعداد و شمار کے لئے T اور T + 1 وقت کا کوئی منطقی تعلق نہیں ہے ، فرض کریں کہ آپ کو اعداد و شمار سے پتہ چلنے کا امکان نہیں ہے ، لہذا بہت سارے نقائص دراصل ان وجوہات کی وجہ سے ہیں ، اور ان کی تلافی نہیں کی جاسکتی ہے!

  • 3۔ پروگرام کی وجہ سے ڈیٹا کی غلطی کچھ غیر معمولی غلطیاں ، جیسے کہ کچھ قسم کے اسٹاک کی قیمتوں میں غیر معمولی ، خالی وغیرہ کی وجہ سے ہوسکتا ہے کہ اعداد و شمار کو ریکارڈ کرنے کے عمل میں غلطی ہو۔ یہ کیوں ہوتا ہے؟ بہرحال ، اس کی بہت سی وجوہات ہیں ، ہم جانتے ہیں کہ یہ ہوسکتا ہے۔ اس کے علاوہ ، یہ تبادلے کے مسائل کی وجہ سے ہوتا ہے ، جیسے کہ تبادلے نے لیول 2 کے اعداد و شمار کی قیمتوں کو غلط طور پر بھیجا تھا۔ اس کے نتیجے میں ، 100٪ قابل اعتماد اعداد و شمار حاصل کرنا اصولی طور پر مشکل ہے ، اعداد و شمار کی جانچ اور صفائی ضروری ہے ، اور یہ ایک بورنگ چیز ہے ، اور قواعد و ضوابط کا قیام بھی انفرادی تجربے پر منحصر ہے۔