کوانٹیٹائزڈ پڑھنا ضروری ہے: ٹک ڈیٹا کیا ہے؟ کیوں قابل اعتماد ٹرانزیکشن ڈیٹا تلاش کرنا مشکل ہے؟

مصنف:چھوٹا سا خواب, تخلیق: 2016-11-02 19:33:56, تازہ کاری: 2016-11-02 19:48:20

  • ایک، ٹک ڈیٹا کیا ہے؟

ٹِک ڈیٹا خود میں کوئی راز نہیں ہے، یہ تبادلے آپ کو ہر ایک اسٹاک (یا فیوچر آپشنز) کی فعال آرڈر بک (یعنی آپ کا آرڈر اب بھی تبادلے میں موجود ہے لیکن اس کا تجزیہ نہیں کیا گیا ہے) میں خرید و فروخت کے احکامات بھیجتا ہے۔

**举例说明:**
  某天的市场一开始的时候苹果股票的order book(委托挂单)清空(这里不进行auction period的探讨):
  1. 接着来了第一个卖家:1000@100 :
  这时候交易所会发给你一个message,告诉你是苹果股票有人想以100块钱卖出1000股,
  那么这个order就先挂在了order book上,成为卖一。

  卖:1000@100


  2. 第二个卖家来了,他想卖得更高: 1000@101:
  这时候交易所会发给你另一个message,告诉你是苹果股票有人卖的价格比你差,于是排序在更上面,卖二。

  卖:1000@101

  1000@100


  3. 刚才的第一个卖家后悔了,cancel了他的order:1000@100撤消了,那么交易所会有message告诉你,
  现在只剩一个1000@101(卖一)。但是你可能需要自己编程处理这种remove掉一个tick的情况。

  卖:1000@101


  4. 终于有买家来了... 500@90 , 这个价格是不会成交的,因为买家低于现在的最佳卖价:101,
  那么order book里面会继续存着这个order,同时会发送一个tick告诉市场上的其他人,有买单了:

  卖:1000@101

  买:500@90


  5. 继续,接着有一位买家以101块钱买入1000股,等于要把目前的bestoffer 1000@101给match - 撮合了,那么你是不会收到这个最新的bid: 101@1000 的,
  因为它会进入matching engine的瞬间跟对面的best offer 撮合了,tick table的一个规则: bid offer 永远不会cross,
  否则要么是数据商的bug,要么是交易所的bug。现在,你只会收到一个告诉你delete the best offer的message,那么tick table长这样:

  买:500@90

ٹِک ڈیٹا اتنا آسان ہے کہ مارکیٹ اس عمل کو دہرائے گی۔لیکن اس سے بھی زیادہ پریشان کن بات یہ ہے کہ:

- 1. زیادہ تر وقت ٹک کے اعداد و شمار UDP میں بھیجے جاتے ہیں ، تصور کریں کہ اگر اسٹاک ایکسچینج میں تجارت بہت فعال ہے تو ، اعداد و شمار کی مقدار بہت زیادہ ہوگی ، UDP میں گمشدہ پیکیج کا سامنا کرنا پڑے گا ، اس کا علاج کیسے کیا جائے گا۔ کبھی بھی پاگل ٹک اپ ڈیٹ کا سامنا کرنا پڑا لیکن مائکرو سیکنڈ کی تازہ کاری کیشے کو برقرار رکھنا ، شاید ترتیب دینا (ایکسچینج پروٹوکول دیکھیں) ، اور فرنٹ اینڈ کو بھیجنا۔

- 2۔ ریئل ٹائم ٹِک ڈیٹا کو تیزی سے کیسے پروسیس کیا جائے، ورنہ ڈیٹا کا حجم اتنا بڑا ہو جائے گا کہ ایک بار تاخیر ہونے کے بعد آپ ریئل ٹائم ٹِک کی رفتار سے کبھی نہیں چل سکیں گے جب تک کہ آپ کا پروگرام بند نہ ہو جائے۔

- 3۔ کچھ خاص حالات کی وجہ سے بگ سے بچنے کے لئے کس طرح، ایک بار جب ایک ٹک درست نہیں ہوتا ہے، تو اس کے بعد کی ٹک ٹیبل غلط ہے:)

** اسی طرح ٹک کے بارے میں سمجھنے کا مسئلہ بھی ہے: مختلف مارکیٹوں میں ٹک کے مختلف مقامات ہیں ، جیسا کہ اوپر بیان کیا گیا ہے ، ترقی یافتہ ممالک میں اسٹاک مارکیٹوں کو حقیقی وقت میں آگے بڑھایا جاتا ہے۔ ((ایک نیا آرڈر ہے اور ٹک کے بھیجنے کی سطح کے اندر ، جیسے کہ ٹوکیو ایکسچینج صرف 8 ٹک لیول بھیجتا ہے ، لہذا آپ پورے ٹک کو نہیں دیکھ سکتے ہیں ، کیونکہ اگر بہت سارے لوگ تجارت کرتے ہیں تو 100 سے زیادہ سطحیں ہوسکتی ہیں) ۔ گھریلو ٹائم ٹائم کتنے ملی سیکنڈ ہیں؟ ایک سنیپ شاٹ (Snapshot) ، ٹائم ٹائم ٹائم 3 سیکنڈ ہے، اور پھر آپ کو بھیج دیا جاتا ہے، شاید گھریلو ٹرانزیکشن سسٹم بہت پرانا ہے، آئی ٹی کی ترقی کے ساتھ نہیں رہ سکتا.

(یہ مضمون کوانٹم ٹریڈر وائی فائی آئی ڈی: کوانٹسیٹی کے ذریعہ مرتب کیا گیا ہے۔)

  • دو: اسکرپٹ ڈیٹا اور ایکسچینج ڈیٹا کی تفصیلات کیا ہیں؟

غیر ملکی ہائی فریکوئنسی ٹِک ڈیٹا کے لئے ، آرڈر کے اعداد و شمار کا مکمل عمل موجود ہے ، لہذا آپ اس آرڈر کے اعداد و شمار کو استعمال کرکے اسکرپٹ ڈیٹا کو بحال کرسکتے ہیں۔

ملک میں دو بڑے اسٹاک اور چار بڑے فیوچر نظریاتی طور پر فوری اعداد و شمار ہیں۔ مثال کے طور پر ، عام اعداد و شمار کے شعبوں میں شامل ہیں: کیا آپ جانتے ہیں؟ کھولنے کی قیمت سب سے زیادہ قیمت سب سے کم قیمت تازہ ترین قیمت تجارت کی مقدار تجارت کی مقدار کیا آپ جانتے ہیں؟ یہاں سب سے کم قیمت سب سے کم قیمت ہے جو تجارت شروع ہونے سے لے کر اب تک ہوئی ہے۔ فرض کریں کہ آپ کے پاس ہر ٹرانزیکشن کے بارے میں تفصیلی تفصیلات ہیں ، لیکن حقیقت میں یہ اعداد و شمار زیادہ سے زیادہ منٹ کے ساتھ اندازہ لگایا جاسکتا ہے ، لہذا غیر ملکی ٹِک ڈیٹا میں عام طور پر یہ فیلڈ موجود نہیں ہے۔ کیا آپ جانتے ہیں؟ ایکسچینج اور ڈینس کے ذریعہ پیش کردہ حقیقی وقت کی تجارت تین اقسام میں ہے ، فوری طور پر اور ایک ایک کرکے تبادلہ اور تفویض۔ کیا آپ جانتے ہیں؟ فوٹو گرافی ہر 3 سیکنڈ میں ایک بار مارکیٹ کی تصویر بناتی ہے ، اور اس کے بعد موجودہ قیمت ، سب سے زیادہ ، سب سے کم ، ٹرانزیکشن حجم ، ٹرانزیکشن کی رقم وغیرہ کی تصاویر بھیجتی ہے۔ چونکہ فوٹو گرافی ہر 3 سیکنڈ میں ہوتی ہے ، لہذا ہمیں نہیں معلوم کہ اس 3 سیکنڈ کے دوران مارکیٹ میں کیا ہوتا ہے۔ ہر دن کی مسلسل بولی کا وقت دو بجے اور دوپہر میں 4 گھنٹے ہوتا ہے۔ لہذا اسکرپٹ کی تعداد 14400/3 ہے ، شاید 3800 بار ہے۔ صرف اسٹاک کے معاملے میں ، ہر دن کی پوری مارکیٹ میں فوٹو گرافی کا ڈیٹا 2 جی سے زیادہ ہے۔ کیا آپ جانتے ہیں؟ ٹرانزیکشن فی پیسے حقیقی ایٹم فی ٹرانزیکشن ہے۔ تاہم یہ اعداد و شمار بھی 3 سیکنڈ کے بیچ بھیجے جاتے ہیں ، نہ کہ حقیقی وقت میں۔ مثال کے طور پر ، ایک ٹرانزیکشن جو 1.5 سیکنڈ میں ہوا ، 3 سیکنڈ تک نہیں بھیجا گیا۔ کیا آپ جانتے ہیں؟ لیول 2 میں صرف ایک خریدار اور ایک فروخت کنندہ کے لئے سب سے اوپر 50، لیکن تمام فہرستوں کے لئے نہیں ہے. (یہ مضمون کوانٹم ٹریڈر ویکسین آئی ڈی: کوانٹسیٹی کے ذریعہ مرتب کیا گیا ہے۔)

**典型的有几类原因导致数据的差异**
- **1. 数据记录方式**

مثال کے طور پر اسٹاک کے لیول 1 کے اعداد و شمار کو لے لیں، جہاں ایک ایکسچینج ایک ڈی بی ایف فائل شائع کرتا ہے، جس میں تمام سیکیورٹیز کی تازہ ترین حالت کا ڈیٹا ریکارڈ کیا جاتا ہے، اور ڈی بی ایف فائل خود بخود تازہ ہوتی رہتی ہے۔ پھر ڈیٹا فراہم کرنے والے یا ڈیٹا ریکارڈ کرنے والے کو صرف اس فائل کو ہر وقت پڑھنے کی ضرورت ہوتی ہے، اور پھر تمام ڈیٹا کو ڈیٹا بیس میں ڈال دیا جاتا ہے، لیکن چونکہ ایکسچینج ڈیٹا کی تازہ کاری کی تعدد ایک واحد قدر نہیں ہے، لہذا ڈیٹا کو یاد رکھنے کا بہترین طریقہ یہ ہے کہ آپ اس کی تازہ کاری کی تعدد سے زیادہ کثرت سے پڑھیں۔ یہ مسئلہ پیدا ہوتا ہے کیونکہ آپ بہت زیادہ پڑھتے ہیں اگر ہر بار ڈیٹا ریکارڈ کیا جاتا ہے تو بہت زیادہ ڈیٹا آتا ہے، اور پھر بہت زیادہ بار بار ہوتا ہے۔ لہذا بہت سے لوگ اس طریقہ کو استعمال کرتے ہیں جب ڈیٹا تبدیل ہوتا ہے تو میں ڈیٹا بیس میں ڈالتا ہوں۔ اس طرح کے ایک اصول کی وجہ سے، آپ کو کچھ غیر فعال تجارت شدہ سیکیورٹیز کے اعداد و شمار کو فعال تجارت شدہ سیکیورٹیز کے مقابلے میں کم ملتا ہے، طویل مدتی مستقبل کے اعداد و شمار کو حالیہ سے کم ملتا ہے، ٹائم لائن کی عدم مطابقت وغیرہ.

- **2. 运维问题**

کوئی بھی ضمانت نہیں دے سکتا کہ نیٹ ورک کاٹ نہیں جائے گا۔ اگر نیٹ ورک کاٹ ، مشین کی خرابی ، پروگرام کی خرابی وغیرہ کی وجہ سے ، تبادلے کے اعداد و شمار کو نظر انداز کردیا جائے گا۔ مندرجہ بالا اعداد و شمار کے طریقہ کار کے مطابق ، سطح 1 کے اعداد و شمار T اور T + 1 لمحات کے لئے حقیقت میں کوئی منطقی تعلق نہیں ہے ، فرض کریں کہ آپ کو خود اعداد و شمار سے تلاش کرنا ناممکن ہے ، لہذا بہت ساری کمیاں دراصل ان وجوہات کی وجہ سے ہیں ، اور اس کی تلافی نہیں کی جاسکتی ہے۔

- **3. 程序导致的数据错误**

کچھ غیر معمولی غلطیاں ، جیسے کہ کچھ قسم کے اسٹاک کی قیمتوں میں غیر معمولی ، خالی وغیرہ ، اعداد و شمار کو ریکارڈ کرنے کے طریقہ کار میں غلطی کی وجہ سے ہوسکتی ہیں۔ کیوں؟ اس کی بہت سی وجوہات ہیں ، اور ہم جانتے ہیں کہ یہ ہوسکتا ہے۔ ایک چھوٹا سا حصہ تبادلے کے مسائل کی وجہ سے ہے ، جیسے کہ تبادلے نے لیول 2 کے اعداد و شمار کی افتتاحی قیمت کو غلط کردیا تھا۔ لہذا اصول میں 100٪ قابل اعتماد اعداد و شمار حاصل کرنا مشکل ہے ، اعداد و شمار کی جانچ پڑتال اور صفائی ضروری ہے ، اور یہ بھی ایک بورنگ چیز ہے ، اور قواعد کی تشکیل بھی ذاتی تجربے پر منحصر ہے۔


مزید