4
ध्यान केंद्रित करना
1271
समर्थक

मात्रात्मक अवश्य पढ़ें: टिक डेटा वास्तव में क्या है? विश्वसनीय व्यापारिक डेटा प्राप्त करना इतना कठिन क्यों है?

में बनाया: 2016-11-02 19:33:56, को अपडेट: 2016-11-02 19:48:20
comments   0
hits   12005
  • ### एक, टिक डेटा क्या है?

Tick Data अपने आप में कोई रहस्य नहीं है, यह है कि एक्सचेंज आपको प्रत्येक स्टॉक (या फ्यूचर्स ऑप्शन) की सक्रिय ऑर्डर बुक (यानी आपके आदेश एक्सचेंज में मौजूद हैं, लेकिन संश्लेषित नहीं किए गए हैं) में खरीदे गए या बेचे गए चालानों की स्थिति भेजता है।

**举例说明:**
  某天的市场一开始的时候苹果股票的order book(委托挂单)清空(这里不进行auction period的探讨):
  1. 接着来了第一个卖家:1000@100 :
  这时候交易所会发给你一个message,告诉你是苹果股票有人想以100块钱卖出1000股,
  那么这个order就先挂在了order book上,成为卖一。

  卖:1000@100


  2. 第二个卖家来了,他想卖得更高: 1000@101:
  这时候交易所会发给你另一个message,告诉你是苹果股票有人卖的价格比你差,于是排序在更上面,卖二。

  卖:1000@101

  1000@100


  3. 刚才的第一个卖家后悔了,cancel了他的order:1000@100撤消了,那么交易所会有message告诉你,
  现在只剩一个1000@101(卖一)。但是你可能需要自己编程处理这种remove掉一个tick的情况。

  卖:1000@101


  4. 终于有买家来了... 500@90 , 这个价格是不会成交的,因为买家低于现在的最佳卖价:101,
  那么order book里面会继续存着这个order,同时会发送一个tick告诉市场上的其他人,有买单了:

  卖:1000@101

  买:500@90


  5. 继续,接着有一位买家以101块钱买入1000股,等于要把目前的bestoffer 1000@101给match - 撮合了,那么你是不会收到这个最新的bid: 101@1000 的,
  因为它会进入matching engine的瞬间跟对面的best offer 撮合了,tick table的一个规则: bid offer 永远不会cross,
  否则要么是数据商的bug,要么是交易所的bug。现在,你只会收到一个告诉你delete the best offer的message,那么tick table长这样:

  买:500@90

  Tick डेटा इतना सरल है कि बाजार इस प्रक्रिया को दोहराएगा। लेकिन सबसे ज्यादा परेशानी यह है कि:

    1. कई बार टिक का डेटा यूडीपी में भेजा जाता है, कल्पना करें कि यदि शेयर बाजार में व्यापार बहुत सक्रिय है, तो डेटा की मात्रा बहुत बड़ी है, यूडीपी में पैकेज खोने की स्थिति होगी, कैसे निपटें। एक पागल टिक अपडेट का सामना किया गया है, लेकिन इसे माइक्रो सेकंड के अपडेट कैश में रखा जाना चाहिए, इसे सॉर्ट किया जा सकता है (एक्सचेंज प्रोटोकॉल देखें), और इसे सामने के लिए भेजा गया है।
    1. कैसे और अधिक तेजी से वास्तविक समय टिक डेटा को संसाधित करने के लिए, अन्यथा डेटा इतना बड़ा है कि एक बार देरी हो जाती है, तो आप अपने कार्यक्रम को लटका देने तक रिंग के वास्तविक समय टिक की गति को नहीं पकड़ सकते हैं।
    1. कैसे कुछ विशेष परिस्थितियों से बचें जो एक बग का कारण बनते हैं, एक बार जब एक टिक सही नहीं है, तो उसके बाद की टिक टेबल पूरी तरह से गलत है:)

** इसी तरह, टिक के बारे में समझने की समस्या हैः विभिन्न बाजारों में टिक अलग-अलग हैं, ऊपर विकसित देशों के शेयर बाजारों के बारे में कहा गया है, वास्तविक समय में स्थिति को आगे बढ़ाएं ((नए आदेश हैं और टिक के स्तर के भीतर, उदाहरण के लिए टोक्यो एक्सचेंज केवल 8 टिक स्तर भेजता है, तो आप पूरे पूरे टिक को नहीं देख सकते हैं, क्योंकि 100 से अधिक स्तर हो सकते हैं, अगर बहुत से लोग व्यापार करते हैं) । घरेलू समय विनिमय कितने मिलीसेकंड एक स्नैपशॉट है, ऊपर विनिमय गहरा विनिमय 3 सेकंड है, और फिर आप के लिए भेजा, शायद घरेलू व्यापार प्रणाली बहुत पुराना है, आईटी के विकास के साथ नहीं रख सकता है. तो यह टिक डेटा वास्तविक समय टिक नहीं है, आप केवल जानते हैं कि टिक है! पहले 100 मिलीसेकंड और अब टिक में परिवर्तन इस तरह के टिक है, शायद बीच में हजारों टिक किया गया है.

(इस लेख को क्वांटिक ट्रेडर्स द्वारा संकलित किया गया है।)

  • ### दूसरा: क्या है स्नैपशॉट डेटा और एक्सचेंज डेटा के बारे में कुछ विवरण

   विदेशों में उच्च-आवृत्ति टिक डेटा के लिए, पूर्ण आदेश डेटा प्रक्रिया है, इसलिए आप इन आदेश डेटा का उपयोग करके स्नैपशॉट डेटा को पुनर्स्थापित कर सकते हैं।

देश के दो सबसे बड़े स्टॉक और चार सबसे बड़े वायदा सैद्धांतिक रूप से एक झलक डेटा हैं। उदाहरण के लिए, एक विशिष्ट डेटा फ़ील्ड में शामिल हैंः प्रक्षेपण मूल्य उच्चतम मूल्य सबसे कम मूल्य नवीनतम मूल्य लेनदेन की मात्रा लेनदेन की मात्रा यहाँ सबसे कम कीमत सबसे कम कीमत है जो कि शुरू से लेकर अब तक हुई है, मान लीजिए कि आपके पास प्रत्येक लेनदेन का विस्तृत विवरण है, वास्तव में यह डेटा max (min) से अनुमानित किया जा सकता है, इसलिए विदेशों में टिक डेटा में आमतौर पर यह क्षेत्र नहीं होता है। एक्सचेंज में तीन प्रकार के वास्तविक समय के लेनदेन होते हैं, जैसे कि शॉर्टकट्स और एक-एक लेनदेन और कमीशन। एक स्नैपशॉट हर 3 सेकंड में बाजार की एक तस्वीर है (गहरे एक्सचेंज, शीर्ष एक्सचेंज 5 सेकंड है), और फिर वर्तमान मूल्य, उच्चतम, निम्नतम, लेनदेन की मात्रा, लेनदेन की राशि और अन्य स्थिति की तस्वीरें भेजता है। चूंकि तस्वीर 3 सेकंड में एक बार है, इसलिए इस 3 सेकंड के दौरान बाजार में क्या हुआ, हम नहीं जानते। हर दिन लगातार बोली लगाने का समय सुबह के हर दो घंटे में 4 घंटे है। इसलिए स्नैपशॉट की संख्या 144003 लगभग 3800 बार है। अकेले स्टॉक में, पूरे बाजार में स्नैपशॉट डेटा की मात्रा 2 जी से अधिक है। एक-एक लेन-देन एक वास्तविक परमाणु-प्रति लेन-देन है। लेकिन यह डेटा भी 3 सेकंड के लिए एक बैच है, और वास्तविक समय नहीं है। उदाहरण के लिए, एक लेन-देन 1.5 सेकंड में होता है, 3 सेकंड में भेजा जाता है। यह सब सूचीबद्ध नहीं है, लेकिन केवल शीर्ष 50 में से कुछ को सूचीबद्ध किया गया है। (इस लेख को क्वांटिक ट्रेडर्स द्वारा संकलित किया गया है।)

डेटा में भिन्नता के कारणों की कुछ श्रेणियां हैं

  • 1. डेटा रिकॉर्डिंग विधि उदाहरण के लिए स्टॉक के लेवल 1 के डेटा को लें, एक्सचेंज एक डीबीएफ फाइल जारी करता है, जिसमें सभी प्रतिभूतियों की नवीनतम स्थिति डेटा दर्ज होता है, डीबीएफ फाइल लगातार अपडेट होती है। तो डेटा प्रदाता या डेटा रिकॉर्ड करने वाले व्यक्ति को हर समय इस फाइल को पढ़ने और डेटाबेस में सभी डेटा डालने की आवश्यकता होती है, लेकिन चूंकि एक्सचेंज डेटा को अपडेट करने की आवृत्ति एक एकल मूल्य नहीं है, इसलिए डेटा को याद नहीं करने के लिए, सबसे अच्छा तरीका यह है कि आप पढ़ते हैं कि आप कितनी बार अपडेट करते हैं। ऐसी समस्या आती है, क्योंकि आप बहुत कुछ पढ़ते हैं। यदि हर बार रिकॉर्ड किया गया डेटा एक बड़ा डेटा है, तो डेटा को दोहराने की ज़रूरत नहीं है। इसलिए हम अक्सर कई तरीकों का उपयोग करते हैं जब यह डेटा बदल जाता है तो मैं इसे डेटाबेस में डालता हूं। इस नियम के कारण, आप देख सकते हैं कि कुछ निष्क्रिय प्रतिभूतियों में सक्रिय प्रतिभूतियों की तुलना में कम डेटा होता है, लंबी अवधि के वायदा डेटा की तुलना में कम होता है, और समय तालिका असंगत होती है।

  • 2. परिचालन समस्याएं कोई भी गारंटी नहीं दे सकता कि नेटवर्क बंद नहीं होगा। यदि नेटवर्क, मशीन त्रुटि, प्रोग्रामिंग त्रुटि आदि कारणों से, एक्सचेंज का डेटा प्ले नहीं किया जाएगा। डेटा तंत्र के अनुसार, जैसा कि ऊपर बताया गया है, वास्तव में स्तर 1 डेटा के लिए टी और टी + 1 समय कोई तार्किक संबंध नहीं है, यदि आप डेटा से ही नहीं पा सकते हैं, तो बहुत सारी कमी वास्तव में इन कारणों के कारण होती है, और इसे ठीक नहीं किया जा सकता है! जैसे कि पहले के टेलीविजन वीडियो टेप बहुत अस्पष्ट हैं, लेकिन अतीत अतीत में है जिसे आप ठीक नहीं कर सकते।

  • 3. प्रोग्राम के कारण डेटा त्रुटि कुछ असामान्य त्रुटियां, जैसे कि कुछ प्रकार के शेयरों की कीमतों में असामान्यताएं, रिक्तियां आदि, डेटा रिकॉर्ड करने की प्रक्रिया में त्रुटि के कारण हो सकती हैं। ऐसा क्यों होता है? इसके कई कारण हैं, हम जानते हैं कि ऐसा हो सकता है। कम भाग में यह एक्सचेंजों की समस्याओं के कारण होता है, जैसे कि एक्सचेंजों ने लेवल 2 डेटा की शुरुआती कीमतों को गलत तरीके से भेजा है। इसलिए, सिद्धांत रूप में, 100% विश्वसनीय डेटा होना मुश्किल है, डेटा की जांच और सफाई आवश्यक है, और यह एक थकाऊ काम है, और नियमों का निर्माण व्यक्तिगत अनुभव पर भी निर्भर करता है।