मशीन लर्निंग पर आधारित ऑर्डर बुक उच्च आवृत्ति व्यापार रणनीति

लेखक:छोटे सपने, बनाया गयाः 2016-11-16 16:52:38, अद्यतन किया गयाः 2016-11-16 16:55:18

मशीन लर्निंग पर आधारित ऑर्डर बुक उच्च आवृत्ति व्यापार रणनीति

  • पहली बात

    प्रतिभूति बाजार के व्यापार तंत्र को बोली-संचालित बाजार और आदेश-संचालित बाजार के रूप में विभाजित किया जा सकता है, जो कि बाजार के माध्यम से तरलता प्रदान करने के लिए बाज़ारिया पर निर्भर करता है, जो कि सीमा शुल्क के माध्यम से तरलता प्रदान करता है, जो कि निवेशकों द्वारा खरीद और बिक्री के लिए बोली लगाने के माध्यम से होता है। चीन का प्रतिभूति बाजार एक आदेश-संचालित बाजार है, जिसमें शेयर बाजार और वायदा बाजार शामिल हैं।

    imgचित्र 1 ऑर्डर ड्राइव बाजार का ग्राफ

    • (i) सीमित मूल्य सूची के लिए आदेश पुस्तिका परिचय

      ऑर्डर बुक का अध्ययन बाजार की सूक्ष्म संरचना के अध्ययन की श्रेणी में आता है, बाजार की सूक्ष्म संरचना सिद्धांत सूक्ष्म अर्थशास्त्र में मूल्य सिद्धांत और निर्माता सिद्धांत के रूप में अपने विचारों का स्रोत है, जबकि इसके मूल प्रश्नों के विश्लेषण में वित्तीय परिसंपत्तियों के लेनदेन और उनके मूल्य निर्माण की प्रक्रिया और कारणों के लिए सामान्य संतुलन, स्थानीय संतुलन, सीमांत लाभ, सीमांत लागत, बाजार निरंतरता, स्टॉक सिद्धांत, गेम थ्योरी, सूचना अर्थशास्त्र और अन्य कई सिद्धांतों और तरीकों का उपयोग किया जाता है।

      विदेशी शोध के अनुसार, बाजार के सूक्ष्म संरचना के क्षेत्र में ओ हारा का प्रतिनिधित्व किया गया है, जिसमें अधिकांश सिद्धांत बाजार-प्रेरित बाजारों (यानी बोली-चालित बाजारों) पर आधारित हैं, जैसे कि स्टॉक मॉडल और सूचना मॉडल आदि। इस वर्ष, वास्तविक लेनदेन बाजारों में, ऑर्डर-ड्राइविंग धीरे-धीरे ऊपर आ गया है, लेकिन ऑर्डर-ड्राइविंग बाजारों के लिए विशेष रूप से कम अध्ययन किया गया है।

      घरेलू शेयर बाजार और फ्यूचर्स बाजार दोनों ऑर्डर ड्राइव बाजार हैं, नीचे दी गई छवि स्टॉक इंडेक्स फ्यूचर्स कॉन्ट्रैक्ट आईएफ 1312 के लेवल_1 इंडस्ट्री ऑर्डर बुक की स्क्रीनशॉट है। ऊपर से सीधे प्राप्त जानकारी बहुत अधिक नहीं है, बुनियादी जानकारी में एक खरीद मूल्य, एक बिक्री मूल्य, एक खरीद मात्रा और एक बिक्री मात्रा शामिल है। कुछ विदेशी अकादमिक लेखों में, ऑर्डर बुक के अनुरूप एक सूचना पुस्तिका भी है, जिसमें सबसे विस्तृत ऑर्डर फ़ोटोग्राफ डेटा शामिल है, जिसमें प्रत्येक ऑर्डर की मात्रा, डिलिवरी मूल्य, ऑर्डर प्रकार आदि शामिल हैं, क्योंकि घरेलू बाजार में सूचना पुस्तिका सार्वजनिक नहीं है, इसलिए हम केवल ऑर्डर बुक पर भरोसा कर सकते हैं।

      imgचित्रा 2 स्टॉक इंडेक्स फ्यूचर्स मुख्य अनुबंध स्तर -1 ऑर्डर बुक

    • (बी) ऑर्डर बुक उच्च आवृत्ति लेनदेन अनुसंधान प्रगति

      ऑर्डर बुक के गतिशील मॉडलिंग के दो मुख्य तरीके हैं, एक शास्त्रीय मापन अर्थशास्त्र और दूसरा मशीन सीखने का तरीका। मापन अर्थशास्त्र का तरीका एक शास्त्रीय मुख्यधारा का शोध है, जैसे कि मूल्य अंतर विश्लेषण के लिए एमआरआर विश्लेषण, ह्वांग और स्टॉल विश्लेषण, ऑर्डर अवधि के लिए एसीडी मॉडल और मूल्य पूर्वानुमान के लिए लॉजिस्टिक मॉडल।

      मशीनी शिक्षा के लिए वित्तीय क्षेत्र में शैक्षणिक अनुसंधान भी बहुत सक्रिय है, उदाहरण के लिए 2012 में फ्यूजForecasting trends of high_frequency KOSPI200 index data using learning classifiers फ्यूज एक आम शोध विचार है, जो तकनीकी विश्लेषण के सामान्य संकेतकों (MA, EMA, RSI आदि) का उपयोग करके बाजार की भविष्यवाणी करने के लिए मशीन सीखने के वर्गीकरण विधियों को पेश करता है। लेकिन यह अभ्यास ऑर्डर बही गतिशीलता की जानकारी को खोदने के लिए अपर्याप्त है, अर्थात, ऑर्डर बही गतिशीलता की जानकारी का उपयोग करके उच्च उतार-चढ़ाव के लिए व्यापार करने के लिए अध्ययन देश और विदेश में अपेक्षाकृत कम है, यह एक गहराई से अध्ययन के लायक क्षेत्र है।

  • 2. ऑर्डर बुक में उच्च आवृत्ति लेनदेन में मशीन सीखने का उपयोग

    • (i) सिस्टम आर्किटेक्चर

      नीचे दिए गए चित्र में एक विशिष्ट मशीन सीखने की ट्रेडिंग रणनीति के लिए एक सिस्टम आर्किटेक्चर है, जिसमें ऑर्डर बुक डेटा, विशेषता खोज, मॉडल निर्माण और सत्यापन और ट्रेडिंग अवसर के कुछ प्रमुख मॉड्यूल शामिल हैं। यह ध्यान देने योग्य है कि ट्रेडिंग प्रक्रिया बाजार की घटनाओं द्वारा शुरू की जाती है, जिसमें टिक बाजार का आगमन एक है।

      imgचित्र 3 मशीन सीखने पर आधारित ऑर्डर बुक मॉडलिंग के लिए सिस्टम आर्किटेक्चर

    • (२) वेक्टर मशीन का परिचय

      1970 के दशक में, वापनिक और अन्य लोगों ने सांख्यिकीय सीखने के सिद्धांत (एसएलटी) का निर्माण करना शुरू किया, जो सीमित नमूना परिस्थितियों में सांख्यिकीय नियम और सीखने के तरीकों की प्रकृति का अध्ययन करने के लिए उपयोग किया जाता है, सीमित नमूना मशीन सीखने की समस्याओं के लिए एक अच्छा सैद्धांतिक ढांचा स्थापित करता है, जो छोटे नमूने, गैर-रैखिक, उच्च आयामी संख्याओं और स्थानीय अतिसूक्ष्म बिंदुओं जैसे वास्तविक समस्याओं को बेहतर ढंग से हल करता है। 1995 में, वापनिक और अन्य लोगों ने एक नया सामान्य सीखने का तरीका स्पष्ट रूप से पेश किया, जो कि व्यापक रूप से ध्यान दिया गया था और विभिन्न क्षेत्रों में लागू किया गया था।

      एसवीएम रैखिक रूप से विभाज्य स्थितियों में सबसे अच्छा वर्गीकरण सुपरप्लेन से विकसित होता है। दो प्रकार के वर्गीकरण समस्याओं के लिए, प्रशिक्षण नमूना सेट को ((xi,yi), i = 1,2...l, l के रूप में सेट किया जाता है, प्रशिक्षण नमूना के लिए इकाइयों की संख्या, और प्रशिक्षण नमूना के लिए xi, yi के लिए {-1+,1} इनपुट नमूना xi के लिए एक वर्ग चिह्न ((अपेक्षित आउटपुट) है। एसवीएम एल्गोरिथ्म सबसे अच्छा वर्गीकरण सुपरप्लेन खोजने के लिए शुरू होता है।

      इष्टतम वर्गीकरण सुपरफ्लैट न केवल सभी नमूनों को सही ढंग से अलग करने में सक्षम है (प्रशिक्षण त्रुटि स्कोर 0 है), बल्कि दोनों वर्गों के बीच सबसे बड़ा मार्जिन बनाने में भी सक्षम है, जिसे प्रशिक्षण डेटासेट से उस वर्गीकरण सुपरफ्लैट की न्यूनतम दूरी के योग के रूप में परिभाषित किया गया है। इष्टतम वर्गीकरण सुपरफ्लैट का अर्थ है कि परीक्षण डेटा के लिए औसत वर्गीकरण त्रुटि सबसे कम है।

      यदि d-dimensional vector space में एक सुपरफ्लैट है:

      F(x) = w*x+b=0

      उपरोक्त दो प्रकार के डेटा को अलग करने में सक्षम होने के लिए, इस सुपरप्लेन को एक विभाजन इंटरफ़ेस कहा जाता है; जहां w * x दो वेक्टरों w और x के आंतरिक भागों को d-dimensional vector space में है।

      यदि इंटरफ़ेस को विभाजित करेंः

      w*x+b=0

      जिस अंतर (मार्जिन) से अंतर (मार्जिन) सबसे अधिक हो, उस अंतर को सबसे अच्छा अंतर कहा जाता है।

      imgचित्रा 4 SVM द्विआधारीकरण के सबसे अच्छे अंतरफलक का नक्शा

      सबसे अच्छा अंतरण इंटरफ़ेस समीकरण के लिए एकीकरण, जो दो प्रकार के नमूनों के बीच की दूरी को बढ़ा सकता है

      img

      तो किसी भी नमूने के लिए,

      img

      सबसे अच्छा इंटरफ़ेस प्राप्त करने के लिए, उपरोक्त सूत्रों को पूरा करने के अलावा, इसे कम से कम करना होगा।

      इस प्रकार, एसवीएम समस्या का गणितीय मॉडल हैःimg

      एसवीएम अंततः सबसे अनुकूलित योजना समस्या बन गई, और अकादमिक अनुसंधान का मुख्य रूप से तेजी से समाधान, बहु-श्रेणी में प्रचार, व्यावहारिक समस्या अनुप्रयोग आदि पर ध्यान केंद्रित किया गया।

      एसवीएम मूल रूप से द्वि-वर्गीकरण समस्याओं के लिए था और वर्तमान व्यावहारिक अनुप्रयोगों की आवश्यकताओं के आधार पर बहु-वर्गीकरण समस्याओं के लिए भी इसका विस्तार किया गया है। पहले से मौजूद बहु-वर्गीकरण एल्गोरिदम में एक-पर-एक, एक-पर-एक, त्रुटि-संकेतन, डीएजी-एसवीएम और मल्टी-आई-क्लास एसवीएम वर्गीकरण आदि शामिल हैं।

    • (iii) ऑर्डर बुक के संकेतकों को निकालना

      स्टॉक इंडेक्स फ्यूचर्स लेवल-1 के उदाहरण के रूप में, ऑर्डर बुक में मुख्य रूप से एक खरीद, बिक्री, खरीद, बिक्री आदि बुनियादी संकेतकों को शामिल किया गया है, और गहराई, स्प्लिट, सापेक्ष मूल्य अंतर जैसे संकेतकों को व्युत्पन्न किया जा सकता है, अन्य संकेतकों में होल्डिंग्स, लेनदेन, सीमांकन आदि शामिल हैं, कुल मिलाकर 17 संकेतकों के लिए, जैसा कि नीचे दी गई तालिका में दिखाया गया है।

      तालिका 1 लेवल बाजार ऑर्डर बुक पर आधारित संकेतक

      img

    • (४) ऑर्डर बुक की गतिशील विशेषताएं और लेनदेन के अवसर

      बाजार के सूक्ष्म दृष्टिकोण से, कम समय में मूल्य गति को मापने के दो तरीके हैं, एक मध्य मूल्य गति है, और दूसरा मूल्य अंतर क्रॉस है। इस लेख में अधिक सरल और सहज मध्य मूल्य गति का चयन किया गया है। मध्य मूल्य की परिभाषाः

      img

      आदेश पुस्तिका के अनुसार, मध्य मूल्य ΔT में ΔP परिवर्तनों को तीन श्रेणियों में विभाजित किया गया है।

      नीचे दिया गया चार्ट 29 अक्टूबर को मुख्य अनुबंध IF1311 के मध्य मूल्य आंदोलन का वितरण है, जिसमें 32400 दैनिक टिक बाजार डेटा हैं।

      Δt = 1 टिक के मामले में, मध्य मूल्य में 0.2 का पूर्ण परिवर्तन लगभग 6000 बार, 0.4 का पूर्ण परिवर्तन लगभग 1500 बार, 0.6 का पूर्ण परिवर्तन लगभग 150 बार, 0.8 का पूर्ण परिवर्तन लगभग 50 बार, और 1 से 10 बार बड़ा होता है।

      Δt = 2tick के मामले में, मध्य मूल्य में 0.2 का पूर्ण परिवर्तन लगभग 7000 बार, 0.4 का पूर्ण परिवर्तन लगभग 3000 बार, 0.6 का पूर्ण परिवर्तन लगभग 550 बार, 0.8 का पूर्ण परिवर्तन लगभग 205 बार, और 1 से अधिक का पूर्ण परिवर्तन लगभग 10 बार होता है।

      हम मानते हैं कि यदि परिवर्तन का पूर्ण मूल्य 0.4 से अधिक है, तो यह एक संभावित व्यापारिक अवसर है। यदि Δt = 1 टिक है, तो प्रति दिन लगभग 1700 अवसर हैं; यदि Δt = 2 टिक है, तो प्रति दिन लगभग 4000 अवसर हैं।

      img

      चित्रा 5 IF1311 मध्य मूल्य में 29 अक्टूबर को हुए बदलाव का सारण ((Δt=1 tick)

      img

      चित्रा 6 IF1311 मध्य मूल्य परिवर्तन का 29 अक्टूबर का सारण ((Δt=2tick)

  • तीन, रणनीतिक प्रमाण

    क्योंकि एसवीएम मॉडल में बड़ी नमूना स्थितियों में प्रशिक्षण की जटिलता अधिक होती है और प्रशिक्षण का समय लंबा होता है, इसलिए हमने आईएफ 1311 अनुबंध के अक्टूबर में लेवल_1 बाजार डेटा के साथ मॉडल की प्रभावशीलता को सत्यापित करने के लिए अपेक्षाकृत कम अवधि के लिए ऐतिहासिक बाजार डेटा का चयन किया।

    • (i) मॉडल प्रभाव परीक्षण

      डेटा चक्रः अक्टूबर में IF1311 अनुबंध बाजार के आंकड़े;

      Δt मूल्य निर्धारणः Δt जितना छोटा होगा, लेनदेन के विवरण पर उतनी ही अधिक आवश्यकता होगी, जब Δt = 1 टिक, वास्तविक लेनदेन में लाभ प्राप्त करना मुश्किल होगा। मॉडल के प्रभाव को तुलना करने के लिए, यहां क्रमशः 1 टिक, 2 टिक, 3 टिक का मूल्य निर्धारण किया गया है।

      मॉडल के मूल्यांकन के संकेतकों में नमूना सटीकता, परीक्षण सटीकता, भविष्यवाणी समय शामिल हैं।imgतालिका 2 1 टिक डेटा के साथ 1 टिक के प्रभाव का अनुमान लगाती है

      imgतालिका 3 1 टिक डेटा के साथ 2 टिक के प्रभाव का अनुमान लगाती है

      imgतालिका 4 2tick डेटा के साथ 2tick के प्रभाव का पूर्वानुमान

      इन तीन तालिकाओं के आंकड़ों से, हम निम्नलिखित निष्कर्ष निकाल सकते हैंः उच्चतम सटीकता लगभग 70% है, और 60% सटीकता में, इसे व्यापार रणनीति में बदल दिया जा सकता है।

    • (२) रणनीतिक प्रतिरूपण लाभ

      उदाहरण के लिए, 31 अक्टूबर को, हम एक एनालॉग ट्रेडिंग करते हैं, एक संस्था का स्टॉक फ्यूचर्स ट्रेडिंग शुल्क आमतौर पर 0.26/10000 होता है। हम मानते हैं कि ट्रेडिंग की संख्या में कोई सीमा नहीं है। हम मानते हैं कि प्रत्येक ट्रेड के लिए एकतरफा स्लाइड मूल्य 0.2 अंक है और प्रत्येक एकल हाथ की संख्या 1 है।

      तालिका 5 31 अक्टूबर को लेनदेन के लिए एनालॉग रणनीतिimg

      दिन भर में 605 बार कारोबार किया गया, प्रक्रियाओं को शामिल किया गया, 339 बार लाभ हुआ, जीत का प्रतिशत 56%, शुद्ध लाभ 11814.99 युआन।

      सैद्धांतिक रूप से, स्लाइड मूल्य 145,520 युआन है, जो रणनीतिक वास्तविक युद्ध के लिए महत्वपूर्ण है। यदि आदेश विवरण को अधिक बारीकी से नियंत्रित किया जाता है, तो स्लाइड मूल्य को कम किया जा सकता है और शुद्ध लाभ में वृद्धि की जा सकती है। यदि आदेश विवरण को अनुचित रूप से नियंत्रित किया जाता है, या बाजार में उतार-चढ़ाव असामान्य है, तो स्लाइड मूल्य अधिक होगा, जबकि शुद्ध लाभ कम होगा। इसलिए उच्च आवृत्ति व्यापार की सफलता अक्सर विवरण के निष्पादन पर निर्भर करती है।

      चित्र 7 31 अक्टूबर को एनालॉग रणनीतियों के लाभimg

मूल कथनः इस लेख के लेखक के लिए मूल, कृपया स्रोत का उल्लेख करें।


अधिक

ईवन1987गुडविन, सीख रही हैं कि कैसे ऑर्डर बीन का अध्ययन किया जाए