समय श्रृंखला विश्लेषण के लिए शुरुआती गाइड

लेखक:अच्छाई, बनाया गयाः 2019-03-30 11:17:42, अद्यतन किया गयाः

पिछले कुछ वर्षों में हमने परिसंपत्ति की कीमतों में शोषण योग्य पैटर्न की पहचान करने में मदद करने के लिए विभिन्न उपकरणों को देखा है। विशेष रूप से हमने बुनियादी अर्थमिति, सांख्यिकीय मशीन लर्निंग और बेजियन सांख्यिकी पर विचार किया है।

जबकि ये सभी डेटा विश्लेषण के लिए महान आधुनिक उपकरण हैं, उद्योग में संपत्ति मॉडलिंग का विशाल बहुमत अभी भी सांख्यिकीय समय श्रृंखला विश्लेषण का उपयोग करता है। इस लेख में हम यह जांचने जा रहे हैं कि समय श्रृंखला विश्लेषण क्या है, इसके दायरे की रूपरेखा तैयार करें और जानें कि हम वित्तीय डेटा की विभिन्न आवृत्तियों पर तकनीकों को कैसे लागू कर सकते हैं।

समय श्रृंखला विश्लेषण क्या है?

सबसे पहले, एक समय श्रृंखला को कुछ मात्रा के रूप में परिभाषित किया जाता है जिसे कुछ अंतराल पर समय में क्रमशः मापा जाता है।

अपने व्यापक रूप में, समय श्रृंखला विश्लेषण अतीत में डेटा बिंदुओं की एक श्रृंखला के साथ क्या हुआ है और भविष्य में क्या होगा इसकी भविष्यवाणी करने का प्रयास करने के बारे में है।

हालांकि, हम समय श्रृंखलाओं के लिए एक मात्रात्मक सांख्यिकीय दृष्टिकोण लेने जा रहे हैं, यह मानकर कि हमारी समय श्रृंखलाएं यादृच्छिक चर के अनुक्रमों की प्राप्ति हैं। यानी, हम यह मानने जा रहे हैं कि एक या अधिक सांख्यिकीय वितरणों के आधार पर हमारी समय श्रृंखलाओं के लिए कुछ अंतर्निहित जनरेटिंग प्रक्रिया है, जिससे ये चर तैयार किए गए हैं।

समय श्रृंखला विश्लेषण अतीत को समझने और भविष्य की भविष्यवाणी करने का प्रयास करता है। यादृच्छिक चरों के इस प्रकार के अनुक्रम को एक असतत समय स्टोकैस्टिक प्रक्रिया (डीटीएसपी) के रूप में जाना जाता है। मात्रात्मक व्यापार में हम व्यापार संकेत उत्पन्न करने के लिए श्रृंखलाओं के बीच अंतर्निहित संबंधों का अनुमान लगाने या भविष्य के मूल्यों की भविष्यवाणी करने के लिए इन डीटीएसपी में सांख्यिकीय मॉडल फिट करने का प्रयास करते हैं।

सामान्य तौर पर, वित्तीय दुनिया के बाहर के लोगों सहित समय श्रृंखलाओं में अक्सर निम्नलिखित विशेषताएं होती हैंः

  • रुझान - एक रुझान एक समय श्रृंखला में एक सुसंगत दिशात्मक आंदोलन है। ये रुझान या तो निर्धारक या स्टोकैस्टिक होंगे। पूर्व हमें प्रवृत्ति के लिए एक अंतर्निहित तर्क प्रदान करने की अनुमति देता है, जबकि उत्तरार्द्ध एक श्रृंखला की एक यादृच्छिक विशेषता है जिसे हम स्पष्ट करने की संभावना नहीं है। रुझान अक्सर वित्तीय श्रृंखलाओं में दिखाई देते हैं, विशेष रूप से कमोडिटी की कीमतों में, और कई कमोडिटी ट्रेडिंग एडवाइजर (सीटीए) फंड अपने ट्रेडिंग एल्गोरिदम में परिष्कृत प्रवृत्ति पहचान मॉडल का उपयोग करते हैं।
  • मौसमी भिन्नता - कई समय श्रृंखलाओं में मौसमी भिन्नता होती है। यह विशेष रूप से व्यावसायिक बिक्री या जलवायु स्तरों का प्रतिनिधित्व करने वाली श्रृंखलाओं में सच है। मात्रात्मक वित्त में हम अक्सर वस्तुओं में मौसमी भिन्नता देखते हैं, विशेष रूप से बढ़ते मौसम या वार्षिक तापमान भिन्नता (जैसे प्राकृतिक गैस) से संबंधित।
  • सीरियल निर्भरता - समय श्रृंखलाओं, विशेष रूप से वित्तीय श्रृंखलाओं की सबसे महत्वपूर्ण विशेषताओं में से एक सीरियल सहसंबंध है। यह तब होता है जब समय श्रृंखला अवलोकन जो समय में एक दूसरे के करीब होते हैं, सहसंबंधित होते हैं। अस्थिरता क्लस्टरिंग सीरियल सहसंबंध का एक पहलू है जो मात्रात्मक व्यापार में विशेष रूप से महत्वपूर्ण है।

हम मात्रात्मक वित्त में समय श्रृंखला विश्लेषण कैसे लागू कर सकते हैं?

मात्रात्मक शोधकर्ताओं के रूप में हमारा लक्ष्य सांख्यिकीय समय श्रृंखला विधियों का उपयोग करके रुझानों, मौसमी भिन्नताओं और सहसंबंधों की पहचान करना है, और अंततः निष्कर्ष या भविष्यवाणियों के आधार पर व्यापार संकेत या फ़िल्टर उत्पन्न करना है।

हमारा दृष्टिकोण होगाः

  • भविष्य के मूल्यों का पूर्वानुमान और पूर्वानुमान - सफल व्यापार करने के लिए हमें कम से कम सांख्यिकीय अर्थ में भविष्य की परिसंपत्ति की कीमतों का सटीक पूर्वानुमान करने की आवश्यकता होगी।
  • अनुकरण श्रृंखला - एक बार जब हम वित्तीय समय श्रृंखलाओं के सांख्यिकीय गुणों की पहचान कर लेते हैं तो हम उनका उपयोग भविष्य के परिदृश्यों के अनुकरण उत्पन्न करने के लिए कर सकते हैं। यह हमें ट्रेडों की संख्या, अपेक्षित ट्रेडिंग लागत, अपेक्षित रिटर्न प्रोफ़ाइल, बुनियादी ढांचे में आवश्यक तकनीकी और वित्तीय निवेश, और इस प्रकार अंततः किसी विशेष रणनीति या पोर्टफोलियो की जोखिम प्रोफ़ाइल और लाभप्रदता का अनुमान लगाने की अनुमति देता है।
  • अनुमेय संबंध - समय श्रृंखलाओं और अन्य मात्रात्मक मूल्यों के बीच संबंधों की पहचान हमें फ़िल्टरिंग तंत्र के माध्यम से अपने ट्रेडिंग संकेतों को बढ़ाने की अनुमति देती है। उदाहरण के लिए, यदि हम यह अनुमान लगा सकते हैं कि विदेशी मुद्रा जोड़ी में स्प्रेड बोली / मांग मात्रा के साथ कैसे भिन्न होता है, तो हम किसी भी संभावित ट्रेडों को फ़िल्टर कर सकते हैं जो उस अवधि में हो सकते हैं जहां हम लेनदेन लागत को कम करने के लिए एक व्यापक स्प्रेड का अनुमान लगाते हैं।

इसके अतिरिक्त हम अपने समय श्रृंखला मॉडल के लिए मानक (शास्त्रीय/आवृत्तिवादी या बेजियन) सांख्यिकीय परीक्षण लागू कर सकते हैं ताकि कुछ व्यवहारों को उचित ठहराया जा सके, जैसे कि इक्विटी बाजारों में शासन परिवर्तन।

समय श्रृंखला विश्लेषण सॉफ्टवेयर

आज तक हमने अपनी ट्रेडिंग रणनीति कार्यान्वयन के लिए लगभग विशेष रूप से C ++ और पायथन का उपयोग किया है। ये दोनों भाषाएँ एक पूरे ट्रेडिंग स्टैक को लिखने के लिए प्रथम श्रेणी के वातावरण हैं। वे दोनों में कई पुस्तकालय होते हैं और केवल उस भाषा के भीतर एक ट्रेडिंग सिस्टम के अंत से अंत तक निर्माण की अनुमति देते हैं।

दुर्भाग्य से, सी ++ और पायथन में व्यापक सांख्यिकीय पुस्तकालय नहीं हैं। यह उनकी कमियों में से एक है। इस कारण से हम समय श्रृंखला अनुसंधान करने के साधन के रूप में आर सांख्यिकीय वातावरण का उपयोग करेंगे। समय श्रृंखला पुस्तकालयों, सांख्यिकीय तरीकों और सीधे प्लॉटिंग क्षमताओं की उपलब्धता के कारण आर नौकरी के लिए उपयुक्त है।

हम R को समस्या-समाधान के तरीके से सीखेंगे, जिसके द्वारा आवश्यकता के अनुसार नई कमांड और सिंटैक्स पेश किए जाएंगे। सौभाग्य से, इंटरनेट पर R के लिए बहुत सारे बेहद उपयोगी ट्यूटोरियल उपलब्ध हैं और मैं उन्हें समय श्रृंखला विश्लेषण लेखों के अनुक्रम के माध्यम से जाने के रूप में इंगित करूंगा।

क्वांटस्टार्ट टाइम सीरीज विश्लेषण रोडमैप

सांख्यिकीय सीखने, अर्थमिति और बेजियन विश्लेषण के विषयों पर अब तक के पिछले लेख, ज्यादातर परिचयात्मक प्रकृति के रहे हैं और आधुनिक, उच्च आवृत्ति मूल्य निर्धारण जानकारी के लिए ऐसी तकनीकों के अनुप्रयोगों पर विचार नहीं किया है।

उपरोक्त कुछ तकनीकों को उच्च आवृत्ति डेटा पर लागू करने के लिए हमें एक गणितीय ढांचे की आवश्यकता है जिसमें हमारे शोध को एकीकृत किया जा सके। समय श्रृंखला विश्लेषण इस तरह के एकीकरण प्रदान करता है और हमें सांख्यिकीय सेटिंग के भीतर अलग-अलग मॉडल पर चर्चा करने की अनुमति देता है।

अंततः हम मूल्य स्तर और दिशा का पूर्वानुमान लगाने, फिल्टर के रूप में कार्य करने और शासन परिवर्तन निर्धारित करने के लिए निम्नलिखित विधियों के साथ मिलकर बेयिसियन उपकरणों और मशीन लर्निंग तकनीकों का उपयोग करेंगे, अर्थात यह निर्धारित करेंगे कि हमारी समय श्रृंखलाओं ने उनके अंतर्निहित सांख्यिकीय व्यवहार को कब बदल दिया है।

हमारे समय श्रृंखला रोडमैप इस प्रकार है। नीचे दिए गए विषयों में से प्रत्येक अपने स्वयं के लेख या लेखों के सेट का गठन करेगा। एक बार जब हम इन तरीकों की गहराई से जांच कर लेंगे, तो हम उच्च आवृत्ति डेटा की जांच के लिए कुछ परिष्कृत आधुनिक मॉडल बनाने की स्थिति में होंगे।

  • समय श्रृंखला परिचय - इस लेख में समय श्रृंखला विश्लेषण के क्षेत्र, इसके दायरे और वित्तीय आंकड़ों पर इसका उपयोग कैसे किया जा सकता है, इसकी रूपरेखा दी गई है।
  • सहसंबंध - समय श्रृंखला मॉडलिंग का एक बिल्कुल मौलिक पहलू श्रृंखला सहसंबंध की अवधारणा है। हम इसे परिभाषित करेंगे और समय श्रृंखला विश्लेषण के सबसे बड़े जाल में से एक का वर्णन करेंगे, अर्थात् सहसंबंध का तात्पर्य कारण नहीं है
  • पूर्वानुमान - इस खंड में हम पूर्वानुमान की अवधारणा पर विचार करेंगे, जो किसी विशेष समय श्रृंखला के लिए भविष्य की दिशा या स्तर की भविष्यवाणियां कर रहा है, और यह व्यवहार में कैसे किया जाता है।
  • स्टोकैस्टिक मॉडल - हमने साइट पर विकल्प मूल्य निर्धारण के क्षेत्र में स्टोकैस्टिक मॉडल पर विचार करने में कुछ समय बिताया है, अर्थात् ज्यामितीय ब्राउनियन गति और स्टोकैस्टिक अस्थिरता के साथ। हम सफेद शोर और ऑटोरेग्रेसिव मॉडल सहित अन्य मॉडल देखेंगे।
  • प्रतिगमन - जब हमारे पास डेटा में निर्धारक (स्टोकैस्टिक के विपरीत) रुझान होते हैं, तो हम प्रतिगमन मॉडल का उपयोग करके उनके बहिर्वाह को उचित ठहरा सकते हैं। हम रैखिक और गैर-रैखिक प्रतिगमन दोनों पर विचार करेंगे, और सीरियल सहसंबंध के लिए खाता बनाएंगे।
  • स्थैतिक मॉडल - स्थैतिक मॉडल यह मानते हैं कि श्रृंखला के सांख्यिकीय गुण (अर्थात औसत और विचलन) समय में स्थिर होते हैं। हम चलती औसत (एमए) मॉडल का उपयोग कर सकते हैं, साथ ही साथ उन्हें एआरएमए मॉडल बनाने के लिए ऑटोरेग्रेसिव मॉडल के साथ जोड़ सकते हैं।
  • गैर-स्थिर मॉडल - कई वित्तीय समय श्रृंखलाएं गैर-स्थिर होती हैं, यानी उनके पास भिन्न औसत और भिन्नता होती है। विशेष रूप से, परिसंपत्ति की कीमतों में अक्सर उच्च अस्थिरता की अवधि होती है। इन श्रृंखलाओं के लिए हमें गैर-स्थिर मॉडल जैसे एआरआईएमए, आर्क और गार्च का उपयोग करने की आवश्यकता होती है।
  • मल्टीवेरिएट मॉडलिंग - हमने अतीत में क्वांटस्टार्ट पर मल्टीवेरिएट मॉडल पर विचार किया है, अर्थात् जब हमने इक्विटी के औसत-रिवर्सिंग जोड़े पर विचार किया था। इस खंड में हम अधिक कठोर रूप से सह-संयोजन को परिभाषित करेंगे और इसके लिए आगे के परीक्षणों को देखेंगे। हम वेक्टर ऑटोरेग्रेसिव (वीएआर) मॉडल पर भी विचार करेंगे [मूल्य-जोखिम के साथ भ्रमित नहीं होना चाहिए!]
  • स्टेट-स्पेस मॉडल - स्टेट स्पेस मॉडलिंग इंजीनियरिंग में उपयोग किए जाने वाले आधुनिक नियंत्रण सिद्धांत के लंबे इतिहास को उधार लेती है ताकि हमें तेजी से बदलते मापदंडों (जैसे रैखिक प्रतिगमन में दो सह-एकीकृत परिसंपत्तियों के बीच β ढलान चर) के साथ समय श्रृंखलाओं का मॉडल बनाने की अनुमति मिल सके। विशेष रूप से, हम प्रसिद्ध कैलमैन फ़िल्टर और छिपे हुए मार्कोव मॉडल पर विचार करेंगे। यह समय श्रृंखला में बेजियन विश्लेषण के प्रमुख उपयोगों में से एक होगा।

अधिक