आम तौर पर मशीन सीखने और डेटा खनन से संबंधित शब्द

लेखक:छोटे सपने, बनाया गयाः 2017-03-20 09:58:22, अद्यतन किया गयाः

आम तौर पर मशीन सीखने और डेटा खनन से संबंधित शब्द

  • Sampling (नमूना):

    • Simple Random Sampling (सरल यादृच्छिक नमूनाकरण)
    • OfflineSampling (ऑफलाइन आदि के लिए संभव K नमूनाकरण)
    • ऑनलाइन नमूनाकरण (ऑनलाइन आदि के लिए संभव है)
    • Ratio-based Sampling (समान अनुपात के साथ यादृच्छिक नमूनाकरण)
    • स्वीकृति-अस्वीकरण नमूनाकरण (Acceptance-Rejection Sampling)
    • महत्व नमूनाकरण
    • एमसीएमसी ((मार्कोव चेन मोंटे कार्लो मार्कोव मोंटे कार्लो नमूनाकरण एल्गोरिथ्मः मेट्रोपोलिस-हैस्टिंग और गिब्स)) ।
  • Clustering (ग्रुपिंग):

    • K-अर्थ है,
    • के-मीडियड्स,
    • दो अंक K-Means,
    • FK-Means,
    • कैनोपी,
    • Spectral-KMeans (स्पेक्ट्रल-KMeans)
    • जीएमएम-ईएम (हाइब्रिड गॉस मॉडल - अधिकतम एल्गोरिथ्म के समाधान की उम्मीद)
    • K-Pototypes, CLARANS (विभाजन के आधार पर)
    • BIRCH (श्रेणी के आधार पर)
    • CURE (स्तरीय आधार पर)
    • DBSCAN (घनत्व के आधार पर)
    • CLIQUE ((घनत्व आधारित और ग्रिड आधारित) ।
  • Classification & Regression (वर्गीकरण और प्रतिगमन):

    • LR (रैखिक प्रतिगमन)
    • LR (Logistic Regression Logical Regression), जो कि लॉजिस्टिक रिग्रेशन के लिए एक बहुत ही अच्छा तरीका है।
    • SR (Softmax Regression शायद क्लास लॉजिक रिग्रेशन)
    • जीएलएम (Generalized Linear Model)
    • RR ((Ridge Regression रिवर्स रिवर्स/L2 नियमित न्यूनतम द्विगुणित रिवर्स),
    • LASSO ((Least Absolute Shrinkage and Selectionator Operator L1 नियम न्यूनतम दो गुना प्रतिगमन है),
    • आरएफ (रैंडम वन)
    • DT (DecisionTree) निर्णय वृक्ष,
    • जीबीडीटी (Gradient Boosting Decision Tree) के अनुसार, एक निर्णय लेने वाला पेड़ जो कि ग्रिडिएंट बूस्टिंग निर्णय पेड़ है, एक निर्णय लेने वाला पेड़ है जो ग्रिडिएंट बूस्टिंग निर्णय पेड़ है।
    • CART (ClassificationAnd Regression Tree) वर्गीकरण और प्रतिगमन पेड़,
    • KNN ((K-Nearest Neighbor K निकटतम पड़ोसी))
    • एसवीएम ((सपोर्ट वेक्टर मशीन),
    • KF ((KernelFunction) Kernel Function PolynomialKernel Function बहुपद Kernel Function, बहुपद Kernel Function, बहुपद Kernel Function, बहुपद Kernel Function, बहुपद Kernel Function, बहुपद Kernel Function, बहुपद Kernel Function, बहुपद Kernel Function, बहुपद Kernel Function, बहुपद Kernel Function)
    • गुआसियन कर्नेल फंक्शन गुआसियन कर्नेल फंक्शन/रेडियल बेस फंक्शन आरबीएफ व्यास के लिए आधार फंक्शन,
    • String KernelFunction स्ट्रिंग कर्नेल फ़ंक्शन)
    • NB (Naive Bayes, Naïve Bayes), BN (Bayesian Network/Bayesian Belief Network/Belief Network)
    • एलडीए ((Linear Discriminant Analysis/FisherLinear Discriminant Analysis/फिशर लाइनर डिस्क्रिमिनेन्ट डिस्क्रिमिनेशन))
    • EL (Ensemble Learning) एकीकरण सीखना बूस्टिंग, बैगिंग, स्टैकिंग)
    • AdaBoost (अनुकूली संवर्धन)
    • MEM (अधिकतम एंट्रोपी मॉडल) ।
  • प्रभावशीलता मूल्यांकनः

    • कन्फ्यूजन मैट्रिक्स
    • यह एक बहुत ही अच्छा तरीका है कि हम अपने ग्राहकों के साथ एक अच्छा समय बिता सकते हैं।
    • Accuracy (सटीकता), F-score (F स्कोर),
    • ROC Curve (ROC वक्र), AUC (AUC क्षेत्रफल),
    • लिफ्ट वक्र, केएस वक्र।
  • PGM (संभववादी ग्राफिकल मॉडल की संभावना ग्राफ मॉडल):

    • BN ((Bayesian Network/Bayesian Belief Network/BeliefNetwork बेयेसियन नेटवर्क/बेयेसियन विश्वास नेटवर्क/विश्वास नेटवर्क),
    • MC (मार्कोव चेन)
    • HMM (Hidden Markov Model) - एक मॉडल जो एक व्यक्ति के लिए एक रहस्य है।
    • MEMM (अधिकतम एन्ट्रोपी मार्कोव मॉडल)
    • CRF (सशर्त यादृच्छिक क्षेत्र)
    • MRF (मार्कोव रैंडम फील्ड) ।
  • एनएन (Neural Network):

    • ANN (कृत्रिम तंत्रिका नेटवर्क)
    • बीपी (Error BackPropagation) त्रुटि वापस फैलती है।
  • डीप लर्निंग

    • ऑटो-एन्कोडर (स्वचालित एन्कोडर)
    • SAE (Stacked Auto-encoders) स्वचालित एन्कोडरों को ढेर करता है।
    • स्पार्स ऑटो-एन्कोडर एक दुर्लभ ऑटो-एन्कोडर है।
    • Denoising Auto-encoders ऑटो-एनकोडर को शोर करने के लिए,
    • कॉन्ट्रैक्टिव ऑटो-एन्कोडर
    • आरबीएम (Restricted Boltzmann Machine)
    • डीबीएन (डीप बिलीफ नेटवर्क)
    • सीएनएन (Convolutional Neural Network) के अनुसार, यह एक ऐसा नेटवर्क है, जो एक बार फिर से विकसित हो रहा है।
    • Word2Vec (शब्द वेक्टर सीखने का मॉडल) ।
  • DimensionalityReduction (आकार में कमी):

    • LDA Linear Discriminant Analysis/Fisher Linear Discriminant विश्लेषण/फिशर लाइनर डिस्क्रिमिनेन्ट विश्लेषण,
    • PCA (प्राथमिक घटक विश्लेषण)
    • आईसीए (Independent Component Analysis)
    • SVD (Singular Value Decomposition) एक विशिष्ट मूल्य विखंडन है।
    • एफए (Factor Analysis) ।
  • टेक्स्ट खनन (text mining):

    • VSM (वेक्टर स्पेस मॉडल)
    • Word2Vec (शब्द वेक्टर सीखने का मॉडल)
    • TF (Term Frequency शब्द आवृत्ति)
    • TF-IDF ((Term Frequency-Inverse DocumentFrequency) शब्द आवृत्ति-विपरित दस्तावेज़ आवृत्ति)
    • MI (म्यूचुअल सूचना)
    • ईसीई (Expected Cross Entropy)
    • QEMI (द्वितीय सूचना कंक्रीट)
    • IG (InformationGain) जानकारी का लाभ,
    • IGR (Information Gain Ratio) सूचना लाभ की दर,
    • गिनी (गिनी गुणांक)
    • x2 Statistic ((x2 सांख्यिकी),
    • TEW ((TextEvidence Weight) पाठ साक्ष्य का अधिकार)
    • OR (ऑड्स रेशियो लाभ की संभावना)
    • एन-ग्राम मॉडल,
    • एलएसए (Latent Semantic Analysis)
    • PLSA (Probabilistic Latent Semantic Analysis) (संभाव्यता पर आधारित संभावित अर्थ विश्लेषण)
    • एलडीए (Latent Dirichlet Allocation) ।
  • एसोसिएशन खनन (संबद्ध खनन):

    • पहले से,
    • एफपी-ग्रोथ (Frequency Pattern Tree Growth)
    • सर्वप्रथम,
    • स्पैड।
  • अनुशंसा इंजनः

    • DBR (डेमोग्राफिक-आधारित सिफारिश)
    • CBR (Context-basedRecommendation) सामग्री के आधार पर अनुशंसाएं
    • CF (सहकारी फ़िल्टरिंग सह-फ़िल्टरिंग)
    • यूसीएफ (User-based Collaborative Filtering Recommendation) के अनुसार, यूजर-आधारित सहयोगात्मक फ़िल्टरिंग अनुशंसाएं यूजर-आधारित सहयोगात्मक फ़िल्टरिंग अनुशंसाएं हैं।
    • आईसीएफ (Item-based Collaborative Filtering Recommendation) परियोजना के आधार पर सहयोगात्मक फ़िल्टरिंग की सिफारिश करता है।
  • समानता माप और दूरी मापः

    • यूक्लिडियन दूरी
    • मैनहट्टन डिस्टेंस
    • Chebyshev Distance (चेबिशेव दूरी)
    • मिन्कोवस्की दूरी
    • मानकीकृत यूक्लिडियन दूरी
    • महलनोबिस दूरी (मार्स की दूरी)
    • कॉस (कोसिन स्ट्रिंग)
    • HammingDistance/Edit Distance (हैमिंग दूरी/संपादित दूरी)
    • JaccardDistance (जैकार्ड दूरी)
    • Correlation Coefficient Distance (संबंधित गुणांक दूरी)
    • जानकारी एंट्रोपी (Information Entropy)
    • KL ((Kullback-Leibler Divergence KL फैलाव/रिलेटिव एंट्रोपी के सापेक्ष घनत्व) ।)
  • Feature Selection (विशेषताओं का चयन एल्गोरिथ्म):

    • म्यूचुअल इन्फॉर्मेशन
    • DocumentFrequence (दस्तावेज़ की आवृत्ति)
    • सूचना लाभ (Information Gain)
    • चि-स्क्वायरड टेस्ट (कार्टोन टेस्ट)
    • गिनी (गिनी गुणांक) ।
  • Outlier Detection (असामान्यता का पता लगाने वाला एल्गोरिथ्म):

    • Statistic-based (सांख्यिकी-आधारित)
    • दूरी-आधारित (दूरी के आधार पर)
    • Density-based (घनत्व आधारित)
    • Clustering-based (क्लस्टर आधारित) ।
  • Learning to Rank (पढ़ने के आधार पर क्रमबद्ध करना):

    • विशेषांक: मैक्रैंक;
    • जोड़े के अनुसारः रैंकिंगएसवीएम, रैंकिंगनेट, फ्रैंक, रैंकिंग बूस्ट;
    • सूचीबद्धः AdaRank,SoftRank,LamdaMART。

अधिक