4
ध्यान केंद्रित करना
1271
समर्थक

मशीन लर्निंग और डेटा माइनिंग से संबंधित सामान्य शब्द

में बनाया: 2017-03-20 09:58:22, को अपडेट:
comments   0
hits   2015

मशीन लर्निंग और डेटा माइनिंग से संबंधित सामान्य शब्द

  • नमूनाकरण:

    • Simple Random Sampling (सरल यादृच्छिक नमूनाकरण)
    • OfflineSampling (ऑफ़लाइन नमूनाकरण)
    • ऑनलाइन सैंपलिंग (ऑनलाइन नमूनाकरण)
    • Ratio-based Sampling (अनुपात आधारित नमूनाकरण)
    • Acceptance-Rejection Sampling (स्वीकृति-अस्वीकृति नमूनाकरण)
    • Importance Sampling (महत्व नमूनाकरण)
    • MCMC ((MarkovChain Monte Carlo मार्कोव मोंटे कार्लो नमूनाकरण एल्गोरिथ्मः मेट्रोपोलिस-हैस्टिंग और गिब्स) ।
  • क्लस्टरिंग (clustering):

    • K-Means,
    • K-Mediods,
    • K-Means का एक सेकंड
    • FK-Means,
    • Canopy,
    • स्पेक्ट्रल-के-मीन्स (Spectral-KMeans)
    • GMM-EM (मिश्रित Gaussian मॉडल - अधिकतम करने के लिए एल्गोरिदम की उम्मीद)
    • K-Pototypes, CLARANS (विभाजन के आधार पर)
    • BIRCH (स्तर के आधार पर)
    • CURE (स्तर के आधार पर)
    • DBSCAN (घनत्व के आधार पर)
    • CLIQUE ((घनत्व आधारित और जाली आधारित)) ।
  • Classification&Regression (वर्गीकरण और प्रतिगमन):

    • LR (रैखिक प्रतिगमन)
    • LR (लॉजिस्टिक रिग्रेशन)
    • SR{Softmax Regression} (सॉफ्टमैक्स रिग्रेशन)
    • GLM (Generalized Linear Model) एक सामान्यीकृत रैखिक मॉडल है।
    • RR{Ridge Regression रिग्रेशन/L2 रेगुलर मिनिमम द्विगुणित रिग्रेशन),
    • LASSO ((Least Absolute Shrinkage andSelectionator Operator L1 ध्रुवीय न्यूनतम द्विगुणित वापसी),
    • आरएफ (Random Forest) के अनुसार,
    • DT (DecisionTree) ने कहा, “यह एक बहुत ही महत्वपूर्ण निर्णय है।
    • GBDT (ग्रेडिएंट बूस्टिंग डिसीजन ट्री)
    • CART (Classification And Regression Tree) एक वर्गीकरण और प्रतिगमन वृक्ष है।
    • यह भी पढ़ेंः “अफगानिस्तान में एक और हादसा” (अंग्रेज़ी में)
    • SVM(Support VectorMachine),
    • KF ((KernelFunction कोर फ़ंक्शन PolynomialKernel Function बहुपद कोर फ़ंक्शन
    • Guassian KernelFunction Guassian KernelFunction/Radial BasisFunction RBF रेडियल बेसिस फंक्शन
    • String KernelFunction स्ट्रिंग कर्नेल फ़ंक्शन)
    • NB ((Naive Bayes),BN ((Bayesian Network/Bayesian Belief Network/ Belief Network बेयज़ियन नेटवर्क/ बेयज़ियन विश्वास नेटवर्क/ विश्वास नेटवर्क),
    • LDA ((Linear Discriminant Analysis/Fisher) Linear Discriminant Analysis/Fisher
    • EL ((Ensemble Learning) Boosting, Bagging, Stacking को एकीकृत करता है, जो कि एक प्रकार का एकीकरण है।
    • AdaBoost (अनुकूली संवर्धन)
    • MEM (अधिकतम एन्ट्रोपी मॉडल) ।
  • Effectiveness Evaluation (प्रभाविता मूल्यांकन):

    • Confusion Matrix (कन्फ्यूजन मैट्रिक्स)
    • Precision (सटीकता), Recall (रिकॉल दर),
    • Accuracy (सटीकता), F-score (एफ स्कोर),
    • आरओसी वक्र, एयूसी, एयूसी क्षेत्र
    • LiftCurve (लिफ्ट वक्र), KS Curve (केएस वक्र)
  • PGM (संभावित ग्राफिकल मॉडल):

    • BN ((Bayesian Network/Bayesian Belief Network/ BeliefNetwork) बेयज़ियन नेटवर्क/बेयज़ियन विश्वास नेटवर्क/विश्वास नेटवर्क)
    • इस पोस्ट को पोस्ट करने के बाद, मैं अपने ब्लॉग पर एक टिप्पणी लिख रहा हूं।
    • HMM (HiddenMarkov Model) एक गुप्त मार्कोव मॉडल है, जो दुनिया भर के वैज्ञानिकों के लिए बहुत उपयोगी है।
    • MEMM (अधिकतम एंट्रोपी मार्कोव मॉडल)
    • CRF (सशर्त यादृच्छिक क्षेत्र)
    • MRF (मार्कोव रैंडम फील्ड)
  • NN (न्यूरल नेटवर्क):

    • ANN (आर्टिफिशियल न्यूरल नेटवर्क)
    • BP ((Error BackPropagation त्रुटि का उल्टा प्रसार)
  • DeepLearning

    • ऑटो-एन्कोडर
    • SAE (Stacked Auto-encoders) - स्टैक्ड ऑटो-एन्कोडर्स, जो कि स्टैक्ड ऑटो-एन्कोडर्स हैं।
    • Sparse Auto-encoders स्वचालित एन्कोडर को कम करता है
    • Denoising Auto-encoders - डीनोइजिंग ऑटो-एन्कोडर्स
    • Contractive Auto-encoders (संकुचित स्वतः एन्कोडर)
    • आरबीएम (Restricted Boltzmann Machine) एक सीमित बोल्ज़मैन मशीन है।
    • डीबीएन (Deep Belief Network) के अनुसार, “हमारे पास इस तरह की जानकारी नहीं है।
    • सीएनएन के अनुसार, यह एक प्रकार का “विघटनकारी तंत्रिका नेटवर्क” है, और यह “विघटनकारी तंत्रिका नेटवर्क” के रूप में जाना जाता है।
    • Word2Vec (शब्द वेक्टर सीखने का मॉडल)
  • DimensionalityReduction (आकार में कमी):

    • LDA LinearDiscriminant Analysis/Fisher Linear Discriminant रैखिक भेदभाव विश्लेषण/फिशर रैखिक भेदभाव
    • पीसीए (प्रिंसिपल कंपोनेंट एनालिसिस)
    • ICA (Independent Component Analysis) स्वतंत्र घटक विश्लेषण है।
    • SVD (Singular Value Decomposition) एक विशेष मूल्य अवशोषण है।
    • FA ((FactorAnalysis कारक विश्लेषण विधि) ।
  • टेक्स्ट माइनिंग (Text Mining):

    • वेक्टर स्पेस मॉडल (VSM)
    • Word2Vec (वर्ड वेक्टर लर्निंग मॉडल)
    • TF: टर्म फ्रीक्वेंसी (Term Frequency)
    • TF-IDF ((Term Frequency-Inverse DocumentFrequency) शब्द आवृत्ति-उल्टा दस्तावेज़ आवृत्ति), जो कि एक प्रकार का शब्द आवृत्ति है, जो कि एक प्रकार का शब्द आवृत्ति है, जो कि एक प्रकार का शब्द आवृत्ति है।
    • MI ((MutualInformation) के अनुसार, यह एक प्रकार का “म्यूचुअल इंफॉर्मेशन” है।
    • ECE (Expected Cross Entropy) के अनुसार, “एक व्यक्ति के लिए एक क्रॉस एंट्रॉपी की उम्मीद है, और एक व्यक्ति के लिए एक क्रॉस एंट्रॉपी है।
    • QEMI (दूसरी सूचना तालिका)
    • IG ((InformationGain) सूचना का लाभ)
    • IGR (सूचना लाभ अनुपात)
    • क्या आप जानते हैं कि किस देश में सबसे कम जनसंख्या है?
    • x2 सांख्यिकी
    • TEW (TextEvidence Weight) टेक्स्ट साक्ष्य का वजन है।
    • OR{Odds Ratio} के बारे में
    • N-Gram Model,
    • LSA (Latent Semantic Analysis) का मतलब है “अंतर्निहित शब्दार्थ विश्लेषण” या “अंतर्निहित शब्दार्थ विश्लेषण”।
    • PLSA ((ProbabilisticLatent Semantic Analysis) संभावनाओं के आधार पर संभावित शब्दार्थ विश्लेषण)
    • LDA ((Latent DirichletAllocation संभावित डिरिचलेट मॉडल) ।
  • एसोसिएशन माइनिंगः

    • Apriori,
    • FP-growth (Frequency Pattern Tree Growth) एक प्रकार का फ़्रीक्वेंसी पैटर्न ट्री ग्रोथ एल्गोरिथ्म है।
    • AprioriAll,
    • Spade。
  • Recommendation Engine (अनुशंसा इंजन):

    • DBR (डेमोग्राफिक-आधारित अनुशंसा)
    • CBR (Context-basedRecommendation) - संदर्भ-आधारित अनुशंसाएँ (CBR) - संदर्भ-आधारित अनुशंसाएँ (CBR) - संदर्भ-आधारित सिफारिशें (CBR)
    • CF (सामूहिक फ़िल्टरिंग)
    • यूसीएफ (यूजर-आधारित सहयोगी फ़िल्टरिंग अनुशंसा), यूसीएफ (यूजर-आधारित सहयोगी फ़िल्टरिंग अनुशंसा), यूसीएफ (यूजर-आधारित सहयोगी फ़िल्टरिंग अनुशंसा), यूसीएफ (यूजर-आधारित सहयोगी फ़िल्टरिंग अनुशंसा), यूसीएफ (यूजर-आधारित सहयोगी फ़िल्टरिंग अनुशंसा) ।
    • आईसीएफ (आईटम-आधारित सहयोगी फ़िल्टरिंग अनुशंसा) ।
  • Similarity Measure&Distance Measure (समानता माप और दूरी माप):

    • यूक्लिडियन दूरी
    • यह एक ऐसा समय है जब हम एक दूसरे के साथ बातचीत कर सकते हैं।
    • चेबीशेव दूरी (चेबीशेव दूरी)
    • MinkowskiDistance (मिनकोव्स्की दूरी) एक ऐसा शब्द है जिसका अर्थ है “मिनकोव्स्की दूरी”।
    • मानकीकृत यूक्लिडियन दूरी (Standardized Euclidean Distance)
    • इस वीडियो में, हम आपको बता रहे हैं कि किस तरह से यह घटना घटी।
    • और यह एक बहुत ही अजीब बात है।
    • HammingDistance/Edit Distance (हैमिंग दूरी/संपादन दूरी)
    • JaccardDistance (जैकार्ड दूरी)
    • Correlation Coefficient Distance (संपर्क गुणांक दूरी)
    • यह एक बहुत ही महत्वपूर्ण विषय है।
    • KL ((Kullback-Leibler Divergence KL फैलाव / सापेक्ष एंट्रोपी अपेक्षाकृत कम)
  • Feature Selection (विशेषता चयन एल्गोरिदम):

    • Mutual Information (आपसी जानकारी)
    • DocumentFrequence (दस्तावेज़ आवृत्ति)
    • Information Gain (सूचना लाभ)
    • चि-स्क्वायर टेस्ट
    • Gini (गिनी गुणांक)
  • Outlier Detection (असामान्य बिंदु का पता लगाने के लिए एल्गोरिथ्म):

    • “मैंने अपने जीवन में एक बार भी ऐसा नहीं किया है।
    • Distance-based (दूरी-आधारित)
    • और यह भी कि यह कैसे काम करता है।
    • Clustering-based (क्लस्टरिंग आधारित) ।
  • Learning to Rank (शिक्षा के आधार पर रैंक):

    • Pointwise:McRank;
    • Pairwise:RankingSVM,RankNet,Frank,RankBoost;
    • Listwise:AdaRank,SoftRank,LamdaMART。