8
Follow
1364
Followers
मशीन लर्निंग और डेटा माइनिंग से संबंधित सामान्य शब्द
-
नमूनाकरण:
- Simple Random Sampling (सरल यादृच्छिक नमूनाकरण)
- OfflineSampling (ऑफ़लाइन नमूनाकरण)
- ऑनलाइन सैंपलिंग (ऑनलाइन नमूनाकरण)
- Ratio-based Sampling (अनुपात आधारित नमूनाकरण)
- Acceptance-Rejection Sampling (स्वीकृति-अस्वीकृति नमूनाकरण)
- Importance Sampling (महत्व नमूनाकरण)
- MCMC ((MarkovChain Monte Carlo मार्कोव मोंटे कार्लो नमूनाकरण एल्गोरिथ्मः मेट्रोपोलिस-हैस्टिंग और गिब्स) ।
-
क्लस्टरिंग (clustering):
- K-Means,
- K-Mediods,
- K-Means का एक सेकंड
- FK-Means,
- Canopy,
- स्पेक्ट्रल-के-मीन्स (Spectral-KMeans)
- GMM-EM (मिश्रित Gaussian मॉडल - अधिकतम करने के लिए एल्गोरिदम की उम्मीद)
- K-Pototypes, CLARANS (विभाजन के आधार पर)
- BIRCH (स्तर के आधार पर)
- CURE (स्तर के आधार पर)
- DBSCAN (घनत्व के आधार पर)
- CLIQUE ((घनत्व आधारित और जाली आधारित)) ।
-
Classification&Regression (वर्गीकरण और प्रतिगमन):
- LR (रैखिक प्रतिगमन)
- LR (लॉजिस्टिक रिग्रेशन)
- SR{Softmax Regression} (सॉफ्टमैक्स रिग्रेशन)
- GLM (Generalized Linear Model) एक सामान्यीकृत रैखिक मॉडल है।
- RR{Ridge Regression <unk> रिग्रेशन/L2 <unk> रेगुलर मिनिमम द्विगुणित रिग्रेशन),
- LASSO ((Least Absolute Shrinkage andSelectionator Operator L1 ध्रुवीय न्यूनतम द्विगुणित वापसी),
- आरएफ (Random Forest) के अनुसार,
- DT (DecisionTree) ने कहा, "यह एक बहुत ही महत्वपूर्ण निर्णय है।
- GBDT (ग्रेडिएंट बूस्टिंग डिसीजन ट्री)
- CART (Classification And Regression Tree) एक वर्गीकरण और प्रतिगमन वृक्ष है।
- यह भी पढ़ेंः "अफगानिस्तान में एक और हादसा" (अंग्रेज़ी में)
- SVM(Support VectorMachine),
- KF ((KernelFunction कोर फ़ंक्शन PolynomialKernel Function बहुपद कोर फ़ंक्शन
- Guassian KernelFunction Guassian KernelFunction/Radial BasisFunction RBF रेडियल बेसिस फंक्शन
- String KernelFunction स्ट्रिंग कर्नेल फ़ंक्शन)
- NB ((Naive Bayes),BN ((Bayesian Network/Bayesian Belief Network/ Belief Network बेयज़ियन नेटवर्क/ बेयज़ियन विश्वास नेटवर्क/ विश्वास नेटवर्क),
- LDA ((Linear Discriminant Analysis/Fisher) [Linear Discriminant Analysis/Fisher] (रैखिक भेदभाव विश्लेषण/फिशर रैखिक भेदभाव विश्लेषण)
- EL ((Ensemble Learning) Boosting, Bagging, Stacking को एकीकृत करता है, जो कि एक प्रकार का एकीकरण है।
- AdaBoost (अनुकूली संवर्धन)
- MEM (अधिकतम एन्ट्रोपी मॉडल) ।
-
Effectiveness Evaluation (प्रभाविता मूल्यांकन):
- Confusion Matrix (कन्फ्यूजन मैट्रिक्स)
- Precision (सटीकता), Recall (रिकॉल दर),
- Accuracy (सटीकता), F-score (एफ स्कोर),
- आरओसी वक्र, एयूसी, एयूसी क्षेत्र
- LiftCurve (लिफ्ट वक्र), KS Curve (केएस वक्र)
-
PGM (संभावित ग्राफिकल मॉडल):
- BN ((Bayesian Network/Bayesian Belief Network/ BeliefNetwork) बेयज़ियन नेटवर्क/बेयज़ियन विश्वास नेटवर्क/विश्वास नेटवर्क)
- इस पोस्ट को पोस्ट करने के बाद, मैं अपने ब्लॉग पर एक टिप्पणी लिख रहा हूं।
- HMM (HiddenMarkov Model) एक गुप्त मार्कोव मॉडल है, जो दुनिया भर के वैज्ञानिकों के लिए बहुत उपयोगी है।
- MEMM (अधिकतम एंट्रोपी मार्कोव मॉडल)
- CRF (सशर्त यादृच्छिक क्षेत्र)
- MRF (मार्कोव रैंडम फील्ड)
-
NN (न्यूरल नेटवर्क):
- ANN (आर्टिफिशियल न्यूरल नेटवर्क)
- BP ((Error BackPropagation त्रुटि का उल्टा प्रसार) <unk>
-
DeepLearning
- ऑटो-एन्कोडर
- SAE (Stacked Auto-encoders) - स्टैक्ड ऑटो-एन्कोडर्स, जो कि स्टैक्ड ऑटो-एन्कोडर्स हैं।
- Sparse Auto-encoders स्वचालित एन्कोडर को कम करता है
- Denoising Auto-encoders - डीनोइजिंग ऑटो-एन्कोडर्स
- Contractive Auto-encoders (संकुचित स्वतः एन्कोडर)
- आरबीएम (Restricted Boltzmann Machine) एक सीमित बोल्ज़मैन मशीन है।
- डीबीएन (Deep Belief Network) के अनुसार, "हमारे पास इस तरह की जानकारी नहीं है।
- सीएनएन के अनुसार, यह एक प्रकार का "विघटनकारी तंत्रिका नेटवर्क" है, और यह "विघटनकारी तंत्रिका नेटवर्क" के रूप में जाना जाता है।
- Word2Vec (शब्द वेक्टर सीखने का मॉडल) <unk>
-
DimensionalityReduction (आकार में कमी):
- LDA LinearDiscriminant Analysis/Fisher Linear Discriminant रैखिक भेदभाव विश्लेषण/फिशर रैखिक भेदभाव
- पीसीए (प्रिंसिपल कंपोनेंट एनालिसिस)
- ICA (Independent Component Analysis) स्वतंत्र घटक विश्लेषण है।
- SVD (Singular Value Decomposition) एक विशेष मूल्य अवशोषण है।
- FA ((FactorAnalysis कारक विश्लेषण विधि) ।
-
टेक्स्ट माइनिंग (Text Mining):
- वेक्टर स्पेस मॉडल (VSM)
- Word2Vec (वर्ड वेक्टर लर्निंग मॉडल)
- TF: टर्म फ्रीक्वेंसी (Term Frequency)
- TF-IDF ((Term Frequency-Inverse DocumentFrequency) शब्द आवृत्ति-उल्टा दस्तावेज़ आवृत्ति), जो कि एक प्रकार का शब्द आवृत्ति है, जो कि एक प्रकार का शब्द आवृत्ति है, जो कि एक प्रकार का शब्द आवृत्ति है।
- MI ((MutualInformation) के अनुसार, यह एक प्रकार का "म्यूचुअल इंफॉर्मेशन" है।
- ECE (Expected Cross Entropy) के अनुसार, "एक व्यक्ति के लिए एक क्रॉस एंट्रॉपी की उम्मीद है, और एक व्यक्ति के लिए एक क्रॉस एंट्रॉपी है।
- QEMI (दूसरी सूचना तालिका)
- IG ((InformationGain) सूचना का लाभ)
- IGR (सूचना लाभ अनुपात)
- क्या आप जानते हैं कि किस देश में सबसे कम जनसंख्या है?
- x2 सांख्यिकी
- TEW (TextEvidence Weight) टेक्स्ट साक्ष्य का वजन है।
- OR{Odds Ratio} के बारे में
- N-Gram Model,
- LSA (Latent Semantic Analysis) का मतलब है "अंतर्निहित शब्दार्थ विश्लेषण" या "अंतर्निहित शब्दार्थ विश्लेषण"।
- PLSA ((ProbabilisticLatent Semantic Analysis) संभावनाओं के आधार पर संभावित शब्दार्थ विश्लेषण)
- LDA ((Latent DirichletAllocation संभावित डिरिचलेट मॉडल) ।
-
एसोसिएशन माइनिंगः
- Apriori,
- FP-growth (Frequency Pattern Tree Growth) एक प्रकार का फ़्रीक्वेंसी पैटर्न ट्री ग्रोथ एल्गोरिथ्म है।
- AprioriAll,
- Spade。
-
Recommendation Engine (अनुशंसा इंजन):
- DBR (डेमोग्राफिक-आधारित अनुशंसा)
- CBR (Context-basedRecommendation) - संदर्भ-आधारित अनुशंसाएँ (CBR) - संदर्भ-आधारित अनुशंसाएँ (CBR) - संदर्भ-आधारित सिफारिशें (CBR)
- CF (सामूहिक फ़िल्टरिंग)
- यूसीएफ (यूजर-आधारित सहयोगी फ़िल्टरिंग अनुशंसा), यूसीएफ (यूजर-आधारित सहयोगी फ़िल्टरिंग अनुशंसा), यूसीएफ (यूजर-आधारित सहयोगी फ़िल्टरिंग अनुशंसा), यूसीएफ (यूजर-आधारित सहयोगी फ़िल्टरिंग अनुशंसा), यूसीएफ (यूजर-आधारित सहयोगी फ़िल्टरिंग अनुशंसा) ।
- आईसीएफ (आईटम-आधारित सहयोगी फ़िल्टरिंग अनुशंसा) ।
-
Similarity Measure&Distance Measure (समानता माप और दूरी माप):
- यूक्लिडियन दूरी
- यह एक ऐसा समय है जब हम एक दूसरे के साथ बातचीत कर सकते हैं।
- चेबीशेव दूरी (चेबीशेव दूरी)
- MinkowskiDistance (मिनकोव्स्की दूरी) एक ऐसा शब्द है जिसका अर्थ है "मिनकोव्स्की दूरी"।
- मानकीकृत यूक्लिडियन दूरी (Standardized Euclidean Distance)
- इस वीडियो में, हम आपको बता रहे हैं कि किस तरह से यह घटना घटी।
- और यह एक बहुत ही अजीब बात है।
- HammingDistance/Edit Distance (हैमिंग दूरी/संपादन दूरी)
- JaccardDistance (जैकार्ड दूरी)
- Correlation Coefficient Distance (संपर्क गुणांक दूरी)
- यह एक बहुत ही महत्वपूर्ण विषय है।
- KL ((Kullback-Leibler Divergence KL फैलाव / सापेक्ष एंट्रोपी अपेक्षाकृत कम) <unk>
-
Feature Selection (विशेषता चयन एल्गोरिदम):
- Mutual Information (आपसी जानकारी)
- DocumentFrequence (दस्तावेज़ आवृत्ति)
- Information Gain (सूचना लाभ)
- चि-स्क्वायर टेस्ट
- Gini (गिनी गुणांक)
-
Outlier Detection (असामान्य बिंदु का पता लगाने के लिए एल्गोरिथ्म):
- "मैंने अपने जीवन में एक बार भी ऐसा नहीं किया है।
- Distance-based (दूरी-आधारित)
- और यह भी कि यह कैसे काम करता है।
- Clustering-based (क्लस्टरिंग आधारित) ।
-
Learning to Rank (शिक्षा के आधार पर रैंक):
- Pointwise:McRank;
- Pairwise:RankingSVM,RankNet,Frank,RankBoost;
- Listwise:AdaRank,SoftRank,LamdaMART。
Related Recommendations
Comment
All comments (0)
No data
- 1
