8
Follow
1364
Followers
Istilah berkaitan pembelajaran mesin dan perlombongan data biasa
Created 2017-03-20 09:58:22
0
2184
Istilah berkaitan pembelajaran mesin dan perlombongan data biasa
-
Sampling:
- Simple Random Sampling (Pemilikan rawak mudah)
- OfflineSampling (Offline Sampling, mungkin K)
- "Saya tidak tahu apa-apa tentang apa yang berlaku di Malaysia, tetapi saya tidak tahu apa yang berlaku di Malaysia.
- Sampling berasaskan nisbah (Ratio-based Sampling)
- Acceptance-RejectionSampling (Sampling Kebenaran-Penghapusan)
- Importance Sampling (Sampling Kepentingan)
- MCMC ((MarkovChain Monte Carlo: Metropolis-Hasting & Gibbs))
-
Clustering:
- K-Means,
- K-Mediods,
- K-Means, dua pertiga.
- FK-Means,
- Canopy,
- Spectral-KMeans (pengumpulan spektrum)
- GMM-EM, model Gaussian campuran - algoritma yang dijangka akan menyelesaikan masalah ini.
- K-Pototypes, CLARANS (berdasarkan pembahagian),
- BIRCH (berdasarkan hierarki)
- CURE (berdasarkan hierarki)
- DBSCAN (berdasarkan ketumpatan)
- CLIQUE ((berdasarkan ketumpatan dan berdasarkan grid) <unk>
-
Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression
- LR (Linear Regression) ialah kaedah yang digunakan untuk mengkaji dan mengkaji keadaan.
- LR (LogisticRegression) adalah kaedah logik yang digunakan untuk mengkaji semula keadaan.
- SR (Softmax Regression)
- GLM (Generalized Linear Model) ialah model linear yang meluas.
- RR (Ridge Regression)
- LASSO ((Least Absolute Shrinkage andSelectionator Operator L1 Regression kepada Bilangan Dua Paling Minimal)
- RF (hutan rawak)
- DT: Saya tidak tahu apa yang anda fikirkan.
- GBDT (Gradient BoostingDecision Tree) adalah satu daripada dua buah pokok keputusan yang dicipta oleh Google.
- CART (Classification And Regression Tree) adalah sebuah kumpulan kumpulan yang terdiri daripada dua jenis pokok.
- KNN (K-Nearest Neighbor K)
- SVM(Support VectorMachine),
- KF ((KernelFunction Fungsi teras PolynomialFungsi teras berbilang fungsi,
- Guassian KernelFunction Guassian KernelFunction / Radial BasisFunction RBF fungsi asas radial,
- String KernelFunction (fungsi teras senar)
- BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network), BN (Bayesian Network), BN (Bayesian Network), BN (Bayesian Network), BN (Bayesian Network), BN (Bayesian Network), BN (Bayesian Network), BN (Bayesian Network), BN (Bay
- LDA ((Linear Discriminant Analysis/FisherLinear Discriminant), yang mana ia digunakan untuk mengkaji dan mengkaji kesesuaian dalam bidang analisis.
- EL ((Ensemble Learning mengintegrasikan pembelajaran Boosting, Bagging, Stacking) dan EL ((Ensemble Learning mengintegrasikan pembelajaran Boosting, Bagging, Stacking) dan EL ((Ensemble Learning mengintegrasikan pembelajaran Boosting, Bagging, Stacking).
- Adaptive Boosting (Peningkatan Beradaptasi)
- MEM (Model Entropy Maksimum)
-
Evaluasi Kesan:
- Confusion Matrix (Matrik Kekecohan)
- Precision, Recall, dan lain-lain.
- F-score (skor F) dan Accuracy (kecekapan)
- ROC Curve, AUC, dan AUC
- LiftCurve, KS Curve
-
PGM (Probabilistic Graphical Models):
- BN ((Bayesian Network/Bayesian Belief Network/BeliefNetwork)
- MC (Markov Chain) adalah sebuah blog yang mengkhususkan diri dalam blog Markov Chain.
- HMM (Model Markov Tersembunyi)
- MEMM (Model Maksimum Entropy Markov) ialah model enteri Markov maksimum.
- CRF (Conditional Random Field), sebuah lapangan terbang bersesuaian dengan keadaan lapangan terbang.
- MRF (Markov Random Field)
-
NN (Rangkaian Neural):
- ANN (Rangkaian Neural Buatan)
- BP ((Error BackPropagation) <unk>
-
DeepLearning
- Auto-encoder (pengekod automatik)
- SAE (Stacked Auto-encoders) adalah pengekod automatik yang ditumpuk.
- Sparse Auto-encoders adalah pengekod automatik yang jarang digunakan.
- Denoising Auto-encoders, pengekod automatik untuk menghapuskan bunyi.
- Contractive Auto-encoders (Pengekod automatik kontraktif)
- RBM (Restricted Boltzmann Machine) ialah sebuah mesin bertekanan Boltzmann terhad.
- DBN (Rangkaian Kepercayaan mendalam)
- CNN (ConvolutionalNeuralNetwork) adalah sebuah rangkaian saraf konvolusional yang telah dipasarkan di seluruh dunia.
- Word2Vec (Model Pembelajaran Vektor Perkataan).
-
DimensionalityReduction (pengurangan dimensi):
- LDA LinearDiscriminant Analysis/Fisher Linear Discriminant Analisis pembezaan linear
- PCA (Analisis Komponen Utama)
- ICA (Independent Component Analysis) adalah sebuah syarikat yang bergerak dalam bidang analisis komponen bebas.
- SVD (Singular Value Decomposition) ialah penguraian nilai singular.
- FA ((FactorAnalysis kaedah analisis faktor) }}.
-
Text Mining (Perlombongan Teks):
- Model Ruang Vektor (VSM)
- Word2Vec (model pembelajaran vektor perkataan)
- TF (Term Frequency) ialah istilah untuk frekuensi frekuensi.
- TF-IDF ((Term Frequency-Inverse DocumentFrequency) ialah frekuensi terbalik dokumen.
- MI ((MutualInformation)) adalah sebuah blog yang mengkaji tentang isu-isu yang berkaitan dengan Islam.
- ECE (Expected Cross Entropy) adalah sebuah platform yang menyediakan maklumat mengenai enteriori yang boleh dipercayai.
- QEMI (Pengkalan Maklumat Sekunder)
- IG ((InformationGain), sebuah laman web di Malaysia yang dikhaskan untuk blog dan blog.
- IGR (Information Gain Ratio) ialah kadar keuntungan maklumat.
- Gini, atau Pekali Gini.
- x2 Statistic (((x2 statistik),
- TEW (TextEvidence Weight) adalah sebuah laman web yang mengkhususkan diri dalam bidang teks.
- OR ((Odds Ratio)), yang merupakan satu-satunya pilihan dalam pilihan raya ini.
- N-Gram Model,
- LSA (Latent Semantic Analysis) adalah kaedah yang digunakan untuk mengkaji dan mengkaji kata-kata dalam bahasa Inggeris.
- PLSA ((ProbabilisticLatent Semantic Analysis) adalah analisis semantik laten berdasarkan kebarangkalian.
- LDA ((Latent DirichletAllocation Model Dirichlet yang berpotensi) }}
-
Association Mining (Pertubuhan Perlombongan):
- Apriori,
- FP-growth (Frequency Pattern Tree Growth) ialah algoritma pertumbuhan pokok dengan corak frekuensi.
- AprioriAll,
- Spade。
-
Enjin Rekomendasi:
- DBR (Demographic-based Recommendation) adalah cadangan berasaskan demografi yang dibuat oleh pengkaji.
- CBR (Context-basedRecommendation) adalah satu kaedah yang digunakan untuk membuat cadangan berdasarkan konteks.
- CF (Collaborative Filtering), sebuah laman web di Malaysia yang mengkhususkan diri dalam penyaringan kolaboratif.
- UCF (User-based Collaborative Filtering Recommendation) adalah sebuah cadangan penapisan kolaboratif berasaskan pengguna.
- ICF ((Item-based Collaborative Filtering Recommendation) <unk>
-
Similarity Measure & Distance Measure:
- Jarak Euclidean
- "Manhattan Distance" (Jarak Manhattan) adalah sebuah blog blog yang mengkaji mengenai isu-isu yang berkaitan dengan isu-isu yang berkaitan dengan pengebumian.
- Jarak antara Chebyshev dan Chebokshev adalah kira-kira 100 km.
- MinkowskiDistance (Jarak Minkowski) ialah jarak yang digunakan untuk mengesan jarak antara dua objek.
- Jarak Euclidean Standardized
- MahalanobisDistance (Jarak Mar)
- "Cosine" ialah "Cosine" dan "Cosine" ialah "Cosine".
- HammingDistance/Edit Distance (Jarak Hamming/Jarak Edit)
- JaccardDistance (Jarak Jaccard) adalah sebuah blog blog yang mengkaji mengenai isu ini.
- Correlation Coefficient Distance (Jarak pekali hubungan)
- InformationEntropy (Informasi Entropy) ialah sebuah blog yang diterbitkan oleh Google.
- KL ((Kullback-Leibler Divergence KL Perbezaan/Relative Entropy relatif rendah) <unk>)
-
Feature Selection:
- "Mutual Information" (Maklumat Bersama)
- DocumentFrequence (Kebanyakan Dokumen)
- Maklumat Mendapat (Information Gain)
- Ujian Chi-squared
- Gini (Kepantasan Gini)
-
Outlier Detection (algoritma pengesanan titik luar biasa):
- Menurut beliau, ia adalah satu perkara yang tidak dapat difahami.
- "Saya tidak tahu apa-apa tentang apa yang berlaku di Malaysia.
- Density-based (berdasarkan ketumpatan),
- Clustering-based (berdasarkan pengumpulan) [2].
-
Learning to Rank (berasaskan pembelajaran):
- Pointwise:McRank;
- Pairwise:RankingSVM,RankNet,Frank,RankBoost;
- Listwise:AdaRank,SoftRank,LamdaMART。
Related Recommendations
Comment
All comments (0)
No data
- 1
