Istilah yang umum digunakan untuk pembelajaran mesin dan penambangan data

Penulis:Mimpi kecil, Dibuat: 2017-03-20 09:58:22, Diperbarui:

Istilah yang umum digunakan untuk pembelajaran mesin dan penambangan data

  • Sampling (Contoh):

    • Simple Random Sampling (Contoh acak sederhana)
    • OfflineSampling (K-sampling mungkin offline, dll.)
    • Online Sampling (K mungkin sampel online dll)
    • Ratio-based Sampling (Sampling acak rasio yang sama)
    • Acceptance-RejectionSampling (Sampling penerimaan-penolakan)
    • Importance Sampling (Contoh Pentingnya)
    • MCMC ((MarkovChain Monte Carlo MarkovMont Carlo Sampling Algorithm: Metropolis-Hasting & Gibbs) )).
  • Clustering (mengelompokkan):

    • K berarti,
    • K-Mediods,
    • Dua poin K-Means,
    • FK berarti,
    • Canopy,
    • Spektral-KMeans (Kelompok Spektral)
    • GMM-EM (Mixed Gaussian Model - Diharapkan Algoritma Maksimalisasi Solusi)
    • K-Pototypes, CLARANS (berdasarkan pembagian), dan K-Pototypes (berdasarkan pembagian).
    • BIRCH (berdasarkan tingkat)
    • CURE (berdasarkan tingkat)
    • DBSCAN (berdasarkan kepadatan)
    • CLIQUE (berdasarkan kepadatan dan berbasis grid) ⇒
  • Classification & Regression (Klasifikasi & Regresi):

    • LR (Linear Regression)
    • LR (Logistic Regression Logical Regression)
    • SR (Softmax Regression mungkin regressi logika kelas),
    • GLM (Generalized Linear Model) adalah sebuah model linear dalam arti luas.
    • RR ((Ridge Regression) Regression R/L2 Regular Minimum 2x Regression),
    • LASSO (Least Absolute Shrinkage and Selectionator Operator L1 adalah regulasi regresi minimal dua kali lipat)
    • RF (Hutan acak)
    • DT (DecisionTree) adalah sebuah pohon keputusan yang dibangun oleh para pembuat keputusan.
    • GBDT (Gradient Boosting Decision Tree) adalah pohon keputusan yang memiliki gradien yang menurun.
    • CART (ClassificationAnd Regression Tree) adalah sebuah pohon klasifikasi regresi yang digunakan untuk mengidentifikasi jenis-jenis pohon yang dapat diklasifikasikan.
    • KNN ((K-Nearest Neighbor K dekat tetangga),
    • SVM (Support VectorMachine),
    • KF ((KernelFunction) Fungsi Kernel PolynomialKernel Function Fungsi Kernel dengan bentuk multipolar,
    • Guassian KernelFunction Fungsi Gaussian Kernel/Radial BasisFunction Fungsi RBF
    • String KernelFunction (fungsi inti string)
    • NB (Naive Bayes, Bayesian Network/Bayesian Belief Network/Belief Network)
    • LDA (Linear Discriminant Analysis/FisherLinear Discriminant Analysis/Fisher Linear Discriminant Analysis) adalah sebuah metode yang digunakan oleh para peneliti untuk mendeteksi perbedaan dalam analisis linier.
    • EL (Ensemble Learning Integration Learning) adalah sebuah aplikasi pembelajaran yang berbasis pada bahasa Inggris.
    • Ada Boost (Adaptive Boosting) adalah sebuah aplikasi yang digunakan untuk meningkatkan kemampuan adaptasi.
    • MEM (Model Entropi Maksimum)
  • Efektivitas Evaluasi:

    • Di sini kita akan melihat beberapa contoh yang bisa kita gunakan untuk mencari tahu apakah ada yang benar atau salah.
    • Precision (keakuratan), Recall (tingkat penarikan),
    • Accuracy (keakuratan), F-score (skor F),
    • ROC Curve (kurva ROC), AUC (area AUC),
    • LiftCurve, KS Curve.
  • PGM (Probabilistic Graphical Models Probability Chart Model):

    • BN ((Bayesian Network/Bayesian Belief Network/BeliefNetwork Jaringan Bayesian/Jaringan Keyakinan Bayesian/Jaringan Keyakinan Bayesian),
    • MC (Markov Chain) adalah sebuah jaringan yang terdiri dari dua bagian, yaitu:
    • HMM (Hidden Markov Model) adalah sebuah model yang dibuat oleh para ilmuwan di Amerika Serikat.
    • MEMM (Maximum Entropy Markov Model) adalah sebuah model yang digunakan untuk mendeteksi entropy yang tinggi.
    • CRF (Conditional Random Field) adalah sebuah lapangan terbang acak kondisional.
    • MRF ((Markov Random Field di Markov Random Airport) ).
  • NN (jaringan saraf):

    • ANN (Artificial Neural Network) adalah sebuah jaringan saraf buatan yang digunakan oleh para ilmuwan untuk mendeskripsikan sistem saraf otak manusia.
    • BP (Error BackPropagation) adalah salah satu dari dua jenis penularan yang terjadi di Indonesia.
  • DeepLearning

    • Auto-encoder (pengenkode otomatis)
    • SAE (Stacked Auto-encoders) adalah sebuah sistem pengenkodean otomatis yang ditumpuk.
    • Sparse Auto-encoders adalah encoder otomatis yang langka.
    • Denoising Auto-encoders untuk membuat encoder otomatis berisik.
    • Contractive Auto-encoders (penyempitan pengenkode otomatis)
    • RBM (Restricted Boltzmann Machine) adalah sebuah mesin yang digunakan untuk mendeteksi dan mendeteksi gelombang listrik.
    • DBN (Deep Belief Network) adalah jaringan kepercayaan yang berbasis di Indonesia.
    • CNN (Convolutional Neural Network) adalah sebuah media sosial yang berbasis di Amerika Serikat.
    • Word2Vec (Model Pembelajaran Vektor Kata)
  • DimensionalityReduction (pengurangan dimensi):

    • LDA Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/LDA Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis
    • PCA (Principal Component Analysis) adalah analisis komponen utama.
    • ICA (Independent Component Analysis) adalah analisis komponen independen.
    • SVD (Singular Value Decomposition) adalah suatu metode yang digunakan untuk mendeskripsikan nilai-nilai yang berbeda.
    • FA (Faktor Analisis)
  • Text Mining (Mining Teks):

    • VSM (Vector Space Model)
    • Word2Vec (Model Pembelajaran Vektor Kata)
    • TF (Term Frequency)
    • TF-IDF (Term Frequency-Inverse Document Frequency) adalah frekuensi terbalik dari sebuah dokumen.
    • MI (MutualInformation) saling berkirim pesan.
    • ECE (Expected Cross Entropy) adalah entropy yang diharapkan pada suatu entropy.
    • QEMI (Bandar Informasi Sekunder)
    • IG (Information Gain) adalah sebuah situs web yang menyediakan informasi yang bermanfaat.
    • IGR (Information Gain Ratio) adalah rasio keuntungan informasi yang meningkat.
    • Gini (koefisien Gini)
    • x2 Statistic ((x2 jumlah statistik),
    • TEW (TextEvidence Weight) adalah sebuah organisasi yang berbasis di Amerika Serikat.
    • OR (Odds Ratio) Rasio Keunggulan,
    • Model N-Gram,
    • LSA (Latent Semantic Analysis) adalah bahasa yang digunakan untuk analisis semantik latent.
    • PLSA (Probabilistic Latent Semantic Analysis) adalah analisis semantik latent yang didasarkan pada probabilitas.
    • LDA (Laten Dirichlet Allocation, model Dirichlet potensial)
  • Asosiasi Pertambangan:

    • Sebelumnya,
    • FP-growth (Frequency Pattern Tree Growth) adalah algoritma pertumbuhan pohon bertipe frekuensi yang digunakan oleh para peneliti untuk mempelajari pertumbuhan pohon.
    • AprioriAll,
    • Spade.
  • Recommendation Engine (mesin rekomendasi):

    • DBR (Demographic-based Recommendation) adalah sebuah rekomendasi berbasis demografi yang ditujukan kepada para pekerja yang bekerja di sektor perkebunan.
    • CBR (Context-basedRecommendation) adalah rekomendasi berdasarkan konten yang dibuat oleh para penulis dan penulis.
    • CF (Collaborative Filtering) adalah sebuah aplikasi untuk menyaring konten yang ada di media sosial.
    • UCF (User-based Collaborative Filtering Recommendation) adalah sebuah organisasi yang berbasis di Amerika Serikat.
    • ICF (Item-based Collaborative Filtering Recommendation) adalah rekomendasi untuk penyaringan kolaboratif berdasarkan proyek.
  • Similarity Measure & Distance Measure (Pengukuran Kesamaan dan Jarak):

    • Jarak Euclidean (Jarak Eropa)
    • Perjalanan ini dilakukan oleh seorang pria yang dikenal sebagai "Manhattan Distance" (jarak Manhattan).
    • Chebyshev Distance (Jarak dari Chebyshev)
    • Minkowski Distance (dalam bahasa Inggris: Minkowski Distance)
    • Standardized Euclidean Distance (Jarak Euclidean Standardized)
    • Di sini, Anda dapat melihat beberapa gambar yang menarik dari situs web ini.
    • Cos (kekuatan cosine)
    • HammingDistance/Edit Distance (dalam bahasa Inggris).
    • Jaccard Distance (JD) adalah sebuah video yang dibuat oleh seorang blogger bernama Jaccard.
    • Correlation Coefficient Distance (jarak koefisien korelasi)
    • Informasi Entropy (dalam bahasa Inggris: Information Entropy)
    • KL ((Kullback-Leibler Divergence KL dispersi/Relative Entropy relatif kuat) ).
  • Feature Selection (Algorithm Pemilihan Fitur):

    • Mutual Information (Informasi bersama)
    • DocumentFrequence (frekuensi dokumen)
    • Informasi Gain (Mendapatkan Informasi)
    • Test Chi-squared (tes sisi kartu)
    • Gini (koefisien Gini)
  • Outlier Detection (Algoritma Deteksi Titik Keanehan):

    • Pernyataan ini disampaikan oleh seorang wartawan yang juga anggota DPR RI.
    • "Distance-based" (berdasarkan jarak)
    • Density-based (dasar kepadatan)
    • Clustering-based (berdasarkan kelompok).
  • Belajar untuk Peringkat:

    • Secara spesifik: McRank;
    • Perkalian:RankingSVM,RankNet,Frank,RankBoost;
    • AdaRank,SoftRank,LamdaMART,..

Lebih banyak