avatar of 发明者量化-小小梦 发明者量化-小小梦
konzentrieren Sie sich auf Private Nachricht
4
konzentrieren Sie sich auf
1271
Anhänger

Allgemeine Begriffe zum maschinellen Lernen und Data Mining

Erstellt in: 2017-03-20 09:58:22, aktualisiert am:
comments   0
hits   2015

Allgemeine Begriffe zum maschinellen Lernen und Data Mining

  • Sampling (Stichprobe):

    • Einfach zufällige Stichproben (Simple Random Sampling)
    • Offline-Sampling ist eine Methode, mit der die Daten von Männern, Frauen und Männern offline analysiert werden können.
    • Online-Sampling (z.B. möglicherweise K-Sampling)
    • Ratio-based Sampling (RBSS) ist eine Methode, die sich auf das Ratio-basierte Sampling (RBSS) stützt.
    • Acceptance-RejectionSampling (A-R-Sampling) ist eine Methode, mit der die Proben von Personen, die sich für eine Stichprobe entschieden haben, in die Stichprobe aufgenommen werden können.
    • Im Gegensatz zu den meisten anderen Ländern, in denen die Zahl der Probanden sehr hoch ist, ist die Zahl der Probanden gering.
    • MCMC ((MarkovChain Monte Carlo: Metropolis-Hasting & Gibbs) }}
  • Clustering:

    • K-Means,
    • K-Mediods,
    • Das ist eine gute Idee.
    • FK-Means,
    • Canopy,
    • Die Spektral-K-Means-Gruppierung ist ein weiteres Beispiel für die Spektral-K-Means-Gruppierung.
    • Das ist ein Beispiel dafür, wie die Massenverteilung in der Massenverteilung der Massenverteilung in der Massenverteilung der Massenverteilung der Massenverteilung in der Massenverteilung der Massenverteilung in der Massenverteilung der Massenverteilung in der Massenverteilung funktioniert.
    • K-Pototypes, CLARANS (auf der Grundlage von Zuteilungen)
    • BIRCH (auf der Grundlage von Hierarchien)
    • CURE (auf der Grundlage von Schichten)
    • DBSCAN (auf Basis der Dichte)
    • CLIQUE ((Dichte und Gitter basiert))
  • Classification&Regression: Die Klassifizierung und Regression:

    • Das ist eine sehr interessante Methode, die sich in der letzten Zeit sehr gut entwickelt hat.
    • Die LogisticRegression ist eine logische Regression.
    • SR (Softmax Regression) ist eine logische Regression der Arithmetikklasse.
    • Das GLM (Generalized Linear Model) ist ein lineares Modell in der allgemeinen Definition.
    • RR (Ridge Regression)
    • LASSO ((Least Absolute Shrinkage andSelectionator Operator L1 ist die reguläre minimale Doppelrückkehr),
    • RF (zufälliger Wald)
    • Das ist eine sehr wichtige Frage, die sich in den letzten Jahren immer wieder stellt.
    • GBDT (Gradient BoostingDecision Tree) ist eine Webseite, die sich mit der Entwicklung von Gradient-Boosting-Decision-Trees befasst.
    • CART (Classification And Regression Tree) ist ein System, das die Klassifizierung und Regression von Regressionsbäumen erlaubt.
    • Die Nachrichtenagentur KNN berichtete, dass die Nachbarschaft von K-Nearest Neighbor (KNN) die Nachbarschaft von K-Nearest Neighbor (KNN) ist.
    • SVM(Support VectorMachine),
    • KF ((KernelFunction Kernfunktionen PolynomialKernel Function Kernfunktionen mit mehrfacher Kernform,
    • Guassian KernelFunction Guassian KernelFunction/Radial BasisFunction RBF Radialbasisfunktionen
    • String KernelFunction (String-Kernel-Funktion) ist eine String-Kernel-Funktion.
    • NB ((Naive Bayes),BN ((Bayesian Network/Bayesian Belief Network/ Belief Network), die von Bayesian Beliefs ausgerichtet ist, ist ein Netzwerk von Bayesian Beliefs, das sich auf die Behauptung von Bayesianism ausrichtet, dass die Behauptung von Bayesianismus die Behauptung von Bayesianismus ist.
    • LDA ((Linear Discriminant Analysis/FisherLinear Discriminant) ist eine Methode, mit der man die LDA (Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis) als eine Methode definiert, die die LDA (Linear Discriminant Analysis) als eine Methode definiert.
    • Das Ensemble Learning integriert Boosting, Bagging, Stacking, und das Ensemble Learning ist ein Programm, das sich auf die Entwicklung von Lernprozessen konzentriert.
    • Adaptive Boosting ist ein Projekt, das sich auf die Entwicklung von Adaptive Boosting konzentriert, das sich auf die Entwicklung von Adaptive Boosting konzentriert.
    • Das Maximum-Entropie-Modell (MEM)
  • Effektivitätsbewertung:

    • Die Konfusion Matrix ist ein Konzept, das sich in der Vergangenheit entwickelt hat.
    • Das sind die drei Hauptmerkmale von Precision, Recall und Recall.
    • Die Ergebnisse der Studie werden in den folgenden Kategorien veröffentlicht:
    • ROC-Kurve, AUC, AUC-Fläche,
    • LiftCurve, KS Curve
  • PGM (Probabilistic Graphical Models) ist ein Probabilitätsmodell.

    • BN ((Bayesian Network/Bayesian Belief Network/ BeliefNetwork) ist ein Netzwerk von Bayesischen Glaubensgemeinschaften, das sich aus einer Reihe von Beliefsgruppen zusammensetzt.
    • Die Markov-Kette ist eine von den wichtigsten Werken der ukrainischen Geschichte.
    • Das HMM (Hidden Markov Model) ist ein Modell, das auf der Grundlage von Realität und Logik entwickelt wurde.
    • MEMM (Maximum Entropy Markov Model) ist ein Modell, das das Maximum Entropy Markov-Modell (MEMM) definiert.
    • CRF (Conditional Random Field) ist ein Flughafen, der von der Flughafenbehörde der USA geführt wird.
    • MRF (Markov Random Field)
  • Das ist eine sehr schwierige Aufgabe, die ich nicht bewältigen kann.

    • Das ist eine Art von “Artificial Neural Network” (ANN), ein künstliches neuronales Netzwerk.
    • BP ((Error BackPropagation) }}
  • DeepLearning

    • Auto-Encoder (Automatischer Encoder) ist eine Software, die sich mit dem Auto-Encoder verbinden kann.
    • SAE (Stacked Auto-encoders) ist eine Software, die automatische Codierer aufstapelt, um Daten zu erfassen.
    • Sparse Auto-encoders ist ein sparsamer Auto-Encoder.
    • Denoising Auto-encoders, die automatische Codierer zum Lärmen bringen.
    • Contractive Auto-encoders ist ein Programm, das sich mit der Entwicklung von Contractive Auto-encoders befasst.
    • RBM (Restricted Boltzmann Machine) ist eine Maschine, die in der Lage ist, die RBM-Werte zu bestimmen.
    • Das Deep Belief Network (DBN) ist ein Netzwerk, das sich mit der Frage beschäftigt, wie man den Glauben in der Welt verändern kann.
    • Das Convolutional Neural Network (CNN) ist ein Netzwerk von Neuronen, die sich in der Vergangenheit entwickelt haben.
    • Word2Vec (Word-Vektor-Lernmodell)
  • Dimensionalität Reduktion:

    • LDA LinearDiscriminant Analysis/Fisher Linear Discriminant Linear Discriminant Analysis/Fisher Linear Discriminant ist eine Methode, mit der man die LDA-Linien unterscheidet.
    • PCA (Principal Component Analysis) ist ein Programm, das sich mit der Analyse der Hauptkomponenten befasst.
    • Die ICA (Independent Component Analysis) ist eine Organisation, die sich mit der Analyse von unabhängigen Komponenten befasst.
    • SVD (Singular Value Decomposition) ist eine Singular-Value-Decomposition, die sich auf die Singular-Value-Decomposition bezieht.
    • FA (Faktoranalyse)
  • Text-Mining: Das ist eine sehr interessante Methode.

    • VSM (Vektorraummodell)
    • Word2Vec, ein Modell für das Vektorlernen von Wörtern, ist eine neue Version von Word.org.
    • Das ist eine sehr schwierige Aufgabe.
    • TF-IDF ((Term Frequency-Inverse DocumentFrequency) ist ein Programm, das sich auf die Inverse-Dokumentfrequenz bezieht.
    • Das ist eine sehr schwierige Aufgabe, die wir uns nicht leisten können.
    • ECE: “Die erwartete Kreuzentropie”
    • QEMI (zweite Informationsleiste)
    • IG ((InformationGain)) ist ein Blog, der sich mit der Entwicklung von Informationsgewinn beschäftigt.
    • Das Internet ist eine der wichtigsten Plattformen der Welt.
    • Das ist der Gini-Koeffizient.
    • x2 Statistic ((x2 Statistiken)), die von der Regierung des Vereinigten Königreichs veröffentlicht wurden.
    • TEW (TextEvidence Weight) ist eine Organisation, die sich für die Beurteilung von Texten einsetzt.
    • Das ist die einzige Möglichkeit, die wir haben.
    • N-Gram Model,
    • LSA (Latent Semantic Analysis) ist ein Programm, das sich mit der Semantik von Latent Semantic Analysis befasst.
    • PLSA (Probabilistic Latent Semantic Analysis) ist eine Probabilitätsbasierte potentielle Semantik.
    • LDA (Latent Dirichlet Allocation)
  • Association Mining (mit Verknüpfung zu Bergbau):

    • Apriori,
    • FP-growth (Frequency Pattern Tree Growth) ist ein Algorithmus, der das Wachstum von Frequenzmustern in Bäumen erlaubt.
    • AprioriAll,
    • Spade。
  • Empfehlungs-Engine:

    • DBR (Demographic-based Recommendation) ist eine Empfehlung, die demographisch basiert und die von der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe der Bevölkerungsgruppe)
    • CBR (Context-basedRecommendation) ist ein Kontext-basierter Empfehlungssatz, der sich auf die Inhalte bezieht.
    • CF (Collaborative Filtering) ist ein Projekt, das sich mit der Entwicklung von Filtern und Filtern in der Öffentlichkeit beschäftigt.
    • UCF (User-based Collaborative Filtering Recommendation) ist eine Empfehlung für die Nutzer, die gemeinsam Filter durchführen.
    • ICF: “Item-based Collaborative Filtering Recommendation” (ICF: “Item-based Collaborative Filtering Recommendation”) ist eine Empfehlung für das Projekt, in dem ein Kollaborationsfilter eingesetzt wird.
  • Ähnlichkeits- und Entfernungsmaß:

    • Die Euclidische Distanz (Euclidean Distance)
    • Die ManhattanDistance ist ein Blog, der sich mit der Frage beschäftigt, wie man sich mit dem Internet auseinandersetzt.
    • Die Distanz zwischen Tschebyschew und Tschetschew ist etwa 30 Kilometer.
    • Die Minkowski-Distanz ist eine Distanz, die zwischen zwei Distanzen liegt.
    • Die Standardisierte Euklidische Distanz (Standardized Euclidean Distance) ist eine Standardisierte Euklidische Distanz.
    • Die Entfernung zwischen Mahalanobis und Marsch ist ungefähr so groß wie die Entfernung zwischen Marsch und Mars.
    • Das ist die Art, wie wir uns das Leben gestalten.
    • HammingDistance/Edit Distance ist eine Webseite, die sich mit dem Thema “Hamming” beschäftigt.
    • JaccardDistance ist ein Blog, der sich mit der Frage beschäftigt, wie man den Menschen helfen kann, sich zu verändern.
    • Der Korrelationskoeffizienten-Abstand ist der Abstand zwischen den Korrelationskoeffizienten.
    • Das Internet ist eine Art Informationsentropie.
    • KL ((Kullback-Leibler Divergenz KL Differenz/Relative Entropy relativ hoch) )
  • Feature Selection (Algorithmus zur Auswahl von Merkmalen):

    • Wir sind nicht mehr in der Lage, das zu tun.
    • Das ist eine sehr wichtige Frage, die sich in den letzten Jahren immer wieder stellt.
    • Information Gain (Informationsgewinn) ist eine der wichtigsten Themen der Welt.
    • Der Chi-Quadrat-Test ist ein Test, bei dem der Wert des Quadrats der Quadratzähler in der Quadratzähler-Skala angegeben wird.
    • Gini (Gini-Koeffizient)
  • Outlier Detection (Algorithmus zur Erkennung von Ausnahmepunkten):

    • Das ist eine sehr wichtige Frage, die sich in den letzten Jahren immer wieder stellt.
    • Das ist eine sehr wichtige Frage, die sich in den letzten Jahren immer wieder gestellt hat.
    • Density-based (dichtebasiert)
    • Clustering-based (clusterbasiert)
  • Learning to Rank (auf der Grundlage von Erfahrungen sortiert):

    • Pointwise:McRank;
    • Pairwise:RankingSVM,RankNet,Frank,RankBoost;
    • Listwise:AdaRank,SoftRank,LamdaMART。