Termes courants liés à l'apprentissage automatique et à l'exploration de données
Termes courants liés à l'apprentissage automatique et à l'exploration de données
Créé le: 2017-03-20 09:58:22,
Mis à jour le:
0
2015
Termes courants liés à l’apprentissage automatique et à l’exploration de données
Sampling (échantillonnage):
Les résultats de l’enquête ont été publiés sur le site Web de l’agence.
L’enquête a été menée par le groupe de travail de l’UNESCO.
Les résultats de l’enquête ont été publiés sur le site Internet de l’agence.
Les résultats de l’enquête ont été publiés dans le journal L’Humanité et dans le journal L’Humanité.
L’expérience a été utilisée pour analyser les résultats de l’échantillonnage et de l’échantillonnage de l’échantillon.
L’importance de l’échantillonnage
MCMC (MarkovChain Monte Carlo) est une chaîne de montage électronique basée sur la chaîne de montage électronique de Markov.
Clustering (clustering) est une catégorie de clustering.
K-Means,
K-Mediods,
Il y a aussi un autre exemple.
FK-Means,
Canopy,
Le spectral-KMeans est un groupe de données de la catégorie Spectral-KMeans.
GMM-EM (modèle de Gauss hybride - une solution de maximisation attendue)
Les résultats de l’étude ont été publiés dans le journal L’Occident, publié par l’association K-Pototypes.
BIRCH (basé sur la hiérarchie)
CURE (basé sur les niveaux)
DBSCAN (basé sur la densité)
CLIQUE ((basé sur la densité et basé sur la grille))
Classification et régression:
La régression linéaire est une méthode de calcul qui permet de calculer le nombre de fois que la régression linéaire a lieu.
Il y a des gens qui ne sont pas d’accord avec ce que je dis, mais il y a des gens qui sont d’accord avec moi.
SR (Softmax Regression) est une régression logique de classe Ar.
Le modèle linéaire généralisé (GLM) est un modèle linéaire généralisé, qui est un modèle linéaire généralisé.
RR (Ridge Regression) est la régression de la courbe / L2 par la régression de la courbe par le plus petit carré.
LASSO ((Least Absolute Shrinkage andSelectionator Operator L1 est une régression de la plus petite valeur absolue par deux),
RF (Forêt au hasard)
DT: “L’arbre de décision est un arbre de décision”.
Le projet de loi sur l’arbre de décision de renforcement graduel (GBDT) a été adopté par le Parlement européen et le Conseil de l’Europe.
CART est un arbre de classification et de régression.
Le blogueur a également publié un billet sur son blog, “K-Nearest Neighbor K”.
SVM(Support VectorMachine),
KF{KernelFunction fonction nucléaire polynomialKernel Function fonction nucléaire polynomial,
La fonction noyau de Guassian est la fonction radial de base RBF.
La fonction de noyau de chaîne de caractères (String KernelFunction)
Il est le fondateur du Bayesian Network/Bayesian Belief Network/Belief Network, un réseau de croyances basé sur la théorie de Bayesianism.
LDA ((Linear Discriminant Analysis/FisherLinear Discriminant Analysis/Fisher) est une méthode d’analyse de la discrimination linéaire utilisée par les chercheurs pour déterminer la différence entre les deux types de discrimination.
L’Ensemble Learning est une plateforme d’apprentissage intégrée de Boosting, Bagging et Stacking.
Le projet Adaptive Boosting, qui a été lancé en 2009, est un projet qui vise à améliorer la qualité de vie des populations.
Le modèle d’entropie maximale.
Évaluation de l’efficacité:
La confusion est une question de temps.
La précision, le rappel, le taux de rappel.
La plupart des sites Web sont basés sur des sites Web de référence, tels que les sites Web d’entreprises et les sites Web d’entreprises.
La courbe de ROC, l’aire de couverture de l’AUC,
LiftCurve, KS Curve (en anglais seulement)
PGM (modèle de carte de probabilité des modèles graphiques probabilistiques):
BN ((Bayesian Network/Bayesian Belief Network/ BeliefNetwork) est un réseau de croyances basé sur la théorie de l’évolution, qui est basé sur la théorie de l’évolution.
La chaîne de Markov est une chaîne d’informations qui a été créée par le blogueur russe Mikhail Gorbachev.
Il y a aussi un modèle de Markov, qui est un modèle de HiddenMarkov.
Le modèle de Markov à entrée maximale (MEMM) est un modèle de Markov à entrée maximale (MEMM).
Le CRF est un champ aléatoire conditionnel, un champ aléatoire conditionnel.
Il a été construit par les forces de l’ordre russe à la suite de la défaite de l’aviation russe dans la bataille de Markov.
Il y a aussi un lien vers le site de l’association:
Il a été créé en 2009 par un groupe de chercheurs de l’Université de Montréal, et il a été développé par un groupe de chercheurs de l’Université de Montréal.
BP ((Error BackPropagation est une erreur de propagation à l’envers) }}
DeepLearning
L’encodeur automatique (en anglais: Auto-encoder) est un logiciel de programmation de logiciels de téléphonie mobile.
SAE est une plateforme d’encodeurs automatiques empilés.
Sparse Auto-encoders est un éditeur de codeurs automatiques.
Le Denoising Auto-encoders est un codeur automatique qui élimine le bruit.
Contractive Auto-encoders est un logiciel d’enregistrement de données qui a été développé par l’équipe de développement de Contractive.
RBM (machine à Boltzmann restreint)
DBN (Réseau des croyances profondes) est un réseau de croyances profondes basé à New York, aux États-Unis.
Il a été créé par un groupe d’étudiants de l’Université de Montréal, et il a été créé par un groupe de chercheurs de l’Université de Montréal.
Word2Vec est un modèle d’apprentissage par vecteur de mots.
Dimensionalité Réduction:
LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant Analysis est une analyse de la discrimination linéaire utilisée dans le domaine de l’analyse linéaire et de la discrimination linéaire.
L’analyse des composants principaux (PCA)
L’analyse des composants indépendants (ICA)
SVD (Singular Value Decomposition) est une décomposition de valeur singulière.
FA (Analyse des facteurs)
Le projet a été lancé par le blogueur et blogueuse de la blogosphère.
Le modèle de l’espace vectoriel (VSM) est un modèle de l’espace vectoriel.
Le projet Word2Vec est un modèle d’apprentissage par vecteur de mots.
Le terme “fréquence” est utilisé pour désigner la fréquence de la communication.
TF-IDF (Term Frequency-Inverse DocumentFrequency) est une plateforme de diffusion de documents en anglais, créée par l’association d’éditeurs et de développeurs de logiciels de diffusion de documents.
Le blogueur a également publié un billet sur le sujet:
Le projet de loi sur l’économie de l’espace (ECE) a été adopté par le Parlement européen et le Conseil de l’Europe.
QEMI est une plateforme d’information secondaire.
Il y a aussi des blogs qui ont été créés par des blogueurs et des blogueuses.
Le rapport de l’Information Gain Ratio (IGR) a été publié par le New York Times et par le New York Times.
Le coefficient de Gini est le coefficient de l’activité humaine.
x2 Statistique
TEW (TextEvidence Weight) est un groupe de blogueurs et d’écrivains qui se spécialisent dans la recherche de preuves.
Le taux de prévalence de l’Odds Ratio (OR) est le taux de prévalence de l’Odds Ratio.
N-Gram Model,
L’analyse sémantique latente (LSA) est un outil d’analyse sémantique sous-jacente qui permet d’analyser le contenu de la langue.
PLSA (Probabilistic Latent Semantic Analysis) est une analyse sémantique latente basée sur la probabilité.
LDA est une allocation Dirichlet latente.
Association Mining (en anglais seulement):
Apriori,
FP-growth est un algorithme de croissance d’arbres à motif fréquent.
AprioriAll,
Spade。
Le moteur de recommandation (en anglais Recommendation Engine):
DBR est une recommandation démographique basée sur la population.
CBR (Context-basedRecommendation) est une recommandation basée sur le contexte.
Il y a aussi le filtrage collaboratif.
La recommandation de filtrage collaboratif basée sur l’utilisateur (UCF) est une recommandation de filtrage collaboratif basée sur l’utilisateur.
ICF: Recommandation de filtrage collaboratif basée sur des éléments.
Mesure de similitude et mesure de distance:
La distance euclidienne est la distance entre un point et un autre point.
La distance de Manhattan est une distance de plus d’un kilomètre.
La distance entre Chebyshev et la ville de Moscou est d’environ 1 km.
La distance de Minkowski est la distance qui sépare les pays de l’Union soviétique.
La distance euclidienne normalisée (en anglais Standardized Euclidean Distance) est une distance qui peut être calculée à partir d’une seule équation.
Le site de Mahalanobis a été créé par un groupe d’experts de l’Université de Delhi.
Il y a un lien entre le nombre de cosine et le nombre de cosine.
HammingDistance/Edit Distance est un groupe de blogueurs américains qui a créé le blog HammingDistance.
La distance de Jaccard est de plus en plus grande.
La distance de coefficient de corrélation est la distance de coefficient de corrélation.
Le projet de loi sur l’économie de l’information, publié par la Commission européenne,
KL ((Kullback-Leibler Divergence KL La diffraction / Entropy Relative est relativement faible)
Sélection de caractéristiques:
Le blogueur a également publié un billet sur son blog.
Il est également possible d’utiliser le logiciel de partage de vidéos DocumentFrequence.
Il y a aussi le fait que les médias ne sont pas des sources d’information.
Le Chi-squared Test est un test qui permet d’évaluer le nombre de caractères dans un texte.
Le coefficient de Gini.
Outlier Detection (algorithme de détection des points d’exception):
Le blogueur a également publié un article sur le sujet.
La plupart des gens ne sont pas d’accord avec ce qu’ils disent.
Le projet de loi sur l’immigration est en cours de révision.
Clustering-based (basé sur le regroupement).
Learning to Rank (Classement basé sur l’apprentissage):