Termes courants liés à l'apprentissage automatique et à l'exploration de données

发明者量化-小小梦

1364

Followers

Quantpedia

Created 2017-03-20 09:58:22

2184

Termes courants liés à l'apprentissage automatique et à l'exploration de données

Sampling (échantillonnage):
- Les résultats de l'enquête ont été publiés sur le site Web de l'agence.
- L'enquête a été menée par le groupe de travail de l'UNESCO.
- Les résultats de l'enquête ont été publiés sur le site Internet de l'agence.
- Les résultats de l'enquête ont été publiés dans le journal L'Humanité et dans le journal L'Humanité.
- L'expérience a été utilisée pour analyser les résultats de l'échantillonnage et de l'échantillonnage de l'échantillon.
- L'importance de l'échantillonnage
- MCMC (MarkovChain Monte Carlo) est une chaîne de montage électronique basée sur la chaîne de montage électronique de Markov.
Clustering (clustering) est une catégorie de clustering.
- K-Means，
- K-Mediods，
- Il y a aussi un autre exemple.
- FK-Means，
- Canopy，
- Le spectral-KMeans est un groupe de données de la catégorie Spectral-KMeans.
- GMM-EM (modèle de Gauss hybride - une solution de maximisation attendue)
- Les résultats de l'étude ont été publiés dans le journal L'Occident, publié par l'association K-Pototypes.
- BIRCH (basé sur la hiérarchie)
- CURE (basé sur les niveaux)
- DBSCAN (basé sur la densité)
- CLIQUE ((basé sur la densité et basé sur la grille))
Classification et régression:
- La régression linéaire est une méthode de calcul qui permet de calculer le nombre de fois que la régression linéaire a lieu.
- Il y a des gens qui ne sont pas d'accord avec ce que je dis, mais il y a des gens qui sont d'accord avec moi.
- SR (Softmax Regression) est une régression logique de classe Ar.
- Le modèle linéaire généralisé (GLM) est un modèle linéaire généralisé, qui est un modèle linéaire généralisé.
- RR (Ridge Regression) est la régression de la courbe / L2 par la régression de la courbe par le plus petit carré.
- LASSO ((Least Absolute Shrinkage andSelectionator Operator L1 est une régression de la plus petite valeur absolue par deux),
- RF (Forêt au hasard)
- DT: "L'arbre de décision est un arbre de décision".
- Le projet de loi sur l'arbre de décision de renforcement graduel (GBDT) a été adopté par le Parlement européen et le Conseil de l'Europe.
- CART est un arbre de classification et de régression.
- Le blogueur a également publié un billet sur son blog, "K-Nearest Neighbor K".
- SVM(Support VectorMachine)，
- KF{KernelFunction fonction nucléaire polynomialKernel Function fonction nucléaire polynomial,
- La fonction noyau de Guassian est la fonction radial de base RBF.
- La fonction de noyau de chaîne de caractères (String KernelFunction)
- Il est le fondateur du Bayesian Network/Bayesian Belief Network/Belief Network, un réseau de croyances basé sur la théorie de Bayesianism.
- LDA ((Linear Discriminant Analysis/FisherLinear Discriminant Analysis/Fisher) est une méthode d'analyse de la discrimination linéaire utilisée par les chercheurs pour déterminer la différence entre les deux types de discrimination.
- L'Ensemble Learning est une plateforme d'apprentissage intégrée de Boosting, Bagging et Stacking.
- Le projet Adaptive Boosting, qui a été lancé en 2009, est un projet qui vise à améliorer la qualité de vie des populations.
- Le modèle d'entropie maximale.
Évaluation de l'efficacité:
- La confusion est une question de temps.
- La précision, le rappel, le taux de rappel.
- La plupart des sites Web sont basés sur des sites Web de référence, tels que les sites Web d'entreprises et les sites Web d'entreprises.
- La courbe de ROC, l'aire de couverture de l'AUC,
- LiftCurve, KS Curve (en anglais seulement)
PGM (modèle de carte de probabilité des modèles graphiques probabilistiques):
- BN ((Bayesian Network/Bayesian Belief Network/ BeliefNetwork) est un réseau de croyances basé sur la théorie de l'évolution, qui est basé sur la théorie de l'évolution.
- La chaîne de Markov est une chaîne d'informations qui a été créée par le blogueur russe Mikhail Gorbachev.
- Il y a aussi un modèle de Markov, qui est un modèle de HiddenMarkov.
- Le modèle de Markov à entrée maximale (MEMM) est un modèle de Markov à entrée maximale (MEMM).
- Le CRF est un champ aléatoire conditionnel, un champ aléatoire conditionnel.
- Il a été construit par les forces de l'ordre russe à la suite de la défaite de l'aviation russe dans la bataille de Markov.
Il y a aussi un lien vers le site de l'association:
- Il a été créé en 2009 par un groupe de chercheurs de l'Université de Montréal, et il a été développé par un groupe de chercheurs de l'Université de Montréal.
- BP ((Error BackPropagation est une erreur de propagation à l'envers) }}
DeepLearning
- L'encodeur automatique (en anglais: Auto-encoder) est un logiciel de programmation de logiciels de téléphonie mobile.
- SAE est une plateforme d'encodeurs automatiques empilés.
- Sparse Auto-encoders est un éditeur de codeurs automatiques.
- Le Denoising Auto-encoders est un codeur automatique qui élimine le bruit.
- Contractive Auto-encoders est un logiciel d'enregistrement de données qui a été développé par l'équipe de développement de Contractive.
- RBM (machine à Boltzmann restreint)
- DBN (Réseau des croyances profondes) est un réseau de croyances profondes basé à New York, aux États-Unis.
- Il a été créé par un groupe d'étudiants de l'Université de Montréal, et il a été créé par un groupe de chercheurs de l'Université de Montréal.
- Word2Vec est un modèle d'apprentissage par vecteur de mots.
Dimensionalité Réduction:
- LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant Analysis est une analyse de la discrimination linéaire utilisée dans le domaine de l'analyse linéaire et de la discrimination linéaire.
- L'analyse des composants principaux (PCA)
- L'analyse des composants indépendants (ICA)
- SVD (Singular Value Decomposition) est une décomposition de valeur singulière.
- FA (Analyse des facteurs)
Le projet a été lancé par le blogueur et blogueuse de la blogosphère.
- Le modèle de l'espace vectoriel (VSM) est un modèle de l'espace vectoriel.
- Le projet Word2Vec est un modèle d'apprentissage par vecteur de mots.
- Le terme "fréquence" est utilisé pour désigner la fréquence de la communication.
- TF-IDF (Term Frequency-Inverse DocumentFrequency) est une plateforme de diffusion de documents en anglais, créée par l'association d'éditeurs et de développeurs de logiciels de diffusion de documents.
- Le blogueur a également publié un billet sur le sujet:
- Le projet de loi sur l'économie de l'espace (ECE) a été adopté par le Parlement européen et le Conseil de l'Europe.
- QEMI est une plateforme d'information secondaire.
- Il y a aussi des blogs qui ont été créés par des blogueurs et des blogueuses.
- Le rapport de l'Information Gain Ratio (IGR) a été publié par le New York Times et par le New York Times.
- Le coefficient de Gini est le coefficient de l'activité humaine.
- x2 Statistique
- TEW (TextEvidence Weight) est un groupe de blogueurs et d'écrivains qui se spécialisent dans la recherche de preuves.
- Le taux de prévalence de l'Odds Ratio (OR) est le taux de prévalence de l'Odds Ratio.
- N-Gram Model，
- L'analyse sémantique latente (LSA) est un outil d'analyse sémantique sous-jacente qui permet d'analyser le contenu de la langue.
- PLSA (Probabilistic Latent Semantic Analysis) est une analyse sémantique latente basée sur la probabilité.
- LDA est une allocation Dirichlet latente.
Association Mining (en anglais seulement):
- Apriori，
- FP-growth est un algorithme de croissance d'arbres à motif fréquent.
- AprioriAll，
- Spade。
Le moteur de recommandation (en anglais Recommendation Engine):
- DBR est une recommandation démographique basée sur la population.
- CBR (Context-basedRecommendation) est une recommandation basée sur le contexte.
- Il y a aussi le filtrage collaboratif.
- La recommandation de filtrage collaboratif basée sur l'utilisateur (UCF) est une recommandation de filtrage collaboratif basée sur l'utilisateur.
- ICF: Recommandation de filtrage collaboratif basée sur des éléments.
Mesure de similitude et mesure de distance:
- La distance euclidienne est la distance entre un point et un autre point.
- La distance de Manhattan est une distance de plus d'un kilomètre.
- La distance entre Chebyshev et la ville de Moscou est d'environ 1 km.
- La distance de Minkowski est la distance qui sépare les pays de l'Union soviétique.
- La distance euclidienne normalisée (en anglais Standardized Euclidean Distance) est une distance qui peut être calculée à partir d'une seule équation.
- Le site de Mahalanobis a été créé par un groupe d'experts de l'Université de Delhi.
- Il y a un lien entre le nombre de cosine et le nombre de cosine.
- HammingDistance/Edit Distance est un groupe de blogueurs américains qui a créé le blog HammingDistance.
- La distance de Jaccard est de plus en plus grande.
- La distance de coefficient de corrélation est la distance de coefficient de corrélation.
- Le projet de loi sur l'économie de l'information, publié par la Commission européenne,
- KL ((Kullback-Leibler Divergence KL La diffraction / Entropy Relative est relativement faible) <unk>
Sélection de caractéristiques:
- Le blogueur a également publié un billet sur son blog.
- Il est également possible d'utiliser le logiciel de partage de vidéos DocumentFrequence.
- Il y a aussi le fait que les médias ne sont pas des sources d'information.
- Le Chi-squared Test est un test qui permet d'évaluer le nombre de caractères dans un texte.
- Le coefficient de Gini.
Outlier Detection (algorithme de détection des points d'exception):
- Le blogueur a également publié un article sur le sujet.
- La plupart des gens ne sont pas d'accord avec ce qu'ils disent.
- Le projet de loi sur l'immigration est en cours de révision.
- Clustering-based (basé sur le regroupement).
Learning to Rank (Classement basé sur l'apprentissage):
- Pointwise：McRank；
- Pairwise：RankingSVM，RankNet，Frank，RankBoost；
- Listwise：AdaRank，SoftRank，LamdaMART。

Related Recommendations

HTTP 403 error Bitcoin trading by using bots Please translate the buy plan page Running botvs docker on android http://www.stevenwu.me/archives/871 Deep Learning Tutorial

Comment

All comments (0)

No data

1
20 / page

Termes courants liés à l'apprentissage automatique et à l'exploration de données

Sampling (échantillonnage):

Clustering (clustering) est une catégorie de clustering.

Classification et régression:

Évaluation de l'efficacité:

PGM (modèle de carte de probabilité des modèles graphiques probabilistiques):

Il y a aussi un lien vers le site de l'association:

DeepLearning

Dimensionalité Réduction:

Le projet a été lancé par le blogueur et blogueuse de la blogosphère.

Association Mining (en anglais seulement):

Le moteur de recommandation (en anglais Recommendation Engine):

Mesure de similitude et mesure de distance:

Sélection de caractéristiques:

Outlier Detection (algorithme de détection des points d'exception):

Learning to Rank (Classement basé sur l'apprentissage):