avatar of 发明者量化-小小梦 发明者量化-小小梦
Suivre Messages privés
4
Suivre
1271
Abonnés

Termes courants liés à l'apprentissage automatique et à l'exploration de données

Créé le: 2017-03-20 09:58:22, Mis à jour le:
comments   0
hits   2015

Termes courants liés à l’apprentissage automatique et à l’exploration de données

  • Sampling (échantillonnage):

    • Les résultats de l’enquête ont été publiés sur le site Web de l’agence.
    • L’enquête a été menée par le groupe de travail de l’UNESCO.
    • Les résultats de l’enquête ont été publiés sur le site Internet de l’agence.
    • Les résultats de l’enquête ont été publiés dans le journal L’Humanité et dans le journal L’Humanité.
    • L’expérience a été utilisée pour analyser les résultats de l’échantillonnage et de l’échantillonnage de l’échantillon.
    • L’importance de l’échantillonnage
    • MCMC (MarkovChain Monte Carlo) est une chaîne de montage électronique basée sur la chaîne de montage électronique de Markov.
  • Clustering (clustering) est une catégorie de clustering.

    • K-Means,
    • K-Mediods,
    • Il y a aussi un autre exemple.
    • FK-Means,
    • Canopy,
    • Le spectral-KMeans est un groupe de données de la catégorie Spectral-KMeans.
    • GMM-EM (modèle de Gauss hybride - une solution de maximisation attendue)
    • Les résultats de l’étude ont été publiés dans le journal L’Occident, publié par l’association K-Pototypes.
    • BIRCH (basé sur la hiérarchie)
    • CURE (basé sur les niveaux)
    • DBSCAN (basé sur la densité)
    • CLIQUE ((basé sur la densité et basé sur la grille))
  • Classification et régression:

    • La régression linéaire est une méthode de calcul qui permet de calculer le nombre de fois que la régression linéaire a lieu.
    • Il y a des gens qui ne sont pas d’accord avec ce que je dis, mais il y a des gens qui sont d’accord avec moi.
    • SR (Softmax Regression) est une régression logique de classe Ar.
    • Le modèle linéaire généralisé (GLM) est un modèle linéaire généralisé, qui est un modèle linéaire généralisé.
    • RR (Ridge Regression) est la régression de la courbe / L2 par la régression de la courbe par le plus petit carré.
    • LASSO ((Least Absolute Shrinkage andSelectionator Operator L1 est une régression de la plus petite valeur absolue par deux),
    • RF (Forêt au hasard)
    • DT: “L’arbre de décision est un arbre de décision”.
    • Le projet de loi sur l’arbre de décision de renforcement graduel (GBDT) a été adopté par le Parlement européen et le Conseil de l’Europe.
    • CART est un arbre de classification et de régression.
    • Le blogueur a également publié un billet sur son blog, “K-Nearest Neighbor K”.
    • SVM(Support VectorMachine),
    • KF{KernelFunction fonction nucléaire polynomialKernel Function fonction nucléaire polynomial,
    • La fonction noyau de Guassian est la fonction radial de base RBF.
    • La fonction de noyau de chaîne de caractères (String KernelFunction)
    • Il est le fondateur du Bayesian Network/Bayesian Belief Network/Belief Network, un réseau de croyances basé sur la théorie de Bayesianism.
    • LDA ((Linear Discriminant Analysis/FisherLinear Discriminant Analysis/Fisher) est une méthode d’analyse de la discrimination linéaire utilisée par les chercheurs pour déterminer la différence entre les deux types de discrimination.
    • L’Ensemble Learning est une plateforme d’apprentissage intégrée de Boosting, Bagging et Stacking.
    • Le projet Adaptive Boosting, qui a été lancé en 2009, est un projet qui vise à améliorer la qualité de vie des populations.
    • Le modèle d’entropie maximale.
  • Évaluation de l’efficacité:

    • La confusion est une question de temps.
    • La précision, le rappel, le taux de rappel.
    • La plupart des sites Web sont basés sur des sites Web de référence, tels que les sites Web d’entreprises et les sites Web d’entreprises.
    • La courbe de ROC, l’aire de couverture de l’AUC,
    • LiftCurve, KS Curve (en anglais seulement)
  • PGM (modèle de carte de probabilité des modèles graphiques probabilistiques):

    • BN ((Bayesian Network/Bayesian Belief Network/ BeliefNetwork) est un réseau de croyances basé sur la théorie de l’évolution, qui est basé sur la théorie de l’évolution.
    • La chaîne de Markov est une chaîne d’informations qui a été créée par le blogueur russe Mikhail Gorbachev.
    • Il y a aussi un modèle de Markov, qui est un modèle de HiddenMarkov.
    • Le modèle de Markov à entrée maximale (MEMM) est un modèle de Markov à entrée maximale (MEMM).
    • Le CRF est un champ aléatoire conditionnel, un champ aléatoire conditionnel.
    • Il a été construit par les forces de l’ordre russe à la suite de la défaite de l’aviation russe dans la bataille de Markov.
  • Il y a aussi un lien vers le site de l’association:

    • Il a été créé en 2009 par un groupe de chercheurs de l’Université de Montréal, et il a été développé par un groupe de chercheurs de l’Université de Montréal.
    • BP ((Error BackPropagation est une erreur de propagation à l’envers) }}
  • DeepLearning

    • L’encodeur automatique (en anglais: Auto-encoder) est un logiciel de programmation de logiciels de téléphonie mobile.
    • SAE est une plateforme d’encodeurs automatiques empilés.
    • Sparse Auto-encoders est un éditeur de codeurs automatiques.
    • Le Denoising Auto-encoders est un codeur automatique qui élimine le bruit.
    • Contractive Auto-encoders est un logiciel d’enregistrement de données qui a été développé par l’équipe de développement de Contractive.
    • RBM (machine à Boltzmann restreint)
    • DBN (Réseau des croyances profondes) est un réseau de croyances profondes basé à New York, aux États-Unis.
    • Il a été créé par un groupe d’étudiants de l’Université de Montréal, et il a été créé par un groupe de chercheurs de l’Université de Montréal.
    • Word2Vec est un modèle d’apprentissage par vecteur de mots.
  • Dimensionalité Réduction:

    • LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant LDA LinearDiscriminant Analysis/Fisher Linear Discriminant Analysis est une analyse de la discrimination linéaire utilisée dans le domaine de l’analyse linéaire et de la discrimination linéaire.
    • L’analyse des composants principaux (PCA)
    • L’analyse des composants indépendants (ICA)
    • SVD (Singular Value Decomposition) est une décomposition de valeur singulière.
    • FA (Analyse des facteurs)
  • Le projet a été lancé par le blogueur et blogueuse de la blogosphère.

    • Le modèle de l’espace vectoriel (VSM) est un modèle de l’espace vectoriel.
    • Le projet Word2Vec est un modèle d’apprentissage par vecteur de mots.
    • Le terme “fréquence” est utilisé pour désigner la fréquence de la communication.
    • TF-IDF (Term Frequency-Inverse DocumentFrequency) est une plateforme de diffusion de documents en anglais, créée par l’association d’éditeurs et de développeurs de logiciels de diffusion de documents.
    • Le blogueur a également publié un billet sur le sujet:
    • Le projet de loi sur l’économie de l’espace (ECE) a été adopté par le Parlement européen et le Conseil de l’Europe.
    • QEMI est une plateforme d’information secondaire.
    • Il y a aussi des blogs qui ont été créés par des blogueurs et des blogueuses.
    • Le rapport de l’Information Gain Ratio (IGR) a été publié par le New York Times et par le New York Times.
    • Le coefficient de Gini est le coefficient de l’activité humaine.
    • x2 Statistique
    • TEW (TextEvidence Weight) est un groupe de blogueurs et d’écrivains qui se spécialisent dans la recherche de preuves.
    • Le taux de prévalence de l’Odds Ratio (OR) est le taux de prévalence de l’Odds Ratio.
    • N-Gram Model,
    • L’analyse sémantique latente (LSA) est un outil d’analyse sémantique sous-jacente qui permet d’analyser le contenu de la langue.
    • PLSA (Probabilistic Latent Semantic Analysis) est une analyse sémantique latente basée sur la probabilité.
    • LDA est une allocation Dirichlet latente.
  • Association Mining (en anglais seulement):

    • Apriori,
    • FP-growth est un algorithme de croissance d’arbres à motif fréquent.
    • AprioriAll,
    • Spade。
  • Le moteur de recommandation (en anglais Recommendation Engine):

    • DBR est une recommandation démographique basée sur la population.
    • CBR (Context-basedRecommendation) est une recommandation basée sur le contexte.
    • Il y a aussi le filtrage collaboratif.
    • La recommandation de filtrage collaboratif basée sur l’utilisateur (UCF) est une recommandation de filtrage collaboratif basée sur l’utilisateur.
    • ICF: Recommandation de filtrage collaboratif basée sur des éléments.
  • Mesure de similitude et mesure de distance:

    • La distance euclidienne est la distance entre un point et un autre point.
    • La distance de Manhattan est une distance de plus d’un kilomètre.
    • La distance entre Chebyshev et la ville de Moscou est d’environ 1 km.
    • La distance de Minkowski est la distance qui sépare les pays de l’Union soviétique.
    • La distance euclidienne normalisée (en anglais Standardized Euclidean Distance) est une distance qui peut être calculée à partir d’une seule équation.
    • Le site de Mahalanobis a été créé par un groupe d’experts de l’Université de Delhi.
    • Il y a un lien entre le nombre de cosine et le nombre de cosine.
    • HammingDistance/Edit Distance est un groupe de blogueurs américains qui a créé le blog HammingDistance.
    • La distance de Jaccard est de plus en plus grande.
    • La distance de coefficient de corrélation est la distance de coefficient de corrélation.
    • Le projet de loi sur l’économie de l’information, publié par la Commission européenne,
    • KL ((Kullback-Leibler Divergence KL La diffraction / Entropy Relative est relativement faible)
  • Sélection de caractéristiques:

    • Le blogueur a également publié un billet sur son blog.
    • Il est également possible d’utiliser le logiciel de partage de vidéos DocumentFrequence.
    • Il y a aussi le fait que les médias ne sont pas des sources d’information.
    • Le Chi-squared Test est un test qui permet d’évaluer le nombre de caractères dans un texte.
    • Le coefficient de Gini.
  • Outlier Detection (algorithme de détection des points d’exception):

    • Le blogueur a également publié un article sur le sujet.
    • La plupart des gens ne sont pas d’accord avec ce qu’ils disent.
    • Le projet de loi sur l’immigration est en cours de révision.
    • Clustering-based (basé sur le regroupement).
  • Learning to Rank (Classement basé sur l’apprentissage):

    • Pointwise:McRank;
    • Pairwise:RankingSVM,RankNet,Frank,RankBoost;
    • Listwise:AdaRank,SoftRank,LamdaMART。