Les termes couramment utilisés pour l'apprentissage automatique et l'exploration de données

Auteur:Le petit rêve, Créé: 2017-03-20 09:58:22, mis à jour:

Les termes couramment utilisés pour l'apprentissage automatique et l'exploration de données

  • Sampling (échantillonnage):

    • L'échantillonnage aléatoire simple (SLA)
    • L'échantillonnage est effectué en ligne.
    • Les résultats de cette étude ont été publiés dans la revue Science et Technology.
    • Les résultats de l'analyse sont les suivants:
    • L'échantillonnage d'acceptation-rejet est une méthode d'échantillonnage qui consiste à échantillonner les données de l'échantillon.
    • L'importance de l'échantillonnage
    • Le MCMC (Markov Chain Monte Carlo) est un algorithme de prélèvement de Markov à Monte Carlo, développé par Metropolis-Hasting & Gibbs.
  • Clustering (groupement):

    • K signifie,
    • Les K-médiodes,
    • Deux points K-Means,
    • FK signifie,
    • Le canopé,
    • Le groupe a été créé en collaboration avec l'équipe de la société Spektral-KMeans.
    • GMM-EM (modèle Gaussian hybride - algorithme de maximisation attendu à résoudre)
    • Le projet K-Pototypes, CLARANS (basé sur la classification), a été lancé par le gouvernement de la République démocratique du Congo.
    • BIRCH (en fonction du niveau)
    • CURE (en fonction du niveau)
    • DBSCAN (basé sur la densité)
    • CLIQUE (basé sur la densité et basé sur la grille) ⇒
  • Classification et régression:

    • LR (Régression linéaire)
    • LR (Logistic Regression) est une logique de régression.
    • SR (Softmax Regression peut-être une régression logique de classe),
    • Le GLM (Generalized Linear Model) est un modèle linéaire à large définition.
    • RR ((Ridge Regression Rétrogradation de l'axe / Rétrogradation minimale double de la règle L2)),
    • LASSO (Least Absolute Shrinkage and Selectionator Operator L1 est une règle de régression minimale à deux fois)
    • RF (Forêt aléatoire)
    • DT (Arbre de décision)
    • GBDT (Gradient Boosting Decision Tree) est un arbre décisionnel basculant sur une gradiente.
    • CART (Classification and Regression Tree) est un arbre de régression de catégorisation qui est un arbre de régression de catégorisation.
    • KNN ((K-Nearest Neighbor K le plus proche du voisin))
    • SVM (Support VectorMachine),
    • KF ((KernelFunction) fonction de noyau polynomial fonction de noyau polynomial fonction de noyau polynomial fonction de noyau polynomial fonction de noyau polynomial fonction de noyau polynomial fonction de noyau polynomial fonction de noyau polynomial fonction de noyau polynomial fonction de noyau polynomial fonction de noyau polynomial
    • Fonction de noyau de Guassian Fonction de noyau de Gaussian / Radial BasisFunction Fonction de base de radius de RBF
    • La fonction de base de la chaîne est la fonction de base de la chaîne (String KernelFunction).
    • NB (Naive Bayes, Bayesian Network/Bayesian Belief Network/Belief Network) Le réseau Bayésien est un réseau de croyances basé sur la croyance en Dieu.
    • LDA (Linear Discriminant Analysis/FisherLinear Discriminant Analysis/Fisher Linear Discriminant Analysis) est une méthode utilisée par les chercheurs pour déterminer la différence entre les deux types de données.
    • EL (Enseignement d'ensemble intégré à l'apprentissage Boosting, Bagging, Stacking)
    • AdaBoost est un logiciel de boost adaptatif développé par Google.
    • MEM (Modèle de l'entropie maximale)
  • Effectiveness Evaluation (Évaluation de l'efficacité de la catégorie):

    • Il y a un autre problème avec la matrice de confusion.
    • Le nombre d'exemplaires de la série est de plus de 300.
    • L'accuracy est une mesure de l'exactitude de l'information, de l'exactitude, du score F.
    • La courbe ROC est la courbe de l'AUC, la courbe de l'AUC est la courbe de l'AUC.
    • La courbe de levage (Lift Curve), la courbe de KS (KS Curve) et la courbe de levage (Lift Curve) sont des courbes de levage.
  • PGM (Probabilistic Graphical Models) est un modèle de graphique de probabilité:

    • BN (Bayesian Network/Bayesian Belief Network/BeliefNetwork) est un réseau de croyances basé sur la croyance en Dieu.
    • MC (Markov Chain) est une chaîne de Markov.
    • Le modèle HMM (Hidden Markov Model) est un modèle de Markov qui a été inventé par les scientifiques américains.
    • MEMM (Maximum Entropy Markov Model) est un modèle d'entropie de Markov qui a été développé par les scientifiques américains pour déterminer l'entropie maximale.
    • Le CRF (Conditional Random Field) est un système de mesure de la fréquence de l'aéroport.
    • MRF (Markov Random Field à Markov Random Airport) est un aéroport de la région de Markov.
  • Il a écrit un article intitulé:

    • ANN (Réseau Neural Artificiel) est un réseau de neurones artificiels qui a été créé pour aider les personnes atteintes d'une maladie.
    • BP (Error BackPropagation) est un mot anglais qui désigne l'erreur de propagation inverse.
  • Apprentissage profond

    • Le codeur automatique (auto-encoder)
    • SAE ((Stacked Auto-encoders) est un système de numérotation automatique qui est mis en place par un système de numérotation automatique.
    • Les auto-encodeurs Sparse sont des encodeurs automatiques rares.
    • Denoising Auto-encoders est un logiciel de détection du bruit utilisé par les auto-encodeurs.
    • Les auto-encodeurs contractifs sont des machines qui utilisent des machines à coder automatiques.
    • RBM (Restricted Boltzmann Machine) est un appareil électronique électronique conçu pour être utilisé par les appareils électroniques.
    • DBN (Deep Belief Network) est un réseau de croyances profondément ancré qui a été créé par le gouvernement de l'État de New York.
    • CNN (Convolutional Neural Network) est une chaîne de télévision américaine basée à New York.
    • Word2Vec (modèle d'apprentissage vectoriel des mots) ⇒
  • DimensionalityReduction (réduction de dimension):

    • LDA Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis est une analyse linéaire qui consiste à déterminer la différence entre les deux types de discriminants.
    • L'analyse des composants principaux (PCA)
    • ICA (Analyse des composants indépendants)
    • SVD (Singular Value Decomposition) est une décomposition de valeurs singulières.
    • FA (Analyse des facteurs)
  • Le projet de loi sur l'exploitation minière de texte (TMS)

    • VSM (Vector Space Model) est un modèle d'espace vectoriel.
    • Il s'agit d'un modèle d'apprentissage vectoriel pour Word2Vec.
    • TF (Term Frequency) est un terme utilisé pour désigner une fréquence.
    • TF-IDF (Term Frequency-Inverse Document Frequency) est un ensemble de fréquences qui est utilisé pour décrire la fréquence inverse de la fréquence d'un document.
    • Il a été interpellé par un policier.
    • L'ECE (l'entropie croisée attendue) est la valeur de l'entropie croisée attendue.
    • Le QEMI (l'agence de renseignements secondaire) est un réseau de médias sociaux.
    • IG (Information Gain) est un site internet qui a été créé pour aider les internautes à améliorer leur vie privée.
    • Il y a aussi des sites de téléchargement de vidéos et de vidéos sur Internet.
    • Le coefficient de Gini est le coefficient de Gini.
    • Il y a une différence de taille entre les deux.
    • TEW (TextEvidence Weight) est un groupe de chercheurs américains qui travaillent sur le droit à l'évidence.
    • Le taux d'avantage est le plus élevé.
    • Modèle N-Gram,
    • L'analyse sémantique latente (LSA) est une méthode d'analyse sémantique utilisée par les chercheurs dans le domaine de l'analyse sémantique.
    • PLSA (Probabilistic Latent Semantic Analysis) est une analyse sémantique latente basée sur la probabilité.
    • LDA (Allocation latente des Dirichlets) est un modèle de Dirichlet potentiel.
  • Association Mining (en anglais seulement):

    • A priori,
    • L'algorithme FP-growth est un algorithme de croissance d'arbres basé sur le modèle de fréquence.
    • Avant tout,
    • Une pique.
  • Le moteur de recommandation:

    • DBR (Demographic-based Recommendation) est une recommandation basée sur les données démographiques.
    • CBR (Context-based Recommendation) est un groupe de personnes qui émettent des recommandations basées sur le contexte.
    • CF (Collaborative Filtering est un filtre collaboratif)
    • UCF (User-based Collaborative Filtering Recommendation) est un groupe de filtrage collaboratif basé sur les utilisateurs.
    • ICF (Item-based Collaborative Filtering Recommendation) est une organisation de filtrage collaboratif basée sur le projet.
  • La mesure de la similitude et la mesure de la distance

    • La distance euclidienne est la distance moyenne de la terre à la surface de la Terre.
    • La distance de Manhattan est la distance de la ville de Manhattan à partir de la ville de Manhattan.
    • La distance de Chebyshev est située entre la ville de Chebyshev et la ville de Chebyshev.
    • Il est également possible d'obtenir un permis de conduire pour un véhicule de ligne.
    • La distance euclidienne standardisée est une distance de longueur qui correspond à la distance de longueur de l'œuf.
    • La distance de Mahalanobis (à la distance de Mars) est la distance maximale de la planète à partir de laquelle elle est située.
    • Cos (c'est une consonne cosine)
    • La distance d'édition est la distance entre le texte et le contenu.
    • La distance de Jaccard est la distance maximale de la distance de Jaccard à partir de laquelle la distance de Jaccard est atteinte.
    • La distance de coefficient de corrélation est la distance de coefficient de corrélation.
    • Il y a aussi des sites de téléchargement de vidéos.
    • KL (divergence de Kullback-Leibler)
  • Le système de sélection des fonctionnalités:

    • Je suis très heureux que vous ayez été là.
    • La fréquence des documents est la fréquence des documents.
    • Le projet de loi a été lancé par le gouvernement.
    • Le test au chi-squared est un test qui permet de déterminer la taille de la peau d'un animal.
    • Le coefficient Gini est un coefficient de Gini.
  • Le détecteur de points d'exception:

    • Les statistiques sont basées sur les statistiques.
    • Le site Web de l'organisation est basé sur le site de l'organisation.
    • Les données sont basées sur la densité (Density-based).
    • Clustering-based (basé sur les clusters)
  • Apprendre à classer (basé sur l'apprentissage):

    • Dans le sens des mots:
    • Par paire: classementSVM, classementNet, franc, classementBoost;
    • Dans la liste: AdaRank, SoftRank, LamdaMART.

Plus de