Los términos más usados para el aprendizaje automático y la extracción de datos

El autor:Un sueño pequeño., Creado: 2017-03-20 09:58:22, Actualizado:

Los términos más usados para el aprendizaje automático y la extracción de datos

  • Sampling (Sample) (en inglés):

    • El resultado de este estudio es que la mayoría de las personas que se encuentran en el mercado de trabajo no tienen la capacidad de elegir el tipo de trabajo que desean.
    • La mayoría de las personas que usan este método son mujeres, pero la mayoría de las mujeres no lo usan.
    • En línea (es decir, en línea, es posible que sea K)
    • El análisis de las muestras se realiza a partir de datos obtenidos por los expertos.
    • La muestra de aceptación-rechazo es la muestra de aceptación-rechazo.
    • Importance Sampling (la toma de muestras de importancia)
    • MCMC ((MarkovChain Monte Carlo Algorithm de muestreo de Monte Carlo de Markov: Metropolis-Hasting & Gibbs))).
  • Clustering (grupo):

    • K-significa,
    • Las medias K,
    • Los dos puntos de K-Means,
    • FK-significa,
    • el techo,
    • Es una de las principales razones por las que los usuarios de Facebook están usando este tipo de contenido para crear sus propios blogs.
    • GMM-EM (modelo de Gauss híbrido - algoritmos de maximización esperados para resolver),
    • K-Pototypes, CLARANS (basado en la clasificación) y K-Pototypes (basado en la clasificación) han desarrollado una serie de proyectos de investigación y desarrollo.
    • BIRCH (basado en el nivel)
    • CURE (basado en el nivel)
    • DBSCAN (basado en la densidad)
    • CLIQUE (basado en la densidad y en la red).
  • Classification & Regression (Clasificación y regresión):

    • La regresión lineal (LR) es la regresión lineal que se produce en el tiempo.
    • LR (regresión lógica de logística)
    • SR (Softmax Regression, probablemente regreso lógico de clase)
    • GLM (Generalized Linear Model) es un modelo lineal en sentido amplio, que se utiliza para generar las líneas generalizadas.
    • RR ((Ridge Regression Regression/L2 Regular Regressión Mínima Doble))
    • LASSO ((Least Absolute Shrinkage and Selectionator Operator L1 regra de la regresión mínima de dos veces)
    • RF (Foresta aleatoria)
    • DT (DecisionTree) es un árbol de decisión que se encuentra en el centro de la ciudad de Nueva York.
    • El GBDT (Gradient Boosting Decision Tree) es un árbol de decisión que aumenta el grado de crecimiento de los procesos de decisión.
    • CART (ClassificationAnd Regression Tree) es una categoría de árboles de regresión que incluye los árboles de clasificación y regresión.
    • K-Nearest Neighbor (K-Negro más cercano)
    • SVM ((Suporte VectorMachine),
    • KF ((KernelFunction) Función de núcleo Polinomial Función de núcleo de polinomios
    • Función del núcleo de Guassian Función del núcleo de Gaussian Función del núcleo de Gaussian / Función de base radial Función de base radial
    • String KernelFunction (función de núcleo de la cadena)
    • NB (Naive Bayes, Bayesian Network/Bayesian Belief Network/Belief Network), también conocido como Bayesian Network/Bayesian Belief Network/Belief Network, también conocido como Bayesian Network/Bayesian Belief Network/Belief Network, también conocido como Bayesian Network/Bayesian Belief Network/Belief Network.
    • LDA (Linear Discriminant Analysis/FisherLinear Discriminant Analysis/Fisher Linear Discriminant Analysis) es un método de análisis que se utiliza para determinar el grado de diferenciación entre los componentes de una misma molécula.
    • EL (Ensemble Learning integra el aprendizaje de Boosting, Bagging, Stacking) es una plataforma de aprendizaje que permite a los estudiantes aprender de forma más rápida y rápida.
    • AdaBoost (Boosting adaptativo) es una aplicación de desarrollo de aplicaciones para mejorar la capacidad de adaptación de los usuarios.
    • MEM (Modelo de máxima entropía del modelo de mayor cilindrada).
  • Evaluación de la eficacia:

    • La Confusion Matrix (Matriz de confusión) es una matriz de confusión en la que los usuarios de Internet pueden encontrar información acerca de la matriz de confusión.
    • La precisión (precisión), el recalque (tasa de recuperación), la precisión (precisión), el recalque (tasa de recuperación) y el recalque (tasa de recuperación).
    • La precisión (acuridad), el F-score (puntuación F) y el valor de la puntuación (puntuación F).
    • La curva de ROC, la superficie de la AUC, el tamaño de la curva de ROC, la longitud de la curva de ROC, la longitud de la curva de ROC, la longitud de la curva de ROC, la longitud de la curva de ROC, la longitud de la curva de ROC, la longitud de la curva de ROC, la longitud de la curva de ROC, la longitud de la curva de AUC, la longitud de la curva de ROC, la longitud de la curva de ROC, la longitud de la curva de AUC, la longitud de la curva de AUC.
    • Lift Curve (curva de elevación) y KS Curve (curva de KS)
  • PGM (Probabilistic Graphical Models Probabilidad de los modelos gráficos):

    • BN ((Redes Bayesianas/Redes de creencias Bayesianas/Redes de creencias)
    • MC (Markov Chain) es una cadena de Markov que se encuentra en el centro de la Tierra.
    • HMM (Hidden Markov Model) El modelo de Markov oculto es el modelo de Markov oculto que se encuentra en la parte superior de la base de datos.
    • MEMM (Maximum Entropy Markov Model) es el modelo de entropía de Markov más grande que existe en el mundo.
    • CRF (Conditional Random Field) es un campo aleatorio condicional, donde los aeropuertos son seleccionados de forma aleatoria.
    • MRF ((Markov Random Field en el Aeropuerto Random de Markov) ).
  • NN (Red Neural):

    • ANN (Redes Neurales Artificiales) es una red de redes neurales artificiales que se ha desarrollado en todo el mundo.
    • BP (Error BackPropagation) es un error de propagación inversa que se produce cuando el virus se propaga hacia atrás.
  • Aprendizaje profundo

    • Auto-encoder (encodador automático)
    • SAE (Stacked Auto-encoders) es un conjunto de codificadores automáticos que se acumulan.
    • En la actualidad, la mayoría de los usuarios de Sparse Auto-encoders están utilizando el código de código automático Sparse.
    • Denoising Auto-encoders para bloquear el ruido de los auto-encoders
    • Los encoders automáticos contractivos (CPA) son los encoders automáticos contractivos que se usan para codificar datos.
    • RBM (Restricted Boltzmann Machine) es una máquina de boltzmann limitada, diseñada por el fabricante de máquinas de boltzmann.
    • DBN (Red de Creencias Profundas) es una red de creencias profundas que se centra en las creencias profundas.
    • CNN (Convolutional Neural Network) es una red de neuronas convulsivas que se ha convertido en una de las redes más conocidas del mundo.
    • Word2Vec (modelo de aprendizaje de vectores de palabras)
  • DimensionalityReduction (reducción de dimensión):

    • Análisis lineal discriminante LDA/Análisis lineal discriminante Fisher
    • El PCA (Análisis de componentes principales) es un sistema de análisis de componentes basado en el análisis de componentes principales.
    • El ICA (Análisis de Componentes Independientes) es un grupo de expertos en análisis de componentes independientes.
    • SVD (descomposición de valor singular)
    • FA (Análisis por factores).
  • Text Mining (minería de texto):

    • VSM (Vector Space Model) es el modelo de espacio vectorial que se utiliza para crear un modelo de espacio vectorial.
    • Word2Vec (modelo de aprendizaje de vectores de palabras)
    • TF (término de frecuencia)
    • TF-IDF (Term Frequency-Inverse Document Frequency) es un programa de traducción de textos de la lengua inglesa que se utiliza para traducir y traducir documentos en inglés.
    • MI (MutualInformation) es una red de noticias que informa a los ciudadanos de todo el mundo acerca de los ataques terroristas.
    • ECE (Expected Cross Entropy) (Entropía cruzada esperada)
    • El blog QEMI (en inglés) es un sitio web de noticias secundarias.
    • IG (Information Gain) es un sitio web de noticias que ofrece información sobre el aumento de las ganancias de los usuarios.
    • El IGR (Information Gain Ratio) es el índice de ganancia de información, que es el porcentaje más alto de los datos de la información.
    • El Gini (coeficiente de Gini) es el valor de la diferencia entre el precio de la moneda y el precio de la moneda.
    • ¿Qué es esto? ¿Qué es esto?
    • TEW (TextEvidence Weight) es una organización de derechos humanos que trabaja en el ámbito de la protección de los derechos humanos.
    • La probabilidad de ventaja de las probabilidades (Odds Ratio)
    • el modelo N-Gram,
    • LSA (Análisis Semántico Latente) es una herramienta de análisis de semántica que se utiliza para analizar la semántica latente.
    • PLSA (Probabilistic Latent Semantic Analysis, análisis semántico latente basado en la probabilidad) es un análisis semántico basado en la probabilidad.
    • LDA (Allocación latente de Dirichlet, modelo potencial de Dirichlet)
  • Asociación de Minería (Extracción asociada):

    • En primer lugar,
    • FP-growth (Algorithm de crecimiento de árboles con patrones de frecuencia)
    • En primer lugar,
    • Es una pica.
  • El motor de recomendación:

    • DBR (Demographic-based Recommendation) es una recomendación basada en las estadísticas demográficas, que se basa en el número de personas que viven en el país.
    • En la actualidad, la mayoría de las recomendaciones se basan en el contenido, y la mayoría de las recomendaciones se basan en el contexto.
    • CF (Filtro colaborativo) es un filtro de colaboración que permite a los usuarios filtrar información de manera independiente.
    • UCF (User-based Collaborative Filtering Recommendation) es un sitio web de filtración colaborativa basado en el usuario.
    • ICF (Item-based Collaborative Filtering Recommendation) (Recomendación de filtración colaborativa basada en el objeto)
  • Similarity Measure&Distance Measure (Medida de similitud y distancia):

    • La distancia euclidiana es la distancia de la Tierra a la Tierra.
    • En la actualidad, la ciudad de Nueva York es la capital de la región.
    • En el caso de Chebyshev Distance (Distancia Chebyshev), el número de personas que se encuentran en el lugar de la muerte es de alrededor de 100 personas.
    • En el caso de los niños, la distancia de Minkowski es de un kilómetro y medio.
    • Distanza euclidiana estandarizada (distanza euclidiana estandarizada)
    • La distancia de Mahalanobis (la distancia de Marte) es de aproximadamente un kilómetro.
    • Cos (Cosín consonante)
    • HammingDistance/Edit Distance (Distancia de Hamming/Distancia de edición), también conocido como HammingDistance/Edit Distance, es un código de código abierto que permite a los usuarios editar datos de forma automática.
    • La distancia de Jaccard es la distancia de la distancia de Jaccard a la distancia de Jaccard.
    • La distancia del coeficiente de correlación
    • La información entropía (en inglés: Information Entropy) es una plataforma de información que se ha desarrollado en los Estados Unidos.
    • KL ((Divergencia de Kullback-Leibler KL dispersión/Relativa entropía en relación con el acelerador) ).
  • Selección de características (algorismo de selección de características):

    • En la página web de la organización, se puede leer:
    • DocumentFrequence (Frecuencia de los documentos)
    • La información ganada es la información ganada.
    • El Chi-squared Test es una prueba que se realiza a través de una serie de métodos.
    • El coefficiente Gini es el coeficiente de Gini.
  • El sistema de detección de puntos de anomalía (Outlier Detection):

    • El proyecto está basado en datos estadísticos.
    • En la actualidad, la mayoría de los usuarios de Twitter están conectados a Facebook.
    • Density-based (basado en la densidad)
    • Clustering-based (basado en el clustering)
  • Aprendiendo a clasificar:

    • En cuanto a los puntos: McRank;
    • En pares: RankingSVM,RankNet,Frank,RankBoost;
    • En la lista: AdaRank, SoftRank, LamdaMART.

Más.