avatar of 发明者量化-小小梦 发明者量化-小小梦
Seguir Mensajes Privados
4
Seguir
1271
Seguidores

Términos comunes relacionados con el aprendizaje automático y la minería de datos

Creado el: 2017-03-20 09:58:22, Actualizado el:
comments   0
hits   2015

Términos comunes relacionados con el aprendizaje automático y la minería de datos

  • Muestreo:

    • En el caso de las muestras, el método de selección es el de la selección aleatoria simple.
    • OfflineSampling (Samplamiento fuera de línea, etc. con una probabilidad de K)
    • En el caso de las muestras en línea, se puede obtener un total de K.
    • El análisis de las muestras basado en la proporción (Ratio-based Sampling) es un método de análisis basado en la proporción.
    • El proceso de selección de las muestras se lleva a cabo a través de una serie de métodos de selección de la muestra.
    • Importance Sampling (Muestreo de Importancia)
    • MCMC ((MarkovChain Monte Carlo: Metropolis-Hasting & Gibbs) }} es una cadena de bloques de datos que se encuentra en el centro de la cadena de bloques de datos.
  • Clustering (agrupación):

    • K-Means,
    • K-Mediods,
    • El segundo es K-Means.
    • FK-Means,
    • Canopy,
    • Es un ejemplo de cómo el mundo puede ser diferente a lo que parece.
    • GMM-EM (modelo de Gauss híbrido - se espera que el algoritmo de maximización resuelva)
    • K-Pototypes, CLARANS (basado en las divisiones)
    • BIRCH (basado en jerarquías)
    • CURE (basado en jerarquías)
    • DBSCAN (basado en la densidad)
    • CLIQUE ((basado en la densidad y basado en la red)
  • Clasificación y regresión:

    • LR: Regresión lineal, es un término que se utiliza para referirse a la regresión lineal.
    • En la actualidad, la regresión logística es una forma de regresión que se utiliza para el cálculo de la velocidad de un sistema.
    • SR: Regresión lógica de clase Ar (Softmax)
    • El modelo lineal generalizado (GLM) es un modelo de referencia para el modelo lineal generalizado (GLM).
    • RR (Ridge Regression) Regressión de la columna / Regressión de la columna L2 a la menor ecuación (L2)
    • LASSO ((Least Absolute Shrinkage andSelectionator Operator L1 Regresión por el mínimo absoluto de las dos veces), es un operador de reducción y selección que se utiliza para calcular el retorno por el mínimo absoluto de las dos veces.
    • RF (Bosque al azar) es un blog que se dedica a la búsqueda de bosques.
    • DT: El árbol de la decisión.
    • En el caso de los árboles de decisión, los árboles de decisión son los árboles de decisión que se encuentran en el proceso de toma de decisiones, los árboles de decisión que se encuentran en el proceso de toma de decisiones.
    • CART (Clasification and Regression Tree) es un árbol de clasificación y regresión que se utiliza para clasificar los árboles de regresión.
    • El blog de K-Nearest Neighbor K es un blog de noticias y noticias que se encuentra en el sitio web oficial de K-Nearest Neighbor K.
    • SVM(Support VectorMachine),
    • KF ((KernelFunction Función de núcleo PolynomialKernel Function Función de núcleo polinomial
    • Guassian KernelFunction Función de base radial RBF Función de base radial
    • String KernelFunction (Función de núcleo de cadena)
    • NB ((Naive Bayes),BN ((Bayesian Network/Bayesian Belief Network/ Belief Network) es una red de creencias que tiene como objetivo el conocimiento de las teorías de Bayesianismo.
    • LDA ((Linear Discriminant Analysis/FisherLinear Discriminant), también conocido como LDA (Linear Discriminant Analysis/Fisher), es un método de análisis de discriminantes lineares utilizado por los investigadores de la Universidad Estatal de California (UCSF) para evaluar el comportamiento de los investigadores de la Universidad Estatal de California (UCSF).
    • EL ((Ensemble Learning integra el aprendizaje de Boosting, Bagging, Stacking), que es una herramienta de aprendizaje que permite a los estudiantes a aprender de manera más eficiente y más rápida.
    • AdaBoost es una plataforma de desarrollo de aplicaciones para el desarrollo de aplicaciones basadas en la tecnología de la información.
    • MEM (Modelo de Máxima Entropía para el modelo de mayor cube).
  • Evaluación de la efectividad:

    • Confusion Matrix (Matriz de Confusión) es una plataforma de noticias que se ha convertido en una herramienta de comunicación.
    • Precision (precisión), Recall (retorno), y el resto de las herramientas de la herramienta.
    • El objetivo de este estudio es evaluar el rendimiento de la investigación en el campo de la seguridad social.
    • La curva de ROC, el área de AUC, el área de la superficie de AUC, y el área de la superficie de la superficie de AUC.
    • LiftCurve (curva de elevación) y KS Curve (curva de KS)
  • PGM (modelo de gráfico de probabilidad de modelos gráficos probabilísticos):

    • BN ((Bayesian Network/Bayesian Belief Network/ BeliefNetwork) es una red de información sobre la religión basada en las creencias de Bayesianismo, que es una red de información basada en las creencias de Bayesianismo.
    • La cadena de Markov es una de las cadenas más grandes del mundo.
    • El modelo oculto de Markov (HMM) es el modelo de Markov que se utiliza para medir la densidad de las moléculas de carbono.
    • MEMM (Modelo de Máxima Entropía Markov) es un modelo de entropía máxima de Markov para el cálculo de la entropía máxima de un sistema.
    • CRF (Conditional Random Field) es un campo aleatorio condicional, donde el tiempo de vuelo de un avión es el mismo que el tiempo de vuelo de un avión.
    • MRF (Markov Random Field) es un aeropuerto de la ciudad de Moscú, Rusia.
  • La red neuronal es una red neuronal.

    • ANN (Red Neural Artificial) es una red neuronal artificial creada por un grupo de personas que trabajan en la red.
    • BP ((Error BackPropagation) es un error de propagación hacia atrás.
  • DeepLearning

    • El sitio web de la empresa es el sitio web de la empresa.
    • SAE: Las Auto-encoders apiladas.
    • Sparse Auto-encoders es una herramienta de codificación automática que permite a los usuarios crear y descargar códigos de forma automática.
    • Denoising Auto-encoders es una aplicación de código abierto que permite a los codificadores automáticos hacer ruido.
    • Contractive Auto-encoders es una aplicación de código abierto para el desarrollo de aplicaciones de código abierto.
    • RBM (máquina Boltzmann restringida) es una máquina de Boltzmann restringida que se encuentra en el extremo sur de la Tierra.
    • DBN (Red de Creencias Profundas) es una red de creencias profundas en el mundo.
    • La red neuronal convolutional (CNN) es una red neuronal que se ha convertido en un medio de comunicación para los seres humanos, que se ha convertido en un medio de comunicación para los humanos.
    • Word2Vec es un modelo de aprendizaje por vectores de palabras.
  • DimensionalityReduction (Reducción de las dimensiones):

    • LDA LinearDiscriminant Analysis/Fisher Linear Discriminant Análisis lineal discriminante
    • El análisis de componentes principales (PCA, por sus siglas en inglés) es un método de análisis de componentes básicos (PCA, por sus siglas en inglés).
    • ICA (Análisis de Componentes Independientes)
    • SVD (descomposición de valor singular)
    • FA ((FactorAnalysis) es una técnica de análisis de factores.
  • La minería de texto:

    • VSM es un modelo de espacio vectorial.
    • Word2Vec es un modelo de aprendizaje vectorial de palabras.
    • El blog es un medio de comunicación para los que no tienen acceso a la información.
    • TF-IDF (Term Frequency-Inverse DocumentFrequency) es una aplicación de software de búsqueda de documentos que permite a los usuarios encontrar y descargar documentos de forma inversa.
    • MI (MutualInformation) es una red de noticias y medios de comunicación en la que los ciudadanos de todo el mundo pueden compartir información.
    • ECE: “La expectativa de la entropía cruzada” es un término que se usa para referirse a la entropía cruzada esperada.
    • QEMI es una plataforma de información secundaria, que es un medio de comunicación para los ciudadanos de la India.
    • IG ((InformationGain) es el nombre de la página web de Internet de Internet de los Estados Unidos.
    • El IGR (Information Gain Ratio) es el índice de ganancias de la información, y el IGR es el índice de ganancias de la información.
    • ¿Cuál es la diferencia entre el número de personas que viven en el mundo y el número de personas que no?
    • x2 Estadísticas (x2)
    • TEW (TextEvidence Weight) es una red de noticias y noticias en línea que se centra en el tema de la evidencia textual.
    • La mayoría de los bloggers de la región están en contra de la idea de que el índice de probabilidad sea superior al índice de probabilidad.
    • N-Gram Model,
    • En la actualidad, la mayoría de los usuarios de Twitter están en línea, por lo que es muy probable que los usuarios de Twitter estén en línea.
    • PLSA ((ProbabilisticLatent Semantic Analysis) Análisis semántico latente basado en la probabilidad) es una herramienta de análisis de semántica latente basada en la probabilidad.
    • LDA ((Latent DirichletAllocation Modelo de distribución latente de Dirichlet))
  • La Asociación de Minería (Association Mining):

    • Apriori,
    • FP-growth (Frequency Pattern Tree Growth) es un algoritmo de crecimiento de árboles de patrones de frecuencia que se utiliza para medir el crecimiento de árboles de patrones de frecuencia.
    • AprioriAll,
    • Spade。
  • Recommendation Engine (Motor de Recomendaciones): Es un motor de búsqueda de contenido para la web.

    • DBR es una Recomendación basada en la demografía.
    • CBR (Recomendación basada en el contexto)
    • CF (Collaborative Filtering) es una aplicación de filtraje colaborativo que permite a los usuarios de Facebook y otras plataformas de medios de comunicación compartir sus videos.
    • UCF (Recomendación de filtrado colaborativo basado en el usuario)
    • ICF ((Item-based Collaborative Filtering Recommendation) es una recomendación de filtrado colaborativo basado en el proyecto.
  • Similarity Measure&Distance Measure (medidas de similitud y distancia):

    • La distancia euclídea es la distancia que separa a un hombre de una mujer, y la distancia que separa a un hombre de una mujer.
    • El blog de la ciudad de Nueva York, ManhattanDistance, fue creado por un grupo de blogueros y blogueras.
    • La distancia entre Chebyshev y Cheboksaryv es de aproximadamente 3 kilómetros.
    • La distancia de Minkowski es la distancia entre el hombre y la mujer.
    • La Distancia Euclídea Estandarizada es un término usado para referirse a la distancia entre el Sol y la Tierra.
    • La distancia de Mahalanobis es de aproximadamente 10 kilómetros, y la distancia de Mahalanobis es de aproximadamente 10 kilómetros.
    • Cos ((Cosine) es la raíz de la raíz de la raíz de la raíz).
    • HammingDistance/Edit Distance es un sitio web que se encuentra en el sitio web de HammingDistance.
    • La distancia de Jaccard es de unos pocos kilómetros.
    • La Correlación Coefficient Distance (Distancia de Coeficiente de Correlación) es el coeficiente de correlación entre la distancia y el valor de la correlación.
    • La información es un medio de comunicación que se utiliza para transmitir información.
    • KL ((Kullback-Leibler Divergencia KL dispersión / Entropía Relativa es relativamente baja)
  • Selección de características:

    • La información mutua es un medio de comunicación muy útil para los ciudadanos.
    • DocumentFrequence (Frecuencia de Documentos) es un sitio web que ofrece información sobre las frecuencias de documentación.
    • La información es la fuente de la vida, la fuente de la vida.
    • La prueba de chi-cuadrado es una prueba de la fuerza de un átomo de carbono.
    • Gini es el coeficiente de Gini.
  • Outlier Detection (Algoritmo de detección de puntos de excepción):

    • El blog también se centra en las estadísticas, que se basan en las estadísticas.
    • Distance-based (basado en la distancia)
    • Density-based (basado en la densidad)
    • Clustering-based (basado en el clustering) [2].
  • Learning to Rank (Clasificación por aprendizaje):

    • Pointwise:McRank;
    • Pairwise:RankingSVM,RankNet,Frank,RankBoost;
    • Listwise:AdaRank,SoftRank,LamdaMART。