Часто используемые термины для машинного обучения и добычи данных

Автор:Маленькие мечты, Создано: 2017-03-20 09:58:22, Обновлено:

Часто используемые термины для машинного обучения и добычи данных

  • Sampling (выборка):

    • Simple Random Sampling (Простое рандомирование)
    • OfflineSampling (возможно, K-выборка в автономном режиме и т.д.)
    • Онлайн-выборка (возможно, K-выборка онлайн и т.д.)
    • Ratio-based Sampling (Распорное рандомизирование)
    • Принятие-отторжение выборки
    • Примечание:
    • MCMC ((MarkovChain Monte Carlo Марковский алгоритм выборки Монте-Карло: Metropolis-Hasting & Gibbs))).
  • Clustering (группировка):

    • К-означает,
    • К-средний,
    • Второй пункт K-Means,
    • FK-значит,
    • Покрывало,
    • Спектр-KMeans (Спектр-KMeans)
    • GMM-EM ((Гибридная модель Гаусса - ожидаемое решение алгоритма максимизации))
    • К-Пототипы, КЛАРАНС (на основе классификации)
    • BIRCH (по уровню)
    • CURE (по уровню)
    • DBSCAN (на основе плотности)
    • CLIQUE (на основе плотности и на основе решетки).
  • Classification & Regression (Классификация и регрессия):

    • LR (линейная регрессия)
    • LR (Логистическая регрессия логической регрессии)
    • SR (Softmax Regression, возможно, логическое регрессирование классов)
    • GLM (Generalized Linear Model) - генерализованная линейная модель в широком смысле.
    • RR (Ridge Regression) - регрессия рентабельности/L2 - регулярная минимальная двойная регрессия)
    • LASSO ((Least Absolute Shrinkage and Selectionator Operator L1 правильный минимальный двукратный регресс))
    • RF (Рассказ о лесах)
    • DT (DecisionTree) - дерево решения, созданное в 2010 году.
    • GBDT (Gradient Boosting Decision Tree) - дерево решения с понижающимся градиентом.
    • CART (ClassificationAnd Regression Tree) - классификационный регрессионный дерево.
    • KNN ((K-Nearest Neighbor K-ближайший сосед),
    • SVM ((поддержка VectorMachine),
    • KF ((KernelFunction) Ядерная функция PolynomialKernel Function, многопольная ядерная функция,
    • Guassian KernelFunction Гауссианская ядерная функция/Радиальная BasisFunction RBF диаметр к базе,
    • String KernelFunction (Страничная ядровая функция)
    • NB (Naive Bayes, Bayesian Belief Network, Belief Network, Bayesian Network, Bayesian Belief Network) (Байесовская сеть) (Байесовская сеть)
    • LDA ((Linear Discriminant Analysis/FisherLinear Discriminant Analysis/FisherLinear Discriminant Analysis) - анализ линейного дискриминатора, выполненный с помощью линейного дискриминатора, который используется для определения линейного дискриминатора, или для определения линейного дискриминатора, выполненного с помощью линейного дискриминатора.
    • EL (Ensemble Learning) интегрирует обучение Boosting, Bagging, Stacking и другие.
    • AdaBoost (Адаптивный Boosting) - это программа, которая позволяет пользователям улучшать свои привычки.
    • MEM (максимальная энтропическая модель).
  • Effectiveness Evaluation (Оценка эффективности):

    • В этом случае, если вы не хотите, чтобы ваш ребенок был сбит с толку, вы должны быть готовы.
    • Прецизия (точность), Recall (скорость отзыва),
    • Показатели: Accuracy (точность), F-score (F-баллы),
    • ROC Curve (ROC кривая), AUC (AUC площадь),
    • LiftCurve, KS Curve (Крёстная кривая)
  • PGM (Probabilistic Graphical Models) - вероятностная диаграмма моделей:

    • BN ((Bayesian Network/Bayesian Belief Network/BeliefNetwork) Сеть Байеса / Сеть убеждений Байеса / Сеть убеждений Байеса)
    • MC (Markov Chain) - Марковская цепь,
    • HMM (Скрытая модель Маркова)
    • MEMM (Maximum Entropy Markov Model) - модель максимальной энтропии Маркова.
    • CRF (Conditional Random Field) - условия случайного полета.
    • MRF ((Markov Random Field) Марковский случайный аэропорт) ⇒
  • Нейронная сеть:

    • В частности, он рассказал о том, как в 2010 году он был арестован в Нью-Йорке.
    • BP (Error BackPropagation) (Ошибка обратного распространения).
  • Глубокое обучение

    • Авто-енкодер (авто-кодер),
    • SAE (Stacked Auto-encoders) - набор автокодеров, которые настраиваются на одном устройстве.
    • Спарс Auto-encoders - редкий автоматический кодер.
    • В этом случае, если вы хотите, чтобы ваш компьютер был более безопасным, вы можете использовать его в качестве инструмента.
    • Contractive Auto-encoders (сокращенные авто-кодеры)
    • RBM (Restricted Boltzmann Machine) - ограниченный Болтсманский аппарат.
    • В частности, в сети "DBN" (Deep Belief Network) сообщается о том, что ученые пытаются доказать свою правоту.
    • CNN (Convolutional Neural Network) рассказывает о том, как в 2010 году в Нью-Йорке появилась новая сеть, называемая "Конвулсионная нейронная сеть".
    • Word2Vec ((слововекторная модель обучения) ).
  • DimensionalityReduction (Снижение измерений):

    • LDA Linear Discriminant Analysis/Fisher Linear Discriminant Анализ линейного дискриминатора/Фишер линейного дискриминатора
    • PCA (Principal Component Analysis) (Анализ основных компонентов)
    • ICA (Independent Component Analysis) - независимый компонентный анализ.
    • SVD (Singular Value Decomposition) - уникальное расщепление значения, которое происходит в течение одного дня.
    • FA (Факторный анализ).
  • Text Mining (Текстовое майнинг):

    • VSM (векторная модель пространства)
    • Word2Vec (слово-векторная модель обучения)
    • TF (Term Frequency)
    • TF-IDF ((Term Frequency-Inverse DocumentFrequency) - частота слов-в обратном направлении документа),
    • Миссия по взаимной информации (Mutual Information)
    • ECE (Expected Cross Entropy) - ожидаемый кросс-энтропический параметр.
    • QEMI (вторичный информационный канал)
    • IG (Information Gain) - информационный прирост.
    • ИГР (Information Gain Ratio - соотношение доходов от получения информации)
    • Число гини (коэффициент Кини)
    • x2 Statistic ((x2 статистические показатели),
    • TEW (TextEvidence Weight) - право на доказательство текста.
    • ОР (отношение шансов)
    • Модель N-Gram,
    • LSA (Latent Semantic Analysis) - несуществующий семантический анализ.
    • PLSA (Probabilistic Latent Semantic Analysis) - вероятностно-основанный потенциальный семантический анализ.
    • LDA (Latent Dirichlet Allocation, потенциальная модель Дирихле)
  • Association Mining (связанные с добычей):

    • Прежде всего,
    • FP-growth (Frequency Pattern Tree Growth) - алгоритм роста деревьев с частотным паттерном.
    • Прежде всего,
    • Пика.
  • Рекомендационная система:

    • DBR (Demographic-based Recommendation) (Демографическая рекомендация) - это рекомендация, основанная на демографической статистике.
    • CBR (Context-basedRecommendation) - рекомендация, основанная на содержании.
    • CF (Collaborative Filtering - совместное фильтрация)
    • UCF (User-based Collaborative Filtering Recommendation) - рекомендация по совместному фильтрации, основанная на пользователях.
    • ICF (Item-based Collaborative Filtering Recommendation) (Рекомендации по совместному фильтрации на основе элементов).
  • Similarity Measure&Distance Measure (Меры сходства и расстояния):

    • Евклидовое расстояние
    • ManhattanDistance (англ. Расстояние до Манхэттена)
    • В результате, он был вынужден отказаться от участия в выборах.
    • MinkowskiDistance (отрыв от Минковского)
    • Standardized Euclidean Distance (Стандартизированное евклидовое расстояние)
    • Махаланобис Дистанция (от Марса)
    • Кос (косиновая струна)
    • HammingDistance/Edit Distance (англ. HammingDistance/Edit Distance) - расстояние, на котором можно редактировать текст.
    • Якорд Дистанция (Jaccard Distance)
    • Корреляционный коэффициент расстояния
    • "Информационная энтропия" (англ. Information Entropy)
    • KL ((Kullback-Leibler Divergence KL расхождение/Относительная энтропия относительно дивергенции)).
  • Feature Selection (альгоритм выбора функций):

    • Встречается с одним из самых известных людей в мире.
    • DocumentFrequence (частота документа)
    • Например, в Китае, в Китае, в Китае, в Китае, в Китае, в Китае.
    • В результате вы получите более высокую оценку, чем вы ожидали.
    • Gini (коэффициент Кини)
  • Outlier Detection (Альгоритм обнаружения отклонений):

    • Statistic-based (основанная на статистике)
    • Например, в Китае, в Китае, в Китае, в Китае, в Китае, в Китае.
    • Density-based (на основе плотности)
    • Clustering-based (основанное на кластеризации)
  • Learning to Rank (Сортировка на основе обучения):

    • В смысле: Макранк;
    • Парально: RankingSVM,RankNet,Frank,RankBoost;
    • В списке: AdaRank, SoftRank, LamdaMART.

Больше