مشین لرننگ اور ڈیٹا کان کنی سے متعلق عام اصطلاحات

مصنف:چھوٹا سا خواب, تخلیق: 2017-03-20 09:58:22, تازہ کاری:

مشین لرننگ اور ڈیٹا کان کنی سے متعلق عام اصطلاحات

  • نمونے لینا:

    • سادہ رینڈم سیمپلنگ (Simple Random Sampling)
    • آف لائن سیمپلنگ (آف لائن وغیرہ کے لئے ممکنہ K نمونہ)
    • آن لائن سیمپلنگ (کئی نمونے آن لائن وغیرہ)
    • Ratio-based Sampling (Ratio-based Sampling) یعنی تناسب پر مبنی بے ترتیب نمونے لینا
    • Acceptance-RejectionSampling (قبولیت سے مسترد نمونے لینے)
    • اہمیت سیمپلنگ
    • ایم سی ایم سی ((مارکوف چین مونٹی کارلو مارکوف مونٹی کارلو نمونے لینے کا الگورتھم: میٹروپولیس - ہسٹنگ اینڈ گبز)) ؛
  • کلسٹرنگ (مجموعہ بندی):

    • K کا مطلب ہے،
    • K-میڈیز،
    • دو پوائنٹس K-Means،
    • FK کا مطلب ہے،
    • چھت،
    • اسپیکٹرل-KMeans
    • GMM-EM ((مختلّد گاس ماڈل - متوقع زیادہ سے زیادہ الگورتھم حل)
    • K-Pototypes، CLARANS (تقسیم پر مبنی)
    • BIRCH (مرتبہ کی بنیاد پر)
    • CURE (مختلف سطحوں پر مبنی)
    • ڈی بی ایس سی این (بنیاد پر کثافت)
    • CLIQUE ((گھنےائی پر مبنی اور گرڈ پر مبنی) ⇒
  • Classification & Regression (مجموعہ بندی اور رجعت):

    • LR (لکیری رجعت)
    • LR (Logistic Regression منطقی رجعت)
    • SR (Softmax Regression شاید کلاس لاجک ریگریشن)
    • جی ایل ایم (Generalized Linear Model) ، ایک وسیع معنوں میں لکیری ماڈل،
    • RR ((ریج ریگریشن ریجنشن / L2 باقاعدگی سے کم سے کم دو گنا ریجنشن)
    • LASSO (کم سے کم مطلق سکڑنے اور سلیکشنٹر آپریٹر L1 کے اصول کم سے کم دو گنا واپسی)
    • RF (آزمائش شدہ جنگل)
    • ڈبلیو ٹی (DecisionTree)
    • جی بی ڈی ٹی (Gradient Boosting Decision Tree) ، جس کا مطلب ہے گرڈینٹ بوسٹنگ ڈیسیشن ٹری۔
    • CART (ClassificationAnd Regression Tree) ، ایک درجہ بندی اور رجعت کا درخت۔
    • KNN ((K-Nearest Neighbor K قریب ترین پڑوسی)
    • SVM ((سپورٹ ویکٹر مشین) ،
    • KF ((KernelFunction) نیوکل فنکشن PolynomialKernel Function کثیر مقصدی نیوکل فنکشن،
    • گاسین کرنل فنکشن گاسین کرنل فنکشن/Radial BasisFunction RBF قطر کی طرف بنیاد فنکشن،
    • String KernelFunction (سٹرنگ کیرنل فنکشن) ؛
    • NB (بائیسین نیٹ ورک/بائیسین عقیدے کا نیٹ ورک)
    • ایل ڈی اے (Linear Discriminant Analysis/FisherLinear Discriminant Analysis/فشر لکیری امتیاز تجزیہ)
    • EL ((Ensemble Learning سیکھنے کے لئے Boosting، Bagging، Stacking کو ضم کرتا ہے)
    • ایڈی باؤسٹ (Adaptive Boosting) خود کو بہتر بنانے کے لیے ایک ایپلی کیشن ہے۔
    • MEM (زیادہ سے زیادہ انٹروپی ماڈل) ۔
  • Effectiveness Evaluation (متاثرتی تشخیص):

    • Confusion Matrix (مشکوک میٹرکس)
    • اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے علاوہ، اس کے بعد، اس کے بعد، اس کے بعد، اس کے بعد، اس کے بعد، اس کے بعد، اس کے بعد.
    • Accuracy (درستگی) ، F-score (F اسکور)
    • ROC Curve (ROC وکر) ، AUC (AUC رقبہ)
    • لیفٹ وکر، کے ایس وکر۔
  • پی جی ایم (Probabilistic Graphical Models Probability Graph Models):

    • BN ((Bayesian Network/Bayesian Belief Network/BeliefNetwork بیزس نیٹ ورک/بیزس اعتماد نیٹ ورک/عقائد نیٹ ورک)
    • MC (مارکوف چین)
    • HMM (خفیہ مارکوف ماڈل)
    • MEMM (زیادہ سے زیادہ انٹروپی مارکوف ماڈل)
    • سی آر ایف (مشروط بے ترتیب میدان)
    • ایم آر ایف (مارکوف رینڈم فیلڈ) ۔
  • نیورل نیٹ ورک (Neural Network):

    • اے این این (مصنوعی اعصابی نیٹ ورک)
    • بی پی (Error BackPropagation) ۔
  • ڈیپ لرننگ

    • آٹو انکوڈر (آٹو انکوڈر)
    • SAE (Stacked Auto-encoders) ایک دوسرے کے ساتھ خود کار طریقے سے انکوڈر کو ڈھونڈتے ہیں،
    • سپارس آٹو انکوڈرز خود کار طریقے سے انکوڈرز کو کم کرتے ہیں۔
    • ڈینوسنگ آٹو انکوڈرز
    • Contractive Auto-encoders (مخلوط آٹو انکوڈر)
    • RBM (Restricted Boltzmann Machine) (محدود بولٹزمین مشین)
    • ڈی بی این (Deep Belief Network) نے اپنے ایک بیان میں کہا ہے کہ 'ہمیں یقین نہیں ہے کہ یہ سچ ہے۔'
    • سی این این (Convolutional Neural Network) کے مطابق ، یہ ایک ایسا نیٹ ورک ہے جس کے ذریعے نیورل نیٹ ورک کو تبدیل کیا جاسکتا ہے۔
    • Word2Vec ((لفظ ویکٹر سیکھنے کا ماڈل) ‖
  • DimensionalityReduction (بعد میں کمی):

    • LDA Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/فشر لکیری امتیاز کا تجزیہ
    • پی سی اے (Principal Component Analysis)
    • آئی سی اے (آزادانہ جزو تجزیہ)
    • SVD (Singular Value Decomposition) (ایک منفرد قدر کی تحلیل)
    • ایف اے (factor analysis) ۔
  • ٹیکسٹ مائننگ:

    • ویکٹر اسپیس ماڈل (VSM)
    • Word2Vec (لفظ ویکٹر سیکھنے کا ماڈل)
    • ٹی ایف (Term Frequency)
    • TF-IDF ((Term Frequency-Inverse DocumentFrequency) لفظی تعدد - دستاویز کی تعدد کے برعکس)
    • MI (متقابل انفارمیشن)
    • ECE (Expected Cross Entropy) (متوقع کراس اینٹروپی)
    • QEMI (دوسری معلومات کی دکان)
    • آئی جی (InformationGain) نے اپنے بلاگ پر لکھا ہے:
    • آئی جی آر (Information Gain Ratio) معلومات کے فوائد میں اضافے کی شرح
    • جینی (جینی کوفیکٹر)
    • x2 Statistic ((x2 شماریات)
    • ٹی ایچ او (TextEvidence Weight) نے کہا ہے کہ 'یہ ایک بہت بڑا مسئلہ ہے'۔
    • OR (Odds Ratio) فائدہ کی شرح،
    • این گرام ماڈل،
    • LSA (Latent Semantic Analysis) (خفیہ سیمانٹک تجزیہ)
    • PLSA (Probabilistic Latent Semantic Analysis) (محتمل پر مبنی ممکنہ معنوی تجزیہ)
    • ایل ڈی اے (Latent Dirichlet Allocation) ۔
  • ایسوسی ایشن مائننگ:

    • اس سے پہلے،
    • FP-growth (فریکوئنسی پیٹرن ٹری گروتھ)
    • اس سے پہلے کہ،
    • پیڈ.
  • سفارش انجن:

    • ڈی بی آر (ڈیموگرافک پر مبنی سفارشات)
    • سی بی آر (Context-basedRecommendation) کے مطابق ، یہ ایک ایسا پروگرام ہے جس میں مواد پر مبنی سفارشات پیش کی جاتی ہیں۔
    • سی ایف (معاونی فلٹرنگ)
    • UCF (User-based Collaborative Filtering Recommendation) صارف پر مبنی تعاون پر مبنی فلٹرنگ کی سفارشات
    • آئی سی ایف (Item-based Collaborative Filtering Recommendation) ۔
  • Similarity Measure&Distance Measure (مماثلت اور فاصلے کی پیمائش):

    • یوکلیڈین فاصلہ (یورپی فاصلہ)
    • مینہٹن ڈسٹینشن
    • Chebyshev Distance (چیبی شیف کی دوری)
    • مِنکوفسکی فاصلہ
    • معیاری یوکلیڈین فاصلہ (Standardized Euclidean Distance)
    • مہلانوبس فاصلہ (مریخ کی دوری)
    • Cos (کوسین سٹرنگ)
    • HammingDistance/Edit Distance (ہمنگ فاصلہ/ترمیم فاصلہ)
    • جاکارڈ فاصلہ
    • Correlation Coefficient Distance (متعلقہ کوفشن فاصلہ)
    • انفارمیشن اینٹروپی (انفارمیشن انٹروپی)
    • KL ((کل بیک - لیبلر تغیرات KL پھیلاؤ / رشتہ دار انٹروپی کے لئے نسبتاً مائع) ۔)
  • فیچر سلیکشن:

    • Mutual Information (متقابل معلومات)
    • دستاویز کی فریکوئنسی
    • معلومات حاصل کریں
    • چی سکوائرڈ ٹیسٹ (کارٹ سائیڈ ٹیسٹ)
    • گینی (گینی کوفیکٹر)
  • Outlier Detection (غیر معمولی نقطہ کا پتہ لگانے کا الگورتھم):

    • Statistic-based (شماریات پر مبنی)
    • Distance-based (دوری پر مبنی)
    • Density-based (یعنی کثافت پر مبنی)
    • Clustering-based (کلسٹرنگ پر مبنی)
  • Learning to Rank (مطالعہ پر مبنی درجہ بندی):

    • واضح طور پر: میک رینک؛
    • جوڑے کے لحاظ سے: رینکنگ ایس وی ایم، رینکنگ نیٹ، فرینک، رینکنگ بوسٹ؛
    • فہرست کے لحاظ سے: AdaRank،SoftRank،LamdaMART。

مزید