avatar of 发明者量化-小小梦 发明者量化-小小梦
پر توجہ دیں نجی پیغام
4
پر توجہ دیں
1271
پیروکار

عام مشین لرننگ اور ڈیٹا مائننگ سے متعلق اصطلاحات

میں تخلیق کیا: 2017-03-20 09:58:22, تازہ کاری:
comments   0
hits   2015

عام مشین لرننگ اور ڈیٹا مائننگ سے متعلق اصطلاحات

  • نمونہ لینا:

    • سادہ رینڈم سیمپلنگ (Simple Random Sampling)
    • آف لائن سیمپلنگ (Offline Sampling)
    • آن لائن نمونے لینا (K)
    • Ratio-based Sampling (ratio-based sampling) ، یعنی تناسب پر مبنی نمونہ لینا۔
    • Acceptance-RejectionSampling (قبول - رد نمونہ لینا)
    • Importance Sampling (مهمیت نمونے لینا)
    • MCMC ((MarkovChain Monte Carlo مارکوف مونٹی کارلو نمونہ الگورتھم: میٹروپولیس-ہاسٹنگ اور گیبز)
  • کلسٹرنگ:

    • K-Means,
    • K-Mediods,
    • K-Means کی ایک سیکنڈ
    • FK-Means,
    • Canopy,
    • اس کے علاوہ، اس کے بارے میں مزید معلومات حاصل کرنے کے لئے، براہ کرم یہاں کلک کریں.
    • GMM-EM (مخلوط Gaussian ماڈل - امید ہے کہ زیادہ سے زیادہ الگورتھم کو حل کیا جائے گا)
    • K-Pototypes، CLARANS (تقسیم کی بنیاد پر)
    • BIRCH: درجہ بندی پر مبنی
    • CURE (ترتیب پر مبنی)
    • ڈی بی ایس سی اے این (DBSCAN)
    • CLIQUE (( کثافت پر مبنی اور گرڈ پر مبنی)
  • Classification&Regression: درجہ بندی اور رجعت

    • LR ((Linear Regression) ، جس کا مطلب ہے “لکیری رجعت”
    • LR (LogisticRegression) ایک ایسا طریقہ ہے جس کا استعمال کرتے ہوئے لوگ اپنے اپنے مقاصد کو حاصل کرنے کے لئے استعمال کرتے ہیں.
    • SR (سافٹ میکس رجریشن)
    • جی ایل ایم (Generalized Linear Model) ایک وسیع پیمانے پر لکیری ماڈل ہے، جس کا مطلب یہ ہے کہ اس میں کوئی فرق نہیں پڑتا ہے کہ یہ کیا ہے.
    • RR ((Ridge Regression ریج رجریشن / L2 باقاعدہ کم سے کم دوگنا ریگریشن) ،
    • LASSO ((Least Absolute Shrinkage andSelectionator Operator L1 کم سے کم مطلق سکڑنے اور انتخاب کرنے والا آپریٹر L1)
    • RF (بے ترتیب جنگل)
    • ڈی ٹی: (DecisionTree) فیصلہ کرنے والا درخت
    • جی بی ڈی ٹی (Gradient BoostingDecision Tree) ، جو کہ “ترقی پذیر فیصلہ سازی کا درخت” (Gradient BoostingDecision Tree) کے نام سے جانا جاتا ہے۔
    • CART (ClassificationAnd Regression Tree) ایک درجہ بندی اور رجعت درخت ہے.
    • اس کے بعد، میں نے اپنے پڑوسیوں کے ساتھ بات چیت کی، اور میں نے ان کے ساتھ بات کی.
    • SVM(Support VectorMachine),
    • KF ((KernelFunction کلر فنکشن PolynomialKernel Function کثیر عددی کلر فنکشن ،
    • Guassian KernelFunction گوسیئن کرنل فنکشن / شعاعی بنیاد فنکشن RBF شعاعی بنیاد فنکشن ،
    • String KernelFunction (سٹرنگ کارن فنکشن)
    • NB ((Naive Bayes) ،BN ((Bayesian Network/Bayesian Belief Network/ Belief Network) ، بیزین نیٹ ورک / بیزین عقیدے نیٹ ورک / عقیدے نیٹ ورک) ، بیزین نیٹ ورک / بیزین عقیدے نیٹ ورک / عقیدے نیٹ ورک)
    • LDA ((Linear Discriminant Analysis/FisherLinear Discriminant تجزیہ/فشر لکیری تجزیہ)
    • EL ((Ensemble Learning) ایک انٹیگریٹڈ لرننگ پلیٹ فارم ہے جس میں Boosting، Bagging، Stacking،
    • AdaBoost (مطابقتی فروغ)
    • MEM ((میکسیمم انٹروپی ماڈل سب سے بڑا کک ماڈل)
  • Effectiveness Evaluation (کارکردگی کی تشخیص):

    • کنفیوژن میٹرکس
    • Precision، Recall، اور RecallRate کے درمیان فرق کیا ہے؟
    • Accuracy، F-score، F-score، F-score، F-score، F-score، F-score، F-score، F-score، F-score
    • ROC Curve (ROC منحنی خطوط) ، AUC (AUC رقبہ)
    • LiftCurve (لیفٹ وکر) ، KS Curve (کے ایس وکر)
  • پی جی ایم ((Probabilistic Graphical Models احتمال گرافک ماڈل):

    • BN ((Bayesian Network/Bayesian Belief Network/ BeliefNetwork بییسین نیٹ ورک/ بییسین عقیدت نیٹ ورک/ عقیدت نیٹ ورک)
    • مارکوف چین کے بارے میں مزید معلومات کے لیے یہاں کلک کریں۔
    • HMM (پوشیدہ مارکوف ماڈل)
    • MEMM (زیادہ سے زیادہ انٹروپی مارکوف ماڈل)
    • سی آر ایف (Conditional Random Field) ، ایک مشروط رینڈم فیلڈ (Conditional Random Field) ہوائی اڈہ ہے۔
    • MRF (مارکوف رینڈم فیلڈ)
  • نیورل نیٹ ورک:

    • اے این این (مصنوعی اعصابی نیٹ ورک)
    • بی پی ((Error BackPropagation) غلطیاں الٹا پھیلائی جاتی ہیں)
  • DeepLearning

    • آٹو انکوڈر (Auto-encoder)
    • SAE: Stacked Auto-encoders (اسٹیکڈ آٹو انکوڈر)
    • Sparse Auto-encoders خود کار طریقے سے انکوڈر کو کم کرتا ہے
    • Denoising Auto-encoders: آٹو انکوڈروں کو شور مچانے کے لیے
    • Contractive Auto-encoders (انگریزی: Contractive Auto-encoders) ایک ایسا آٹو انکوڈر ہے جس کا استعمال عام طور پر انگریزی میں کیا جاتا ہے۔
    • RBM (محدود بولٹ مین مشین)
    • ڈی بی این (ڈیپ بیلیف نیٹ ورک) کے مطابق:
    • سی این این کے مطابق، اس کے نتیجے میں، اس کے نتیجے میں، اس کے نتیجے میں، اس کے نتیجے میں، اس کے نتیجے میں.
    • Word2Vec (ورڈ ویکٹر سیکھنے کا ماڈل)
  • DimensionalityReduction (بڑے پیمانے پر کمی):

    • LDA LinearDiscriminant Analysis/Fisher Linear Discriminant لکیری امتیازی تجزیہ
    • پی سی اے (پرنسپل کمپونینٹ تجزیہ)
    • آئی سی اے (Independent Component Analysis) ، جو کہ آزاد اجزاء کا تجزیہ ہے
    • SVD (Singular Value Decomposition) ایک منفرد قدر کی خرابی ہے.
    • FA ((FactorAnalysis فیکٹر تجزیہ کا طریقہ)
  • ٹیکسٹ مائننگ:

    • VSM (ویکٹر اسپیس ماڈل)
    • ورڈ2ویک (ورڈ ویکٹر لرننگ ماڈل)
    • ٹرم فریکوئنسی (Term Frequency)
    • TF-IDF ((Term Frequency-Inverse DocumentFrequency) اصطلاحی تعدد - انورٹڈ دستاویزی تعدد) ،
    • ایم آئی (MutualInformation) ایک ایسی ویب سائٹ ہے جس میں لوگ ایک دوسرے سے بات کرتے ہیں اور ایک دوسرے سے مشورہ کرتے ہیں۔
    • ECE (متوقع کراس انٹروپی)
    • QEMI (دوسری انفارمیشن کالم)
    • IG ((InformationGain) معلومات میں اضافہ)
    • آئی جی آر (انفارمیشن گین ریٹ)
    • کیا آپ کو معلوم ہے کہ اس کا کیا مطلب ہے؟
    • x2 اعدادوشمار (x2)
    • ٹی ای ڈبلیو (TextEvidence Weight) ، ٹیکسٹ ایوڈینس ویٹ (TextEvidence Weight) ، ٹی ای ڈبلیو (TextEvidence Weight) ، ٹی ای وی (TextEvidence Weight) ،
    • OR ((Odds Ratio) کا تناسب)
    • N-Gram Model,
    • LSA (Latent Semantic Analysis) ایک ایسا نظام ہے جس کے ذریعے ہم اپنے الفاظ کی شناخت کرتے ہیں اور ان کا تجزیہ کرتے ہیں۔
    • PLSA (Probabilistic Latent Semantic Analysis) ، جو کہ ممکنہ طور پر لیٹینٹ سیمنٹک تجزیہ ہے، اس کا مقصد یہ ہے کہ ممکنہ طور پر لیٹینٹ سیمنٹک تجزیہ کیا جائے۔
    • LDA ((Latent DirichletAllocation ممکنہ ڈریکلیٹ ماڈل) }}
  • ایسوسی ایشن مائننگ:

    • Apriori,
    • FP-growth (Frequency Pattern Tree Growth) ، جو کہ FP-growth (فریکوئنسی پیٹرن ٹری گروتھ) کے نام سے جانا جاتا ہے۔
    • AprioriAll,
    • Spade。
  • Recommendation Engine (انجین کی سفارش):

    • ڈی بی آر: ڈیموگرافک پر مبنی سفارش
    • سی بی آر (Context-basedRecommendation) ایک ایسا ٹول ہے جس کا مقصد یہ ہے کہ لوگوں کو ان کے مواد پر مبنی سفارشات فراہم کی جائیں۔
    • سی ایف (Collaborative Filtering) ، ایک ویب سائٹ جس میں صارفین کو ان کے مواد کو شیئر کرنے کی اجازت دی گئی ہے۔
    • یو سی ایف (User-based Collaborative Filtering Recommendation) ، جو صارف پر مبنی باہمی تعاون سے فلٹرنگ کی سفارشات ہے ، کے مطابق:
    • ICF ((Item-based Collaborative Filtering Recommendation پروجیکٹ پر مبنی باہمی تعاون سے فلٹرنگ کی سفارش) }}
  • Similarity Measure&Distance Measure (مماثلت کی پیمائش اور فاصلے کی پیمائش):

    • Euclidean Distance (یوکلیڈ فاصلہ)
    • ManhattanDistance (مین ہیٹن ڈسٹینس)
    • چیبی شیف فاصلہ (Chebyshev Distance)
    • MinkowskiDistance (مینکوفسکی فاصلہ)
    • معیاری Euclidean فاصلے
    • مہلانوبیس ڈسٹینس
    • Cos ((Cosine رسی) ،
    • HammingDistance/Edit Distance (ہیمنگ فاصلہ/ترمیم فاصلہ)
    • JaccardDistance (جاکارڈ کا فاصلہ)
    • Correlation Coefficient Distance ((مرتبہ کوفیشنٹ فاصلہ))
    • انفارمیشن اینٹروپی (Information Entropy)
    • KL ((Kullback-Leibler Divergence KL بکھرنے / رشتہ دار انٹروپی نسبتا کم ہے)
  • خصوصیت انتخاب:

    • باہمی معلومات
    • دستاویزی تعدد (DocumentFrequence)
    • Information Gain (معلومات کا فائدہ)
    • چی اسکوائرڈ ٹیسٹ
    • Gini (گنی کا فیکٹر)
  • Outlier Detection ((غیر معمولی نقطہ کا پتہ لگانے کے الگورتھم):

    • Statistic-based (شماریات پر مبنی)
    • فاصلے پر مبنی
    • ڈینسٹی بیسڈ
    • کلسٹرنگ پر مبنی۔
  • Learning to Rank (مطالعہ پر مبنی درجہ بندی):

    • Pointwise:McRank;
    • Pairwise:RankingSVM,RankNet,Frank,RankBoost;
    • Listwise:AdaRank,SoftRank,LamdaMART。