মেশিন লার্নিং এবং ডেটা মাইনিং সম্পর্কিত সাধারণ শব্দ

লেখক:ছোট্ট স্বপ্ন, তৈরিঃ 2017-03-20 09:58:22, আপডেটঃ

মেশিন লার্নিং এবং ডেটা মাইনিং সম্পর্কিত সাধারণ শব্দ

  • স্যাম্পলিংঃ

    • সাধারণ র্যান্ডম স্যাম্পলিং (Simple Random Sampling)
    • অফলাইন স্যাম্পলিং (অফলাইন ইত্যাদি হতে পারে)
    • অনলাইন স্যাম্পলিং (অনলাইন ইত্যাদি হতে পারে)
    • Ratio-based Sampling (অংশীদার ভিত্তিক র্যান্ডম স্যাম্পলিং)
    • Acceptance-RejectionSampling (অনুমোদন-প্রত্যাখ্যান নমুনা)
    • গুরুত্বপূর্ণতা নমুনা
    • MCMC ((MarkovChain Monte Carlo মার্কভ মন্ট কার্লো নমুনা অ্যালগরিদমঃ মেট্রোপলিস-হ্যাস্টিং & গিবস) ।) ।
  • Clustering (ক্লাসিং):

    • K মানে,
    • কে-মিডিয়ড,
    • দুই সেকেন্ডে কে মানে,
    • FK-Means,
    • ক্যানোপি,
    • স্পেকট্রাল-কেমেন্স (Spectral-KMeans)
    • GMM-EM (হাইব্রিড গাউস মডেল - প্রত্যাশিত সর্বাধিকীকরণ অ্যালগরিদম সমাধান)
    • K-Pototypes, CLARANS (বিভক্তির ভিত্তিতে)
    • BIRCH (স্তরের উপর ভিত্তি করে)
    • CURE (স্তরের উপর ভিত্তি করে)
    • DBSCAN (ঘনত্বের ভিত্তিতে)
    • CLIQUE (ঘনত্ব ভিত্তিক এবং গ্রিড ভিত্তিক) ।
  • Classification & Regression (ক্লাসেশন ও রিগ্রেশন):

    • লিনিয়ার রিগ্রেশন (LR)
    • লজিস্টিক রেগ্রেশন লজিক্যাল রিগ্রেশন।
    • SR (Softmax Regression সম্ভবত ক্লাস লজিক্যাল রিগ্রেশন)
    • জিএলএম (Generalized Linear Model) একটি সাধারণ রৈখিক মডেল।
    • RR ((রিজ রেগ্রেশন রিগ্রেশন / L2 নিয়মিত সর্বনিম্ন দ্বিগুণ রিগ্রেশন),
    • LASSO ((Least Absolute Shrinkage and Selectionator Operator L1 নিয়ম সর্বনিম্ন দ্বিগুণ প্রত্যাবর্তন))
    • আরএফ (এলোমেলো বন)
    • DT (DecisionTree) - সিদ্ধান্তের গাছ
    • GBDT (Gradient Boosting Decision Tree) হল একটি গ্র্যাডিয়েন্ট বুস্টিং ডিসিশন ট্রি।
    • CART (ClassificationAnd Regression Tree) হল একটি শ্রেণীবিভাগ পুনর্বিবেচনা গাছ।
    • কেএনএন (K-Nearest Neighbor)
    • এসভিএম (সমর্থন ভেক্টর মেশিন),
    • KF ((KernelFunction) Kernel ফাংশন PolynomialKernel Function বহুপলিয়াম Kernel ফাংশন,
    • Guassian KernelFunction গ্যাসীয় কার্নেল ফাংশন/Radial BasisFunction RBF ব্যাসার্ধ ভিত্তিক ফাংশন,
    • String KernelFunction স্ট্রিং কার্নেল ফাংশন)
    • NB (Naive Bayes, Bayesian Network/Bayesian Belief Network/Belief Network), বিএন (Bayesian Network/Bayesian Belief Network/Belief Network), বিএন (Bayesian Network/Bayesian Belief Network/Belief Network), বিএন (Bayesian Network/Bayesian Belief Network/Belief Network), বিএন (Bayesian Network/Bayesian Belief Network/Belief Network), বিএন (Bayesian Network/Bayesian Belief Network/Belief Network) এবং বিএন (Bayesian Network/Bayesian Belief Network/Belief Network) ।
    • এলডিএ (Linear Discriminant Analysis/FisherLinear Discriminant Analysis/ফিশার লিনিয়ার ডিসক্রিমিন্যান্ট বিশ্লেষণ)
    • EL (Ensemble Learning ইন্টিগ্রেটেড লার্নিং বস্টিং, ব্যাগিং, স্ট্যাকিং)
    • এডাপ্টিভ বুস্টিং (Adaptative Boosting) এর মাধ্যমে আপনি আপনার জীবনযাত্রা উন্নত করতে পারবেন।
    • এমইএম (Maximum Entropy Model) ।
  • কার্যকারিতা মূল্যায়নঃ

    • কনফিউশন ম্যাট্রিক্স
    • প্রিসিশন (নির্ভুলতা), রিকল (রিকল রেট)
    • Accuracy (নির্ভুলতা), F-score (F স্কোর),
    • ROC কার্ভ (ROC কার্ভ), AUC (AUC এলাকা),
    • লিফট কার্ভ, কেএস কার্ভ।
  • পিজিএম (Probabilistic Graphical Models Probability Chart Models):

    • BN ((Bayesian Network/Bayesian Belief Network/BeliefNetwork) বেয়েজ নেটওয়ার্ক/বেয়েজ বিশ্বাস নেটওয়ার্ক/বিশ্বাস নেটওয়ার্ক)
    • মার্কভ চেইন (Markov Chain) ।
    • এইচএমএম (Hidden Markov Model) নামের এই মডেলটি একটি ম্যাক্সিকোভ মডেল।
    • এমইএমএম (Maximum Entropy Markov Model) (সর্বোচ্চ এন্ট্রোপি মার্কভ মডেল)
    • সিআরএফ (Conditional Random Field) নামক একটি বিমানবন্দর।
    • MRF (মার্কভ র্যান্ডম ফিল্ড) ।
  • এনএন (Neural Network):

    • ANN (আর্টিফিশিয়াল নিউরাল নেটওয়ার্ক)
    • বিপি (Error BackPropagation) ।
  • ডিপলার্নিং

    • অটো-এনকোডার (অটো এনকোডার)
    • SAE (Stacked Auto-encoders) স্বয়ংক্রিয় এনকোডারগুলিকে একত্রিত করে।
    • স্পারস অটো-ইনকোডারগুলি স্বয়ংক্রিয় এনকোডারগুলির একটি বিরল সংখ্যা।
    • অটো-এনকোডারগুলিকে অটো-এনকোডারগুলির জন্য নীরব করে তোলা।
    • কন্ট্রাক্টিভ অটো-ইনকোডার (CAC) ।
    • RBM (Restricted Boltzmann Machine) নামক একটি যন্ত্র যা বোল্টজম্যানের একটি সীমিত মেশিন।
    • ডাব্লুবিএন (Deep Belief Network) নামের এই নেটওয়ার্কটি একটি সামাজিক নেটওয়ার্ক।
    • সিএনএন (Convolutional Neural Network) -এর একটি ভিডিওতে দেখা যাচ্ছে,
    • Word2Vec (শব্দ ভেক্টর লার্নিং মডেল) ।
  • DimensionalityReduction (আকার হ্রাস):

    • LDA Linear Discriminant Analysis/Fisher Linear Discriminant বিশ্লেষণ / ফিশার লিনিয়ার ডিসক্রিমিন্যান্ট বিশ্লেষণ
    • পিসিএ (প্রধান উপাদান বিশ্লেষণ)
    • আইসিএ (Independent Component Analysis) নামক একটি সংস্থা।
    • SVD (একক মান বিভাজন)
    • FA (ফ্যাক্টর বিশ্লেষণ) ।
  • টেক্সট মাইনিং (টেক্সট মাইনিং):

    • ভিএসএম (ভেক্টর স্পেস মডেল)
    • Word2Vec (ওয়ার্ড ভেক্টর লার্নিং মডেল)
    • টিএফ (Term Frequency)
    • TF-IDF ((Term Frequency-Inverse DocumentFrequency) শব্দ ফ্রিকোয়েন্সি-ইনভার্স ডকুমেন্ট ফ্রিকোয়েন্সি)
    • মিউচুয়াল ইনফরমেশন (এমআই) ।
    • ECE (Expected Cross Entropy) (প্রত্যাশিত ক্রস এন্ট্রোপি)
    • QEMI (দ্বিতীয় তথ্য মনিটর)
    • আইজি (InformationGain) তথ্য লাভ,
    • আইজিআর (ইনফরমেশন গেইন রেসিও) তথ্য লাভের হার।
    • গিনি (গিনি কোয়ালিটি)
    • x2 Statistic ((x2 পরিসংখ্যান),
    • TEW ((TextEvidence Weight) টেক্সট প্রমাণের অধিকার)
    • OR (অডস রেসিও এডভান্টেজ)
    • এন-গ্রাম মডেল,
    • LSA (Latent Semantic Analysis) (ল্যাটেনট সিমান্টিক বিশ্লেষণ)
    • PLSA (Probabilistic Latent Semantic Analysis) - সম্ভাব্যতার উপর ভিত্তি করে সম্ভাব্য অর্থ বিশ্লেষণ।
    • এলডিএ (Latent Dirichlet Allocation) ।
  • অ্যাসোসিয়েশন মাইনিং (সম্পর্কিত খনন):

    • আগে থেকেই,
    • FP-growth (ফ্রিকোয়েন্সি প্যাটার্ন ট্রি গ্রোথ)
    • প্রথমে,
    • স্পাইড ।
  • সুপারিশ ইঞ্জিনঃ

    • DBR (Demographic-based Recommendation) - জনসংখ্যার উপর ভিত্তি করে সুপারিশ
    • CBR (Context-basedRecommendation) - বিষয়বস্তু ভিত্তিক সুপারিশ।
    • সিএফ (Collaborative Filtering সহযোগী ফিল্টারিং)
    • ইউসিএফ (ইউজার-ভিত্তিক সহযোগী ফিল্টারিং সুপারিশ)
    • আইসিএফ (আইটেম-ভিত্তিক সহযোগী ফিল্টারিং সুপারিশ) ।
  • Similarity Measure&Distance Measure (সমতুল্যতা এবং দূরত্বের পরিমাপ):

    • ইউক্লিডিয়ান দূরত্ব
    • ম্যানহাটানের দূরত্ব
    • Chebyshev Distance (চেবিশেভ দূরত্ব),
    • মিনকোভস্কি দূরত্ব
    • স্ট্যান্ডার্ডাইজড ইউক্লিডিয়ান দূরত্ব (Standardized Euclidean Distance)
    • মহালানোবিস দূরত্ব (মার্টের দূরত্ব)
    • কস (কসাইন কোষন)
    • HammingDistance/Edit Distance (হ্যামিং দূরত্ব/সম্পাদনা দূরত্ব)
    • জ্যাকার্ড ডিসট্যান্স (জ্যাকার্ড দূরত্ব)
    • Correlation Coefficient Distance (প্রাসঙ্গিক সহগ দূরত্ব)
    • তথ্য এন্ট্রোপি (ইনফরমেশন এন্ট্রোপি)
    • KL ((Kullback-Leibler Divergence KL বিচ্ছিন্নতা/আপেক্ষিক এন্ট্রোপি আপেক্ষিকভাবে ঝাঁকুনি) ।)
  • Feature Selection (বৈশিষ্ট্য নির্বাচন অ্যালগরিদম):

    • মিউচুয়াল ইনফরমেশন
    • ডকুমেন্ট ফ্রিকোয়েন্সি
    • তথ্য লাভ (Information Gain)
    • এই পরীক্ষার ফলাফলের জন্য, আপনি একটি কার্ড পরীক্ষা করতে পারেন।
    • গিনি (গিনি কোয়ালিফায়ার) ।
  • আউটলিয়ার ডিটেকশন (Outlier Detection):

    • Statistic-based (গণনা ভিত্তিক)
    • Distance-based (দূরত্ব ভিত্তিক)
    • Density-based (ঘনত্ব-ভিত্তিক)
    • Clustering-based (ক্লাস ভিত্তিক) ।
  • Learning to Rank (শিক্ষার ভিত্তিতে র্যাঙ্কিং):

    • পয়েন্টওয়াইডঃ ম্যাক্র্যাঙ্ক;
    • প্যারেজ অনুযায়ীঃ র্যাঙ্কিংএসভিএম, র্যাঙ্কনেট, ফ্রাঙ্ক, র্যাঙ্কবুস্ট;
    • তালিকা অনুযায়ী: অ্যাডা র্যাঙ্ক, সফট র্যাঙ্ক, ল্যামডামার্ট ।

আরো