মেশিন লার্নিং সম্পর্কে তিনটি চিত্রঃ মৌলিক ধারণা, পাঁচটি প্রধান শৈলী এবং নয়টি সাধারণ অ্যালগরিদম

লেখক:ছোট্ট স্বপ্ন, তৈরিঃ ২০১৭-০৫-০২ 14:49:49, আপডেটঃ

মেশিন লার্নিং সম্পর্কে তিনটি চিত্রঃ মৌলিক ধারণা, পাঁচটি প্রধান শৈলী এবং নয়টি সাধারণ অ্যালগরিদম

  • প্রথমত, মেশিন লার্নিং এর সারসংক্ষেপ

    img

    1. মেশিন লার্নিং কি?

      মেশিনগুলি প্রচুর পরিমাণে ডেটা বিশ্লেষণ করে শিখতে পারে। উদাহরণস্বরূপ, বিড়াল বা মুখের স্বীকৃতির জন্য প্রোগ্রামিংয়ের প্রয়োজন নেই, তারা চিত্র ব্যবহার করে প্রশিক্ষিত হতে পারে যাতে নির্দিষ্ট লক্ষ্যগুলিকে সংক্ষিপ্ত এবং সনাক্ত করা যায়।

    2. মেশিন লার্নিং এবং এআই এর সম্পর্ক

      মেশিন লার্নিং একটি গবেষণা এবং অ্যালগরিদমের বিভাগ যা ডেটাতে মডেলগুলি সন্ধান করে এবং সেই মডেলগুলি ব্যবহার করে ভবিষ্যদ্বাণী করে। মেশিন লার্নিং এআই-র একটি অংশ এবং এটি জ্ঞান আবিষ্কার এবং ডেটা মাইনিংয়ের সাথে আন্তঃসংযোগ করে।

      img

    3. কিভাবে মেশিন লার্নিং কাজ করে

      ১. ডেটা নির্বাচন করুনঃ আপনার ডেটা তিনটি গ্রুপে ভাগ করুনঃ প্রশিক্ষণ ডেটা, যাচাইকরণ ডেটা এবং পরীক্ষার ডেটা। ২ মডেল ডেটাঃ প্রশিক্ষণ ডেটা ব্যবহার করে সম্পর্কিত বৈশিষ্ট্য ব্যবহার করে মডেল তৈরি করা ৩. বৈধতা মডেলঃ আপনার বৈধতা ডেটা ব্যবহার করে আপনার মডেল অ্যাক্সেস করুন 4 পরীক্ষামূলক মডেলঃ আপনার পরীক্ষার ডেটা ব্যবহার করে যাচাই করা মডেলের কার্যকারিতা পরীক্ষা করুন ৫. মডেল ব্যবহার করুনঃ সম্পূর্ণরূপে প্রশিক্ষিত মডেল ব্যবহার করে নতুন তথ্যের উপর ভবিষ্যদ্বাণী করুন ৬. মডেল অপ্টিমাইজেশনঃ অ্যালগরিদমের পারফরম্যান্স উন্নত করার জন্য আরো ডেটা, ভিন্ন বৈশিষ্ট্য বা সংশোধিত পরামিতি ব্যবহার করা

      img

    4. যেখানে মেশিন লার্নিং আছে

      1 ঐতিহ্যগত প্রোগ্রামিংঃ সফটওয়্যার ইঞ্জিনিয়ার সমস্যা সমাধানের জন্য প্রোগ্রাম লেখেন। প্রথমে কিছু তথ্য থাকে→ সমস্যা সমাধানের জন্য, সফটওয়্যার ইঞ্জিনিয়ার একটি প্রক্রিয়া লেখেন যা মেশিনকে কী করতে হবে তা বলে→ কম্পিউটার এই প্রক্রিয়াটি অনুসরণ করে এবং ফলাফল বের করে। ২ পরিসংখ্যানবিদ্যাঃ বিশ্লেষক ভেরিয়েবলগুলির মধ্যে সম্পর্ক তুলনা করে 3 মেশিন লার্নিংঃ ডেটা সায়েন্টিস্টরা একটি প্রশিক্ষণ ডেটাসেট ব্যবহার করে কম্পিউটারকে কী করতে হবে তা শিখিয়ে দেয় এবং তারপরে সিস্টেমটি সেই কাজটি সম্পাদন করে। প্রথমত, বড় ডেটা রয়েছে। 4 স্মার্ট অ্যাপ্লিকেশনঃ স্মার্ট অ্যাপ্লিকেশনগুলি কৃত্রিম বুদ্ধিমত্তা ব্যবহার করে ফলাফলগুলি অর্জন করে, যেমন চিত্রটি একটি সুনির্দিষ্ট কৃষির অ্যাপ্লিকেশন কেস ইঙ্গিত দেয় যা ড্রোন দ্বারা সংগৃহীত ডেটা ভিত্তিক

      img

    5. মেশিন লার্নিং এর বাস্তব ব্যবহার

      মেশিন লার্নিং এর অনেক অ্যাপ্লিকেশন রয়েছে, এখানে কিছু উদাহরণ দেওয়া হল, আপনি কিভাবে এটি ব্যবহার করবেন?

      দ্রুত 3D ম্যাপিং এবং মডেলিংঃ একটি রেলওয়ে ব্রিজ নির্মাণের জন্য, পিডব্লিউসির ডেটা বিজ্ঞানী এবং ক্ষেত্রের বিশেষজ্ঞরা ড্রোন দ্বারা সংগৃহীত ডেটাতে মেশিন লার্নিং প্রয়োগ করেছেন। এই সমন্বয়টি কাজের সাফল্যের জন্য সুনির্দিষ্ট পর্যবেক্ষণ এবং দ্রুত প্রতিক্রিয়া অর্জন করে।

      ঝুঁকি হ্রাস করার জন্য উন্নত বিশ্লেষণঃ অভ্যন্তরীণ লেনদেন সনাক্ত করার জন্য, পিডব্লিউসি মেশিন লার্নিং এবং অন্যান্য বিশ্লেষণ প্রযুক্তির সাথে একত্রিত করে যাতে আরও বিস্তৃত ব্যবহারকারীর প্রোফাইল তৈরি করা যায় এবং জটিল সন্দেহজনক আচরণের আরও গভীর ধারণা পাওয়া যায়।

      সেরা পারফরম্যান্সের লক্ষ্যগুলি পূর্বাভাস দেওয়াঃ মেশিন লার্নিং এবং অন্যান্য বিশ্লেষণ পদ্ধতি ব্যবহার করে মেলবোর্ন কাপের মাঠে বিভিন্ন ঘোড়ার সম্ভাব্যতা মূল্যায়ন করার জন্য পিডব্লিউসি।

  • দ্বিতীয়ত, মেশিন লার্নিং এর বিবর্তন

    img

    কয়েক দশক ধরে, এআই গবেষকদের বিভিন্ন "গোষ্ঠী" একে অপরের মধ্যে আধিপত্যের জন্য লড়াই করে আসছে। এখন কি সময় এসেছে যে এই গোষ্ঠীগুলি একত্রিত হবে? তাদেরও এটি করতে হবে, কারণ সহযোগিতা এবং অ্যালগরিদমের সংমিশ্রণ সত্যিকারের সর্বজনীন এআই (এজিআই) অর্জনের একমাত্র উপায়। এখানে মেশিন লার্নিং পদ্ধতির বিবর্তনের পথ এবং ভবিষ্যতের সম্ভাব্য নমুনা দেওয়া হয়েছে।

    1. পাঁচটি প্রধান প্রজাতি

      ১ প্রতীকবাদঃ জ্ঞান বর্ণনা এবং যৌক্তিক যুক্তির জন্য প্রতীক, নিয়ম এবং যুক্তিবিজ্ঞান ব্যবহার করা হয়। প্রিয় অ্যালগরিদম হলঃ নিয়ম এবং সিদ্ধান্ত গাছ ২য় বেয়েস পদ্ধতিঃ ঘটনার সম্ভাবনা অর্জন করে সম্ভাব্যতা মূল্যায়ন করা, পছন্দের অ্যালগরিদম হলঃ সরল বেয়েস বা মার্কভ ৩. সংযুক্তিবাদঃ সম্ভাব্যতা ম্যাট্রিক্স এবং ওজনযুক্ত নিউরন ব্যবহার করে গতিশীলভাবে প্যাটার্ন সনাক্ত এবং ইন্ডাকশন করতে, প্রিয় অ্যালগরিদম হলঃ নিউরাল নেটওয়ার্ক ৪. বিবর্তনবাদঃ পরিবর্তন উৎপন্ন করা এবং তারপরে নির্দিষ্ট লক্ষ্যের জন্য এর মধ্যে সর্বোত্তম এবং পছন্দের অ্যালগরিদমটি হলঃ জেনেটিক অ্যালগরিদম 5Analogizer: সীমাবদ্ধতা অনুযায়ী ফাংশন অপ্টিমাইজ করা ((যতটা সম্ভব উচ্চতর যেতে, কিন্তু একই সময়ে রাস্তা থেকে দূরে না), প্রিয় অ্যালগরিদম হলঃ ভেক্টর মেশিন সমর্থন

      img

    2. বিবর্তনের পর্যায়

      ১৯৮০ এর দশক

      প্রধান ধারাঃ প্রতীকবাদ আর্কিটেকচারঃ সার্ভার বা বড় মেশিন প্রধান তত্ত্বঃ জ্ঞান প্রকৌশল মৌলিক সিদ্ধান্ত লজিকঃ সিদ্ধান্ত সমর্থন সিস্টেম, সীমিত কার্যকারিতা

      ১৯৯০-২০০০ সাল

      প্রধান ধারাঃ বেয়েজ স্থাপত্যঃ ছোট সার্ভার ক্লাস্টার প্রধান তত্ত্বঃ সম্ভাব্যতা তত্ত্ব শ্রেণীবিন্যাসঃ স্কেলযোগ্য তুলনা বা বিপরীতে, অনেক কাজের জন্য যথেষ্ট ভাল

      ২০১০-এর দশকের গোড়ার দিকে

      প্রধান ধারাঃ সংহতিবাদ স্থাপত্যঃ বড় সার্ভার ফার্ম প্রধান তত্ত্বঃ স্নায়ুবিজ্ঞান এবং সম্ভাব্যতা সনাক্তকরণঃ আরও সুনির্দিষ্ট চিত্র এবং শব্দ সনাক্তকরণ, অনুবাদ, আবেগ বিশ্লেষণ ইত্যাদি

      img

    3. এই দুটি ধারা একসাথে কাজ করবে এবং তাদের নিজস্ব পদ্ধতি একত্রিত করবে।

      ২০১০-এর দশকের শেষভাগ

      প্রধান ধারাঃ সংমিশ্রণবাদ + প্রতীকবাদ আর্কিটেকচারঃ অনেক মেঘ প্রধান তত্ত্বঃ মেমরি নিউরাল নেটওয়ার্ক, ব্যাপক ইন্টিগ্রেশন, জ্ঞান ভিত্তিক যুক্তি সহজ উত্তরঃ সংকীর্ণ, ক্ষেত্র-নির্দিষ্ট জ্ঞান ভাগাভাগি

      ২০২০-এর দশক

      প্রধান ধারাঃ সংমিশ্রণবাদ + প্রতীকবাদ + বেয়েজ +... স্থাপত্যঃ ক্লাউড কম্পিউটিং এবং কুয়াশা কম্পিউটিং প্রধান তত্ত্বঃ উপলব্ধি করার সময় নেটওয়ার্ক, যুক্তি এবং কাজের সময় নিয়ম রয়েছে সহজ উপলব্ধি, যুক্তি এবং কর্মঃ সীমিত স্বয়ংক্রিয়তা বা মানব-জাগতিক মিথস্ক্রিয়া

      ২০৪০-এর দশক

      প্রধান ধারাঃ অ্যালগরিদমের সংমিশ্রণ স্থাপত্যঃ সর্বত্র সার্ভার প্রধান তত্ত্বঃ সেরা সমন্বয় মেটা লার্নিং উপলব্ধি এবং প্রতিক্রিয়াঃ বিভিন্ন শেখার পদ্ধতির মাধ্যমে অর্জিত জ্ঞান বা অভিজ্ঞতার উপর ভিত্তি করে পদক্ষেপ বা প্রতিক্রিয়া জানানো

  • ৩. মেশিন লার্নিং এর অ্যালগরিদম

    img

    আপনার কোন মেশিন লার্নিং অ্যালগরিদম ব্যবহার করা উচিত? এটি প্রচুর পরিমাণে উপলব্ধ ডেটার প্রকৃতি এবং পরিমাণ এবং প্রতিটি নির্দিষ্ট ব্যবহারের ক্ষেত্রে আপনার প্রশিক্ষণের লক্ষ্যের উপর নির্ভর করে। সবচেয়ে জটিল অ্যালগরিদমগুলি ব্যবহার করবেন না, যদি না এর ফলাফল ব্যয়বহুল ব্যয় এবং সংস্থানগুলির জন্য মূল্যবান হয়। এখানে কয়েকটি সাধারণ অ্যালগরিদম দেওয়া হয়েছে, ব্যবহারের সহজতার স্তরে সাজানো।

    1. সিদ্ধান্ত বৃক্ষঃ ধাপে ধাপে উত্তর দেওয়ার সময়, একটি সাধারণ সিদ্ধান্ত বৃক্ষ বিশ্লেষণ স্তরিত ভেরিয়েবল বা সিদ্ধান্তের নোড ব্যবহার করে, উদাহরণস্বরূপ, একটি নির্দিষ্ট ব্যবহারকারীকে বিশ্বাসযোগ্য বা অবিশ্বস্ত হিসাবে শ্রেণীবদ্ধ করা যায়।

      গুণাবলীঃ বিভিন্ন বৈশিষ্ট্য, গুণাবলী এবং ব্যক্তি, স্থান এবং জিনিসগুলির বৈশিষ্ট্যগুলি মূল্যায়ন করতে দক্ষ দৃশ্যের উদাহরণঃ নিয়ম ভিত্তিক ক্রেডিট মূল্যায়ন, ঘোড়দৌড়ের ফলাফলের পূর্বাভাস

      img

    2. সাপোর্ট ভেক্টর মেশিনঃ হাইপারপ্লেন ভিত্তিক, যা ভেক্টর মেশিনকে ডেটাসেটের শ্রেণীবিভাগ করতে সহায়তা করে।

      উপকারিতাঃ ভেক্টর মেশিনগুলিকে সমর্থন করে যা ভেরিয়েবল এক্স এবং অন্যান্য ভেরিয়েবলগুলির মধ্যে দ্বিপদী শ্রেণিবদ্ধকরণ অপারেশন করতে দক্ষ, তাদের সম্পর্কগুলি রৈখিক কিনা উদাহরণস্বরূপঃ সংবাদ শ্রেণীবিভাগ, হস্তাক্ষর সনাক্তকরণ।

    3. রিগ্রেশন (Regression): রিগ্রেশন একটি ক্রিয়াশীল ভেরিয়েবলের সাথে এক বা একাধিক ক্রিয়াশীল ভেরিয়েবলের মধ্যে অবস্থার সম্পর্ককে চিহ্নিত করতে পারে। এই ক্ষেত্রে, স্প্যাম এবং নন-স্প্যামের মধ্যে পার্থক্য করা হয়েছে।

      উপকারিতাঃ রিগ্রেশনটি ভেরিয়েবলগুলির মধ্যে ধারাবাহিক সম্পর্ক সনাক্ত করতে ব্যবহার করা যেতে পারে, এমনকি যদি সম্পর্কটি খুব স্পষ্ট না হয় দৃশ্যের উদাহরণঃ রাস্তার ট্রাফিক বিশ্লেষণ, মেইল ফিল্টারিং

      img

    4. Naive Bayes Classification: Naive Bayes Classifier ব্যবহার করা হয় সম্ভাব্য শর্তগুলির শাখার সম্ভাব্যতা গণনা করার জন্য; প্রতিটি স্বতন্ত্র বৈশিষ্ট্য "নাম্বর" বা শর্ত-নিরপেক্ষ, তাই তারা অন্য কোনও বস্তুর উপর প্রভাব ফেলবে না। উদাহরণস্বরূপ, পাঁচটি হলুদ এবং লাল গোলকযুক্ত একটি বাক্সে দুটি হলুদ গোলক ধারাবাহিকভাবে ধরা পড়ার সম্ভাবনা কত? চিত্রের উপরের শাখার থেকে দেখা যায়, সামনে থেকে পিছনে দুটি হলুদ গোলক ধরার সম্ভাবনা 1/10। Naive Bayes Classifier একাধিক বৈশিষ্ট্যগুলির জন্য যৌথ শর্তের সম্ভাব্যতা গণনা করতে পারে।

      উপকারিতাঃ একটি ছোট ডেটাসেটে উল্লেখযোগ্য বৈশিষ্ট্যযুক্ত সম্পর্কিত বস্তুগুলির জন্য, সরল বেয়েজ পদ্ধতিগুলি দ্রুত শ্রেণিবদ্ধ করতে পারে দৃশ্যের উদাহরণঃ আবেগ বিশ্লেষণ, ভোক্তা শ্রেণীবিভাগ

    5. লুকানো মার্কভ মডেলঃ একটি লুকানো মার্কভ প্রক্রিয়া যা সম্পূর্ণ নিশ্চিত হয় যে একটি নির্দিষ্ট অবস্থা প্রায়শই অন্যটির সাথে থাকে; একটি ট্র্যাফিক লাইট একটি উদাহরণ; পরিবর্তে, লুকানো মার্কভ মডেল দৃশ্যমান তথ্য বিশ্লেষণ করে লুকানো অবস্থার ঘটনা গণনা করে। তারপরে লুকানো অবস্থার বিশ্লেষণের সাহায্যে লুকানো মার্কভ মডেল সম্ভাব্য ভবিষ্যতের পর্যবেক্ষণের প্যাটার্নগুলি অনুমান করতে পারে। এই ক্ষেত্রে, উচ্চ বা নিম্ন বায়ু চাপের সম্ভাবনা (যা লুকানো অবস্থার) পরিষ্কার, বৃষ্টির দিন, মেঘলা দিনগুলির সম্ভাবনা পূর্বাভাস দিতে ব্যবহৃত হয়।

      উপকারিতাঃ ডেটা পরিবর্তনশীলতা অনুমতি দেয়, স্বীকৃতি এবং পূর্বাভাস অপারেশন জন্য ব্যবহার করা যেতে পারে দৃশ্যের উদাহরণঃ মুখের ভাব বিশ্লেষণ, আবহাওয়া পূর্বাভাস

      img

    6. র্যান্ডম ফরেস্টঃ র্যান্ডম ফরেস্ট অ্যালগরিদমগুলি র্যান্ডমভাবে নির্বাচিত ডেটা সাবসেট সহ একাধিক গাছ ব্যবহার করে সিদ্ধান্ত গাছের নির্ভুলতা উন্নত করে। এই উদাহরণটি একটি জিনের অভিব্যক্তি স্তরে প্রচুর পরিমাণে স্তন ক্যান্সারের পুনরাবৃত্তির সাথে সম্পর্কিত জিনগুলি পরীক্ষা করে এবং পুনরাবৃত্তির ঝুঁকি গণনা করে।

      উপকারিতাঃ এলোমেলো বন পদ্ধতি বড় ডেটা সেট এবং প্রচুর এবং কখনও কখনও অপ্রাসঙ্গিক বৈশিষ্ট্য উপস্থিত আইটেমগুলির জন্য দরকারী প্রমাণিত হয়েছে দৃশ্যের উদাহরণঃ ব্যবহারকারীর ক্ষতির বিশ্লেষণ, ঝুঁকি মূল্যায়ন

    7. পুনরাবৃত্তীয় নিউরাল নেটওয়ার্কঃ যেকোনও নিউরাল নেটওয়ার্কে, প্রতিটি নিউরন এক বা একাধিক লুকানো স্তরের মাধ্যমে অনেকগুলি ইনপুটকে একক আউটপুটে রূপান্তর করে। পুনরাবৃত্তীয় নিউরাল নেটওয়ার্ক (আরএনএন) মানগুলিকে আরও স্তর দ্বারা স্তরিত করে, স্তর-স্তরীয় শেখার অনুমতি দেয়। অন্য কথায়, আরএনএনগুলিতে কোনও ধরণের স্মৃতি রয়েছে যা পূর্ববর্তী আউটপুটগুলি পরবর্তী ইনপুটগুলিকে প্রভাবিত করতে দেয়।

      উপকারিতাঃ সার্কুলার নিউরাল নেটওয়ার্কগুলি প্রচুর পরিমাণে সুশৃঙ্খল তথ্যের উপস্থিতিতে ভবিষ্যদ্বাণী করতে সক্ষম দৃশ্যের উদাহরণঃ চিত্র শ্রেণীবিভাগ এবং সাবটাইটেল যোগ করা, রাজনৈতিক আবেগ বিশ্লেষণ

      img

    8. দীর্ঘ স্বল্পমেয়াদী মেমরি (এলএসটিএম) এবং গেটেড রিকুরেনন্ট ইউনিট নেরুয়াল নেটওয়ার্ক (জিআরইউ) - প্রাথমিক RNN-এর ফর্মগুলি হ্রাসযুক্ত। যদিও এই প্রাথমিক লুপিকাল নিউরাল নেটওয়ার্কগুলি কেবলমাত্র অল্প পরিমাণে প্রাথমিক তথ্য সংরক্ষণের অনুমতি দেয়, তবে নতুন লম্বা মেমরি (এলএসটিএম) এবং গেটেড রিকুরেনন্ট ইউনিট (জিআরইউ) নিউরাল নেটওয়ার্কগুলি উভয়ই দীর্ঘমেয়াদী এবং স্বল্পমেয়াদী স্মৃতি রয়েছে। অন্য কথায়, এই নতুন RNNs এর আরও ভাল নিয়ন্ত্রণ স্মৃতি ক্ষমতা রয়েছে যা পূর্ববর্তী প্রক্রিয়াজাতকরণকে সংরক্ষণ করতে দেয় বা যখন অনেকগুলি ধারাবাহিক পদক্ষেপের প্রয়োজন হয় তখন এই মানগুলি পুনরায় স্থাপন করতে দেয়, যা "গ্রেডিয়েট হ্রাস" বা স্তরযুক্ত মানগুলির চূড়ান্ত অবনতি এড়ায়।

      উপকারিতাঃ দীর্ঘ এবং স্বল্পমেয়াদী স্মৃতি এবং গেট-নিয়ন্ত্রিত সঞ্চালনশীল নিউরাল নেটওয়ার্কগুলি অন্যান্য সঞ্চালনশীল নিউরাল নেটওয়ার্কগুলির মতো একই সুবিধা রয়েছে তবে তাদের আরও ভাল স্মৃতিশক্তি থাকার কারণে আরও বেশি ব্যবহৃত হয় দৃশ্যের উদাহরণঃ প্রাকৃতিক ভাষা প্রক্রিয়াকরণ, অনুবাদ

    9. কনভোলিউশনাল নিউরাল নেটওয়ার্কঃ কনভোলিউশন হল পরবর্তী স্তর থেকে ওজনগুলির সংমিশ্রণ, যা আউটপুট স্তর চিহ্নিত করতে ব্যবহার করা যেতে পারে।

      উপকারিতাঃ খুব বড় ডেটাসেট, প্রচুর বৈশিষ্ট্য এবং জটিল শ্রেণিবদ্ধকরণ কাজগুলির জন্য, কনভলপমেন্ট নিউরাল নেটওয়ার্কগুলি খুব দরকারী দৃশ্যের উদাহরণঃ চিত্র সনাক্তকরণ, পাঠ্য রূপান্তর, ওষুধের আবিষ্কার

  • মূল লিংকঃ

    http://usblogs.pwc.com/emerging-technology/a-look-at-machine-learning-infographic/

    http://usblogs.pwc.com/emerging-technology/machine-learning-methods-infographic/

    http://usblogs.pwc.com/emerging-technology/machine-learning-evolution-infographic/

বিগ ডেটা প্ল্যাটফর্ম থেকে পুনর্নির্দেশিত


আরো