Perjalanan Algoritma Pembelajaran Mesin

Penulis:Mimpi kecil, Dibuat: 2017-02-25 09:37:02, Diperbarui:

Perjalanan Algoritma Pembelajaran Mesin

Dalam memahami masalah pembelajaran mesin yang perlu kita selesaikan.http://machinelearningmastery.com/practical-machine-learning-problems/Setelah itu, kita bisa berpikir tentang data apa yang perlu kita kumpulkan dan algoritma apa yang bisa kita gunakan. Dalam artikel ini, kita akan membahas algoritma pembelajaran mesin yang paling populer dan melihat secara umum metode apa yang tersedia dan berguna. Ada banyak algoritma di bidang pembelajaran mesin, dan setiap algoritma memiliki banyak ekstensi, jadi sangat sulit untuk menentukan algoritma yang tepat untuk masalah tertentu. Dalam artikel ini saya ingin memberi Anda dua cara untuk mengindikasikan algoritma yang akan Anda hadapi di dunia nyata.

  • Cara Belajar

    Algorithm dibagi menjadi beberapa kategori berdasarkan bagaimana mereka memproses pengalaman, lingkungan, atau data apa pun yang kita sebut sebagai input.

    Hanya beberapa gaya belajar atau model belajar utama yang dibahas di sini, dan beberapa contoh dasar. Metode klasifikasi atau organisasi ini bagus karena memaksa Anda untuk berpikir tentang peran dan proses persiapan model untuk memasukkan data, dan kemudian memilih algoritma yang paling sesuai dengan masalah Anda untuk mendapatkan hasil terbaik.

    Pembelajaran pengawasan: data yang dimasukkan disebut data pelatihan, dan memiliki hasil yang diketahui atau ditandai. Misalnya apakah sebuah email adalah spam, atau harga saham dalam jangka waktu tertentu. Model membuat prediksi, dan jika salah, itu akan diperbaiki. Proses ini terus berlanjut sampai data pelatihan memenuhi standar yang tepat. Pembelajaran tanpa pengawasan: data input tidak ditandai dan tidak ada hasil yang ditentukan. Model menginduksi struktur dan nilai-nilai data. Contoh masalah termasuk pembelajaran aturan asosiasi dan masalah pengelompokan, contoh algoritma termasuk algoritma apriori dan algoritma rata-rata K. Pembelajaran semisupervised: data input adalah campuran data yang ditandai dan tidak ditandai, ada beberapa masalah prediksi tetapi model juga harus mempelajari struktur dan komposisi data. Contoh masalah termasuk masalah klasifikasi dan regresi, contoh algoritma pada dasarnya merupakan perpanjangan dari algoritma pembelajaran tanpa pengawasan. Pembelajaran yang ditingkatkan: data input dapat merangsang model dan membuat model bereaksi. Umpan balik tidak hanya diperoleh dari proses belajar yang diawasi, tetapi juga dari imbalan atau hukuman di lingkungan. Contoh masalah adalah kontrol robot, contoh algoritma termasuk Q-learning dan Pembelajaran perbedaan temporal.

    Ketika mengintegrasikan data untuk membuat keputusan bisnis, sebagian besar menggunakan metode pembelajaran yang diawasi dan pembelajaran yang tidak diawasi. Topik berikutnya adalah pembelajaran semi-diawasi, seperti masalah klasifikasi gambar, yang memiliki database besar, tetapi hanya sebagian kecil gambar yang ditandai. Pembelajaran yang ditingkatkan sebagian besar digunakan dalam pengembangan kontrol robot dan sistem kontrol lainnya.

  • Kemiripan algoritma

    Algoritma pada dasarnya diklasifikasikan berdasarkan fungsi atau bentuknya. Misalnya, algoritma berbasis pohon, algoritma jejaring saraf. Ini adalah cara yang sangat berguna untuk mengklasifikasikan, tetapi tidak sempurna. Karena banyak algoritma yang dapat dengan mudah dibagi menjadi dua kategori, seperti Learning Vector Quantization yang merupakan algoritma kelas jejaring saraf dan metode berbasis contoh.

    Di bagian ini saya mencantumkan algoritma yang menurut saya merupakan metode yang paling intuitif untuk mengklasifikasikan. Saya tidak memiliki algoritma atau metode klasifikasi yang lengkap, tetapi saya pikir ini sangat membantu untuk memberi pembaca gambaran yang lebih besar. Jika Anda memiliki pengetahuan yang tidak saya sebutkan, silakan berbagi. Mari kita mulai sekarang!

  • Regresi

    Regression (analisis regresi) berkaitan dengan hubungan antara variabel. Ia menggunakan metode statistik, beberapa contoh algoritma termasuk:

    Kuadrat Kecil Biasa Regresi Logistik Regresi bertahap Splines Regresi Adaptif Multivariate (MARS) Perataan Scatterplot Perkiraan Lokal (LOESS)

  • Metode berbasis instansi

    Pembelajaran berbasis contoh (Instance based learning) adalah simulasi masalah keputusan, contoh atau contoh yang digunakan sangat penting untuk model. Pendekatan ini membangun basis data atas data yang ada dan menambahkan data baru ke dalamnya, kemudian menggunakan metode pengukuran kesamaan untuk menemukan pertandingan terbaik dan membuat prediksi di basis data. Untuk alasan ini, metode ini juga dikenal sebagai metode pemenang raja dan metode berbasis memori.

    k-Negara tetangga terdekat (kNN) Pembelajaran Kuantisasi Vektor (LVQ) Peta Pengorganisasian Sendiri (SOM)

  • Metode Regularisasi

    Ini adalah perpanjangan dari metode lain (biasanya metode regresi), yang semakin menguntungkan model yang lebih sederhana dan lebih baik untuk diinduksi. Saya mencantumkannya di sini karena popularitas dan kekuatannya.

    Regresi Ridge Operator Penyusutan dan Seleksi Absolute Minimum (LASSO) Jaringan elastis

  • Pembelajaran Pohon Keputusan

    Metode pohon keputusan membangun model keputusan berdasarkan nilai aktual dalam data. Pohon keputusan digunakan untuk memecahkan masalah induksi dan regresi.

    Pohon Klasifikasi dan Regresi (CART) Dichotomiser Iteratif 3 (ID3) C4.5 Deteksi Interaksi Otomatis Chi-squared (CHAID) Pohon Keputusan Hutan acak Splines Regresi Adaptif Multivariate (MARS) Mesin Penguat Giring (GBM)

  • Bayesian

    Metode Bayesian adalah metode yang menggunakan teorema Bayesian dalam memecahkan masalah klasifikasi dan regresi.

    Bayes Naif Perkiraan rata-rata satu ketergantungan (AODE) Jaringan Keyakinan Bayesian (BBN)

  • Metode Kernel

    Yang paling terkenal dari Kernel Method adalah Support Vector Machines. Metode ini memetakan data input ke dimensi yang lebih tinggi, sehingga beberapa masalah klasifikasi dan regresi lebih mudah dimodelkan.

    Mesin vektor pendukung (SVM) Fungsi Dasar Radial (RBF) Analisis Diskriminasi Linear (LDA)

  • Metode Pengelompokan

    Clustering, sendiri, menggambarkan masalah dan metode. Metode clustering biasanya diklasifikasikan dengan cara pemodelan. Semua metode clustering menggunakan struktur data yang seragam untuk mengatur data sehingga setiap kelompok memiliki kesamaan yang paling banyak.

    K-Rata Maximizasi Harapan (EM)

  • Belajar Aturan Asosiasi

    Association rule learning adalah metode yang digunakan untuk mengekstrak aturan dari data yang memungkinkan untuk menemukan hubungan antara data ruang multi-dimensi yang sangat besar, dan hubungan penting ini dapat digunakan oleh organisasi.

    Algoritma sebelumnya Algoritma Eclat

  • Jaringan saraf buatan

    Jaringan saraf buatan (AI) terinspirasi dari struktur dan fungsi jaringan saraf biologis. Jaringan neural buatan (AI) adalah bagian dari kategori pencocokan pola yang sering digunakan untuk masalah regresi dan klasifikasi, tetapi terdiri dari ratusan algoritma dan varian. Beberapa di antaranya adalah algoritma klasik yang populer.

    Perceptron Perkembangan Belakang Jaringan Hopfield Peta Pengorganisasian Sendiri (SOM) Pembelajaran Kuantisasi Vektor (LVQ)

  • Pembelajaran mendalam

    Metode pembelajaran mendalam (dalam bahasa Inggris: deep learning) adalah pembaruan modern dari jaringan saraf buatan. Berbeda dengan jaringan saraf tradisional, yang memiliki struktur jaringan yang lebih kompleks, banyak metode yang berkaitan dengan pembelajaran semisupervisory. Masalah pembelajaran ini memiliki data yang besar, tetapi sedikit yang ditandai.

    Mesin Boltzmann Terbatas (RBM) Jaringan Keyakinan mendalam (DBN) Jaringan Konvolutional Auto-encoder ditumpuk

  • Pengurangan Dimensi

    Dimensionality Reduction, seperti metode pengelompokan, mengejar dan memanfaatkan struktur yang seragam dalam data, tetapi dengan informasi yang lebih sedikit untuk mengindikasikan dan menggambarkan data. Ini berguna untuk memvisualisasikan atau menyederhanakan data.

    Analisis Komponen Utama (PCA) Regresi kuadrat terkecil parsial (PLS) Sammon Mapping Skala Multidimensional (MDS) Menguasai Proyeksi

  • Menggabungkan Metode

    Ensemble methods (metode kombinasi) terdiri dari banyak model kecil yang dilatih secara independen, membuat kesimpulan independen, dan akhirnya membentuk prediksi umum. Banyak penelitian yang berfokus pada model apa yang digunakan dan bagaimana model-model ini dikombinasikan.

    Meningkatkan Bootstrapped Aggregation (Pengemas) AdaBoost Generalisasi ditumpuk (pencampuran) Mesin Penguat Giring (GBM) Hutan acak

img

Ini adalah contoh yang disesuaikan dengan metode kombinasi (dari wiki), dengan setiap metode pemadam kebakaran dilambangkan dengan warna abu-abu, dan prediksi akhir yang disintesis dilambangkan dengan warna merah.

  • Sumber Daya Lainnya

    Ini adalah tur ke algoritma pembelajaran mesin yang bertujuan untuk memberi Anda gambaran tentang algoritma apa yang ada dan beberapa alat yang terkait dengan algoritma.

    Di bawah ini adalah beberapa sumber daya lain, jangan terlalu banyak, belajar lebih banyak algoritma akan lebih baik untuk Anda, tetapi pengetahuan yang mendalam tentang beberapa algoritma juga akan berguna.

    • List of Machine Learning Algorithms: Ini adalah sumber daya di wiki, meskipun lengkap, tetapi saya pikir klasifikasi tidak bagus.
    • Machine Learning Algorithms Category: Ini juga sumber di wiki, sedikit lebih baik dari yang di atas, disusun secara alfabetis.
    • CRAN Task View: Machine Learning & Statistical Learning: R Language Extension for Machine Learning Algorithms, untuk melihat apakah Anda lebih memahami apa yang digunakan orang lain.
    • Top 10 Algorithms in Data Mining: Ini adalah artikel yang diterbitkan, sekarang buku, yang mencakup algoritma penambangan data yang paling populer.

Dipindahkan dari Bolloré Column/Developer Python


Lebih banyak