avatar of 发明者量化-小小梦 发明者量化-小小梦
fokus pada mesej peribadi
4
fokus pada
1271
Pengikut

Tiga gambar untuk memahami pembelajaran mesin: konsep asas, lima sekolah utama dan sembilan algoritma biasa

Dicipta dalam: 2017-05-02 14:49:49, dikemas kini pada:
comments   0
hits   2358

Tiga gambar untuk memahami pembelajaran mesin: konsep asas, lima sekolah utama dan sembilan algoritma biasa

  • #### I. Gambaran Pembelajaran Mesin

Tiga gambar untuk memahami pembelajaran mesin: konsep asas, lima sekolah utama dan sembilan algoritma biasa

  1. Apakah itu pembelajaran mesin?

    Mesin belajar dengan menganalisis sejumlah besar data. Sebagai contoh, mereka tidak perlu diprogram untuk mengenali kucing atau wajah manusia, mereka boleh dilatih dengan menggunakan imej untuk mengintegrasikan dan mengenali sasaran tertentu.

  2. Hubungan antara pembelajaran mesin dan kecerdasan buatan

    Pembelajaran mesin adalah satu kategori penyelidikan dan algoritma yang mencari corak dalam data dan menggunakan corak tersebut untuk membuat ramalan. Pembelajaran mesin adalah sebahagian daripada bidang kecerdasan buatan dan bersinggungan dengan penemuan pengetahuan dan penggalian data.

    Tiga gambar untuk memahami pembelajaran mesin: konsep asas, lima sekolah utama dan sembilan algoritma biasa

  3. Cara Pembelajaran Mesin Bekerja

    1 Pilih data: Bahagikan data anda kepada tiga kumpulan: data latihan, data pengesahan dan data ujian 2 Data model: menggunakan data latihan untuk membina model yang menggunakan ciri-ciri yang berkaitan 3 Model pengesahan: menggunakan data pengesahan anda untuk mengakses model anda 4 Model ujian: Performa model yang disahkan dengan menggunakan data ujian anda 5 Menggunakan model: menggunakan model yang terlatih untuk membuat ramalan pada data baru 6 Model penyesuaian: menggunakan lebih banyak data, ciri-ciri yang berbeza atau parameter yang disesuaikan untuk meningkatkan prestasi algoritma

    Tiga gambar untuk memahami pembelajaran mesin: konsep asas, lima sekolah utama dan sembilan algoritma biasa

  4. Di mana pembelajaran mesin berada?

    1 Pemrograman tradisional: Jurutera perisian menulis program untuk menyelesaikan masalah. Pertama, terdapat beberapa data→ Untuk menyelesaikan masalah, jurutera perisian menulis proses untuk memberitahu mesin apa yang harus dilakukan→ Komputer mematuhi proses ini dan menghasilkan hasilnya 2 Statistik: Penganalisis membandingkan hubungan antara pembolehubah 3 Pembelajaran mesin: Saintis data menggunakan set data latihan untuk mengajar komputer apa yang harus dilakukan, dan kemudian sistem melaksanakan tugas tersebut. Pertama, terdapat data besar→ Mesin akan belajar menggunakan set data latihan untuk membuat klasifikasi, menyesuaikan algoritma tertentu untuk mencapai klasifikasi sasaran→ Komputer dapat belajar mengenali hubungan, trend dan pola dalam data 4 Aplikasi pintar: Aplikasi pintar menggunakan hasil yang diperolehi daripada kecerdasan buatan, seperti contoh aplikasi pertanian tepat yang berdasarkan data yang dikumpulkan oleh drone

    Tiga gambar untuk memahami pembelajaran mesin: konsep asas, lima sekolah utama dan sembilan algoritma biasa

  5. Aplikasi praktikal pembelajaran mesin

    Terdapat banyak aplikasi pembelajaran mesin, dan ini adalah beberapa contoh, bagaimana anda boleh menggunakannya?

    Pemetaan dan Pemodelan 3D Cepat: Untuk membina jambatan kereta api, saintis data dan pakar bidang PwC menggunakan pembelajaran mesin ke data yang dikumpulkan oleh drone. Kombinasi ini membolehkan pemantauan tepat dan maklum balas cepat mengenai kejayaan kerja.

    Penguatan analisis untuk mengurangkan risiko: Untuk mengesan urus niaga dalaman, PwC menggabungkan pembelajaran mesin dengan teknik analisis lain, yang menghasilkan profil pengguna yang lebih komprehensif dan pemahaman yang lebih mendalam mengenai tingkah laku yang kompleks dan mencurigakan.

    Tujuan untuk meramalkan prestasi terbaik: PwC menggunakan pembelajaran mesin dan kaedah analisis lain untuk menilai potensi kuda yang berbeza di gelanggang Melbourne Cup.

  • #### Kedua, evolusi pembelajaran mesin

Tiga gambar untuk memahami pembelajaran mesin: konsep asas, lima sekolah utama dan sembilan algoritma biasa

Selama beberapa dekad, “suku” penyelidik kecerdasan buatan telah bersaing antara satu sama lain untuk dominasi. Adakah ini masa untuk mereka bersatu? Mereka mungkin perlu melakukannya, kerana kerjasama dan penggabungan algoritma adalah satu-satunya cara untuk mencapai kecerdasan buatan umum yang benar-benar universal (AGI).

  1. Lima aliran utama

    1 Simbolisme: menggunakan simbol, peraturan dan logik untuk mewakili pengetahuan dan melakukan penalaran logik, algoritma kegemaran adalah: peraturan dan pokok keputusan 2 Bayesian: mengambil kemungkinan yang berlaku untuk membuat kesimpulan kebarangkalian, algoritma kegemaran: Bayesian polos atau Markov 3 Linkageism: Menggunakan probabiliti matriks dan neuron berat untuk mengenal pasti dan mengintegrasikan pola secara dinamik, algoritma kegemaran: Jaringan saraf 4 Evolusi: menghasilkan perubahan dan kemudian mengambil yang terbaik untuk tujuan tertentu, algoritma kegemaran adalah: algoritma genetik 5 Analogizer: mengoptimumkan fungsi mengikut syarat-syarat yang terhad ((pergi ke tempat yang lebih tinggi, tetapi jangan keluar dari jalan raya pada masa yang sama)) Algoritma kegemaran: menyokong mesin vektor

    Tiga gambar untuk memahami pembelajaran mesin: konsep asas, lima sekolah utama dan sembilan algoritma biasa

  2. Peringkat evolusi

    1980an

    Genre utama: Simbolisme Arkitektur: pelayan atau komputer besar Teori utama: kejuruteraan pengetahuan Logik dasar keputusan: Sistem sokongan keputusan, kesempurnaan terhad

    1990an hingga 2000

    Genre utama: Bayes Arkitektur: Kluster pelayan kecil Teori utama: teori kebarangkalian Kategori: Perbandingan atau perbandingan yang boleh diperluas, cukup baik untuk banyak tugas

    Permulaan dan pertengahan 2010

    Genre utama: Kesatuan Arkitektur: ladang pelayan besar Teori utama: sains saraf dan kebarangkalian Pengiktirafan: pengiktirafan imej dan suara yang lebih tepat, terjemahan, analisis emosi dan sebagainya

    Tiga gambar untuk memahami pembelajaran mesin: konsep asas, lima sekolah utama dan sembilan algoritma biasa

  3. Kumpulan-kumpulan ini berharap dapat bekerjasama dan menggabungkan pendekatan mereka.

    Akhir tahun 2010-an

    Genre utama: Kesatuan + Simbolisme Arkitektur: banyak awan Teori utama: rangkaian saraf ingatan, integrasi besar-besaran, penalaran berdasarkan pengetahuan Soalan dan Jawapan Sederhana: Perkongsian pengetahuan yang terhad dan khusus

    2020+

    Genre utama: Kesatuan + Simbolisme + Bayesian + … Arkitektur: pengkomputeran awan dan perisian kabut Teori yang dominan: Persepsi mempunyai rangkaian, penalaran dan kerja mempunyai peraturan Persepsi, penalaran, dan tindakan mudah: automasi atau interaksi manusia-mesin yang terhad

    2040-an +

    Genre utama: Perpaduan Algoritma Arkitektur: pelayan di mana-mana Teori utama: Pembelajaran Meta dengan kombinasi yang terbaik Persepsi dan tindak balas: bertindak atau memberi jawapan berdasarkan pengetahuan atau pengalaman yang diperoleh melalui pelbagai cara pembelajaran

  • #### Ketiga, algoritma pembelajaran mesin

Tiga gambar untuk memahami pembelajaran mesin: konsep asas, lima sekolah utama dan sembilan algoritma biasa

Algoritma pembelajaran mesin mana yang harus anda gunakan? Ini sangat bergantung kepada sifat dan jumlah data yang tersedia dan matlamat latihan anda dalam setiap kes penggunaan tertentu. Jangan gunakan algoritma yang paling rumit kecuali hasilnya bernilai perbelanjaan dan sumber yang mahal.

  1. Pohon Keputusan: Dalam proses tindak balas beransur-ansur, analisis pokok keputusan biasa menggunakan pembolehubah berlapis atau nod keputusan, contohnya, untuk mengklasifikasikan pengguna yang diberikan sebagai kredit yang boleh dipercayai atau tidak boleh dipercayai.

    Kelebihan: Kebolehan menilai pelbagai ciri, kualiti, dan ciri orang, tempat, dan benda Contohnya: penilaian kredit berdasarkan peraturan, ramalan hasil perlumbaan

    Tiga gambar untuk memahami pembelajaran mesin: konsep asas, lima sekolah utama dan sembilan algoritma biasa

  2. Mesin vektor sokongan: Berdasarkan hyperplane, mesin vektor sokongan dapat mengklasifikasikan kumpulan data.

    Kelebihan: Membantu mesin vektor yang mahir melakukan operasi klasifikasi binari antara pembolehubah X dan pembolehubah lain, sama ada hubungannya adalah linear atau tidak Contoh: Pengelompokan berita, pengenalan tulisan tangan.

  3. Regression: Regression boleh menggambarkan hubungan keadaan antara pembolehubah faktor dengan satu atau lebih pembolehubah faktor. Dalam contoh ini, spam dan bukan spam dibezakan.

    Kelebihan: Regresen boleh digunakan untuk mengenal pasti hubungan berkesinambungan antara pembolehubah, walaupun hubungan ini tidak begitu jelas Contoh: analisis trafik jalan raya, penapisan e-mel

    Tiga gambar untuk memahami pembelajaran mesin: konsep asas, lima sekolah utama dan sembilan algoritma biasa

  4. Klasifikasi Naif Bayes: Klasifikasi Naif Bayes digunakan untuk mengira kebarangkalian cabang dari kemungkinan keadaan. Setiap ciri-ciri bebas adalah “naif” atau bebas syarat, jadi mereka tidak mempengaruhi objek lain. Sebagai contoh, dalam kotak yang mengandungi 5 bola kecil kuning dan merah, berapa kebarangkalian mendapat dua bola kecil kuning berturut-turut?

    Kelebihan: Untuk objek berkaitan yang mempunyai ciri-ciri yang ketara dalam set data kecil, kaedah Bayesian yang sederhana dapat dikelaskan dengan cepat Contoh situasi: analisis emosi, pengelompokan pengguna

  5. Model Hidden Markov: proses Markov yang menunjukkan kepastian mutlak bahawa satu keadaan yang diberikan sering disertai dengan keadaan lain. Lampu isyarat lalu lintas adalah contoh. Sebaliknya, model Markov yang tidak jelas mengira kejadian keadaan tersembunyi dengan menganalisis data yang dapat dilihat. Kemudian, dengan menggunakan analisis keadaan tersembunyi, model Markov yang tidak jelas dapat menganggarkan kemungkinan mod pengamatan masa depan.

    Kelebihan: membolehkan data berubah-ubah, sesuai untuk pengiktirafan dan operasi ramalan Contoh: analisis ekspresi muka, ramalan cuaca

    Tiga gambar untuk memahami pembelajaran mesin: konsep asas, lima sekolah utama dan sembilan algoritma biasa

  6. Hutan rawak: Algoritma hutan rawak meningkatkan ketepatan pokok keputusan dengan menggunakan banyak pokok dengan subset data yang dipilih secara rawak. Contoh ini mengkaji banyak gen yang berkaitan dengan kembalinya kanser payudara pada tahap ekspresi gen, dan mengira risiko kembalinya.

    Kelebihan: Kaedah hutan rawak terbukti berguna untuk set data besar dan item dengan banyak dan kadang-kadang tidak berkaitan ciri Contoh Skenario: Analisis Penurunan Penggunaan, Penilaian Risiko

  7. Rangkaian saraf berulang: Dalam rangkaian saraf berulang, setiap neuron menukar banyak input menjadi satu output melalui 1 atau lebih lapisan tersembunyi. Rangkaian saraf berulang (RNN) akan meneruskan nilai lebih jauh, satu demi satu, yang membolehkan pembelajaran satu demi satu.

    Kelebihan: Rangkaian saraf kitaran mempunyai kebolehan meramalkan apabila terdapat banyak maklumat yang teratur Contoh: Pengelompokan imej dan penambahan sarikata, analisis sentimen politik

    Tiga gambar untuk memahami pembelajaran mesin: konsep asas, lima sekolah utama dan sembilan algoritma biasa

  8. Memori jangka pendek yang panjang (LSTM) dan rangkaian saraf kitaran unit kitaran pintu (GRU): Rangkaian RNN awal adalah terputus-putus. Walaupun rangkaian saraf kitaran awal ini hanya membenarkan menyimpan sedikit maklumat awal, rangkaian saraf kitaran pintu (GRU) mempunyai ingatan jangka panjang dan jangka pendek. Dalam erti kata lain, RNN yang lebih baru ini mempunyai keupayaan untuk mengawal ingatan yang lebih baik, yang membolehkan nilai awal disimpan atau nilai-nilai ini ditukar semula apabila perlu menangani banyak siri langkah, yang mengelakkan degradasi akhir nilai yang diteruskan secara bertahap.

    Kelebihan: Memori jangka pendek dan jangka panjang dan rangkaian saraf sel kitaran kawalan pintu mempunyai kelebihan yang sama dengan rangkaian saraf kitaran lain, tetapi lebih sering digunakan kerana mereka mempunyai keupayaan ingatan yang lebih baik Contoh Skenario: Pemprosesan Bahasa Asli, Terjemahan

  9. Rangkaian saraf konvulsi: Konvulsi adalah penggabungan berat dari lapisan susulan yang boleh digunakan untuk menandakan lapisan output.

    Kelebihan: Rangkaian Neural Curl sangat berguna apabila terdapat set data yang sangat besar, banyak ciri, dan tugas klasifikasi yang rumit Contoh: pengenalan imej, teks, suara, penemuan dadah

  • #### Terjemahan semula:

http://usblogs.pwc.com/emerging-technology/a-look-at-machine-learning-infographic/

http://usblogs.pwc.com/emerging-technology/machine-learning-methods-infographic/

http://usblogs.pwc.com/emerging-technology/machine-learning-evolution-infographic/

Disalin dari Big Data Land