Sebagai orang yang sering menjelaskan tentang pembelajaran mesin kepada orang-orang non-profesional, saya menyusun sepuluh poin berikut sebagai beberapa penjelasan tentang pembelajaran mesin.
Pembelajaran mesin tidak seperti yang diiklankan: Anda dapat memecahkan banyak masalah dengan memberikan data pelatihan yang tepat untuk algoritma pembelajaran yang tepat. Sebut saja AI jika itu membantu menjual sistem AI Anda. Tapi Anda harus tahu, AI hanyalah kata yang modis, yang hanya mewakili harapan orang-orang tentang itu.
Ada banyak hal yang menarik tentang kemajuan algoritme pembelajaran mesin, khususnya pembelajaran mendalam. Namun, data adalah faktor kunci yang memungkinkan pembelajaran mesin. Pembelajaran mesin dapat dilakukan tanpa algoritme yang rumit, tetapi tidak tanpa data yang baik.
Pembelajaran mesin melatih model berdasarkan pola dalam data, mengeksplorasi ruang model yang mungkin didefinisikan oleh parameter. Jika ruang parameter terlalu besar, akan ada overfit pada data yang dilatih, dan melatih model yang tidak dapat membuat generalisasi sendiri. Jika Anda ingin menjelaskan hal ini secara rinci, Anda harus melakukan lebih banyak perhitungan matematis, dan Anda harus menganggapnya sebagai pedoman untuk membuat model Anda sesederhana mungkin.
Ada pepatah yang mengatakan bahwa jika Anda memasukkan sampah ke dalam komputer, Anda akan menghasilkan sampah. Meskipun pepatah ini muncul lebih awal dari pembelajaran mesin, itu adalah batasan utama dari pembelajaran mesin. Pembelajaran mesin hanya dapat menemukan pola yang ada dalam data pelatihan. Untuk mengawasi tugas pembelajaran mesin, misalnya, Anda memerlukan set data pelatihan yang kuat, diberi label dengan benar, dan kaya.
Seperti yang diperingatkan dalam prospectus dana, kinerja masa lalu tidak menjamin hasil masa depan. Pembelajaran mesin harus mengeluarkan pernyataan peringatan serupa: ia hanya dapat bekerja berdasarkan data yang didistribusikan sama dengan data pelatihan. Oleh karena itu, waspadalah terhadap penyimpangan antara data pelatihan dan data produksi, dan ulangi model pelatihan secara teratur untuk memastikan bahwa itu tidak akan menjadi usang.
Di tengah-tengah promosi teknologi pembelajaran mesin, Anda mungkin berpikir bahwa apa yang dilakukan oleh pembelajaran mesin adalah memilih dan menyesuaikan algoritma. Tetapi kenyataannya tidak terlalu aneh: sebagian besar waktu dan energi Anda akan dihabiskan untuk membersihkan data dan rekayasa karakteristik, yaitu mengubah karakteristik asli menjadi karakteristik yang lebih baik untuk mewakili sinyal data.
Karena pembelajaran mesin telah diterapkan dan dikembangkan di banyak bidang, pembelajaran mendalam juga telah dipromosikan. Selain itu, pembelajaran mendalam mendorong beberapa pekerjaan yang secara tradisional dilakukan melalui rekayasa fitur menjadi otomatis, terutama untuk data gambar dan video.
Permintaan maaf kepada NRA, karena algoritma pembelajaran mesin tidak membunuh, tetapi membunuh manusia. Ketika sistem pembelajaran mesin gagal, itu jarang terjadi karena ada masalah dengan algoritma pembelajaran mesin. Lebih mungkin adalah kesalahan buatan manusia yang dimasukkan ke dalam data pelatihan, yang menghasilkan bias atau kesalahan sistem lainnya. Kita harus selalu bersikap skeptis dan menggunakan cara yang sesuai untuk teknik perangkat lunak untuk menangani pembelajaran mesin.
Dalam banyak aplikasi pembelajaran mesin, keputusan yang Anda buat hari ini akan mempengaruhi data pelatihan yang dikumpulkan besok. Setelah sistem pembelajaran mesin memasukkan bias ke dalam model, ia dapat terus menghasilkan data pelatihan baru yang diperkuat oleh bias. Selain itu, beberapa bias dapat menghancurkan kehidupan orang.
Sepertinya banyak orang mendapatkan ide tentang kecerdasan buatan dari film-film fiksi ilmiah. Kita harus mendapat inspirasi dari fiksi ilmiah, tetapi kita tidak boleh begitu bodoh untuk menganggap fiksi sebagai realitas. Dari manusia jahat yang sadar ke model pembelajaran mesin yang tidak sadar, ada terlalu banyak realitas dan bahaya yang perlu dikhawatirkan.
Pembelajaran mesin mencakup lebih dari 10 poin yang saya sebutkan di atas. Semoga informasi ini berguna bagi para non-profesional.
Dikutip dari Global AI Big Data Landscape