Kapan Saya Harus Mulai Belajar Machine Learning?
Pasca Festival Inovasi yang dilakukan di kantor kemarin, ada beberapa rekan yang bertanya kepada saya:
“Bagaimana cara untuk memulai belajar machine learning?”
Mungkin jawaban saya bisa jadi beda jika rekan-rekan googling mengenai hal tersebut. Bisa jadi jawaban saya kurang memuaskan. hehe
Tapi menurut saya, ada pertanyaan yang lebih mendasar yang harus ditanyakan pada diri sendiri terkait hal ini, yakni:
“Kapan saya harus mulai belajar machine learning?”
Karena sebenarnya ini hanyalah tools saja.
It’s not about the gun, but the man behind it…
Seperti biasa, akan memudahkan jika kita mendefinisikan terlebih dahulu, apa sih machine learning. Berhubung definisinya cukup luas dan bisa kemana-mana, saya ambil lingkup sbb:
Machine learning is a method of data analysis that automates analytical model building.
Inget yah, ada dua keywords: data analysis dan automation.
So, untuk menjawab “Kapan saya harus mulai belajar?” Kita akan turunkan dari dua keywords di atas yah.
Jadi kalau pekerjaan sehari-hari (atau hobinya) adalah melakukan analisa data, maka Anda berpotensi untuk mempelajari machine learning. Nah, data atau analisa yang seperti apa nih yang harus pakai machine learning?
Dari segi datanya:
Datanya cukup besar.
Contoh: file excel yang sudah mencapai minimal 50 MB dengan jumlah baris ratusan ribu. Ms. Excel masih sanggup buka, tapi kalau pakai fitur filter, muncul warning Excel cannot display all entries.
Kalau file Excelnya besar, masih bisa dianalisa dengan baik dan lancar dengan SPSS. Tapi jika semakin besar lagi dan proses running data dengan SPSS bisa memakan waktu yang lama (misal: bisa ditinggal treadmill dulu), nah mulailah berpikir untuk belajar machine learning.
Datanya dinamis.
Misalkan selalu bertambah atau berubah secara periodik sedangkan analisanya tetap.
Datanya bukan berupa angka!
Misalkan: dalam bentuk teks narasi atau gambar atau geolocation. Ini sih mau gak mau harus segera belajar karena tool analisa data classic sudah tidak sanggup menganalisanya.
Dari segi analisanya:
Analisanya sudah masuk tahap predictive analysis.
Walaupun Ms. Excel atau SPSS sudah memiliki fitur predictive yang lumayan, tapi jika memang tujuannya adalah menganalisa dengan menggunakan predictive analysis yang lebih advance, maka mulailah berpikir untuk belajar machine learning.
Lalu keyword kedua adalah automation.
Jika tipe analisanya itu:
Rutin berulang – ulang.
Walaupun filesize-nya gak besar dan dikerjakan manual (atau semi otomatis dengan Excel macro atau formula), coba deh pertimbangkan untuk belajar.
Butuh banyak metode statistik yang harus dipilih dan dilakukan secara bersamaan.
Dari tadi kan ngomong machine learning terus yah, emang kayak gimana sih bentuknya?
Saya biasa menggunakan program R, tampilannya putih polos. Jika ingin melakukan analisa data, kita harus menuliskan terlebih dahulu script-nya. Keuntungan lain memakai R adalah program ini relatif lebih ramah terhadap spek komputer. Raspberry Pi 3 saya pun bisa melahap algoritma – algoritma yang ada dengan cepat dan baik.
Flashback dulu pada 2014, ketika iseng mencari inovasi apa untuk dept. market research yang berkaitan dengan big data (waktu itu istilah ini lagi hot banget lah) ada 3 alternatif yang saya temukan saat itu:
- Intuitive visual analytics with QlikSense
- Intuitive model builder for data analysis with RapidMiner
- Machine learning with R
Saat itu saya memutuskan untuk tidak segera belajar R, justru saya lebih memilih untuk belajar dan fokus ke poin pertama. Kenapa? Karena dari penjelasan saya sebelumnya di atas, pekerjaan saya waktu itu di market research belum memerlukan adanya machine learning.
Visualisasi dari descriptive analysis saya pikir jauh lebih penting saat itu.
Baru di tahun ini, saat muncul masalah – masalah baru yang tidak bisa diselesaikan secara baik-baik dan kekeluargaan (baca: Ms. Excel dan SPSS), saya baru berpikir untuk membuka diri ke machine learning.