5 minute read

Pertanyaan 14

Dalam menentukan variabel independen yang ingin diteliti pengaruhnya terhadap variabel dependen, berapa banyak batasan variabel independen yang perlu kita masukkan agar mendapatkan output yang valid dan trusted?

Sebenarnya tidak ada batasan berapa variabel yang harus dimasukkan. Tapi ada aturan bahwa banyaknya baris data yang bisa dianalisa menggunakan multivariat harus berjumlah 7 - 10 kali dari banyaknya variabel.

Justru dengan adanya algoritma sekarang ini, variabel yang dimasukkan ke dalam model bisa sangat banyak! Contoh bagaimana perusahaan farmasi di Korea Selatan bisa membuat alat rapid test COVID-19 dengan cepat menggunakan AI.


Pertanyaan 15

Apa warnings yang bisa kita perhatikan dalam menghindari bias dalam pengambilan keputusan dari data yang kita miliki?

Untuk menghindari bias, secara simpel kita harus memperhatikan asumsi dan kondisi saat data tersebut kita ambil atau kita peroleh. Best practice yang bisa saya sampaikan adalah lebih ke memahami bagaimana data bisa dikumpulkan.

Salah satu contoh: Saya melakukan survey makanan favorit orang Indonesia. Survey tersebut dilakukan dengan cara melakukan interview kepada orang-orang yang sedang makan di rumah makan Padang.


Pertanyaan 16

Seperti yang kita ketahui bahwa dalam beberapa bulan ini, NFI mengeluarkan beberapa produk baru. Sebelum proses launching tersebut, analisis bisnis apa saja yang harus dilakukan dan analytic tools apa saja yang dapat digunakan untuk memperkirakan kesuksesan suatu item baru Nutrifood di masa pandemi?

Biasanya sebelum kita launching suatu produk, ada tiga komponen yang harus diperiksa:

Kita harus pastikan bahwa produk baru tersebut tidak memiliki masalah dari tiga komponen di atas.

Lalu bagaimana bisa memprediksi apakah produk tersebut bisa sukses atau tidak di masa pandemi? Sayangnya analisa seperti ini belum bisa dilakukan karena keterbatasan data yang dimiliki.

Hal yang masih bisa dilakukan adalah melakukan monitoring secara berkala dari produk tersebut.


Pertanyaan 17

Apa interpretasi median dari data di bawah ini?

Median dihitung dengan cara mengurutkan data dari yang terkecil sampai terbesar, lalu diambil nilai tengahnya.

Jika ada yang menanyakan: “Kenapa harus diurutkan?

Maka jawabannya: Karena didefinisikan seperti itu!

Median mengukur nilai tengah (central tendency) dari suatu data. Bagaimana kita bisa melihat nilai tengah jika datanya tidak diurutkan? Bagaimana?

Jika kita hitung, maka median untuk Messi adalah 12 sedangkan median untuk Ronaldo adalah 10. Apa artinya?

Perhatikan baik-baik ilustrasi di bawah ini:


Pertanyaan 18

Kapan advanced tools digunakan?

Silakan baca di sini.

Semua digunakan tergantung dari kebutuhan analisa dan data yang di-handle.


Pertanyaan 19

Apakah data yang saling berkorelasi pasti signifikan?

Signifikan dalam hal apa? Jika suatu data berkorelasi, maka sudah bisa dipastikan dia signifikan berkorelasi.

Berbeda dengan bahasan beda signifikan yah.


Pertanyaan 20

Bagaimana menghitung kepastian menggunakan metode regresi linear dengan R^2?

Apa arti dari kepastian pada pertanyaan di atas?

Sebagaimana kita ketahui bersama R^2 merupakan salah satu goodness of fit parameter dalam model regresi. R^2 juga menandakan seberapa baik variabel predictor menjelaskan variabel target.