Sensitivitas Komputasi
Di suatu perkuliahan, dosen saya menyuruh kami untuk membuka Python:
Coba kamu buka Python dan execute perintah ini: 3 * 0.1
Setelah saya execute, detik itu juga hati saya bersorak gembira sekaligus bertanya-tanya dalam hati.
Kenapa bisa begitu? Mungkin sudah tepat bagi saya untuk tidak menggunakan Py. hehe
Tulisan di atas bukan bentuk black campaign terhadap Python. Justru hal tersebut terjadi di mata kuliah yang membahas dalam tentang Python. Lantas apa tujuan dari dosen saya bertindak seperti itu?
Beliau berujar:
Komputer itu bodoh. Dia hanya bisa menjalankan komputasi yang kita perintahkan, menghitung dari input yang kita berikan. Kita sebagai manusia harus punya sensitivitas komputasi.
Apa itu sensitivitas komputasi?
Apakah ini hanya berlaku buat Python saja?
Apakah rekan-rekan master Excel aman dari hal-hal seperti ini?
Setiap komputasi yang dilakukan oleh komputer didasari setidaknya oleh dua hal:
- Inputnya apa?
- Prosesnya bagaimana?
Komputer jika dikasih input angka berapapun, disuruh menghitung bagaimanapun, dia akan mengeluarkan hasilnya. Tapi apakah hasilnya sudah sesuai secara kaidah analisa yang benar?
INPUT
Buat rekan-rekan yang sudah mulai banyak ngoprekin data. Baik memakai Excel, R, Py, ataupun tools lainnya. Saya sarankan untuk meluangkan waktu untuk mundur sedikit.
Cek kembali data kita itu seperti apa tipenya, karakteristiknya, sifatnya, dll.
Dulu saya pernah mengingatkan di post ini.
Ingat yah:
Berbeda tipe datanya, berbeda pula cara kita memahami datanya.
Sebagai contoh:
Misalkan kita hendak menghitung korelasi antara gender dengan bmi. Apakah kita bisa langsung menghitung di Excel dengan rumus =correl(gender,bmi)
?
Jawabannya: tidak semudah itu Fergusso…
Walaupun kalian sudah mengganti gender menjadi angka (misal pria = 1
, wanita = 2
) dan di Excelnya juga sudah keluar angka korelasinya, percayalah nilai korelasi yang muncul di layar itu gak ada gunanya.
Lho kenapa? Ini berkaitan dengan:
PROSES KOMPUTASI
Kita harus tahu bagaimana algoritma komputer itu bekerja. CMIIW, rumus correl()
yang ada di Excel sekarang itu secara default adalah menghitung korelasi Pearson.
Maksudnya apa? Korelasi yang bisa dihitung itu jika datanya berupa numerik vs numerik.
Sedangkan gender bukan numerik!
Artinya apa? Tidak tepat perhitungan korelasi yang kita lakukan.
Sebagai reminder, korelasi itu ada banyak jenisnya. Ada Pearson, Spearman, dan Kendal Tau.
Dari sini saya berpesan buat kita semua untuk mulai sensitif terhadap komputasi dengan cara:
- Minimal tahu data kita itu seperti apa.
- Tahu cara komputer melakukan komputasi seperti apa.
Jadi kita gak mudah “tertipu” dengan hasil yang ditampilkan di layar komputer.
Kembali lagi ke kasus flaw Python secara numerik. Tujuan lain dosen saya berbuat demikian adalah untuk menginformasikan bahwa tools yang kita pakai bisa jadi memiliki kelemahan dalam hal komputasi. Akibatnya kita perlu tahu bagaimana cara meng-_handle_ hal ini sehingga komputasi yang kita lakukan kelak masih bisa diterima hasilnya.
Tambahan
Selain sensitivitas komputasi, metodologi juga penting supaya output yg dihasilkan tidak keliru dan pengambilan kesimpulan serta keputusan jadi keliru juga. Pengambilan sample sudah benar belum? Argumen dan dasar berpikirnya bagaimana ketika mengorelasikan dua variabel atau menguji beda suatu hal? That is why, dalam analisis entah bisnis entah ilmiah, bukan hanya data dan tools saja yang dibutuhkan, tapi analyst-nya juga matters.