Membuat Algoritma Systematic Sampling di R
Systematic sampling adalah salah satu teknik sampling yang umum digunakan dalam statistika atau dalam market research. Biasanya survey yang dijalankan pada metode central location menggunakan systematic sampling sebagai landasan merekrut calon responden.
Bayangkan saya punya daftar nama-nama siswa di sekolah dan hendak melakukan survey kepada beberapa orang dari mereka sebagai sampel. Alih-alih memilih siswa secara acak satu per satu, dalam systematic sampling, kita memilih siswa pertama secara acak, lalu setelah itu kita memilih setiap siswa ke-k dari daftar yang ada.
Begini langkah-langkahnya:
- Tentukan Populasi dan Ukuran Sampel: Pertama, kita perlu tahu berapa total jumlah siswa di sekolah (populasi) dan berapa banyak siswa yang ingin dijadikan sampel (ukuran sampel). Jika dalam kasus survey central location, kita bisa asumsikan populasi yang ada sangat amat besar (hingga tak terbatas).
- Hitung Interval Sampling (k): Selanjutnya, kita hitung intervalnya. Caranya dengan membagi total populasi dengan ukuran sampel yang diinginkan.
Misalnya, ada 100 siswa dan kita ingin mengambil sampel 20 siswa. Maka,
intervalnya adalah
.
Ini berarti kita akan memilih setiap siswa ke-5 secara berurutan sejak pengambilan sampel pertama.
- Pilih Titik Awal Secara Acak: Kita perlu memilih satu siswa pertama secara acak dari kelompok pertama (dalam contoh ini, dari siswa nomor 1 sampai 5). Misalkan kita memilih siswa nomor 3.
- Lanjutkan Memilih Setiap Interval ke-k: Setelah mendapatkan
titik awal (siswa nomor 3), kita tinggal menambahkan interval
(
) untuk mendapatkan sampel berikutnya. Jadi, sampel akan terdiri dari siswa nomor 3,
,
,
, dan seterusnya, sampai kita mendapatkan 20 siswa.
Sederhananya, kamu memilih secara berurutan dengan jarak yang sama setelah pemilihan acak pertama.
Kelebihan Systematic Sampling:
- Lebih mudah dan cepat dibandingkan simple random sampling, terutama untuk populasi yang besar.
- Bisa mencakup seluruh populasi secara lebih merata jika daftar populasinya terurut secara acak.
Kekurangan Systematic Sampling:
- Bisa bias jika ada pola tersembunyi dalam daftar populasi yang sesuai dengan interval sampling. Misalnya, jika dalam daftar siswa, setiap siswa ke-10 adalah ketua kelas, dan interval samplingmu adalah 10, maka sampelmu akan berisi semua ketua kelas, yang tidak representatif.
Algoritma Systematic Sampling di R
Berdasarkan penjelasan di atas, kita bisa membuat algoritma sederhananya
dengan base
di R sebagai berikut:
# Langkah 1: Membuat Dataset
set.seed(123) # Mengatur seed untuk reproduksibilitas
population = 1:100
# Langkah 2: Menentukan Ukuran Sampel
sample_size = 20
# Langkah 3: Menghitung Interval k
k <- length(population) / sample_size
# Langkah 4: Titik Awal Acak
start <- sample(1:k, 1)
# Langkah 5: Memilih Setiap Elemen ke-k
systematic_sample = population[seq(start, length(population), by = k)]
# Langkah 6: Memeriksa Sampel
systematic_sample
[1] 3 8 13 18 23 28 33 38 43 48 53 58 63 68 73 78 83 88 93 98
if you find this article helpful, support this blog by clicking the ads.