Konsep Random Sampling Dalam Dunia Akademis

Hajatan pemilu 2019 telah usai. Meskipun demikian, perhatian masyarakat Indonesia banyak tertuju pada hasil quick count lembaga survei yang muncul di televisi. Salah satu hal yang menarik perhatian masyarakat adalah konsep “random sampling”. Apa sih sebenarnya random sampling itu dan bagaimana sebenarnya konsep random sampling dalam dunia akademis?

Sejak tahun 2008, saya menekuni bidang software engineering, human-computer interaction, dan AI (artifical intelligence) yang kebetulan pengujian dan validasinya melibatkan manusia, sehingga saya cukup akrab dengan referensi-referensi utama untuk tema eksperimen seperti ini. Suatu ketika, saya pernah menguji mahasiswa dengan tema tesis desain antarmuka dan uji kebergunaan. Berhubung tema penelitian mahasiswa tersebut adalah desain perangkat lunak dan eksperimen dengan melibatkan manusia (experiment with human participants), maka prosedur pengambilan data primer sangat ketat. Prosedur pemilihan sampel, justifikasi jumlah sampel, dan metode analisis sampel perlu diulas dengan detail. Metode-metode statistika yang dipilih dalam penelitian juga harus mendapatkan justifikasi yang benar.

Konsep pengambilan data dalam dunia akademis biasanya mempertimbangkan tiga hal di bawah ini dan tiga hal inilah yang biasanya paling banyak saya konfirmasi kepada peserta sidang tesis:

1. Prosedur pengambilan sampel. Jumlah sampel harus representatif dan sesuai dengan uji statistika yang digunakan. Sampel besar = 30 itu belum cukup, sangat tergantung dari teknik uji hipotesis yang akan digunakan dalam decision making. Salah satu metrik yang bisa menjadi acuan adalah statistical power dan effect size [1, 2]. Untuk lebih praktisnya, Anda bisa menggunakan software G*Power untuk menghitung jumlah sampel berdasarkan dua metrik tersebut [3]. Tanpa adanya justifikasi dengan dua metrik ini, saya akan mempertanyakan dasar pengambilan sampel dari tesis tersebut.

2. Random sampling adalah proses pengambilan sampel dengan mempertimbangkan peluang setiap anggota populasi. Dengan kata lain, setiap anggota populasi memiliki peluang yang sama untuk diambil sebagai sampel. Dalam melakukannya, kita tidak boleh terlibat langsung memilih sampelnya dengan mencomot satu per satu, karena dikhawatirkan akan terjadi bias saat proses pemilihan sampel (satu anggota populasi memiliki probabilitas yang lebih besar untuk terambil sebagai sampel dibandingkan anggota populasi yang lain). Cara paling mudah untuk melakukan random sampling adalah dengan menyerahkan proses pemilihan sampelnya pada software, misalnya dengan Microsoft Excel, Matlab, atau Python.

Contoh: jika Anda ingin mengambil sampel 60 dari 1000 populasi mahasiswa, maka masukkan 1000 nama mahasiswa ke Matlab, lalu pilih 60 orang secara acak dengan fungsi random. Kalau Anda sendiri yang menentukan sampelnya, dengan mengambil satu per satu tanpa bantuan software, tetap ada peluang falsifikasi dalam proses sampling.

Jika Anda memilih sampel tanpa bantuan software dan hanya mencomot partisipan yang bisa Anda undang atau bisa Anda temui, istilah yang digunakan adalah voluntary basis (non-probabilistic sampling) dan bukan lagi random sampling. Hal ini biasa digunakan untuk riset-riset yang kita tidak mengetahui secara pasti jumlah populasi dari target populasi yang ingin kita teliti. Dalam kasus ini, klaim random sampling dalam proses pemilihan sampel tidak boleh digunakan. Beberapa mahasiswa yang tidak memahami konsep ini biasanya berkeringat dingin cukup deras saat saya membantah prosedur pengambilan data yang keliru. Mengapa? Sebab salah prosedur menyebabkan data tidak valid dan eksperimen atau survei harus diulang. Lebih jauh tentang hal ini, bisa dibaca di buku karya Lazar dkk, bab 2-5. [4]. Hal yang sama bisa Anda cek di referensi lain yang ditulis oleh Ko, LaToza, dan Burnett [5].

3. Demografi sampel harus dijelaskan. Data demografi berisi: jumlah sampel, jenis kelamin, rata-rata umur, sebaran umur (termasuk nilai minimum dan maksimum), latar belakang profesi, tingkat pendidikan, dan hal-hal lain yang relevan dengan eksperimen. Dengan menampilkan data demografi, kita bisa menilai apakah sampel yang diambil sesuai dengan tujuan eksperimen.

Tiga hal di atas wajib dijelaskan secara detail oleh mahasiswa, tentunya dengan mempertimbangkan aspek etika (merahasiakan identitas partisipan yang diambil) dan dengan memastikan bahwa partisipan yang terlibat dalam proses penelitian sudah mendapatkan informasi yang benar tentang prosedur eksperimen, serta hak dan kewajiban partisipan eksperimen. Di artikel mendatang, saya akan menjelaskan hal-hal yang terkait dengan etika eksperimen dan informed consent.

Dalam dunia akademis, tujuan utama penjabaran metode pengambilan dan analisis data adalah niat baik untuk mencari kebenaran, bukan pembenaran. Oleh sebab itu, pilihan-pilihan dan justifikasi dalam setiap detail keputusan wajib didasari dengan penjelasan yang masuk akal, bukan tiba-tiba jatuh dari langit. Statistika itu hanya alat. Hal terpenting dalam penggunaan alat adalah mengetahui bagaimana alat itu digunakan dan mengetahui cara memilih alat yang sesuai untuk kasus yang dihadapi.

Mudah-mudahan artikel singkat ini bermanfaat, terutama untuk rekan-rekan akademisi dan praktisi yang melakukan riset berbasis manusia. Informasi lebih lengkap bisa dibaca dari sumber-sumber di bawah ini.

Referensi:

  1. S.R. Jones, S. Carley, M. Harrison, “An introduction to power and sample size estimation”, Emergency Medicine Journal, vol. 20, no. 5, pp. 453-458, 2004.(URL: https://emj.bmj.com/content/emermed/20/5/453.full.pdf)
  2. J. Brownlee, “A Gentle Introduction to Statistical Power and Power Analysis in Python”, in Machine Learning Mastery, 2018. (Tautan artikel: https://machinelearningmastery.com/statistical-power-and-power-analysis-in-python)

  3. Faul, F., Erdfelder, E., Lang, A.-G., & Buchner, A. (2007). G*Power 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods39, 175-191. (Software dapat diakses di sini: http://www.gpower.hhu.de).
  4. J. Lazar, J.H. Feng, H. Hochheiser, Research Methods in Human-Computer Interaction, 2nd edition, United States: Morgan Kaufmann, 2017.
  5. A. J. Ko, T.D. LaToza, M.M. Burnett, “A Practical Guide to Controlled Experiments of Software Engineering Tools with Human Participants”, in Empirical Software Engineering, vol. 20, no. 1, pp.110-141, 2015. (URL: https://link.springer.com/article/10.1007/s10664-013-9279-3)

Sumber gambar:
Dr. Arindam Dey, “User Experiments in HCI”, 201 Online: https://www.slideshare.net/aridey1983/user-experiments-in-humancomputer-interaction

Be Sociable, Share!

Leave a Reply