
Statistika Bayesian semakin populer dalam ilmu biomedis karena fleksibilitasnya dan kemampuannya menangani data kompleks berdimensi tinggi, serta ukuran sampel kecil dan/atau data yang hilang/tidak lengkap. Namun ketika peneliti mulai mencoba pendekatan Bayesian, mereka sering kali dihadapkan pada pertanyaan yang sangat penting: Apa sebenarnya prior itu? Dan bagaimana saya memilih distribusi prior?

Prior Bayesian: Dasar-dasarnya
Dalam statistika Bayesian, “prior” mengacu pada apa yang sudah Anda ketahui tentang topik atau pertanyaan yang sedang diteliti. Prior merepresentasikan keyakinan awal atau asumsi Anda mengenai parameter model sebelum melihat data apa pun. Prior merangkum apa yang kita ketahui tentang parameter berdasarkan pengetahuan sebelumnya atau opini pakar, dan biasanya dinyatakan dalam bentuk distribusi probabilitas.

Jenis-Jenis Prior dalam Statistika Bayesian
1. Informative Prior (Prior Informatif)
Prior informatif mengandung informasi yang spesifik dan pasti tentang suatu variabel. Jika tersedia informasi sebelumnya, maka Anda memilih distribusi yang mencerminkan informasi tersebut. Ini bisa didasarkan pada studi terdahulu, pendapat pakar, atau pertimbangan teoretis.
Jika Anda memiliki bukti kuat untuk mendukung asumsi Anda (misalnya hasil studi yang sudah ditinjau sejawat), maka gunakan prior kuat (strong prior). Namun jika informasi yang dimiliki terbatas (misalnya opini subjektif pakar tanpa data pendukung), gunakan prior informatif lemah (weakly informative prior).
2. Non-informative Prior (Prior Non-informatif)
Prior ini digunakan ketika tidak ada pengetahuan awal atau jika tujuannya adalah objektivitas. Prior non-informatif seperti mengatakan, “Saya tidak tahu apa-apa secara khusus tentang situasi ini, jadi mari kita bersikap netral.” Ini adalah cara untuk tetap adil dan tidak memihak hasil apa pun sebelum data diperoleh.
3. Regularizing Priors (Prior Regularisasi)
Juga disebut prior regularisasi, prior ini digunakan untuk memberikan batasan atau penalti terhadap parameter dalam model. Tujuannya adalah mencegah overfitting dan meningkatkan kemampuan generalisasi model dengan menghindari nilai parameter yang terlalu kompleks atau ekstrem.
Prior regularisasi sangat berguna ketika model memiliki banyak parameter dibandingkan jumlah data yang tersedia, karena membantu model agar tidak terlalu menyesuaikan diri dengan “noise” dalam data.
Berikut ini beberapa jenis prior regularisasi:
- Laplace Prior
Juga dikenal sebagai double-exponential prior, prior ini memberi penalti terhadap nilai parameter besar dengan memberikan probabilitas lebih tinggi untuk nilai yang dekat dengan nol. Anda seperti berkata, “Buat garis sesederhana mungkin, jangan terlalu banyak naik-turun.”
- Gaussian Prior
Prior Gaussian (normal) memberi penalti pada nilai parameter yang menyimpang jauh dari rata-rata yang ditentukan, sehingga memperkecil nilai parameter mendekati rata-rata. Ibaratnya, “Usahakan agar garis tetap dekat dengan nilai tengah, jangan menyimpang terlalu jauh.”
- Lasso Prior
Prior ini menggabungkan prinsip Laplace dan Gaussian. Lasso memberi penalti terhadap nilai absolut parameter, mendorong sebagian parameter menjadi nol. Seolah berkata, “Gunakan hanya titik-titik yang penting untuk menggambar garis, abaikan yang kurang penting.”
- Ridge Prior
Prior Ridge memberi penalti terhadap kuadrat dari nilai parameter, memperkecil parameter menuju nol tetapi tidak memaksanya menjadi nol. Artinya, “Jangan biarkan garis menjadi terlalu tinggi atau zig-zag terlalu tajam, usahakan tetap datar.”

Distribusi Prior
Distribusi prior adalah distribusi probabilitas yang mewakili keyakinan kita tentang parameter sebelum melihat data. Menentukan prior dalam statistika Bayesian mencakup pemahaman informasi awal yang tersedia, memilih distribusi prior yang tepat, serta mempertimbangkan dampaknya terhadap distribusi posterior dan kesimpulan akhir.
Sebagaimana disebutkan sebelumnya, analisis Bayesian memungkinkan kita menggabungkan pengetahuan awal dalam analisis. Memilih distribusi prior yang tepat dan akurat bisa menghasilkan inferensi posterior yang lebih informatif dan bermakna.

Peran Analisis Sensitivitas
Dalam penggunaan statistika Bayesian, sebaiknya dilakukan analisis sensitivitas untuk mengevaluasi seberapa sensitif inferensi posterior terhadap pilihan prior yang berbeda. Ini dilakukan dengan membandingkan hasil dari berbagai prior untuk menilai kekuatan kesimpulan yang diperoleh. Jika hasil Anda sangat sensitif terhadap pilihan prior, mungkin perlu mengevaluasi ulang pendekatan Anda: bisa dengan mengumpulkan lebih banyak data agar pengaruh prior berkurang, atau memilih prior lain yang lebih sesuai dengan keyakinan dan informasi yang tersedia.
Analisis sensitivitas membantu memastikan bahwa kesimpulan yang Anda buat dapat diandalkan dan tidak hanya bergantung pada asumsi awal.

Penutup
Memilih distribusi prior secara cermat membantu menjaga objektivitas dan transparansi dalam analisis Bayesian. Prior yang tidak sesuai atau dipilih secara asal dapat menyebabkan bias dan menghasilkan kesimpulan yang menyesatkan. Oleh karena itu, penting untuk memahami cara memilih dan menentukan distribusi prior agar pengetahuan awal bisa dimanfaatkan secara bermakna dan efektif dalam analisis.
Tertarik memulai dengan statistika Bayesian? Konsultasikan dengan pakar biostatistik melalui layanan Statistical Analysis & Review dari Editage.