Bagi kamu yang tertarik melakukan penelitian kualitatif, kamu perlu mahir dalam melakukan uji normalitas. Pengujian ini bertujuan untuk menentukan apakah sampel data yang digunakan telah ditarik dari distribusi populasi normal atau untuk memverifikasi apakah data yang dilibatkan di dalam penelitian memiliki distribusi normal. Banyak prosedur statistik seperti korelasi, regresi, t-test, ANOVA, dan tes parametrik lainnya menggunakan distribusi data normal.
Apa itu distribusi normal?
Distribusi normal juga dikenal dengan distribusi Gaussian yang merupakan distribusi probabilitas statistic untuk variabel independen random. Peneliti umumnya mengenalnya sebagai kurva berbentuk lonceng di dalam laporan statistik. Distribusi norma cocok digunakan untuk mengukur variabel riset yang berkelanjutan. Ini adalah distribusi probabilitas yang simetris terhadap nilai rata-rata atau bagian kanan kurva adalah bayangan dari gambar kurva di bagian kiri. Hal ini mengindentifikasi bahwa data yang berdekatan dengan nilai rata-rata sering muncul dibandingkan data yang berada jauh dari angka rata-rata. Area di bawah kurva distribusi normal menunjukkan probabilitas dan total nilai yang ada pada area di bawah kurva. Pada distribusi normal yang sempurna, nilai rata-rata (mean), nilai tengah (median), dan nilai dengan frekuensi terbanyak (mode) sama dan sejumlah nilai tersebut mengindikasikan puncak kurva.
Metode uji normalitas
Terdapat sejumlah metode untuk menguji apakah sejumlah data termasuk ke dalam distribusi normal dan di kelompokan ke dalam dua kategori grafik besar seperti histogram, plot probabilitasi Q-Q, dan metode analisis seperti tes Shapiro Wilk dan Kolmogorov-Smirnov.
Metode grafik untuk menguji normalitas
Motode yang paling berguna untuk menvisualiasi distribusi normal atau variabel tertentu adalah dengan menempatkan data pada grafik yang dikenal sebagai bagan distribusi frekuensi atau histogram.
Distribusi normal pada Gambar 2 menunjukkan sedikit penyimpangan dari distribusi sampel yang sebenarnya (gray bars) pada kurva distribusi normal teoritis (garis merah). Hal ini mengindikasikan bahwa data yang tersedia didistribusikan secara normal. Sedangkan distribusi non-normal pada Gambar 2, merupakan data sampel yang menyimpang dari distribusi normal. Motode grafik biasanya tidak begitu berguna bila ukuran sampel kecil.
Motode analisis untuk menguji normalitas
Pengujian ini diawali dengan menganalisasi data yang nilainya paling dasar. Saat menganalisis data, keseluruhan informasi didapatkan dari data point yang jumlahnya cukup banyak, sehingga penting untuk menampilkan data agregat dengan menampilkan dataset yang paling mewakili. Data distribusi normal adalah yang memiliki nilai terbaik dan yang paling akurat yang ditunjukkan melalui penyimpangan nilai rata-rata dan nilai standar.
Rata-rata aritmatika adalah nilai yang diperoleh dari penjumlahan semua nilai dan dibagi dengan jumlah observasi dan penyimpangan standar yang dilakukan untuk mengukur penyebaran variabel (penyimpangan standar rendah mengindikasikan penyebaran variabel rendah yaitu mengelompokkan data di sekitar rata-rata; penyimpangan standar tinggi mengindikasikan penyebaran variabel tinggi, yaitu frekuensi nilai cenderung berada pada ekor atau jauh dari pusat kurva dan nilai rata-rata. Sebaliknya, nilai distribusi non-normal cenderung tidak dipresentasikan dan ditampilkan pada jangkauan nilai tengah atau interkuartil.
Langkah pertama yang harus kamu ambil untuk menguji normalitas adalah mengecek distribusi variabel diikuti dengan distribusi normal. Hal ini biasanya dilakukan menggunakan sejumlah tes standar yang umum terdapat pada program dan aplikasi statistik seperti tes Kolmogorov–Smirnov, Shapiro–Wilk, dan D’Agostino–Pearson. Sejumlah tes ini menganalisis data untuk memverifikasi apakah distribusinya menyimpang secara signifikan dari distribusi normal dengan menggunakan beberapa parameter seperti p-value. Jika p-value kecil dari 0,05, distribusinya menyimpang secara signifikan dari distribusi normal.
Tes parametrik digunakan ketika distribusi variabel diikuti distribusi normal; bila tidak, tes non-parametrik harus dilakukan. Dari dua kelompok data, tes parametrik yang digunakan secara luas adalah t-test (untuk sampel independen atau yang dipasangkan, tergantung pada jenis data), dan uji non-parametrik seperti tes Mann–Whitney. Untuk lebih dari dua kelompok data, tes parametrik menggunakan ANOVA dan non-parametriknya setara dengan tes korelasi dan pemeringkatan Spearman.
Penting untuk dicatat bila kamu menggunakan jenis tes yang salah misalnya tes parametrik untuk data distribusi non-normal atau tes non-parametrik untuk data distribusi normal, maka hasil penelitian tidak akan akurat. Sehingga, hasil penelitian tidak dapat direpresentasikan secara statistik signifikan karena hasil penelitian non-signifikan adalah signifikan secara statistik.
Sama halnya, ketika melakukan analisis regresi, data distribusi normal merupakan asumsi terpenting untuk melakukan sejumlah tipe analisis regresi. Dalam kata lain, tidak mungkin untuk melakukan berbagai bentuk regresi dengan variabel distribusi non-normal. Sejumlah variabel ini dapat diubah dengan cara lain yaitu dengan melakukan log-transformation, root-transformation, dan lainnya. Hal ini untuk memastikan agar distribusi normal dapat mengubah variabel yang bila terabaikan maka akan mengarah pada hasil penelitian yang tidak akurat.
Dengan mengetahui pentingnya distribusi variabel, kamu dapat mempresentasikan dan memvisualisasikan data tergantung pada normalitas, pengujian normalitas, dan potensi ketidakberhasilkan riset dengan lebih baik. Kamu bisa mempelajari lebih lanjut Langkah selajutnya dalam melakukan analisis statistik pada artikel berikutnya.