Contoh
Dalam statistik, sampel adalah bagian dari populasi. Sampel dipilih secara hati-hati. Sampel harus mewakili seluruh populasi secara adil, tanpa bias. Alasan mengapa sampel diperlukan adalah karena populasi mungkin begitu besar sehingga menghitung semua individu mungkin tidak mungkin atau tidak praktis.
Oleh karena itu, pemecahan masalah dalam statistik biasanya dimulai dengan pengambilan sampel. Pengambilan sampel adalah tentang memilih data mana yang akan diambil untuk kemudian dianalisis. Sebagai contoh, misalkan pencemaran sebuah danau harus dianalisis untuk sebuah penelitian. Tergantung di mana sampel air diambil, penelitian dapat memiliki hasil yang berbeda. Sebagai aturan umum, sampel harus acak. Ini berarti peluang atau probabilitas memilih satu individu sama dengan peluang memilih individu lainnya.
Dalam praktiknya, sampel acak selalu diambil melalui prosedur yang terdefinisi dengan baik. Prosedur adalah seperangkat aturan, urutan langkah-langkah yang ditulis di atas kertas dan diikuti dengan baik. Meskipun demikian, beberapa bias mungkin tetap ada dalam sampel. Pertimbangkan masalah merancang sampel untuk memprediksi hasil jajak pendapat pemilu. Semua metode yang diketahui memiliki masalah, dan hasil pemilihan umum sering berbeda dari prediksi berdasarkan sampel. Jika Anda mengumpulkan pendapat dengan menggunakan telepon, atau dengan bertemu orang-orang di jalan, sampel selalu memiliki bias. Oleh karena itu, dalam kasus-kasus seperti ini, sampel yang benar-benar netral tidak pernah mungkin. Dalam kasus seperti itu, seorang ahli statistik akan memikirkan bagaimana mengukur jumlah bias, dan ada cara untuk memperkirakannya.
Situasi yang sama terjadi ketika para ilmuwan mengukur properti fisik, misalnya berat sepotong logam, atau kecepatan cahaya. Jika kita menimbang suatu objek dengan peralatan yang sensitif, kita akan mendapatkan hasil yang sangat berbeda. Tidak ada sistem pengukuran yang sempurna. Kita mendapatkan serangkaian perkiraan, masing-masing menjadi pengukuran. Ini adalah sampel, dengan tingkat kesalahan tertentu. Statistika dirancang untuk menggambarkan kesalahan, dan melakukan analisis pada data semacam ini.
Ada berbagai jenis sampel:
Polisi perbatasan mencari obat-obatan terlarang dengan anjing yang terlatih khusus: Jika mereka memeriksa setiap mobil kesepuluh, mereka mengambil sampel yang tidak bias.
Pengambilan sampel bertingkat
Jika suatu populasi memiliki sub-populasi yang jelas, maka masing-masing sub-populasi perlu dijadikan sampel. Ini disebut pengambilan sampel berstrata. Stratified sampling juga dikenal sebagai sampel acak berstrata. Stratified sampling sering direpresentasikan sebagai proporsi, seperti persen (%).
Misalkan, sebuah eksperimen ditetapkan untuk mengambil sampel pendapatan orang dewasa. Jelas, pendapatan lulusan perguruan tinggi mungkin berbeda dari yang bukan lulusan perguruan tinggi. Sekarang anggaplah jumlah lulusan pria adalah 30% dari total pria dewasa (angka imajiner). Kemudian Anda akan mengatur agar 30% dari total sampel adalah lulusan laki-laki yang dipilih secara acak, dan 70% dari total adalah laki-laki yang bukan lulusan. Ulangi proses untuk perempuan, karena persentase lulusan perempuan berbeda dari laki-laki. Hal itu memberikan sampel populasi orang dewasa yang dikelompokkan berdasarkan jenis kelamin dan pendidikan perguruan tinggi. Langkah selanjutnya adalah membagi setiap sub-populasi Anda berdasarkan kelompok usia, karena (misalnya) lulusan mungkin mendapatkan lebih banyak pendapatan relatif terhadap yang bukan lulusan di usia paruh baya.
Jenis lain dari sampel berstrata berkaitan dengan variasi. Di sini sampel yang lebih besar diambil dari sub-populasi yang lebih bervariasi sehingga ringkasan statistik seperti rata-rata dan standar deviasi, lebih dapat diandalkan.
Pertanyaan dan Jawaban
T: Apa yang dimaksud dengan sampel dalam statistik?
J: Dalam statistik, sampel adalah bagian dari populasi yang telah dipilih secara hati-hati untuk mewakili seluruh populasi secara adil dan tanpa bias.
T: Mengapa sampel dibutuhkan?
J: Sampel diperlukan karena populasi mungkin begitu besar sehingga menghitung semua individu mungkin tidak mungkin atau tidak praktis. Oleh karena itu, pemecahan masalah dalam statistik biasanya dimulai dengan pengambilan sampel.
T: Bagaimana sampel direpresentasikan?
J: Ketika diperlakukan sebagai kumpulan data, sampel sering diwakili oleh huruf kapital seperti X dan Y, dengan elemen-elemennya diwakili dalam huruf kecil (misalnya, x3), dan ukuran sampel diwakili oleh huruf n.
T: Apa yang seharusnya menjadi sampel?
J: Sebagai aturan umum, sampel harus acak yang berarti peluang atau probabilitas memilih satu individu sama dengan peluang memilih individu lainnya. Dalam praktiknya, sampel acak selalu diambil melalui prosedur yang terdefinisi dengan baik.
T: Dapatkah bias tetap ada dalam sampel?
J: Bahkan ketika menggunakan prosedur yang terdefinisi dengan baik untuk pengambilan sampel, beberapa bias mungkin tetap ada dalam sampel karena faktor-faktor seperti siapa yang menjawab panggilan telepon atau siapa yang berjalan di jalan-jalan tertentu ketika mengumpulkan pendapat untuk prediksi jajak pendapat pemilu. Dalam kasus-kasus seperti ini, akan sulit untuk mendapatkan sampel yang benar-benar netral, tetapi ahli statistik dapat mengukur seberapa besar bias yang masih ada.
T: Apakah ada berbagai jenis sampel?
J: Ya, ada berbagai jenis sampel termasuk sampel lengkap yang mencakup semua elemen yang memiliki sifat-sifat yang diberikan dan sampel yang tidak bias/representatif yang melibatkan pemilihan elemen dari sampel lengkap tanpa tergantung pada sifat-sifatnya. Cara pengambilan sampel diperoleh bersama dengan ukurannya akan berdampak pada bagaimana data dilihat.