Interval kepercayaan

Dalam statistika, interval keyakinan adalah bentuk khusus untuk menaksir parameter tertentu. Dengan metode ini, seluruh interval nilai yang dapat diterima untuk parameter diberikan, bukannya nilai tunggal, bersama dengan kemungkinan bahwa nilai nyata (tidak diketahui) dari parameter akan berada dalam interval. Interval kepercayaan didasarkan pada pengamatan dari sampel, dan karenanya berbeda dari satu sampel ke sampel lainnya. Kemungkinan bahwa parameter akan berada dalam interval disebut tingkat keyakinan. Seringkali, ini diberikan dalam bentuk persentase. Interval kepercayaan selalu diberikan bersama dengan tingkat kepercayaan. Orang mungkin berbicara tentang "interval kepercayaan 95%". Titik akhir dari interval kepercayaan disebut sebagai batas kepercayaan. Untuk prosedur estimasi yang diberikan dalam situasi tertentu, semakin tinggi tingkat keyakinan, semakin lebar interval keyakinan.

Penghitungan interval kepercayaan umumnya memerlukan asumsi tentang sifat proses estimasi - ini terutama merupakan metode parametrik. Salah satu asumsi umum adalah bahwa distribusi populasi dari mana sampel berasal adalah normal. Dengan demikian, interval kepercayaan seperti yang dibahas di bawah ini bukanlah statistik yang kuat, meskipun perubahan dapat dilakukan untuk menambah kekokohan.

Arti istilah "kepercayaan diri"

Istilah keyakinan memiliki arti yang sama dalam statistik, seperti dalam penggunaan umum. Dalam penggunaan umum, klaim keyakinan 95% dalam sesuatu biasanya dianggap sebagai menunjukkan kepastian virtual. Dalam statistika, klaim keyakinan 95% secara sederhana berarti bahwa peneliti telah melihat satu interval yang mungkin dari sejumlah besar kemungkinan interval, di mana sembilan belas dari dua puluh interval mengandung nilai sebenarnya dari parameter.

Contoh praktis

A factory assembly line fills margarine cups to a desired 250g +/- 5g

Sebuah mesin mengisi cangkir dengan margarin. Untuk contoh, mesin disesuaikan sehingga isi cangkir adalah 250g margarin. Karena mesin tidak dapat mengisi setiap cangkir dengan tepat 250g, isi yang ditambahkan ke cangkir individu menunjukkan beberapa variasi, dan dianggap sebagai variabel acak X. Variasi ini diasumsikan terdistribusi secara normal di sekitar rata-rata yang diinginkan yaitu 250g, dengan standar deviasi 2,5g. Untuk menentukan apakah mesin sudah dikalibrasi secara memadai, sampel n = 25 cangkir margarin dipilih secara acak dan cangkir-cangkir tersebut ditimbang. Berat margarin adalah X1 , ..., X25 , sampel acak dari X.

Untuk mendapatkan kesan dari ekspektasi μ, cukup dengan memberikan estimasi. Estimator yang sesuai adalah rata-rata sampel:

μ ^ = X ¯ = 1 n ∑ i = 1 n X i . {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}. } {\displaystyle {\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.}

Sampel menunjukkan bobot aktual x1 , ...,x25 , dengan mean:

x ¯ = 1 25 ∑ i = 1 25 x i = 250.2 gram . {\displaystyle {\bar {x}}={\frac {1}{25}}}\sum _{i=1}^{25}x_{i}=250,2\,{\text{grams}}. } {\displaystyle {\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{grams}}.}

Jika kita mengambil sampel lain dari 25 cangkir, kita dapat dengan mudah berharap menemukan nilai seperti 250,4 atau 251,1 gram. Namun, nilai rata-rata sampel 280 gram akan sangat jarang terjadi jika kandungan rata-rata cangkir sebenarnya mendekati 250g. Ada seluruh interval di sekitar nilai yang diamati 250,2 dari rata-rata sampel di mana, jika seluruh rata-rata populasi benar-benar mengambil nilai dalam kisaran ini, data yang diamati tidak akan dianggap sangat tidak biasa. Interval seperti itu disebut interval kepercayaan untuk parameter μ. Bagaimana kita menghitung interval seperti itu? Titik-titik akhir interval harus dihitung dari sampel, jadi mereka adalah statistik, fungsi dari sampel X1 , ..., X25 dan karenanya variabel acak itu sendiri.

Dalam kasus kita, kita dapat menentukan titik akhir dengan mempertimbangkan bahwa rata-rata sampel X dari sampel yang terdistribusi normal juga terdistribusi normal, dengan ekspektasi μ yang sama, tetapi dengan kesalahan standar σ/√n = 0,5 (gram). Dengan melakukan standarisasi kita mendapatkan variabel acak

Z = X ¯ - μ σ / n = X ¯ - μ 0.5 {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}} {\displaystyle Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}}

tergantung pada parameter μ yang akan diestimasi, tetapi dengan distribusi normal standar yang tidak tergantung pada parameter μ. Oleh karena itu, dimungkinkan untuk menemukan angka -z dan z, tidak tergantung pada μ, di mana Z terletak di antara keduanya dengan probabilitas 1 - α, ukuran seberapa yakin kita ingin menjadi. Kita ambil 1 - α = 0.95. Jadi kita punya:

P ( - z ≤ Z ≤ z ) = 1 - α = 0,95. {P ( - z ≤ Z ≤ z ) = 1 - α = 0.95.} {\displaystyle P(-z\leq Z\leq z)=1-\alpha =0.95.\,}

Angka z mengikuti dari fungsi distribusi kumulatif:

Φ ( z ) = P ( Z ≤ z ) = 1 - α 2 = 0.975 , z = Φ - 1 ( Φ ( z ) ) = Φ - 1 ( 0.975 ) = 1.96 , {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}} {\displaystyle {\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}}

dan kita dapatkan:

0.95 = 1 - α = P ( - z ≤ Z ≤ z ) = P ( - 1.96 ≤ X ¯ - μ σ / n ≤ 1.96 ) = P ( X ¯ - 1.96 σ n ≤ μ ≤ X ¯ + 1.96 σ n ) = P ( X ¯ - 1.96 × 0.5 ≤ μ ≤ X ¯ + 1.96 × 0.5 ) = P ( X ¯ - 0.98 ≤ μ ≤ X ¯ + 0.98 ) . {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\kali 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}} {\displaystyle {\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\\[6pt]&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}}

Hal ini bisa diinterpretasikan sebagai: dengan probabilitas 0.95 kita akan menemukan interval keyakinan di mana kita akan bertemu dengan parameter μ di antara titik akhir stokastik

X ¯ - 0 . 98 {\displaystyle {\bar {X}}-0{.}98\,} {\displaystyle {\bar {X}}-0{.}98\,}

dan

X ¯ + 0.98. {\displaystyle {\bar {X}} + 0.98.\,} {\displaystyle {\bar {X}}+0.98.\,}

Ini tidak berarti bahwa ada 0,95 probabilitas untuk memenuhi parameter μ dalam interval yang dihitung. Setiap kali pengukuran diulang, akan ada nilai lain untuk rata-rata X dari sampel. Dalam 95% kasus, μ akan berada di antara titik akhir yang dihitung dari mean ini, tetapi dalam 5% kasus tidak. Interval kepercayaan aktual dihitung dengan memasukkan bobot yang diukur dalam rumus. Interval keyakinan 0,95 kita menjadi:

( x ¯ - 0.98 ; x ¯ + 0.98 ) = ( 250.2 - 0.98 ; 250.2 + 0.98 ) = ( 249.22 ; 251.18 ) . {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,} {\displaystyle ({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,}

Karena nilai 250 μ yang diinginkan berada dalam interval kepercayaan yang dihasilkan, tidak ada alasan untuk meyakini bahwa mesin salah dikalibrasi.

Interval yang dihitung memiliki titik-titik akhir yang tetap, di mana μ mungkin berada di antaranya (atau tidak). Dengan demikian, kejadian ini memiliki probabilitas 0 atau 1. Kita tidak bisa mengatakan: "dengan probabilitas (1 - α) parameter μ terletak di dalam interval kepercayaan." Kita hanya tahu bahwa dengan pengulangan dalam 100(1 - α) % dari kasus μ akan berada dalam interval yang dihitung. Namun, dalam 100α % kasus tidak. Dan sayangnya kita tidak tahu dalam kasus mana hal ini terjadi. Itulah mengapa kita katakan: "dengan tingkat keyakinan 100(1 - α) %, μ terletak pada interval keyakinan. "

Gambar di sebelah kanan menunjukkan 50 realisasi interval kepercayaan untuk rata-rata populasi μ. Jika kita secara acak memilih satu realisasi, probabilitasnya adalah 95% kita akhirnya memilih interval yang mengandung parameter; namun kita mungkin tidak beruntung dan memilih yang salah. Kita tidak akan pernah tahu; kita terjebak dengan interval kita.

Segmen garis vertikal mewakili 50 realisasi dari interval kepercayaan untuk μ.Zoom
Segmen garis vertikal mewakili 50 realisasi dari interval kepercayaan untuk μ.

Pertanyaan dan Jawaban

T: Apa yang dimaksud dengan interval kepercayaan dalam statistik?


J: Interval kepercayaan adalah interval khusus yang digunakan untuk mengestimasi parameter, seperti rata-rata populasi, yang memberikan rentang nilai yang dapat diterima untuk parameter tersebut, bukan nilai tunggal.

T: Mengapa interval kepercayaan digunakan sebagai pengganti nilai tunggal?


J: Interval kepercayaan digunakan sebagai pengganti nilai tunggal untuk memperhitungkan ketidakpastian dalam mengestimasi parameter berdasarkan sampel, dan untuk memberikan kemungkinan bahwa nilai sebenarnya dari parameter tersebut ada di dalam interval tersebut.

T: Apa yang dimaksud dengan tingkat kepercayaan?


J: Tingkat kepercayaan adalah kemungkinan bahwa parameter yang diestimasi berada di dalam interval kepercayaan, dan sering kali diberikan dalam bentuk persentase (misalnya interval kepercayaan 95%).

T: Apa yang dimaksud dengan batas kepercayaan?


J: Batas keyakinan adalah titik akhir dari interval keyakinan, yang menentukan kisaran nilai yang dapat diterima untuk parameter yang sedang diestimasi.

T: Bagaimana tingkat kepercayaan mempengaruhi interval kepercayaan?


J: Dalam prosedur estimasi yang diberikan, semakin tinggi tingkat kepercayaan, semakin lebar interval kepercayaan.

T: Asumsi apa saja yang diperlukan untuk menghitung interval kepercayaan?


J: Perhitungan interval keyakinan umumnya membutuhkan asumsi tentang sifat proses estimasi, seperti asumsi bahwa distribusi populasi yang menjadi sampel adalah normal.

T: Apakah interval kepercayaan merupakan statistik yang kuat?


J: Interval kepercayaan, seperti yang dibahas di bawah ini, bukanlah statistik yang kuat, meskipun penyesuaian dapat dilakukan untuk menambah ketahanan.

AlegsaOnline.com - 2020 / 2023 - License CC3