Koefisien korelasi peringkat Spearman
Dalam matematika dan statistik, koefisien korelasi peringkat Spearman adalah ukuran korelasi, dinamai menurut pembuatnya, Charles Spearman. Ini ditulis singkat sebagai huruf Yunani rho ( ρ {\displaystyle \rho } ) atau kadang-kadang sebagai r s {\displaystyle r_{s}}. . Ini adalah angka yang menunjukkan seberapa dekat dua set data terkait. Angka ini hanya dapat digunakan untuk data yang dapat diurutkan, seperti dari yang tertinggi ke terendah.
Rumus umum untuk r s {\displaystyle r_{s}} adalah ρ = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle \rho =1-{\cfrac {6\sum d^{2}}{n(n^{2}-1)}}} .
Sebagai contoh, jika Anda memiliki data tentang seberapa mahal komputer yang berbeda, dan data tentang seberapa cepat komputer tersebut, Anda bisa melihat apakah komputer-komputer tersebut terhubung, dan seberapa dekat mereka terhubung, dengan menggunakan r s {\displaystyle r_{s}}. .
Mengerjakannya
Langkah pertama
Untuk mengerjakan r s {\displaystyle r_{s}} Anda pertama-tama harus mengurutkan setiap bagian data. Kita akan menggunakan contoh dari intro komputer dan kecepatannya.
Jadi, komputer dengan harga terendah akan menjadi peringkat 1. Yang lebih tinggi dari itu akan memiliki peringkat 2. Kemudian, itu naik sampai semuanya diperingkat. Anda harus melakukan ini untuk kedua set data.
PC | Harga ($) | R a n k 1 {\displaystyle Rank_{1}}} | Kecepatan (GHz) | R a n k 2 {\displaystyle Rank_{2}} |
A | 200 | 1 | 1.80 | 2 |
B | 275 | 2 | 1.60 | 1 |
C | 300 | 3 | 2.20 | 4 |
D | 350 | 4 | 2.10 | 3 |
E | 600 | 5 | 4.00 | 5 |
Langkah kedua
Selanjutnya, kita harus mencari selisih antara kedua peringkat tersebut. Kemudian, Anda mengalikan selisihnya dengan dirinya sendiri, yang disebut mengkuadratkan. Perbedaannya disebut d {\displaystyle d} , dan angka yang anda dapatkan ketika anda mengkuadratkan d {\displaystyle d} disebut d 2 {\displaystyle d^{2}}. .
R a n k 1 {\displaystyle Rank_{1}}} | R a n k 2 {\displaystyle Rank_{2}} | d {\displaystyle d} | d 2 {\displaystyle d^{2}} |
1 | 2 | -1 | 1 |
2 | 1 | 1 | 1 |
3 | 4 | -1 | 1 |
4 | 3 | 1 | 1 |
5 | 5 | 0 | 0 |
Langkah ketiga
Hitung berapa banyak data yang kita miliki. Data ini memiliki peringkat 1 sampai 5, jadi kita memiliki 5 buah data. Angka ini disebut n {\displaystyle n} .
Langkah keempat
Akhirnya, gunakan semua yang telah kita kerjakan sejauh ini dalam rumus ini: r s = 1 - 6 ∑ d 2 n ( n 2 - 1 ) {\displaystyle r_{s}=1-{\cfrac {6\sum d^{2}}}{n(n^{{2}-1)}}} .
∑ d 2 {\displaystyle \sum d^{{2}} berarti kita mengambil total semua angka yang ada di kolom d 2 {\displaystyle d^{2}}. . Ini karena ∑ {\displaystyle \sum } berarti total.
Jadi, ∑ d 2 {\displaystyle \sum d^{{2}} adalah 1 + 1 + 1 + 1 {\displaystyle 1+1+1+1+1} yaitu 4. Rumusnya mengatakan kalikan dengan 6, yaitu 24.
n ( n 2 - 1 ) {\displaystyle n(n^{2}-1)} adalah 5 × ( 25 - 1 ) {\displaystyle 5\kali (25-1)} yaitu 120.
Jadi, untuk mengetahui r s {\displaystyle r_{s}} , kita cukup melakukan 1 - 24 120 = 0.8 {\displaystyle 1-{\cfrac {24}{120}}=0.8} .
Oleh karena itu, koefisien korelasi peringkat Spearman adalah 0,8 untuk kumpulan data ini.
Apa arti angka-angka tersebut
r s {\displaystyle r_{s}} selalu memberikan jawaban antara -1 dan 1. Angka-angka di antaranya seperti skala, di mana -1 adalah kaitan yang sangat kuat, 0 adalah tidak ada kaitan, dan 1 juga merupakan kaitan yang sangat kuat. Perbedaan antara 1 dan -1 adalah bahwa 1 adalah korelasi positif, dan -1 adalah korelasi negatif. Grafik data dengan nilai r s {\displaystyle r_{s}} dari -1 akan terlihat seperti grafik yang ditunjukkan kecuali garis dan titik-titik akan bergerak dari kiri atas ke kanan bawah.
Sebagai contoh, untuk data yang kita lakukan di atas, r s {\displaystyle r_{s}}} adalah 0.8. Jadi ini berarti ada korelasi positif. Karena mendekati 1, berarti hubungan antara kedua set data tersebut kuat. Jadi, kita dapat mengatakan bahwa kedua set data tersebut saling terkait, dan naik bersama-sama. Jika -0,8, kita bisa mengatakan bahwa itu terkait dan ketika yang satu naik, yang lain turun.
Jika dua angka sama
Terkadang, ketika mengurutkan data, ada dua atau lebih angka yang sama. Ketika hal ini terjadi pada r s {\displaystyle r_{s}}} kita mengambil mean atau rata-rata dari peringkat yang sama. Ini disebut tied ranks. Untuk melakukan ini, kita mengurutkan angka-angka yang terikat seolah-olah mereka tidak terikat. Kemudian, kita menjumlahkan semua peringkat yang akan mereka miliki, dan membaginya dengan berapa banyak jumlahnya. Misalnya, katakanlah kita mengurutkan peringkat seberapa baik orang-orang yang berbeda melakukannya dalam tes mengeja.
Nilai tes | Pangkat | Peringkat (dengan ikatan) |
4 | 1 | 1 |
6 | 2 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3} |
6 | 3 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3} |
6 | 4 | 2 + 3 + 4 3 = 3 {\displaystyle {\tfrac {2+3+4}{3}}=3} |
8 | 5 | 5 + 6 2 = 5.5 {\displaystyle {\tfrac {5+6}{2}}=5.5} |
8 | 6 | 5 + 6 2 = 5.5 {\displaystyle {\tfrac {5+6}{2}}=5.5} |
Angka-angka ini digunakan dengan cara yang persis sama seperti peringkat normal.
Halaman terkait
Pertanyaan dan Jawaban
T: Apa yang dimaksud dengan koefisien korelasi rank Spearman?
J: Koefisien korelasi peringkat Spearman adalah ukuran korelasi yang menunjukkan seberapa dekat dua set data terkait. Koefisien ini hanya dapat digunakan untuk data yang dapat diurutkan, seperti data tertinggi hingga terendah.
T: Siapa yang menciptakan koefisien korelasi peringkat Spearman?
J: Charles Spearman menciptakan koefisien korelasi peringkat Spearman.
T: Bagaimana rumus umum untuk koefisien korelasi peringkat Spearman dituliskan?
J: Rumus umum untuk koefisien korelasi peringkat Spearman ditulis sebagai ρ = 1 - 6∑d2/n(n2-1).
T: Kapan sebaiknya Anda menggunakan koefisien korelasi rank Spearman?
J: Anda harus menggunakan koefisien korelasi peringkat Spearman ketika Anda ingin melihat seberapa dekat dua set data terkait dan apakah keduanya saling terkait.
T: Jenis data apa yang dapat digunakan?
J: Koefisien ini bekerja dengan semua jenis data yang dapat diurutkan, seperti tertinggi hingga terendah.
T: Dapatkah Anda memberikan contoh di mana Anda akan menggunakan ukuran ini?
J: Contoh di mana Anda akan menggunakan ukuran ini adalah jika Anda memiliki data tentang seberapa mahal harga komputer yang berbeda, dan data tentang seberapa cepat komputer tersebut, maka Anda dapat melihat apakah mereka terhubung, dan seberapa dekat mereka terhubung menggunakan r_s.