Yuk, Kita Belajar!

Varian dan standar deviasi (simpangan baku) adalah ukuran-ukuran keragaman (variasi) data statistik yang paling sering digunakan. Standar deviasi (simpangan baku) merupakan akar kuadrat dari varian.

s=\sqrt{s^2}

Oleh karena itu, jika salah satu nilai dari kedua ukuran tersebut diketahui maka akan diketahui juga nilai ukuran yang lain.

Penghitungan

Dasar penghitungan varian dan standar deviasi adalah keinginan untuk mengetahui keragaman suatu kelompok data. Salah satu cara untuk mengetahui keragaman dari suatu kelompok data adalah dengan mengurangi setiap nilai data dengan rata-rata kelompok data tersebut, selanjutnya semua hasilnya dijumlahkan.

Namun cara seperti itu tidak bisa digunakan karena hasilnya akan selalu menjadi 0.

Oleh karena itu, solusi agar nilainya tidak menjadi 0 adalah dengan mengkuadratkan setiap pengurangan nilai data dan rata-rata kelompok data tersebut, selanjutnya dilakukan penjumlahan. Hasil penjumlahan kuadrat (sum of squares) tersebut akan selalu bernilai positif.

Nilai varian diperoleh dari pembagian hasil penjumlahan kuadrat (sum of squares) dengan ukuran data (n).

Namun begitu, dalam penerapannya, nilai varian tersebut bias untuk menduga varian populasi. Dengan menggunakan rumus tersebut, nilai varian populasi lebih besar dari varian sampel.

Oleh karena itu, agar tidak bias dalam menduga varian populasi, maka nsebagai pembagi penjumlahan kuadrat (sum of squares) diganti dengan n-1 (derajat bebas) agar nilai varian sampel mendekati varian populasi. Oleh karena itu rumus varian sampel menjadi:

Nilai varian yang dihasilkan merupakan nilai yang berbentuk kuadrat. Misalkan satuan nilai rata-rata adalah gram, maka nilai varian adalah gram kuadrat. Untuk menyeragamkan nilai satuannya maka varian diakarkuadratkan sehingga hasilnya adalah standar deviasi (simpangan baku).

Untuk mempermudah penghitungan, rumus varian dan standar deviasi (simpangan baku) tersebut bisa diturunkan :

Rumus varian :

Rumus standar deviasi (simpangan baku) :

Keterangan:

s² = varian

s = standar deviasi (simpangan baku)

xi = nilai x ke-i

= rata-rata

n = ukuran sampel

Contoh Penghitungan

Misalkan dalam suatu kelas, tinggi badan beberapa orang siswa yang dijadikan sampel adalah sebagai berikut.

172, 167, 180, 170, 169, 160, 175, 165, 173, 170

Dari data tersebut diketahui bahwa jumlah data (n) = 10, dan (n - 1) = 9. Selanjutnya dapat dihitung komponen untuk rumus varian.

Dari tabel tersebut dapat ketahui:

Dengan demikian, jika dimasukkan ke dalam rumus varian, maka hasilnya adalah sebagai berikut.

Dari penghitungan, diperoleh nilai varian sama dengan 30,32.

Dari nilai tersebut bisa langsung diperoleh nilai standar deviasi (simpangan baku) dengan cara mengakarkuadratkan nilai varian.

UKURAN GEJALA PUSAT DATA DIKELOMPOKKAN

Ukuran gejala pusat merupakan suatu bilangan yang menunjukan sekitar dimana bilangan – bilangan yang ada dalam kumpulan data, oleh karenanya ukuran gejala pusat ini sering disebut dengan harga rata – rata. Harga rata – rata dari sekelompok data itu diharapkan dapat diwakili seluruh harga – harga yang ada dalam sekelompok data itu.

Sebelum membahas hal ini, perlu diperjelas tentang apa yang dimaksud dengan data yang dikelompokkan dan data yang tidak dikelompokkan. Data yang dikelompokkan adalah data yang sudah disusun ke dalam sebuah distribusi frekuensi sehingga data tersebut mempunyai interval kelas yang jelas, mempunyai titik tengah kelas sedangkan data yang tidak dikelompokkan adalah data yang tidak disusun ke dalam distribusi frekuensi sehingga tidak mempunyai interval kelas dan titik tengah kelas.

Mean, Median, Modus sama-sama merupakan ukuran pemusatan data yang termasuk kedalam analisis statistika deskriptif. Namun, ketiganya memiliki kelebihan dan kekurangannya masing-masing dalam menerangkan suatu ukuran pemusatan data. Untuk tahu kegunaannya masing-masing dan kapan kita mempergunakannya, perlu diketahui terlebih dahulu pengertian analisis statistika deskriptif dan ukuran pemusatan data.

a. Mean (Rata – Rata Hitung)

Dalam istilah sehari – hari, mean dikenal dengan sebutan angka rata – rata, ada dua macam mean yang di bicarakan yaitu : mean untuk data yang tidak dikelompokkan dan mean untuk data yang dikelompokan. Mean adalah total semua data dibagi jumlah data. Mean digunakan ketika data yang kita miliki memiliki sebaran normal atau mendekati normal (berbentuk setangkup, nilai yang paling banyak berada ditengah dan makin besar semakin sedikit, makin kecil makin sedikit pula, nilai-nilai ekstrim yang besar maupun yang kecil hampir tidak ada).

b. Median (Nilai Tengan)

Ukuran pemusatan yang menempati posisi tengah jika data diurutkan menurut besarnya. Median adalah nilai yang berada ditengah-tengah data setelah diurutkan dari yang terkecil sampai terbesar. Median cocok digunakan bila data yang kita miliki tidak menyebar normal atau memiliki nilai yang berbeda-beda secara signifikan.

c. Modus (Data Yang Sering Muncul)

Modus adalah suatu angka atau bilangan yang paling sering terjadi / muncul tetapi kalo pada data distribusi frekuensi interval modus terletak pada frekuensi yang paling besar.

d. Kuartil

Kuartil adalah suatu harga yang membagi histogram frekuensi menjadi 4 bagian yang sama, sehingga disini akan terdapat 3 harga kuartil yaitu kuartil I ( K1), kuartil II (K2) dan kuartil III (K3), dimana harga kuarti II sama dengan harga median.

e. Desil

Untuk kelompok data dimana n ≥ 10, dapat ditentukan 9 nilai bagian yang sama, misalnya D1, D2, … Q9, artinya setiap bagian mempunyai jumlah observasi yang sama, sedemikian rupa sehingga nilai 10% data/observasi sama atau lebih kecil dari D1, nilai 20% data/observasi sama atau lebih kecil dari D2, dan seterusnya. Nilai tersebut dinamakan desil pertama, kedua dan seterusnya sampai desil kesembilan.

f. Persentil

Untuk kelompok data dimana n ≥ 100, dapat ditentukan 99 nilai, P1, P2, … P99, yang disebut persentil pertama, kedua dan ke-99, yang membagi kelompok data tersebut menjadi 100 bagian,masing-masing mempunyai bagian dengan jumlah observasi yang sama, dan sedemikian rupa sehingga 1% data/observasi sama atau lebih kecil dari P1, 2% data/observasi sama atau lebih kecil dari P2.

UKURAN VARIASI (DISPERSI)

Dispersi atau variasi atau keragaman data adalah ukuran penyebaran suatu kelompok data terhadap pusat data.

a. Range

Range merupakan selisih antara nilai data terbesar dengan data terkecil dari sekelompok data.

Rumusannya adalah R = Nilai maksimal – Nilai minimal

b. Simpangan rata-rata

Simpangan Rata-Rata (Sr) : Yang dimaksud dengan simpangan (deviation) adalah selisih antara nilai pengamatan ke-i dengan nilai rata-rata, atau antara xi dengan X (X Rata-Rata) Penjumlahan daripada simpangan-simpangan dalam pengamatan kemudian dibagi dengan jumlah pengamatan, n, disebut dengan simpangan rata-rata.

Dalam setiap nilai Xi akan mempunyai simpangan sebesar xi - X. Karena nilai xi bervariasi di atas dan di bawah nilai rata-ratanya maka jika nilai simpangan tersebut dijumlahkan akan sama dengan “nol”. Untuk dapat menghitung rata-rata dari simpangan tersebut maka nilai yang diambil adalah nilai “absolut” dari simpangan itu sendiri, artinya tidak menghiraukan apakah nilai simpangan tersebut positif (+) atau negatif (-).an rata-rata.

c. Variansi (variance)

Variansi (variance) adalah rata-rata kuadrat selisih atau kuadrat simpangan dari semua nilai data terhadap rata-rata hitung. Varians untuk sampel dilambangkan dengan S2. Sedangkan untuk populasi dilambangkan dengan toh kuadrat .

d. Simpangan Baku (Standard Deviation)

Standar deviasi (standard deviation) adalah akar pangkat dua dari variansi. Standar deviasi seringkali disebut sebagai simpangan baku.

e. Jangkauan Kuartil

Jangkauan Kuartil atau simpangan kuartil adalah setengah dari selisih antara kuartil atas (Q3) dengan kuartil bawah (Q1). Dengan rumus :

JK=1/2 (Q3-Q1)

f. Jangkauan Persentil

Jangkauan Persentil adalah selisih antara persentil ke-90 dengan persentil ke-10. Dengan rumus :

JP (10-90) = P90-P10

Data sekunder

Sample data sekunder yang kami ambil yaitu jumlah penduduk kota Bogor tahun 2006 yang dikelompokan berdasarkan pembagian kecamatan dan berdasarkan jenis kelamin.

Sampel datanya ada sebagai berikut :

JUMLAH PENDUDUK KOTA BOGOR PER KECAMATAN

MENURUT JENIS KELAMIN TAHUN 2006

Kecamatan	Laki-Laki	Perempuan	Jumlah
Bogor Selatan	77.254	73.881	151.135
Bogor Timur	38.307	38.958	77.265
Bogor Utara	64.148	61.710	125.858
Bogor Barat	86.496	84.148	170.644
Bogor Tengah	60.235	60.235	120.470
Tanah Sareal	83.257	49.236	132.493
Jumlah	409.427	368.168	777.865

Data Yang Sudah Dikelompokan :

JUMLAH PENDUDUK (Dalam Ratusan)	f	Fkum	Mi	FiMi	µ	Mi - µ	(Mi µ)2	F(Mi - µ)2
38,5 – 47,5	2	43	2	64	26,25	16,75	280,57	561,14
48,5 – 57,5	1	53	3	53	26,25	26,75	715,57	715,57
58,5 – 67,5	4	63	7	252	26,25	36,75	1350,57	5402,28
68,5 – 77,5	2	73	9	146	26,25	46,75	2185,57	4371,14
78,5 – 87,5	3	83	12	249	26,25	56,75	3220,57	9661,71
Jumlah	12	315	12					20711,84