Selasa, 09 April 2019

Kemiringan dan Keruncingan Data

Kemiringan Distribusi Data
Merupakan derajat atau ukuran dari ketidaksimetrisan (Asimetri) suatu distribusi data.
Kemiringan distribusi data terdapat 3 jenis, yaitu :
  • Simetris : menunjukkan letak nilai rata-rata hitung, median, dan modus berhimpit (berkisar di satu titik)
  • Miring ke kanan : mempunyai nilai modus palingkecil dan rata-rata hitung paling besar
  • Miring ke kiri : mempunyai nilai modus paling besar
            dan rata-rata hitung paling kecil




Menentukan Ukuran Statistik Deskriptif Menggunakan Excel Langkah-langkahnya: 
1. Ketik data pada kolom A seperti contoh di atas 
2. Pilih menu Tools pada menu utama 
3. Pilih Data Analysis 
4. Pilih Deskriptive Statistics pada daftar Analysis Tools lalu klik OK
 Ketika Box Dialog muncul:
  Ketik A2…A21 pada kotak Input Range
  Ketik C1 pada kotak Output Range dan pilih Summary Statistics dan klik OK

Senin, 11 Maret 2019

Ukuran Variansi Dan Simpangan Baku

Varian dan standar deviasi (simpangan baku) adalah ukuran-ukuran keragaman (variasi) data statistik yang paling sering digunakan. Standar deviasi (simpangan baku) merupakan akar kuadrat dari varian.s=\sqrt{s^2}Oleh karena itu, jika salah satu nilai dari kedua ukuran tersebut diketahui maka akan diketahui juga nilai ukuran yang lain.

Penghitungan

Dasar penghitungan varian dan standar deviasi adalah keinginan untuk mengetahui keragaman suatu kelompok data. Salah satu cara untuk mengetahui keragaman dari suatu kelompok data adalah dengan mengurangi setiap nilai data dengan rata-rata kelompok data tersebut, selanjutnya semua hasilnya dijumlahkan.

Namun cara seperti itu tidak bisa digunakan karena hasilnya akan selalu menjadi 0.


Oleh karena itu, solusi agar nilainya tidak menjadi 0 adalah dengan mengkuadratkan setiap pengurangan nilai data dan rata-rata kelompok data tersebut, selanjutnya dilakukan penjumlahan. Hasil penjumlahan kuadrat (sum of squares) tersebut akan selalu bernilai positif.

Nilai varian diperoleh dari pembagian hasil penjumlahan kuadrat (sum of squares) dengan ukuran data (n).

Namun begitu, dalam penerapannya, nilai varian tersebut bias untuk menduga varian populasi. Dengan menggunakan rumus tersebut, nilai varian populasi lebih besar dari varian sampel.

Oleh karena itu, agar tidak bias dalam menduga varian populasi, maka nsebagai pembagi penjumlahan kuadrat (sum of squares) diganti dengan n-1 (derajat bebas) agar nilai varian sampel mendekati varian populasi. Oleh karena itu rumus varian sampel menjadi: 


Nilai varian yang dihasilkan merupakan nilai yang berbentuk kuadrat. Misalkan satuan nilai rata-rata adalah gram, maka nilai varian adalah gram kuadrat. Untuk menyeragamkan nilai satuannya maka varian diakarkuadratkan sehingga hasilnya adalah standar deviasi (simpangan baku).


Untuk mempermudah penghitungan, rumus varian dan standar deviasi (simpangan baku) tersebut bisa diturunkan :

Rumus varian :


Rumus standar deviasi (simpangan baku) :


Keterangan:
s2 = varian
s = standar deviasi (simpangan baku)
xi = nilai x ke-i
 = rata-rata
n = ukuran sampel


Contoh Penghitungan

Misalkan dalam suatu kelas, tinggi badan beberapa orang siswa yang dijadikan sampel adalah sebagai berikut. 

172, 167, 180, 170, 169, 160, 175, 165, 173, 170

Dari data tersebut diketahui bahwa jumlah data (n) = 10, dan (n - 1) = 9. Selanjutnya dapat dihitung komponen untuk rumus varian.


Dari tabel tersebut dapat ketahui:

 

Dengan demikian, jika dimasukkan ke dalam rumus varian, maka hasilnya adalah sebagai berikut.

Dari penghitungan, diperoleh nilai varian sama dengan 30,32.

Dari nilai tersebut bisa langsung diperoleh nilai standar deviasi (simpangan baku) dengan cara mengakarkuadratkan nilai varian.

Ukuran Gejala Pusat Data Dikelompokkan




UKURAN GEJALA PUSAT DATA DIKELOMPOKKAN


Ukuran gejala pusat merupakan suatu bilangan yang menunjukan sekitar dimana bilangan – bilangan yang ada dalam kumpulan data, oleh karenanya ukuran gejala pusat ini sering disebut dengan harga rata – rata. Harga rata – rata dari sekelompok data itu diharapkan dapat diwakili seluruh harga – harga yang ada dalam sekelompok data itu.
Sebelum membahas hal ini, perlu diperjelas tentang apa yang dimaksud dengan data yang dikelompokkan dan data yang tidak dikelompokkan. Data yang dikelompokkan adalah data yang sudah disusun ke dalam sebuah distribusi frekuensi sehingga data tersebut mempunyai interval kelas yang jelas, mempunyai titik tengah kelas sedangkan data yang tidak dikelompokkan adalah data yang tidak disusun ke dalam distribusi frekuensi sehingga tidak mempunyai interval kelas dan titik tengah kelas.
Mean, Median, Modus sama-sama merupakan ukuran pemusatan data yang termasuk kedalam analisis statistika deskriptif. Namun, ketiganya memiliki kelebihan dan kekurangannya masing-masing dalam menerangkan suatu ukuran pemusatan data. Untuk tahu kegunaannya masing-masing dan kapan kita mempergunakannya, perlu diketahui terlebih dahulu pengertian analisis statistika deskriptif dan ukuran pemusatan data.
a.      Mean (Rata – Rata Hitung)
Dalam istilah sehari – hari, mean dikenal dengan sebutan angka rata – rata, ada dua macam mean yang di bicarakan yaitu : mean untuk data yang tidak dikelompokkan dan mean untuk data yang dikelompokan. Mean adalah total semua data dibagi jumlah data. Mean digunakan ketika data yang kita miliki memiliki sebaran normal atau mendekati normal (berbentuk setangkup, nilai yang paling banyak berada ditengah dan makin besar semakin sedikit, makin kecil makin sedikit pula, nilai-nilai ekstrim yang besar maupun yang kecil hampir tidak ada).

b.      Median (Nilai Tengan)

Ukuran pemusatan yang menempati posisi tengah jika data diurutkan menurut besarnya. Median adalah nilai yang berada ditengah-tengah data setelah diurutkan dari yang terkecil sampai terbesar. Median cocok digunakan bila data yang kita miliki tidak menyebar normal atau memiliki nilai yang berbeda-beda secara signifikan.




c.       Modus (Data Yang Sering Muncul)

Modus adalah suatu angka atau bilangan yang paling sering terjadi / muncul tetapi kalo pada data distribusi frekuensi interval modus terletak pada frekuensi yang paling besar.

d.      Kuartil

Kuartil adalah suatu harga yang membagi histogram frekuensi menjadi 4 bagian yang sama, sehingga disini akan terdapat 3 harga kuartil yaitu kuartil I ( K1), kuartil II (K2) dan kuartil III (K3), dimana harga kuarti II sama dengan harga median.
e.      Desil
Untuk kelompok data dimana n ≥ 10, dapat ditentukan 9 nilai bagian yang sama, misalnya D1, D2, … Q9, artinya setiap bagian mempunyai jumlah observasi yang sama, sedemikian rupa sehingga nilai 10% data/observasi sama atau lebih kecil dari D1, nilai 20% data/observasi sama atau lebih kecil dari D2, dan seterusnya. Nilai tersebut dinamakan desil pertama, kedua dan seterusnya sampai desil kesembilan.
f.        Persentil
Untuk kelompok data dimana n ≥ 100, dapat ditentukan 99 nilai, P1, P2, … P99, yang disebut persentil pertama, kedua dan ke-99, yang membagi kelompok data tersebut menjadi 100 bagian,masing-masing mempunyai bagian dengan jumlah observasi yang sama, dan sedemikian rupa sehingga 1% data/observasi sama atau lebih kecil dari P1, 2% data/observasi sama atau lebih kecil dari P2.

UKURAN VARIASI (DISPERSI)
 Dispersi atau variasi atau keragaman data adalah ukuran penyebaran suatu kelompok data terhadap pusat data.
a.      Range
Range merupakan selisih antara nilai data terbesar dengan data terkecil dari sekelompok data.
            Rumusannya adalah R = Nilai maksimal – Nilai minimal
b.      Simpangan rata-rata
Simpangan Rata-Rata (Sr) : Yang dimaksud dengan simpangan (deviation) adalah selisih antara nilai pengamatan ke-i dengan nilai rata-rata, atau antara xi dengan X (X Rata-Rata) Penjumlahan daripada simpangan-simpangan dalam pengamatan kemudian dibagi dengan jumlah pengamatan, n, disebut dengan simpangan rata-rata.

Dalam setiap nilai Xi akan mempunyai simpangan sebesar xi - X. Karena nilai xi bervariasi di atas dan di bawah nilai rata-ratanya maka jika nilai simpangan tersebut dijumlahkan akan sama dengan “nol”. Untuk dapat menghitung rata-rata dari simpangan tersebut maka nilai yang diambil adalah nilai “absolut” dari simpangan itu sendiri, artinya tidak menghiraukan apakah nilai simpangan tersebut positif (+) atau negatif (-).an rata-rata.
c.       Variansi (variance)
Variansi (variance) adalah rata-rata kuadrat selisih atau kuadrat simpangan dari semua nilai data terhadap rata-rata hitung. Varians untuk sampel dilambangkan dengan S2. Sedangkan untuk populasi dilambangkan dengan toh kuadrat .
d.      Simpangan Baku (Standard Deviation)
Standar deviasi (standard deviation) adalah akar pangkat dua dari variansi. Standar deviasi seringkali disebut sebagai simpangan baku.
e.      Jangkauan Kuartil
Jangkauan Kuartil atau simpangan kuartil adalah setengah dari selisih antara kuartil atas (Q3) dengan kuartil bawah (Q1). Dengan rumus :
            JK=1/2 (Q3-Q1)
f.       Jangkauan Persentil      
Jangkauan Persentil adalah selisih antara persentil ke-90 dengan persentil ke-10. Dengan rumus :
JP (10-90) = P90-P10











Data sekunder          
Sample data sekunder yang kami ambil yaitu jumlah penduduk kota Bogor tahun 2006 yang dikelompokan berdasarkan pembagian kecamatan dan berdasarkan jenis kelamin.
Sampel datanya ada sebagai berikut :

JUMLAH PENDUDUK KOTA BOGOR PER KECAMATAN
MENURUT JENIS KELAMIN TAHUN 2006


Kecamatan
Laki-Laki
Perempuan
Jumlah
Bogor Selatan
77.254
73.881
151.135
Bogor Timur
38.307
38.958
77.265
Bogor Utara
64.148
61.710
125.858
Bogor Barat
86.496
84.148
170.644
Bogor Tengah
60.235
60.235
120.470
Tanah Sareal
83.257
49.236
132.493
Jumlah
409.427
368.168
777.865


Data Yang Sudah Dikelompokan :

JUMLAH PENDUDUK
(Dalam Ratusan)
f
Fkum
Mi
FiMi
µ
Mi - µ
(Mi  µ)2
F(Mi - µ)2
38,5 – 47,5
2
43
2
64
26,25
16,75
280,57
561,14
48,5 – 57,5
1
53
3
53
26,25
26,75
715,57
715,57
58,5 – 67,5
4
63
7
252
26,25
36,75
1350,57
5402,28
68,5 – 77,5
2
73
9
146
26,25
46,75
2185,57
4371,14
78,5 – 87,5
3
83
12
249
26,25
56,75
3220,57
9661,71
Jumlah
12
315
12

20711,84



Ø  Mean X = FiMi
                              ∑Fi
                           = 315
                              12
                           = 26,25                                                                                                                                                               


Ø  Median = tbmed + (n/2 – Fk) . c
                                                   f
                        = 57,55 + (6 – 7) . 10
                                              4
                        = 57,55 + (-10)
                                           4
                        = 57,55 + (-2,5)
                        = 55,05



Ø  Modus = tbmod +    d1   . c
       d2 + d1
                        = 57,55 +   3      . 10
                                        3 + 2
                        = 57,55 + 30
                                          5
                        = 57,55 + 6
                        = 63,55


Ø  Kuartil
           
            Kuartil dari data di atas :

Q1        = 1(12)     = 12    = 3
      4            4 
            Q1        = tbQ + (1.n/4 - ∑fkum) . c
                                               fQ
                        = 67,55 + (3 – 7) . 10
                                             2
                        = 67,55 + (-40)
                                           2
                        = 67,55 + (-20)
                        = 47,55




Q3        = 3(12) = 36     = 9
      4        4
            Q3        = tbQ + (1.n/4 - ∑fkum) . c
                                               fQ
                        = 87,55 + (9 – 12) . 10
                                             3
                        = 87,55 + (-30)
                                            3
                        = 87,55 + (-10)
                        = 77,55

Ø  Desil

            Desil dari data di atas :

iN          =   12   =  1,2
10              10



Ø  Persentil

            Persentil dari data di atas :

 iN        =  12    =  0,12
100         100



Ø  Simpangan rata-rata (Mean Deviation)

            Simpangan rata-rata dari data di atas :

SR        =  1  ∑f   x  x
                n
                        = 183,75
                             12
                        = 15,31

Ø  Simpangan (Varian)

Varian dari data di atas :

S2         =    1   ∑f(X – Mi)2
   n – 1
= 20711,84
         11
= 1882,90


Ø  Simpangan Baku

            Simpangan Baku dari data di atas :


S          = √S2
                        = √1882,90
                        =43,39


Ø  Jangkauan Kuartil

Jangkauan Kuartil dari data di atas :

JK         = ½(Q3 – Q1)
= ½(77,55 – 47,55)
= ½(30)
= 15


Ø  Jangkauan Persentil

Jangkauan Persentil dari data di atas :

P90                                       =  90 x 12   = 10,8
      100

P10                                       = 10 x 12    = 1,2

      100
JP90-10                  = P90 – P10
= 10,8 – 1,2
= 9,6

Kesimpulan


         Jadi Kesimpulan yang kami dapatkan :
         Mean                          : 26,25
         Median                        : 55,05
         Modus                         : 63,55
         Kuartil                         : Q1 = 47,55  Q3 = 77,55
         Desil                            : 1,2
         Persentil                      : 0,12
         SR                              : 15,31
         Simpangan Varian      : 1882,90
         Simpangan baku         : 43,39
         Jangkauan kuartil        : 15
         Jangkauan persentil    : 9,6
         P90                           : 10,8
         P10                           : 1,2

Kemiringan dan Keruncingan Data

Kemiringan Distribusi Data Merupakan derajat atau ukuran dari ketidaksimetrisan (Asimetri) suatu distribusi data. Kemiringan distribus...