Kamis, 07 Desember 2017

STATISTIK DISTRIBUSI FREKUENSI dan PENGELOMPOKKAN DATA di SPSS

Distribusi frekuensi merupakan suatu uraian atau ringkasan yang dapat dibuat dalam bentuk tabel suatu kelompok data yang menunjukkan sebaran data observasi dalam beberapa kelas. Sehingga ada dapat membentuk suatu tabel frekuensi yang berisikan kategori-kategori tersebut.


Melakukan latihan, sebelumnya harus memiliki data.
Berdasarkan data latihan, tampilan input data adalah sebagai berikut:




            Gambar Tampilan Data View yang telah didefenisikan

Latihan

1.  Diberikan data mengenai jenis kelamin (sex), daerah, tingkat pendidikan dan pendapatan dari 60 orang responden penelitian. Simpan data dengan nama Latihan tabel dan grafik.

Jenis kelamin dikode sebagai berikut:

1 = laki-laki

2 = perempuan

Daerah dikode sebagai berikut: 

1 = Kota

2 = Desa

Tingkat pendidikan dikategorikan sebagai:

1 = responden yang berpendidikan SLTP kebawah 

2 = responden yang berpendidikan SLTA

3 = responden yang berpendidikan D3 ke atas.

Pendapatan kelompokkan atas tiga yaitu:

1 = pendapatan rendah (kurang dari Rp. 1.000.000)

2 = pendapatan menengah ( Rp. 1.000.000 – 3.000.000) 

3 = pendapatan tinggi ( diatas Rp3.000.000)








2.  Diberikan data mengenai investasi dan tabungan domestik Indonesia (dalam trilyun Rp) selama periode tahun 1996 – 2013. Simpan data dengan nama Latihan grafik garis.

Tahun
Investasi
Tabungan
1996
58,9
53,7
1997
68,0
61,1
1998
75,4
69,7
1999
93,4
86,8
2000
115,8
108,3
2001
142,3
130,8
2002
157,8
138,8
2003
178,3
163,8
2004
242,8
283,8
2005
205,6
283,7
2006
220,1
249,2
2007
375,1
450,2
2008
380,7
441,0
2009
405,3
465,6
2010
515,3
518,8
2011
657,6
738,7
2012
805,4
895,0
2013
983,9
1084,3

A.        Distribusi Frekuensi
Dari file Latihan distribusi frekuensi, dapat dibuat distribusi frekuensi untuk jenis kelamin dan pendidikan, sedangkan untuk distribusi frekuensi umur dan pendapatan, sebaiknya data dikelompokkan dulu. Untuk menampilkan distribusi frekuensi pada SPSS adalah dengan cara klik menu Analyze Descriptive Statistics → Frequencies. Akan muncul tampilan berikut:
Gambar Tampilan Frequencies.

Masukkan (pindahkan) variabel jenis kelamin dari kotak sebelah kiri ke kotak sebelah kanan dengan cara klik variabel jenis kelamin di kotak kiri, kemudian klik panah yang menuju ke sebelah kanan. Lakukan hal yang sama untuk variabel pendidikan. Kemudian klik OK. Output dari distribusi frekuensi diberikan sebagai berikut:
Tabel pertama memberikan keterangan mengenai variabel yang diolah, yaitu jumlah observasinya dan jumlah observasi missing. Dari tabel tersebut terlihat bahwa jumlah observasi sebanyak 18 dan tidak ada observasi missing.
Tabel kedua dan ketiga masing-masingnya memberikan distribusi frekuensi untuk jenis kelamin responden dan pendidikan responden. Tabel distribusi frekuensi menampilkan lima kolom sebagai berikut:
  • Kolom pertama: kategori yang difrekuensikan (sebagai contoh pada jenis kelamin adalah pria dan wanita)
  • Kolom kedua: frekuensi masing-masing kategori
  • Kolom ketiga: persentase frekuensi masing-masing kategori (persentase dihitung dari total observasi termasuk observasi missing)
  • Kolom keempat : persentase frekuensi masing-masing kategori tetapi persentase dihitung dengan mengeluarkan observasi missing. (Catatan: berhubung tidak ada observasi missing, baik untuk jenis kelamin maupun pendidikan, maka kolom 3 dan 4 menjadi sama).
  • Kolom kelima: Cumulative Percent yaitu persentase kumulatif yang dihitung dari valid percent. Sebagai contoh pada tabel frekuensi pendidikan. Baris pertama adalah 22,2 persen. Pada baris kedua adalah 55,6 persen yang dihitung dari 22,2 + 33,3 (catatan: perbedaan perhitungan karena pembulatan).

B.        Pengelompokkan Data

Selain menampilkan ukuran statistik deskriptif dari kumpulan data, kita juga dapat menampilkan distribusi frekuensi dari data tersebut. Jika data sudah dalam bentuk kategori (misalnya pendidikan SD, SLTP,SLTA dst) atau data sudah dikategorikan dalam kelompok-kelompok interval tertentu misalnya pendapatan rendah (< 1.000.000), menengah (1.000.000 – 2.000.000), tinggi (>2.000.000), maka kita dapat secara langsung membuat distribusi frekuensinya. Tetapi jika data belum terkelompok dalam kategori-kategori tertentu, tabel distribusi frekuensinya akan sangat panjang mengikuti keragaman dari nilai-nilai data tersebut. Misalnya jika dibentuk tabel distribusi frekuensi dari data umur, maka akan terbentuk tabel distribusi yang tidak ringkas, sehingga kita akan sulit menarik kesimpulan dari data tersebut, seperti terlihat dibawah ini:


Gambar  Tampilan output distribusi frekuensi variable umur

Agar tabel distribusi frekuensi menjadi lebih ringkas sehingga mudah diinterpretasikan, data umur sebaiknya dikelompokkan terlebih dahulu dengan cara klik menu Transform. Ada dua pilihan dalam mengelompokkan data yaitu Recode into Same Variables (kode pengelompokkan akan menindih data asli) dan Recode into Different Variables (kode pengelompokan akan dibuat pada variabel yang baru). Pilih Recode into Different Variables, maka akan muncul tampilan berikut:

Gambar  Tampilan kotak dialog Recode into Different Variables

Pindahkan variable umur ke kotak Input Variables → Output Variables. Kemudian pada kotak Output Variable, untuk Name tuliskan Kel.Umur dan untuk Label tuliskan Kelompok Umur, kemudian klik Change → Old and New Values, akan muncul tampilan berikut:


Gambar Tampilan Recode into Different Old and New Values 
Misalnya variabel umur akan dikelompokkan menjadi dan ≤ 29, 30 – 39, 40  – 49, dan ≥ 50. Untuk mengelompokkan umur ≤ 29, pada bagian Old Value, klik Range, LOWEST through value, kemudian isikan pada kotak dibawahnya angka 29. Pada bagian New Value, pada kotak Value isikan angka 1, lalu klik Add (lihat tampilan diatas). Untuk mengelompokkan umur 30 – 39, pada bagian Old Value, klik Range, kemudian  isikan  pada  kotak  dibawahnya  angka  30  dan  kotak  dibawah through
angka 39. Selanjutnya pada bagian New Value, pada kotak Value isikan angka 2, kemudian klik Add (lihat tampilan berikut ini)

Gambar Tampilan Recode into Different Old and New Values
Dengan cara yang sama lakukan untuk kelompok umur 40 – 49 dan pada  New Value beri kode 3. Selanjutnya untuk kelompok umur ≥ 50, pada bagian Old Value, klik Range, value through HIGHEST, isikan pada kotak dibawahnya angka 50. Selanjutnya pada bagian New Value, pada kotak Value isikan angka 4, lalu klik Add. Setelah selesai memberikan kode untuk pengelompokan umur ini, kemudian klik Continue dan OK. Hasilnya pada sheet Data View akan ada tambahan variabel baru yaitu kelompok umur sebagai berikut:



Berikan keterangan untuk masing-masing kode pengelompokan umur tersebut pada Value Label dengan kode 1 (≤ 29), kode 2 (30-39), kode 3 (40 – 49), kode 4 (≥ 50). Lalu bentuklah distribusi frekuensi untuk kelompok umur tersebut sehingga output adalah sebagai berikut:


Tidak ada komentar:

Posting Komentar