Minggu, 15 Mei 2016

Cara Mendeteksi Outlier Data Menggunakan SPSS

Oleh : Jul Fahmi Salim Selian

Assalamualaikum wr wb..

Selamat Pagi...

Sebelumnya saya sudah share beberapa pengolahan data menggunakan SPSS, kali ini mari kita sama-sama belajar bagaimana mendeteksi data outlier dalam sebuah penelitian. Salah satu kegunaan deteksi data outlier ini adalah akan mampu meningkatkan korelasi data, sehingga akan menaikan R Square dari data. Dan terbukti beberapa kali, sebelum data di deteksi dengan outlier, hasil regresi bisa dikatakan sangat-sangat parah, mulai dari R Square yang sangat kecil, tidak ada variabel yang signifikan, distribusi residual data tidak normal dan berabgai masalh klasik lainnya.

"Makasi Kk Mutia Handayani, uda di izinkan memakai datanya.. :-) "

Berikut merupakan langkah-langkah dalam mendeteksi data outlier dengan menggunakan SPSS :


  • Siapkan data dalam file Excel, susunannya seperti dalam gambar di bawah ini






  • Buka Program SPSS (jangan buka shazam atau eviews, soalnya saya belum nemu caranya, haahhaa)



  • Kemudian copy dan pastekan data di excel ke dalam SPSS, seperti gamabr dibawah ini



  • Ganti nama variabel sesuai dengan kebutuhan, disini saya membuat "Number","Y", "X1", "X2" "X3", "X4" dan "X5"

Sebelum

Sesudah



  • Kemudian klik analyze ==> regression ==> linear



  • Masukan variabel "number" ke dependen dan variabel lain yang ingin di uji ke dalam variabel independen Kemudian klik "Save"






  • Terdapat berbagai pilihan yang harus di centang dalam tab tersebut, maka yang perlu kita centang ckup "unstandarized" "Standarized" "mahal's" "cook" dan "Lev" pada kolom "Predicted Value" dan pada kolom residual ckup klik "Standarized" dan klik ok

Sebelum



Sesudah


  • abaikan hasil outputnya, selanjutnya lihat di "varibel view", maka di tab tersebut akan terdapat penambahan beberapa variabel dan berbapa dia antaranya adalah  berupa mahl, cook dan lev



  • Untuk melihat data yang abnormal, lihat nilai mahl nya, untuk N=30 batasnya adalah 11, jika N=100 maka batasnya adalah 15, artinya jika dalam hasl tersebut terdapat nilai mahl > 11 atau > 15 maka data tersebut harus di buang agar data yang digunaka untuk penelitian memberikakn hasil yang lebih baik.
  • Untuk melihat satu persatu data tersebut yanga akn digunakan untuk regresi, maka copy dan pastekan data mahl,cooks dan levv tersebut ke Excel



Sebagai contoh, pada hasil uji tersebut, salah satu data yang harus di deleted adalah data yang berada di baris kedua, karena nilai Mahl (16,16) > 15, sehngga dapat disimpulkan salah satu data yang abnormal berada di baris kedua. selanjutnya periksa satu persatu datanya, dan hapuslah semua data yang tidak normal tersebut. Setelah dihapus maka data tersebut lah akan digunakan untuk melakukan regresi,biasanya hasil regresinya akan lebih bagus  dari yang belum diuji degan outlier tadi.

Demikianlah langka-langkah dalam mendeteksi outliers dalam data penelitian kita, mohon maaf atas segala kekurangan, semoga dapat membantu.

Silahkan berikan masukannya untuk memperbaiki tulisan ini,,
Terima Kasih Sudah berkunjung.. :-)



2 komentar:

305 mengatakan...

Thanks Pak Jul tutorialnya.

Laura Jacobs mengatakan...

Hello,
Ini adalah untuk memaklumkan kepada orang ramai bahawa Puan Jane Alison, pemberi pinjaman pinjaman peribadi mempunyai membuka peluang kewangan untuk semua orang yang memerlukan apa-apa bantuan kewangan. Kami memberi pinjaman pada kadar 2% kadar faedah kepada individu, syarikat dan syarikat-syarikat di bawah terma dan syarat yang jelas dan mudah difahami. hubungi hari ini kami melalui e-mel supaya kita boleh memberikan syarat-syarat pinjaman dan syarat-syarat kami di: (saintloanss@gmail.com)