Blog Husni Jamal: Pengolahan dan Analisis Data Kuantitatif

Pendahuluan

Suatu penelitian pasti menghasilkan data (bentuk jamak dari datum), yang diartikan sebagai gambaran mengenai suatu objek pengamatan. Oleh Wikipedia, data didefinisikan sebagai hasil pengukuran atau pengamatan suatu variabel yang bentuknya dapat berupa angka, kata-kata, atau citra. Data yang dihasilkan dapat disusun dalam sejumlah kategori yang memiliki ciri tertentu yang disebut sebagai data kualitatif, atau berupa angka hasil dari pengukuran yang disebut sebagai data kuantitatif.

Apapun bentuknya, data memerlukan pengolahan dan analisis agar orang dapat dengan mudah membaca dan mengambil kesimpulan darinya. Pengolahan data dimulai dari sortasi, kodefikasi dan tabulasi dilakukan sesuai dengan bentuk data dan metode analisis yang digunakan. Analisis terhadap data kualitatif sangat mengandalkan kemampuan penelitinya, sehingga akurasi hasil analisis data ini biasanya ditentukan oleh siapa yang menganalisis data tersebut. Sedangkan analisis data kuantitatif dilakukan dengan menggunakan statistika sehingga akurasi hasil analisis sangat ditentukan oleh ketepatan metode statistika yang digunakan. Pada tulisan ini akan difokuskan pada bahasan tentang analisis data kuantitatif karena penelitian yang dilakukan oleh peneliti pemula umumnya menggunakan pendekatan ini.

Skala Pengukuran

Untuk mendapatkan data kuantitatif tentunya dibutuhkan suatu kegiatan pengumpulan data yang dilakukan dengan menggunakan alat ukur yang memiliki skala atau ukuran tertentu. Skala pengukuran dibagi ke dalam empat jenis yaitu: Skala nominal yaitu pengukuran objek yang diamati berdasarkan sejumlah kategori yang setara. Pada penggunaan skala pengukuran ini, objek pengamatan hanya dikelompokkan ke dalam sejumlah kategori yang ditetapkan tanpa dapat ditentukan kategori mana yang lebih baik atau lebih tinggi nilainya. Contoh penggunaan skala nominal adalah pada pengukuran jender. Jender biasanya dikelompokkan ke dalam dua kategori pria dan wanita. Pada kedua kategori ini tidak bisa ditentukan kelompok jender mana yang lebih baik atau lebih tinggi nilainya sehingga keduanya dianggap setara.

Skala ordinal yaitu pengukuran objek yang diamati berdasarkan sejumlah kategori yang dapat disusun dalam suatu urutan (order) tertentu. Hanya saja jarak antara satu urutan dengan urutan lainnya tidak mempunyai makna apa-apa. Contoh pemakaian skala ordinal adalah pengukuran sikap dengan menggunakan skala sikap atau skala Likert. Metode pengukuran ini dipopulerkan oleh Rensis Likert dalam mengukur sikap seseorang terhadap suatu objek. Cara yang digunakan adalah dengan memberikan sejumlah penyataan kepada responden yang harus dijawab dalam lima pilihan jawaban yaitu: sangat tidak setuju, tidak setuju, netral atau ragu-ragu, setuju dan sangat setuju. Dalam hal ini jawaban responden bersifat kualitatif seperti pada skala nominal tetapi memiliki tingkatan dari yang paling rendah yaitu sangat tidak setuju sampai ke yang paling tinggi yaitu sangat setuju. Sungguhpun demikian jarak antara suatu jawaban dengan jawaban lainnya tidak mempunyai makna apa-apa. Jadi tidak dapat diketahui berapa nilai jarak antara sangat tidak setuju dengan tidak setuju atau jarak antara setuju dengan sangat setuju.

Skala interval yaitu pengukuran objek yang diamati berdasarkan sejumlah nilai yang dapat disusun dalam suatu urutan tertentu dimana jarak (interval) antara satu urutan dengan urutan lainnya dapat diketahui. Hanya saja tidak terdapat nilai nol mutlak, yang artinya nilai nol disini tidak mencerminkan objek yang diukur tersebut memang tidak ada. Dengan demikian nilai suatu ukuran tidak dapat dibandingkan dengan nilai ukuran lainnya. Contoh penggunaan skala interval adalah pengukuran suhu. Jarak antara suhu 20 0C dengan 30 0C dapat diketahui yaitu 10 0C tetapi tidak dapat dibandingkan bahwa suhu 20 0C adalah dua kali lipat dari suhu 10 0C. Selain itu suhu 0 0C bukan berarti tidak ada suhu (panas) sama sekali karena nilai 0 disini bukannya nilai nol mutlak.

Skala rasio mirip dengan skala interval tetapi memiliki nilai nol mutlak sehingga perbandingan (ratio) antara suatu nilai dengan nilai lainnya dapat diketahui. Penggunaan skala ini sangat luas dalam kehidupan sehari-hari seperti halnya untuk pengukuran panjang, bobot dan volume. Suatu benda dengan bobot 20 kg dapat dikatakan memiliki bobot dua kali lipat dari benda dengan bobot 10 kg. Jika bobot suatu benda adalah 0 kg dapat diartikan bahwa benda tersebut mutlak tidak ada.

Adakalanya suatu metode statistika hanya dapat dipakai untuk data yang diukur dengan menggunakan skala pengukuran tertentu sehingga ketidaktahuan akan skala pengukuran dapat berakibat kesalahan dalam pemilihan metode analisis yang tepat. Pada analisis data dengan menggunakan program komputer biasanya antara skala pengukuran interval dan rasio tidak dibedakan karena metode statistika yang digunakan untuk kedua skala pengukuran ini umumnya sama.

Jenis Statistika

Data biasanya digunakan untuk memberikan informasi mengenai hasil suatu pengamatan atau keadaan secara utuh. Sebagai contoh adalah informasi jumlah pencari kerja yang sering disusun oleh Dinas Tenaga Kerja di suatu provinsi. Disitu ditulis informasi mengenai jumlah pencari kerja di tiap kabupaten/ kota. Selain itu dapat juga ditambah dengan perkembangan jumlah pencari kerja dari tahun ke tahun. Data yang disajikan pada kasus seperti ini hanya untuk mendeskripsikan (menjelaskan) keadaan pencari kerja di provinsi tersebut. Statistika yang digunakan pada kegiatan seperti ini hanya untuk menggambarkan objek yang diamati dalam bentuk angka-angka atau gambar (biasa dalam bentuk grafik), disebut sebagai statistika deskriptif.

Selain itu statistika dapat juga digunakan untuk memprediksi atau menggeneralisasi objek yang lebih luas, disebut sebagai statistika induktif atau inferen. Pada kasus ini objek yang diamati hanya berstatus sebagai sampel atau contoh yang digunakan untuk memprediksi sejumlah informasi mengenai objek yang lebih luas yaitu populasi. Contohnya adalah perhitungan cepat (quick count) yang sering digunakan pada Pilkadal (Pemilihan Kepala Daerah Langsung). Pada kegiatan ini, data hasil perolehan suara yang didapat dari sejumlah TPS (Tempat Pemungutan Suara) dijadikan sebagai sampel yang akan digunakan untuk memperkirakan hasil perolehan suara keseluruhan (populasi). Dari pengalaman quick count yang pernah dilakukan di sejumlah daerah, terbukti hasilnya sangat mendekati dengan hasil akhir Pilkadal tersebut. Ini menunjukkan bahwa sejumlah TPS sampel, tentunya dengan menggunakan metode statistika induktif, dapat digunakan untuk memprediksi hasil pemilihan seluruh TPS di wilayah yang dijadikan sebagai populasi penelitian.

Berdasarkan metode pengujiannya maka statistika induktif dapat dikelompokkan menjadi statistika parametrik dan nonparametrik. Pada pengujian dengan menggunakan statistika parametrik, data yang digunakan harus memenuhi asumsi tertentu. Sementara itu pada statistika nonparametrik asumsi tersebut tidak dibutuhkan. Sebagai contoh pada uji beda rataan dua sampel berpasangan. Apabila akan menggunakan statistika parametrik seperti uji-t maka data yang digunakan harus diasumsikan berasal dari populasi yang menyebar normal. Jika asumsi tersebut tidak dipenuhi maka dapat digunakan pengujian dengan statistika nonparametrik seperti uji Wilcoxon. Contoh lain adalah untuk uji korelasi. Contoh lain penggunaan statistika parametrik adalah uji korelasi Pearson maka data yang digunakan harus memenuhi asumsi antara lain: (1) data memiliki skala interval atau rasio; dan (2) setiap nilai variabel bebas (X) diperoleh nilai variabel terikat (Y) yang menyebar normal. Jika asumsi ini tidak terpenuhi maka pengujian hanya boleh dilakukan dengan menggunakan statistika nonparametrik seperti uji korelasi Spearman atau Kendal.

Asumsi-asumsi yang dibutuhkan pada penggunaan statistika parametrik sebenarnya merupakan benang merah penghubung antara data sampel dengan data populasi. Oleh karena itu dalam melakukan pendugaan terhadap keadaan populasi pada statistika induktif dengan menggunakan statistika parametrik diyakini memiliki tingkat keakuratan yang lebih tinggi dibandingkan dengan penggunaan statistika nonparametrik.

Sebaran Data

Jika disajikan dua kelompok data sebagai berikut:

Kelompok pertama: 1 2 5 8 9

Kelompok kedua : 4 5 5 5 6

Maka kedua data tersebut menghasilkan rataan yang sama yaitu 5. Tentunya menjadi sangat bias jika orang mempunyai persepsi yang sama antara kelompok data pertama dengan kelompok kedua karena kelompok data pertama menyebar pada rentang yang lebih besar dari nilai 1 sampai 9, sedangkan kelompok data kedua menyebar pada rentang yang lebih sempit yaitu dari nilai 4 sampai dengan 6. Untuk mengatasi hal ini maka dikenal suatu alat ukur yang menggambarkan tingkat keragaman suatu kelompok data yaitu simpangan baku dan ragam.

Dalil Limit Pusat

Ada suatu dalil yang sangat penting dalam statistika induktif, yang dapat dikatakan sebagai jalan pembuka dalam pendugaan terhadap parameter suatu populasi dengan menggunakan statistik suatu sampel, yang disebut dengan dalil limit pusat (central limit theorem). Dalil ini berlaku pada pengukuran anggota sampel yang diambil secara acak dan bebas dengan jumlah yang tetap (n) dari suatu populasi tertentu. Apabila pengambilan sampel dengan jumlah n tersebut dilakukan berulang kali, hingga jumlah yang tak terhingga maka setiap kali pengambilan sampel akan diperoleh nilai rataan sampel (x). Jika nilai rataan sampel ini diletakkan pada sumbu x dan proporsi jumlah sampel pada sumbu y maka akan terbentuklah suatu kurva kontinyu. Kurva ini akan memiliki nilai rataan yang disebut sebagai rataan dari rataan sampel (the mean of the sample means) dan simpangan baku rataan sampel (the standard deviation of the sample means).

Beberapa ketentuan mengenai kurva ini berdasarkan dalil limit pusat adalah: Sebaran rataan sampel akan membentuk suatu kurva mendekati sebaran normal apabila ukuran sampel besar; Sebaran rataan sampel akan membentuk kurva sebaran normal apabila populasi asal memiliki sebaran normal tanpa memperhatikan ukuran sampel; Nilai rataan dari rataan sampel sama dengan rataan populasi; Simpangan baku rataan sampel sama dengan simpangan baku populasi dibagi dengan akar ukuran sampel. Simpangan baku dari x disebut juga sebagai galat baku atau simpangan baku rataan (standard error of the mean) yang disingkat dengan SE. Jadi, apabila diambil satu sampel berukuran besar dari suatu populasi atau berukuran kecil dari suatu populasi yang menyebar normal maka nilai rataan dari sampel tersebut belum tentu sama nilainya dengan rataan populasi tetapi ia berada pada suatu kurva normal dengan rataan sama dengan rataan populasi dan simpang baku SE. Prinsip ini harus betul-betul dipahami dalam menginterpretasikan data agar rataan sampel tidak diartikan sebagai rataan populasi tetapi hanya sebagai penduga rataan populasi. Dalam banyak kasus simpangan baku populasi tidak diketahui sehingga biasanya yang digunakan adalah simpangan baku sampel sebagai pengganti simpangan baku populasi.

Korelasi Sederhana

Korelasi (correlation), berasal kata correlate yang artinya berhubungan, merupakan salah satu metode di dalam statistika untuk mengetahui tingkat keeratan hubungan antara suatu variabel dengan variabel lainnya. Sebagai contoh jika dilakukan pengukuran terhadap bobot lahir bayi dan bobot badan ibunya maka kedua variabel ini dapat dianalisis untuk mengetahui seberapa erat hubungan keduanya. Data yang diperoleh dari pengukuran ini tentunya akan berpasangan, yaitu bobot lahir bayi dan bobot badan ibunya. Jika ditemukan adanya korelasi yang kuat maka orang akan lebih mudah membuat perkiraan kecenderungan bobot lahir seorang bayi hanya dengan mengetahui bobot badan ibunya. Dengan demikian adanya resiko yang diakibatkan oleh bobot lahir seperti bayi yang terlalu berat dapat dihindari lebih awal dengan mempertimbangkan bobot badan ibunya.

Untuk melihat tingkat keeratan hubungan dua variabel dilakukan melalui analisis korelasi sederhana. Pengumpulan data kedua variabel yang diamati dapat dilakukan dalam dua cara. Pertama, dengan menentukan nilai suatu variabel dan kemudian nilai variabel pasangannya diukur sesuai dengan keadaan yang ada di lapangan. Contohnya, jika seorang peneliti ingin mengetahui pengaruh dosis pupuk terhadap hasil produksi suatu tanaman maka dia dapat membuat perlakuan pemupukan dengan sejumlah dosis yang berbeda. Dosis pupuk yang telah ditentukan ini sebagai nilai variabel pertama. Kemudian hasil produksi tanaman yang diukur di lapangan merupakan nilai variabel kedua. Pasangan nilai yang diperoleh ini dapat digunakan untuk mengukur tingkat korelasi kedua variabel tersebut.

Kedua, dengan mengukur nilai kedua variabel dari sampel yang ditentukan secara acak. Misalnya untuk mengetahui korelasi antara bobot lahir bayi dengan bobot badan ibunya sebagaimana dijelaskan dimuka. Pada kasus ini kedua variabel dipilih secara acak. Metode yang paling populer digunakan untuk mengukur tingkat hubungan dua variabel adalah korelasi Pearson atau lengkapnya disebut the Pearson product moment correlation. Nama ini diberikan sebagai penghormatan kepada penemunya Karl Pearson. Syarat digunakan metode ini adalah: Sampel berpasangan sehingga jumlah anggota sampel kedua variabel harus sama; Pengukuran dilakukan dengan menggunakan skala interval atau rasio; Pada suatu nilai variabel x tertentu diperoleh nilai variabel pasangannya (y) yang menyebar secara normal. Begitu juga sebaliknya, pada setiap suatu nilai y tertentu diperoleh nilai x yang menyebar normal. Pembuktian ketentuan ini sangat sulit sehingga untuk lebih memudahkan digunakan saja ketentuan data kedua sampel diambil secara acak dan menyebar secara normal.

Ukuran yang digunakan untuk menentukan keeratan hubungan dua variabel adalah koefisien korelasi (r). Beberapa catatan berkenaan dengan koefisien korelasi adalah: Nilai r antara -1 sampai dengan 1. Nilai -1 atau 1 menunjukkan adanya tingkat korelasi linier yang sempurna. Semakin mendekati ke nilai 0 berarti tingkat korelasinya semakin rendah. Nilai r yang positif menunjukkan korelasi yang searah artinya semakin tinggi nilai x akan diikuti dengan peningkatan nilai y sehingga membentuk garis yang menanjak. Sebaliknya nilai r yang negatif menggambarkan peningkatan nilai x akan diikuti dengan penurunan nilai y sehingga membentuk garis menurun.

Untuk diperhatikan bahwa: Bentuk korelasi yang diukur dengan rumus ini adalah korelasi linier. Artinya untuk melihat hubungan linier antara dua variabel. Jika terdapat nilai korelasi yang tinggi maka titik-titik koordinat pasangan anggota variabel x dan y akan membentuk garis linier (lurus) sempurna. Dengan demikian rendahnya nilai r tidak dapat mengatakan bahwa kedua variabel tidak mempunyai hubungan sama sekali karena yang dinilai hanya korelasi liniernya. Bisa jadi kedua variabel mempunyai korelasi yang tinggi dalam bentuk tidak linier seperti kuadratik atau logaritmik, yang membentuk kurva garis tidak lurus. Korelasi hanya memperlihatkan gejala kuantitatif hubungan dua variabel tetapi tidak menjelaskan apakah kedua variabel mempunyai hubungan sebab akibat. Sebagai contoh ditemui adanya korelasi positif antara jumlah kendaraan bermotor dengan tingkat pendidikan di suatu wilayah. Artinya, terdapat gejala bahwa semakin banyak kendaraan bermotor di suatu wilayah maka tingkat pendidikan masyarakat di wilayah tersebut cenderung akan semakin tinggi. Tetapi hasil ini tidak dapat menjelaskan apakah tingkat pendidikan yang tinggi betul-betul disebabkan oleh banyaknya kendaraan bermotor atau sebaliknya. Penjelasan mengenai hal tersebut harus dilakukan melalui pendekatatan teoritis keilmuan lainnya, tidak dapat semata-mata hanya menggunakan hasil analisis statistika. Nilai r hanya mencerminkan korelasi dua variabel pada tingkat sampel (statistik) sehingga diperlukan uji lanjut untuk mengetahui apakan korelasi sampel tersebut juga berlaku pada tingkat populasi.

Regresi Linier Sederhana

Pada analisis korelasi diperoleh gambaran mengenai keeratan antara dua variabel. Jika hubungan antara kedua variabel tersebut sangat erat (nilai r mendekati 1atau -1) maka titik ordinat pasangan anggota kedua variabel akan berada di sekitar suatu garis lurus, yang disebut garis regresi. Sebagaimana diketahui bahwa dari suatu garis dapat dibuat rumusan matematisnya yang disebut sebagai persamaan regresi. Pada regresi linier dengan dua variabel akan membentuk persamaan umum:

Y = b0 + b1X + e

Y = nilai variabel terikat (dependent variable) atau variabel yang ditentukan

X = nilai variabel bebas (independent variable) atau variabel yang menentukan

b0 = bilangan tetap (konstanta) yang disebut juga dengan intersep (intercept)

b1 = bilangan tetap (konstanta) yang disebut juga dengan slop (slope)

e = galat (error)

Intersep merupakan titik perpotongan antara garis regresi dengan sumbu Y. Apabila nilai X = 0 maka Y = b0 (intersep). Jadi pada keadaan X tidak memberikan kontribusi terhadap persamaan regresi maka nilai rataan Y sama dengan intersep. Nilai ini tidak selalu memberikan makna yang penting karena tidak semua persamaan regresi mencakup nilai X = 0 di dalamnya sehingga dapat dikatakan bahwa garis regresi tersebut tidak pernah menyentuh sumbuh Y.

Galat atau error jangan diartikan sebagai kesalahan. Yang lebih tepat diartikan sebagai faktor yang mungkin mempengaruhi variabel terikat (Y) tetapi tidak teramati didalam penenelitian. Semakin kecil galat yang diperoleh berarti kemampuan variabel bebas untuk menduga variabel terikat semakin baik.

Kata slop (slope) atau koefisien regresi yang dilambangkan dengan b1 dapat diartikan sebagai sudut atau kecuraman. Nilai b1 ini mencerminkan kecuraman dari garis regresi yang terbentuk. Artinya perubahan nilai x sebesar satu unit akan mengakibatkan berubahnya nilai y sebesar b1 unit. Semakin besar nilai b1 maka garis yang terbentuk semakin curam. Jika nilai b1 = 0 maka berapapun nilai x tidak mengubah nilai y sehingga garis regresi yang terbentuk akan mendatar sejajar dengan sumbu x. Sedangkan nilai b1 = 1 atau b1 = -1 akan membentuk garis dengan sudut siku-siku (900). Apabila nilai b1 positif menunjukkan bahwa garis regresi yang terbentuk akan menanjak ke kanan, sedangkan nilai b1 negatif akan membentuk garis regresi yang menanjak ke kiri.

Persyaratan yang harus dipenuhi untuk melakukan analisis regresi ini sama dengan persyaratan pada analisis korelasi. Hanya saja pada persamaan regresi variabel dibagi menjadi dua yaitu variabel bebas (independent variable) dan variabel terikat (dependent variable). Variabel bebas mencerminkan variabel yang dapat dikontrol dan mudah diketahui nilainya, yang didalam persamaan regresi diberi simbol X. Dengan demikian nilai variabel bebas ini dapat ditentukan terlebih dahulu atau dipilih secara acak. Sedangkan variabel terikat (Y) mencerminkan respon atau akibat dari variabel bebas sehingga nilai variable ini harus acak.

Pada analisis regresi biasanya juga dihitung koefisien determinasinya yang merupakan kuadrat dari koefisien korelasi. Pengertian tentang koefisien determinasi (R2) hendaknya dipahami sebagai kemampuan variabel bebas untuk menjelaskan adanya variasi dari variabel terikat. Kata “menjelaskan” disini memberikan pengertian bahwa apabila diperoleh nilai R2 misalnya sebesar 0,80 maka dengan menggunakan nilai variabel bebas (X) dapat diketahui 80% dari nilai variabel terikat (Y). Sedangkan sisanya yaitu 20% dijelaskan oleh faktor lain yang tidak dijadikan sebagai variabel bebas. Koefisien determinasi ini sering disalah artikan sebagai “faktor yang menentukan” nilai variabel terikat, sehingga R2 = 0,80 seolah-olah menyatakan bahwa 80% dari nilai variabel terikat ditentukan oleh variabel bebas. Pemahaman seperti ini cenderung menyesatkan karena koefisien determinasi, seperti halnya koefisien korelasi, tidak mencerminkan prinsip sebab akibat.

Statistika Non Parametrik

Statistika non parametrik merupakan salah satu alternatif analisis data apabila data tersebut tidak layak dianalisis dengan menggunakan statistika parametrik. Berikut ini ditunjuk sejumlah contoh metode statistika non parametrik. Uji c2 (Chi Square) banyak digunakan dalam statistika nonparametrik. Salah satu kegunaan dari metode ini adalah untuk menguji tingkat kesesuaian suatu data yang diukur dengan skala nominal atau ordinal dengan nilai harapan tertentu. Uji Wilcoxon atau lengkapnya disebut dengan Wilcoxon Signed Rank Tests merupakan salah satu metode statistika nonparametrik untuk menguji perbedaan dua populasi dari dua sampel berpasangan. Kata Signed Rank Tests pada uji ini menunjukkan bahwa analisis data dilakukan hanya dengan membuat peringkat (rank) dari selisih data kedua sampel yang diuji.

Uji Mann-Whitney. Metode ini dipergunakan untuk menguji perbedaan dua populasi dari dua sampel tidak berpasangan (independent).

Uji Kolmogorov – Smirnov. Metode ini mirip dengan Mann-Whitney yang dipergunakan untuk menguji perbedaan dua populasi dari dua sampel tidak berpasangan (independent) .

Korelasi Spearman atau lengkapnya disebut Spearman’ rank correlation merupakan salah satu metode untuk menentukan tingkat korelasi pada data yang tidak memenuhi persyaratan untuk diolah dengan metode parametrik seperti Korelasi Pearson.

Blog Husni Jamal

Kamis, 08 Oktober 2015

Pengolahan dan Analisis Data Kuantitatif

Tidak ada komentar:

Asal Bahasa di KBBI

Laporkan Penyalahgunaan