Selamat Datang

Assallamualaikum Wr. Wb,
Please Welcome to "Indahnya Belajar Akuntansi" Blog's. Congratulations and Good Usefull Reading to All


Hati Riang, Akuntansi - pun Gampang...Emak-Bapak ikut Senang..

Jumat, 30 Desember 2016

PENGEMBANGAN DAN PENGUJIAN KUALITASNYA INSTRUMEN PENELITIAN



Oleh: Endang Mulyatiningsih
Universitas Negeri Yogyakarta

A. Pengembangan Instrumen

Penelitian adalah sebuah cara untuk menemukan jawaban atas rumusan masalah dengan menggunakan prosedur yang sistematis dan ilmiah. Rumusan masalah penelitian hanya dapat dijawab berdasarkan data empiris yang diambil dari subjek penelitian.Untuk mengambil data diperlukan instrumen/alat pengumpul data. Oleh sebab itu, instrumen memiliki peran penting dalam penelitian. Agar dapat memperoleh data yang akurat dibutuhkan instrumen yang berkualitas.
Ada dua sumber kesalahan kesimpulan hasil penelitian yaitu kesalahan dari instrumen dan kesalahan pengambilan sampel. Kesimpulan hasil penelitian bisa salah jika instrumen yang digunakan kurang tepat (valid) untuk mengukur variabel/objek yang diteliti. Kesimpulan hasil penelitian juga bisa salah jika subjek yang mengisi instrumen tidak sesuai sasaran. Subjek penelitian mungkin sudah sesuai sasaran, tetapi tidak jujur dalam mengisi data yang diperlukan. Untuk mengantisipasi hal tersebut, maka perlu dikembangkan instrumen yang menarik, tidak membosankan, petunjuk dan statement jelas, jawaban yang dikehendaki juga jelas, tidak menggiring responden untuk memilih jawaban tertentu, dan dapat mengungkap fakta bukan norma yang berlaku di masyarakat. 
Instrumen disusun berdasarkan kajian teori dari variabel yang diteliti. Kajian teori tentang variabel harus jelas dan tuntas sampai menemukan indikator yang digunakan untuk mengukur variabel tersebut. Pada umumnya banyak peneliti pemula yang menyusun kajian teori hanya berupa kutipan-kutipan dari berbagai sumber tanpa dikaitkan dengan masalah yang diteliti. Jika hal ini yang terjadi, maka meskipun teori yang dirujuk sudah banyak tetapi peneliti masih belum memahami tentang substansi teori yang akan diteliti. Keterkaitan antara instrumen dengan kajian teori diilustrasikan pada gambar berikut ini
TEORI
INSTRUMEN
 




TEORI
INSTRUMEN
INSTRUMEN
TEORI



Instrumen disusun berdasar teori (Valid)                                      
Instrumen hanya disusun dari sebagian kecil teori
Instrumen berbeda dengan kajian teori
Langkah-langkah Penyusunan Instrumen Penelitian
Ada beberapa langkah yang sebaiknya diikuti oleh peneliti untuk dapat menghasilkan instrumen yang berkualitas yaitu:
1.      Kaji teori tentang variabel sampai menemukan indikator untuk mengukur variabel tersebut,
2.      Tetapkan jenis instrumen yang akan digunakan sesuai dengan karakteristik variabel yang diteliti dan responden penelitian
3.      Menyusun kisi-kisi instrumen sesuai dengan indikator yang telah ditemukan pada kajian teori.
4.      Menyusun butir pertanyaan sesuai kisi-kisi yang telah dibuat.
5.      Uji keterbacaan instrumen kepada teman sebaya untuk mengetahui susunan kalimat mudah/sulit dipahami.
6.      Validasi instrumen ke ahli materi, ahli pengukuran dan ahli bahasa (expert judgment).
7.      Uji coba instrumen ke sasaran yang memiliki karakteristik sama dengan responden penelitian
8.      Uji kualitas instrumen dari validitas dan reliabilitasnya
Lankah-langkah penyusunan instrumen dalam bentuk diagram alir adalah sebagai berikut
                                           
Temukan indikator X, Y, Z
Susun kisi-kisi instrumen X, Y, Z
Susun butir-butir instrumen sesuai kisi-kisi
Uji keterbacaan instrumen ke teman sejawat
Validasi instrumen dengan pakar (expert judgment)
Uji coba instrumen ke sasaran penelitian
Analisis validatas dan  reliabilitas empiris
Kaji teori variabel X, Y, Z







Gambar 2. Prosedur Penyusunan Instrumen
Alat pengumpul data atau instrumen penelitian dibedakan menjadi dua yaitu test dan non test. Instrumen tes digunakan pada variabel yang mengukur pengetahuan, kemampuan atau kompetensi sedangkan instrumen non tes digunakan untuk mengukur variabel respon benar atau salah seperti pendapat, sikap, kepemilikan pribadi, dll. Variabel yang menggunakan instrumen tes pada umumnya adalah prestasi belajar, potensi akademik, intelegensi, keterampilan, dll. Alat ukur yang digunakan untuk mengukur variabel tersebut antara lain tes prestasi belajar, tes IQ, tes unjuk kerja, dll. Sedangkan alat ukur non tes berupa pedoman wawancara dan lembar observasi. Dari beberapa macam instrumen tersebut, kuesioner dan tes merupakan dua instrumen yang cukup sulit untuk dikembangkan sehingga pembahasan difokuskan pada kedua instrumen tersebut.

1. Tes Kognitif

Instrumen test banyak digunakan pada penelitian tindakan kelas dan kuasi eksperimen. Jenis tes yang banyak digunakan adalah objective test berbentuk pilihan ganda. Penyusunan tes objektif cukup rumit dan sebaiknya memperhatikan kriteria butir soal seperti tertera pada tabel 1
Tabel 1.Kartu Telaah Soal Multiple Choice
NO
KRITERIA PENILAIAN
A
MATERI
1
Soal sesuai dengan indikator
2
Pengecoh berfungsi
3
Mempunyai satu jawaban yang benar atau paling benar
B
KONSTRUKSI
4
Pokok soal dirumuskan secara jelas dan tegas
5
Rumusan soal dan rumusan jawaban hanya merupakan pernyataan yang diperlukan saja
6
Pokok soal tidak menunjuk ke arah jawaban yang benar
7
Pokok soal tidak mengandung pernyataan negatif ganda
8
Pilihan jawaban homogen dan logis ditinjau dari sisi materi
9
Panjang rumusan jawaban relatif sama
10
Pilihan jawaban tidak mengandung pernyataan “semua jawaban di atas benar atau semua jawaban di atas salah”.
11
Pilihan jawaban yang berbentuk angka disusun berdasarkan urutan, sedangkan pilihan jawaban yang berbentuk waktu kejadian disusun secara kronologis
12
Grafik, gambar, tabel dan diagram yang terdapat pada soal jelas dan berfungsi
13
Butir soal tidak tergantung pada jawaban sebelumnya
C
BAHASA
14
Soal menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia
15
Bahasa yang digunakan komunikatif
16
Tidak menggunakan bahasa yang berlaku setempat
17
Pilihan jawaban tidak mengulang kata/frasa yang bukan merupakan satu kesatuan pengertian
Sumber: Puslitbangsisjian

2. Kuesioner

Kuesioner atau angket merupakan alat pengumpulan data yang memuat sejumlah pertanyaan atau pernyataan yang harus dijawab oleh subjek penelitian.Kuesioner efektif digunakan untuk penelitian yang memiliki jumlah sampel banyak karena pengisian kuesioner dapat dilakukan bersama-sama dalam satu waktu.Kuesioner dapat mengungkap banyak hal sehingga dalam waktu singkat diperoleh banyak data/keterangan. Subjek penelitian dapat menjawab sesuai dengan keadaannya tanpa dipengaruhi oleh orang lain.Waktu pengisian kuesioner disesuaikan dengan waktu luang yang dimiliki subjek penelitian. Pekerjaan peneliti lebih ringan karena proses pengambilan sampai pengolahan data hasil pengisian kuesioner dapat dilakukan oleh orang lain (bukan peneliti sendiri). Meskipun telah banyak keunggulannya, kuesioner juga memiliki beberapa kelemahan karena jawaban terbatas pada hal-hal yang ditanyakan.Subjek dapat menjawab pertanyaan/pernyataan yang tidak sesuai dengan keadaan yang sebenarnya.Jawaban hanya mengungkap keadaan subjek pada saat mengisi kuesioner.
Berdasarkan bentuknya, kuesioner dapat berbentuk terbuka dan tertutup. Kuesioner tertutup memiliki jawaban yang sudah disediakan dan tidak memberi peluang kepada responden untuk menambah keterangan lain. Kuesioner terbuka memiliki ruang yang terbuka untuk menulis jawaban sendiri. Kuesioner tertutup dapat dirancang dengan beberapa jenis skala jawaban yaitu: skala Likert, skala Guttman, skala semantic differential dan skala Thrustone.
Skala Likert sering digunakan untuk kuesioner yang mengungkap sikap dan pendapat seseorang terhadap suatu fenomena. Tanggapan responden dinyatakan dalam bentuk jawaban mulai dari sangat tidak setuju sampai sangat setuju. Kolom jawaban sudah tersedia dan responden tinggal memilih salah satu jawaban yang tersedia. Skala Likert merupakan metode skala bipolar yang mengukur tanggapan positif dan negatif terhadap suatu pernyataan. Supaya tanggapan responden lebih tegas pada posisi yang mana, maka disarankan menggunakan empat skala jawaban saja dan tidak menggunakan pilihan jawaban netral. Penggunaan skala Likert dalam penelitian terus berkembang tidak hanya untuk mengukur pendapat saja melainkan juga untuk mengukur pola-pola perilaku. Skala jawaban yang diberikanpun berkembang menjadi sangat sesuai sampai tidak sesuai atau selalu sampai tidak pernah. Contoh penerapan skala Likert pada beberapa instrumen penelitian.
Pengumpulan data dengan skala Guttman dapat diterapkan pada berbagai macam alat pengukuran baik yang berupa tes maupun non tes. Skala Guttman bisanya digunakan untuk mengukur variabel penelitian yang berisi pengetahuan, sikap dan tindakan yang dilakukan responden. Penyusunan kuesioner dengan jawaban berskala Guttman hampir sama dengan skala Likert, perbedaan terletak pada pilihan jawaban yang ditawarkan dalam kuesioner lebih tegas dan hanya terdiri dari dua pilihan yaitu: YA atau TIDAK. Kuesioner tidak memberi alternatif jawaban lain yang masih ragu-ragu.
Perbedaan semantik (semantic differential) dirancang untuk mengukur pola-pola perilaku seseorang dengan menggunakan jawaban yang memiliki makna berlawanan positif dan negatif. Semantic differential dikembangkan oleh Charles E Osgood’s. Satu butir pertanyaan/pernyataan dapat mengungkap beberapa jawaban sekaligus. Jawaban positif dan negatif diletakkan secara berpasangan dalam satu baris. Kolom jawaban diletakkan di tengah-tengah jawaban positif dan negatif. Setiap responden diminta untuk memilih jawaban berdasarkan kedekatannya dengan jawaban positif atau negatif tersebut dengan cara memberi tanda (X atau √) pada kolom jawaban yang sudah disediakan.
Tipe jawaban kuesioner yang paling sering digunakan oleh penelliti dalam mengambil data adalah Skala Likert, dengan beberapa modifikasi jawaban. Berdasarkan pengalaman menyusun dan mereview kuesioner, dapat diidentifikasitipe kesalahan dalam penyusunan instrumen yang banyak dilakukan peneliti yaitu: 
1)       Satu butir pertanyaan untuk beberapa jawaban dan terlalu luas
Contoh:
Saya selalu merasa ingin tahu tentang perkembangan gadget, laptop, internet, sosial media dan lain-lain
Perbaikan: ...................................................................................................................
,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
2)       Pernyataan panjang sehingga memerlukan waktu lama untuk membaca
Contoh
Kurangnya sarana dan prasarana di sekolah tempat saya bekerja menyebabkan para guru kurang dapat mengikuti perkembangan teknologi informasi dan komunikasi digital sehingga memerlukan pelatihan di luar sekolah
Perbaikan: .....................................................................................................................
..........................................................................................................................................
3)       Menggunakan bahasa yang sulit dipahami
Contoh:
Perkembangan gadget, laptop, internet, sosial media memberi nurturing effect negatif pada siswa
Perbaikan:
............................................................................................................................................  ..........................................................................................................................................
4)       Satu dimensi yang sama ditanyakan berulang-ulang dengan pertanyaan positif dan negatif 
contoh
Dalam setiap pelatihan, guru selalu di beri insentif untuk memotivasisemangat berlatih 
-       Saya tetap semangat berlatih teknologi informasi dan komunikasi walaupun tidak diberi insentif dari sekolah
Butuh waktu lama untuk saya mengerti tentang perkembangan teknologi informasi dan komunikasi digital
-       Saya tidak membutuhkan waktu yang lama untuk mengerti perkembangan teknologi informasi dan komunikasi
5)       Pernyataan mengarah pada pemilihan satu jawaban normatif
Contoh:
Untuk menguasai teknologi informasi dan komunikasi digital dibutuhkan keterampilan khusus
Perbaikan:
........................................................................................................................................................
...........................................................................................................................................
6)       Pernyataan menggunakan persyaratan kondisi khusus yang mungkin tidak sesuai dengan kondisi responden
Contoh:
Saya merasa menjadi senior saat ada rekan guru yang lebih muda dari saya walaupun guru yang lebih muda dari saya lebih menguasai teknologi informasi dan komunikasi digital
Perbaikan:
............................................................................................................................................
..........................................................................................................................................
Saya selalu mempelajari perkembangan teknologi informasi dan komunikasi digital walaupun lingkungan sosial saya mengabaikan hal tersebut
............................................................................................................................................
..........................................................................................................................................
7)       Pertanyaan cukup sensitif untuk dijawab
Contoh
Saya mengakses situs-situs khusus orang dewasa untuk menghilangkan kejenuhan selama bekerja
Perbaikan: ................................................................................................................
......................................................................................................................................

Perwajahan kuesioner mempengaruhi suasana psikologis responden dalam memberi jawaban. Secara umum responden akan merasa malas jika mengisi instrumen yang tata tulisnya kurang rapi, banyak salah ketik, font huruf kecil, tinta kurang tajam, jumlah halaman banyak, pertanyaan panjang-panjang, dan jawaban terbuka yang harus ditulis sendiri. Agar instrumen menarik dan responden senang mengisinya buatlah instrumen dengan tata tulis rapi, pertanyaan yang singkat tetapi jelas, dan responden tinggal memilih jawaban, Isi pertanyaan disusun secara sistematis sesuai dengan urutan indikator. Pertanyaan yang mengungkap fakta, sikap dan tindakan nyata sehari-hari biasanya akan mendapat jawaban lebih objektif daripada pertanyaan yang mengukur perilaku sesuai norma-normayang berlaku di masyarakat.

B. Pengujian Kualitas Instrumen

Kualitas instrumen penelitian ditentukan oleh validitasdan reliabilitas.Apabila instrumen tidak memenuhi kriteria valid dan reliabel, maka dianggap tidak layak digunakan untuk penelitian dan instrumen tersebut harus diperbaiki.Validitas mengarah pada kebenaran atau kesepadanan antara teori dengan isi instrumen. Reliabilitas mengandung pengertian ada ketetapan atau konsistensi yaitu apabila sebuah stimulus diulang, atau terulang di bawah kondisi yang hampir sama maka akan menghasilkan respon yang sama. Stimulus dapat berupa pertanyaan atau pernyataan sedangkan respon dapat berupa jawaban atau hasil pengukuran fisik. Proses pengukuran yang hasilnya tidak stabil atau tidak konsisten akan dikatakan tidak reliabel.Berikut ini, dipaparkan cara-cara pemeriksaan validitas dan reliabilitas instrumen/alat pengumpul data penelitian.

1. Validitas

Validitas merupakan istilah yang sering digunakan untuk memberi arti ‘benar’, (true or correct) pada seperangkat alat yang mampu mengukur apa yang seharusnya diukur (tepat). Validitas lebih sulit dicapai dari pada reliabilitas karena ide pemikiran yang tertulis dalam instrumen dituntut mempunyai kecocokan dengan hasil pengamatan kongkret. Alat pengumpul data atau instrumen minimal memiliki dua dari empat tipe pengukuran validitas, yaitu:

a) Face validity

Face validity paling mudah dicapai dan menjadi dasar bagi bermacam-macam pengukuran validitas lainnya. Face validity atau validitas tampang dapat dicapai dari penampilan fisik instrumen seperti tata tulis, penggunaan kalimat, tata bahasa, dan pencetakan instrumen. Setelah hal tersebut tercapai, kemudian instrumen disimak kebenaran definisi, kecocokan istiah yang digunakan dengan tingkat pendidikan dan usia responden yang akan mengisinya.

b) Content validity

Content validity atau validitas isi dicapai setelah validitas tampang terpenuhi. Validitas isi dicapai melalui cara memeriksa kesesuaian isi instrumen dengan teori. Selain itu, juga dikoreksi keterwakilan tiap-tiap indikator/konstruk teori oleh butir-butir yang dikembangkan.Apabila peneliti mengembangkan beberapa konstruk, masing-masing konstruk juga perlu dicek keseimbangan jumlah butir-butir yang digunakan.
Validitas dan reliabilitas mudah dicapai apabila isi instrumen tiap-tiap konstruk/indikator terwakili, seimbang dan tidak overlaping.Pembuktian validitas isi dapat dilakukan dengan meminta pertimbangan ahli (expert judgment) yang sesuai.Instrumen tentang manajemen dimintakan pertimbangan kepada ahli manajemen.Instrumen tentang evaluasi dimintakan pertimbangan kepada ahli evaluasi. Melalui pertimbangan ahli tersebut diharapkan tidak akan terjadi kesalahan pengukuran, atau dengan kata lain instrumen tersebut dinyatakan benar mengukur apa yang hendak diukur (valid).

c) Construct validity

Validitas konstruk (construct validity) digunakan untuk seperangkat alat ukur yang memiliki indikator ganda.Alat ukur yang valid memperoleh data yang konsisten meskipun indikator yang digunakan bervariasi.Agar tidak terjadi overlaping pengukuran antar indikator, maka perlu ada definisi konseptual yang jelasbatasan-batasannya.Validitas konstruk dibedakan menjadi dua yaitu validitas konvergen dan divergen atau diskriminan(discriminant validity).
Validitas konvergenditerapkan ketika indikator indikator yang digunakan dalam satu variabel konvergen atau saling berasosiasi antara indikator yang satu indikator dengan indikator yang lainnya. Validitas divergen dinamakan juga validitas diskriminan. Validitas divergen mempunyai peranan yang berlawanan dengan validitas konvergen yaitu indikator yang satu tidak saling tergantung dengan indikator yang lainnya. Ini berarti bahwa dalam satu variabel dapat tersusun indikator yang saling tergantung dan berasosiasi positif atau konvergen tetapi dapat pula terdapat indikator-indikator yang berasosiasi negatif atau divergen. Validitas divergen ditemukan apabila dua konstruk A dan B sangat berbeda, dan hasil pengukuran A dan B tidak berasosiasi. Contoh materi konvergen adalah
Konvergen (dua indikator yang berkaitan, selaras,  MC)
Divergen (dua indikator yang sangat berbeda)
Validitas konstruk dapat dianalisis dari data uji coba instrumen. Skor butir pertanyaan yang mengukur konstruk yang sama dijumlah, kemudian dikorelasikan dengan jumlah skor seluruh butir. Uji validitas butir juga menggunakan cara yang sama yaitu mengkorelasikan satu kolom skor butir dengan satu kolom skor total. Cara analisis validitas konstruk dan butir lebih midah dilakukan dengan program excel. Ilustrasi pengujian validitas konstruk terdapat pada gambar 2
Indikator 3
Indikator 2
Indikator 1
KORELASI
Total
1
2
3
 






Cara analisis data menggunakan program excel. Rumus yang digunakan adalah korelasi point biserial
1)  Input data kuesioner, jumlah skor responden
2)  Letakkan kursor pada sel di sudut kiri bawah (kasus terakhir, nomor butir pertama, kemudian tulis “=CORREL” Setelah itu akan muncul permintaan  kolom mana yang akan dikorelasikan CORREL(array1; array2).
3)     Jalankan kursor pada kolom nomor butir mulai dari nomor responden 1 sampai terakhir (B4:B32) untuk array 1 dan kolom total skor (Q3:Q32) untuk array 2 sehingga secara keseluruhan muncul =CORREL(B4:B32;Q3:Q32), kemudian tekan enter.
4)     Lakukan cara yang sama pada kolom butir berikutnya, kemudian kunci variabel tetap (skor total) dengan menyisipkan simbol $ disela-sela huruf yang menunjukkan kolom sehingga menjadi seperti ini ;$Q$3:$Q$32. Contoh lengkap =CORREL(C3:C32;$Q$3:$Q$32), tekan enter
5)     Copy rumus untuk butir berikutnya.

d) Validitas kriteria.

Validitas kriteria (criterion validity)digunakan untuk membandingkan hasil pengukuran dari instrumen baru dengan beberapa hasil pengukuran dari instrumen yang standar atau kriteria yang sudah ditetapkan sebelumnya.Validitas kriteria dapat dicapai apabila konstruk yang dibandingkan pada dua alat pengukur tersebut sama. Ada dua tipe validitas ini yaitu: concurrent validity dan predictive validity. Konsep pengukuran validitas kriteria terdapat pada gambar 3
Alat ukur sekarang
Alat ukur yg ada sebelumnya
Alat ukur yg ada sesudahnya 
Prediksi
Kongruence
 






Gambar 3. Konsep Pengukuran Validitas Kriteria

e) Validitas Penilaian Kinerja

Cara-cara pengendalian validitas hasil observasi pada penilaian kinerja dilakukan melalui pengujian validitas inter rater atau interobserver. Jika hasil penilaian dari penilai (rater) pertama dan kedua sudah selaras, maka hasil penilaian sudah dinyatakan valid.Agar dapat selaras, maka masing-masing penilai memiliki kesepahaman tentang kriteria kinerja yang dinilai. Keselarasan hasil penilaian dapat dibuktikan dengan korelasi Produk Moment

2. Reliabilitas

Reliabilitas dapat berarti keterikatan, ketergantungan,ketetapan atau keajegan hasil pengukuran. Contoh: instrumen tes menunjukkan reliabiltas tinggi apabila diujikan beberapa kali ke siswa akan menghasilkan nilai yang relatif tetap.
Konsep Dasar Reliabilitas 

a) Stabilitas

Reliabilitas mempunyai stabilitas antar waktu. Reliabilitas menjawab pertanyaan tentang apakah alat pengukuruan mempunyai jawaban yang sama ketika diterapkan pada periode waktu yang berbeda dengan subjek yang sama. Dalam hal ini, reliabilitas dibuktikan dengan metode test-retest. Alat pengukuran menunjukkan reliabilitas tinggi apabila hasil pengukuran pada tes pertama sama dengan hasil pengukuran pada tes kedua, di bawah kondisi yang sama pada kelompok orang yang sama. Selain menggunakan metode test-retes, stabilitas dapat pula diukur dengan menggunakan sebuah bentuk tes alternatif, tetapi bentuk tes alternatif tersebut harus sangat mirip.Variasi kedua ini dinamakan parallel test. Pada parallel test ini, indikator yang dikembangkan dalam perangkat tes dirancang sama dan butir-butir instrumen yang digunakan juga memiliki kesamaan isi. Cara ini jarang digunakan karena peneliti harus membuat dua instrumen yang setara isinya sehingga tentu saja sulit dilakukan.

b) Representatif

Reliabilitas representatif dibuktikan dengan menyebarkan instrumen pada beberapa kelompok siswa yang berbeda. Sebuah indikator mempunyai reliabilitas yang tinggi apabila memperoleh hasil yang sama ketika diterapkan pada kelas yang berbeda. Untuk memperoleh hasil pengukuran yang reliabel ini, tiap-tiap kelompok yang diukur sebaiknya representatif, mewakili seluruh karakteristik siswa yang beragam.Hasil analisis menentukan indikator mana yang reliabel pada beberapa kelompok orang yang berbeda.

c) Equivalence

Reliabilitas ekuivalensi diterapkan ketika penilai menggunakan indikator ganda dalam mengukur kemampuan siswa. Butir pertanyaan atau pernyataan disusun sedemikian rupa sehingga semua indikator yang terdapat dalam variabel tersebut memiliki bobot yang seimbang.Contoh kongkret misalnya sebuah tes terdiri dari empat indikator dan setiap indikator memiliki jumlah butir yang seimbang.Reliabilitas terbukti apabila data yang diperoleh cukup konsisten untuk beberapa indikator yang berbeda. Apabila sejumlah indikator yang berbeda berfungsi mengukur variabel yang sama, pengukuran yang reliabel akan memberi hasil yang sama untuk semua indikator.
Reliabilitas untuk membuktikan equivalensi dapat dilakukan melalui metode split half (belah dua) dan parallel test. Maksud ekuivalen di sini adalah ada dua benda yang dibandingkan. Pengukuran reliabilitas dengan metode split half menganut konsep konsistensi internal, yaitu peneliti cukup membuat satu instrumen dan satu kali  pengukuran, namun sudah memenuhi syarat pengukuran reliabilitas. Caranya adalah: butir butir pertanyaan yang mengukur konstruk/indikator yang sama dibagi menjadi dua secara acak, ganjil-genap atau awal-akhir. Apabila analisis data menunjukkan hasilyang konsisten atau berkorelasi tinggi antara kelompok butir yang telah dibagi dua tersebut, maka instrumen tersebut dinyatakan reliabel.
Reliabilitas ekuivalensi juga diterapkan pada beberapa tipe pengukuran yang sering terjadi pada penjurian uji kompetensi, lomba memasak, atau jenis lomba lainnya. Pada saat satu orang dinilai atau diamati oleh beberapa orang (interater dan intercoder) maka reliabilitas ekuivalensi akan tercapai apabila data hasil penilaian/pengamatan dari beberapa penilai/pengamat tersebut konsisten, tidak banyak selisihnya. Sebuah pengukuran reliabel apabila masing-masing penilai/pengamat menyetujui hasil penilaian/pengamatan teman sejawatnya..
Instrumen yang berkualitas dituntut memiliki reliabilitas yang tinggi. Apabila intrumen tersebut belum dapat memenui kriteria reliabilitas yang ditetapkan, maka ada kemungkinan proses pengukuran perlu diperbaiki. Ada 4 cara yang dapat dilakukan untuk memperbaiki reliabilitas instrumen, yaitu: (1) memperjelas konseptualisasi materi, (2) meningkatkan ketelitian pengukuran, (3) menggunakan indikator ganda, (4) menggunakan uji coba tes.
1)  Reliabilitas akan meningkat apabila ruang lingkup materi yang diujikan  jelas batasannya. Tes dikembangkan berdasarkan indikator (kisi-kisi) yang telah ditentukan. Instrumen yang baik akan mengukur indikator dengan beberapa pertanyaan/pernyataan yang masing-masing memiliki jawaban tunggal. Indikator yang baik akan saling mendukung dan tidak saling tumpang tindih (overlaping). Masing-masing indikator mempunyai ciri spesifik sehingga pertanyaan/pernyataan seharusnya tidak overlaping. Meskipun indikator sudah spesifik, pengembangan pertanyaan/pernyataan yang digunakan dalam pengukuran indikator juga tidak boleh berlawanan dengan indikator lainnya.
2)  Meningkatkan ketelitian pengukuran. Ketelitian pengukuran mutlak diperlukan  dari sisi konseptualnya dan analisis datanya. Dari sisi konseptualnya, bacalah butir-butir pertanyaan dan pernyataan secara berulang-ulang dan cobalah untuk menjawab semua butir yang tertulis. Tanyakanlah pada diri sendiri, apakah semua pertanyaan/pernyataan yang tertulis tersebut mudah untuk dijawab, jelas kriterianya, dan jawaban yang dikehendaki juga cukup spesifik? Dari sisi analisis data, telitilah data dengan seksama karena kesalahan pengukuran dan kesalahan entry (memasukkan) data ke dalam komputer dapat menyebabkan kesalahan hasil analisis data yang cukup fatal.
3)  menggunakan indikator ganda, sebab dua atau lebih indikator dalam satu variabel akan lebih baik dari pada hanya satu indikator saja. Indikator ganda akan membawa peneliti untuk memahami isi dan konsep secara luas.Butir-butir instrumen lebih mudah dikembangkan apabila jumlah indikator yang digunakan cukup banyak. Hasil pengukuran cenderung lebih stabil pada instrumen yang lebih banyak butirnya. Jumlah butir yang cukup banyak lebih mudah diatur, yaitu pada saat hasil pengisian kurang bagus pada salah satu butir, maka butir tersebut dapat dibuang tanpa mengurangi isi karena sudah terwakili oleh butir-butir lainnya.
4)  menggunakan pretes, pilot studies/try out/uji coba dan replikasi. Reliabilitas dapat ditingkatkan dengan menggunakan dua kali pengukuran. Pada pengukuran pertama, peneliti dapat mencoba alat ukur tersebut sebelum menerapkan pada situasi yang sebenarnya. Karakteristik jawaban hasil uji coba instrumen kemudian dianalisis dan diperbaiki kekurangannya. Butir pertanyaan/pernyataan  yang baik adalah yang memiliki karakteristik jawaban bervariasi, dengan pola jawaban yang sama berkisar 30% - 70%. Apabila semua responden memiliki jawaban yang sama, maka butir tersebut perlu dicek kembali untuk diperbaiki,  diganti atau dibuang.
Rangkuman
Reliability (dependable measure)
Validity (true measure)
v Stabilitas dari waktu ke waktu atau antar dua alat pengukuran (test - retest atau parallel tes)
Contoh: pre and post test
v Representatif antar sub populasi
Diujikan pada sub populasi yang berbeda hasil tetap konsisten
v Ekuivalen antar indikator (konsistensi internal, split half ganjil genap atau awal akhir dan parallel test
v Face - tampang fisik instrumen menurut  pertimbangan orang lain
v Content- keseluruhan isi instrumen mewakili indikator yang diukur
v Construct- konsistensi pengukuan antar indikator
-       convergent –serupa satu dengan yang lain
-       discriminant - berbeda satu dengan yang lain.
v Criterian – berasosiasi dengan alat ukur eksternal
-       Concurrent- berasosiasi dengan pengukuran sebelumnya
-       Predictive- berasosiasi dengan pengukuran berikutnya

d). ReliabilitasPenilaian Kinerja

Penilaian kinerja menggunakan pengamatan yang cara pembuktiannya berbeda karena hasil pengukurannya tidak memperoleh data kuantitatif. Reliabilitas berarti keterkaitan atau konsistensi. Penilaian kinerja menggunakan variasi teknik observasi yang konsisten. Untuk mencapai konsistensi (tidak berubah-ubah) perilaku subjek yang diteliti dari waktu kewaktu, peneliti melakukan observasi berulang-ulang seperti prinsip-prinsip stabilitas dalam pengukuran reliabilitas penilaian tes objektif.

DAFTAR BACAAN
Endang Mulyatiningsih. (2012). Metode Penelitian Terapan Bidang Pendidikan. Bandung: Alfabeta
Likert, R. (1932)A Technique for the Measurement of Attitudes, Archives of Psychology 140: 1–55. Diperoleh dari http://id.wikipedia.org/wiki/pada tanggal 10 Januari 2010
Neuman, W. L. (2003). Social research methods, qualitative and quantitative approaches, (5th. ed.) Boston: Allyn & Bacon
Nitko, A. L; & Brookhart, S. M. (2011). Educational assessment of students 6th edition. Boston: Pearson
Osgood, C. E., May, W. H., & Miron, M. S. (1975) Cross-Cultural Universals of Affective Meaning. Urbana, IL: University of Illinois Press
Osgood, C.E., Suci, G., & Tannenbaum, P. (1975) The measurement of meaning. Urbana, IL: University of Illinois Press
Wiersma, W. (1986).Research methods in education an introduction, 4th . Boston: Allyn and Bacon, Inc.






Tidak ada komentar: