Oleh: Endang Mulyatiningsih
Universitas Negeri Yogyakarta
A. Pengembangan
Instrumen
Penelitian adalah sebuah cara untuk
menemukan jawaban atas rumusan masalah dengan
menggunakan prosedur yang sistematis dan ilmiah. Rumusan
masalah penelitian hanya dapat dijawab berdasarkan data empiris yang diambil dari subjek penelitian.Untuk mengambil data diperlukan instrumen/alat pengumpul data. Oleh sebab itu, instrumen memiliki peran penting dalam
penelitian. Agar dapat memperoleh data yang akurat dibutuhkan instrumen yang
berkualitas.
Ada dua sumber kesalahan kesimpulan hasil penelitian
yaitu kesalahan dari instrumen dan kesalahan pengambilan sampel. Kesimpulan
hasil penelitian bisa salah jika instrumen yang digunakan kurang tepat (valid)
untuk mengukur variabel/objek yang diteliti. Kesimpulan hasil penelitian juga
bisa salah jika subjek yang mengisi instrumen tidak sesuai sasaran. Subjek
penelitian mungkin sudah sesuai sasaran, tetapi tidak jujur dalam mengisi data
yang diperlukan. Untuk mengantisipasi hal tersebut, maka perlu dikembangkan
instrumen yang menarik, tidak membosankan, petunjuk dan statement jelas,
jawaban yang dikehendaki juga jelas, tidak menggiring responden untuk memilih
jawaban tertentu, dan dapat mengungkap fakta bukan norma yang berlaku di
masyarakat.
Instrumen disusun berdasarkan kajian teori dari
variabel yang diteliti. Kajian teori tentang variabel harus jelas dan tuntas sampai
menemukan indikator yang digunakan untuk mengukur variabel tersebut. Pada
umumnya banyak peneliti pemula yang menyusun kajian teori hanya berupa
kutipan-kutipan dari berbagai sumber tanpa dikaitkan dengan masalah yang
diteliti. Jika hal ini yang terjadi, maka meskipun teori yang dirujuk sudah
banyak tetapi peneliti masih belum memahami tentang substansi teori yang akan
diteliti. Keterkaitan antara instrumen dengan kajian teori diilustrasikan pada
gambar berikut ini
|
|
|
||||||
Instrumen disusun
berdasar teori (Valid)
|
Instrumen hanya disusun dari sebagian kecil teori
|
Instrumen berbeda dengan kajian teori
|
Langkah-langkah
Penyusunan Instrumen Penelitian
Ada beberapa langkah
yang sebaiknya diikuti oleh peneliti untuk dapat menghasilkan instrumen yang
berkualitas yaitu:
1. Kaji teori tentang variabel sampai menemukan indikator untuk mengukur
variabel tersebut,
2. Tetapkan jenis
instrumen yang akan digunakan sesuai dengan karakteristik variabel yang
diteliti dan responden penelitian
3. Menyusun kisi-kisi instrumen sesuai dengan
indikator yang telah ditemukan pada kajian teori.
4. Menyusun butir pertanyaan sesuai kisi-kisi yang telah
dibuat.
5. Uji keterbacaan instrumen
kepada teman sebaya untuk mengetahui susunan kalimat mudah/sulit dipahami.
6. Validasi instrumen
ke ahli materi, ahli pengukuran dan ahli bahasa (expert judgment).
7. Uji coba instrumen
ke sasaran yang memiliki karakteristik sama dengan responden penelitian
8. Uji kualitas
instrumen dari validitas dan reliabilitasnya
Lankah-langkah penyusunan instrumen dalam bentuk
diagram alir adalah sebagai berikut
Temukan indikator X, Y, Z
|
Susun kisi-kisi instrumen X, Y, Z
|
Susun butir-butir instrumen sesuai kisi-kisi
|
Uji keterbacaan instrumen ke teman sejawat
|
Validasi instrumen dengan pakar (expert
judgment)
|
Uji coba instrumen ke sasaran penelitian
|
Analisis validatas dan reliabilitas empiris
|
Kaji teori variabel X, Y, Z
|
Gambar 2. Prosedur Penyusunan Instrumen
Alat pengumpul data atau instrumen penelitian
dibedakan menjadi dua yaitu test dan non test. Instrumen tes digunakan pada
variabel yang mengukur pengetahuan, kemampuan atau kompetensi sedangkan
instrumen non tes digunakan untuk mengukur variabel respon benar atau salah
seperti pendapat, sikap, kepemilikan pribadi, dll. Variabel yang menggunakan
instrumen tes pada umumnya adalah prestasi belajar, potensi akademik,
intelegensi, keterampilan, dll. Alat ukur yang digunakan untuk mengukur
variabel tersebut antara lain tes prestasi belajar, tes IQ, tes unjuk kerja,
dll. Sedangkan alat ukur non tes berupa pedoman wawancara dan lembar observasi.
Dari beberapa macam instrumen tersebut, kuesioner dan tes merupakan dua
instrumen yang cukup sulit untuk dikembangkan sehingga pembahasan difokuskan
pada kedua instrumen tersebut.
1. Tes Kognitif
Instrumen test banyak digunakan pada penelitian
tindakan kelas dan kuasi eksperimen. Jenis tes yang banyak digunakan adalah objective
test berbentuk pilihan ganda. Penyusunan tes objektif cukup rumit dan sebaiknya
memperhatikan kriteria butir soal seperti tertera pada tabel 1
Tabel 1.Kartu Telaah Soal Multiple Choice
NO
|
KRITERIA PENILAIAN
|
A
|
MATERI
|
1
|
Soal sesuai dengan indikator
|
2
|
Pengecoh berfungsi
|
3
|
Mempunyai satu jawaban yang benar atau paling benar
|
B
|
KONSTRUKSI
|
4
|
Pokok soal dirumuskan secara jelas dan tegas
|
5
|
Rumusan soal dan rumusan
jawaban hanya merupakan pernyataan yang diperlukan saja
|
6
|
Pokok soal tidak menunjuk ke arah jawaban yang benar
|
7
|
Pokok soal tidak mengandung
pernyataan negatif ganda
|
8
|
Pilihan jawaban homogen dan
logis ditinjau dari sisi materi
|
9
|
Panjang rumusan jawaban relatif sama
|
10
|
Pilihan jawaban tidak mengandung pernyataan “semua jawaban di atas benar
atau semua jawaban di atas salah”.
|
11
|
Pilihan jawaban yang berbentuk angka disusun berdasarkan urutan,
sedangkan pilihan jawaban yang berbentuk waktu kejadian disusun secara
kronologis
|
12
|
Grafik, gambar, tabel dan diagram yang terdapat pada soal jelas dan berfungsi
|
13
|
Butir soal tidak tergantung pada jawaban sebelumnya
|
C
|
BAHASA
|
14
|
Soal menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia
|
15
|
Bahasa yang digunakan komunikatif
|
16
|
Tidak menggunakan bahasa yang berlaku setempat
|
17
|
Pilihan jawaban tidak mengulang kata/frasa yang bukan merupakan satu
kesatuan pengertian
|
Sumber: Puslitbangsisjian
2. Kuesioner
Kuesioner atau angket
merupakan alat pengumpulan data yang memuat
sejumlah pertanyaan atau pernyataan yang harus
dijawab oleh subjek penelitian.Kuesioner
efektif digunakan untuk penelitian yang memiliki jumlah sampel banyak karena
pengisian kuesioner dapat dilakukan bersama-sama dalam satu waktu.Kuesioner dapat mengungkap banyak hal
sehingga dalam waktu singkat diperoleh banyak data/keterangan. Subjek penelitian dapat
menjawab sesuai dengan keadaannya tanpa dipengaruhi oleh orang lain.Waktu pengisian kuesioner disesuaikan dengan waktu
luang yang dimiliki subjek penelitian. Pekerjaan peneliti lebih ringan karena
proses pengambilan sampai pengolahan data hasil pengisian kuesioner dapat
dilakukan oleh orang lain (bukan peneliti sendiri).
Meskipun telah banyak keunggulannya, kuesioner juga memiliki beberapa kelemahan
karena jawaban terbatas pada hal-hal yang ditanyakan.Subjek dapat menjawab pertanyaan/pernyataan
yang tidak sesuai dengan keadaan yang sebenarnya.Jawaban hanya mengungkap keadaan subjek pada saat mengisi kuesioner.
Berdasarkan bentuknya,
kuesioner dapat berbentuk terbuka dan tertutup. Kuesioner tertutup memiliki
jawaban yang sudah disediakan dan tidak memberi peluang kepada responden untuk
menambah keterangan lain. Kuesioner terbuka memiliki ruang yang terbuka
untuk menulis jawaban sendiri. Kuesioner tertutup
dapat dirancang dengan beberapa jenis skala jawaban yaitu: skala Likert, skala
Guttman, skala semantic differential
dan skala Thrustone.
Skala
Likert sering digunakan untuk kuesioner yang mengungkap sikap dan pendapat
seseorang terhadap suatu fenomena. Tanggapan responden dinyatakan dalam bentuk jawaban
mulai dari sangat tidak setuju sampai sangat setuju. Kolom jawaban sudah
tersedia dan responden tinggal memilih salah satu jawaban yang tersedia. Skala
Likert merupakan metode skala bipolar yang mengukur tanggapan positif dan
negatif terhadap suatu pernyataan. Supaya tanggapan responden lebih tegas pada
posisi yang mana, maka disarankan menggunakan empat skala jawaban saja dan
tidak menggunakan pilihan jawaban netral. Penggunaan skala Likert dalam
penelitian terus berkembang tidak hanya untuk mengukur pendapat saja melainkan
juga untuk mengukur pola-pola perilaku. Skala jawaban yang diberikanpun
berkembang menjadi sangat sesuai sampai tidak sesuai atau selalu sampai tidak
pernah. Contoh penerapan skala Likert pada beberapa instrumen penelitian.
Pengumpulan data dengan skala Guttman dapat diterapkan pada berbagai
macam alat pengukuran baik yang berupa tes maupun non tes. Skala Guttman
bisanya digunakan untuk mengukur variabel penelitian yang berisi pengetahuan,
sikap dan tindakan yang dilakukan responden. Penyusunan kuesioner dengan
jawaban berskala Guttman hampir sama dengan skala Likert, perbedaan terletak
pada pilihan jawaban yang ditawarkan dalam kuesioner lebih tegas dan hanya
terdiri dari dua pilihan yaitu: YA atau TIDAK. Kuesioner tidak memberi
alternatif jawaban lain yang masih ragu-ragu.
Perbedaan semantik (semantic
differential) dirancang untuk mengukur pola-pola perilaku seseorang dengan
menggunakan jawaban yang memiliki makna berlawanan positif dan negatif. Semantic differential dikembangkan oleh
Charles E Osgood’s. Satu butir pertanyaan/pernyataan dapat mengungkap beberapa
jawaban sekaligus. Jawaban positif dan negatif diletakkan secara berpasangan
dalam satu baris. Kolom jawaban diletakkan di tengah-tengah jawaban positif dan
negatif. Setiap responden diminta untuk memilih jawaban berdasarkan
kedekatannya dengan jawaban positif atau negatif tersebut dengan cara memberi
tanda (X atau √) pada kolom jawaban yang sudah disediakan.
Tipe jawaban kuesioner yang paling sering digunakan oleh penelliti
dalam mengambil data adalah Skala Likert, dengan beberapa modifikasi jawaban. Berdasarkan
pengalaman menyusun dan mereview kuesioner, dapat diidentifikasitipe kesalahan
dalam penyusunan instrumen yang banyak dilakukan peneliti yaitu:
1)
Satu butir pertanyaan untuk beberapa jawaban dan terlalu
luas
Contoh:
Saya selalu merasa ingin tahu tentang perkembangan gadget, laptop, internet, sosial media dan lain-lain
Saya selalu merasa ingin tahu tentang perkembangan gadget, laptop, internet, sosial media dan lain-lain
Perbaikan:
...................................................................................................................
,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
2)
Pernyataan panjang sehingga memerlukan waktu lama
untuk membaca
Contoh
Kurangnya sarana dan prasarana di sekolah
tempat saya bekerja menyebabkan para guru kurang dapat mengikuti perkembangan
teknologi informasi dan komunikasi digital sehingga memerlukan pelatihan di
luar sekolah
Perbaikan:
.....................................................................................................................
..........................................................................................................................................
3)
Menggunakan bahasa yang sulit dipahami
Contoh:
Perkembangan gadget, laptop, internet,
sosial media memberi nurturing effect
negatif pada siswa
Perbaikan:
............................................................................................................................................ ..........................................................................................................................................
4)
Satu dimensi yang sama ditanyakan berulang-ulang
dengan pertanyaan positif dan negatif
contoh
+ Dalam setiap pelatihan, guru selalu di
beri insentif untuk memotivasisemangat
berlatih
-
Saya tetap semangat berlatih teknologi informasi dan
komunikasi walaupun tidak diberi insentif dari sekolah
+ Butuh waktu lama untuk saya mengerti
tentang perkembangan teknologi informasi dan komunikasi digital
-
Saya tidak membutuhkan waktu yang lama untuk mengerti
perkembangan teknologi informasi dan komunikasi
5)
Pernyataan mengarah pada pemilihan satu jawaban
normatif
Contoh:
Untuk menguasai teknologi informasi dan
komunikasi digital dibutuhkan keterampilan khusus
Perbaikan:
........................................................................................................................................................
...........................................................................................................................................
6)
Pernyataan menggunakan persyaratan kondisi khusus
yang mungkin tidak sesuai dengan kondisi responden
Contoh:
Saya merasa menjadi senior saat ada rekan
guru yang lebih muda dari saya walaupun guru yang lebih muda dari saya lebih
menguasai teknologi informasi dan komunikasi digital
Perbaikan:
............................................................................................................................................
..........................................................................................................................................
Saya selalu mempelajari perkembangan
teknologi informasi dan komunikasi digital walaupun lingkungan sosial saya
mengabaikan hal tersebut
............................................................................................................................................
..........................................................................................................................................
7)
Pertanyaan cukup sensitif untuk dijawab
Contoh
Saya mengakses situs-situs khusus orang
dewasa untuk menghilangkan kejenuhan selama bekerja
Perbaikan:
................................................................................................................
......................................................................................................................................
Perwajahan kuesioner mempengaruhi suasana psikologis responden dalam
memberi jawaban. Secara umum responden akan merasa malas jika mengisi instrumen
yang tata tulisnya kurang rapi, banyak salah ketik, font huruf kecil, tinta
kurang tajam, jumlah halaman banyak, pertanyaan panjang-panjang, dan jawaban
terbuka yang harus ditulis sendiri. Agar instrumen menarik dan responden senang
mengisinya buatlah instrumen dengan tata tulis rapi, pertanyaan yang singkat
tetapi jelas, dan responden tinggal memilih jawaban, Isi pertanyaan disusun
secara sistematis sesuai dengan urutan indikator. Pertanyaan yang mengungkap
fakta, sikap dan tindakan nyata sehari-hari biasanya akan mendapat jawaban
lebih objektif daripada pertanyaan yang mengukur perilaku sesuai norma-normayang
berlaku di masyarakat.
B. Pengujian
Kualitas Instrumen
Kualitas instrumen
penelitian
ditentukan oleh
validitasdan reliabilitas.Apabila
instrumen tidak memenuhi kriteria valid
dan reliabel, maka dianggap tidak layak digunakan untuk penelitian dan instrumen tersebut harus diperbaiki.Validitas mengarah
pada kebenaran atau kesepadanan antara teori dengan isi instrumen. Reliabilitas
mengandung pengertian ada ketetapan
atau konsistensi yaitu apabila sebuah stimulus diulang, atau terulang di
bawah kondisi yang hampir sama maka akan menghasilkan respon yang sama. Stimulus dapat berupa pertanyaan
atau pernyataan sedangkan respon dapat berupa jawaban atau hasil pengukuran
fisik. Proses pengukuran yang hasilnya tidak stabil atau tidak konsisten akan
dikatakan tidak reliabel.Berikut
ini, dipaparkan cara-cara pemeriksaan validitas dan reliabilitas instrumen/alat
pengumpul data penelitian.
1. Validitas
Validitas merupakan istilah yang sering
digunakan untuk memberi arti ‘benar’, (true
or correct) pada seperangkat alat yang
mampu mengukur apa yang seharusnya diukur (tepat). Validitas lebih sulit dicapai dari pada reliabilitas
karena ide pemikiran yang tertulis dalam instrumen dituntut mempunyai kecocokan
dengan hasil pengamatan
kongkret. Alat pengumpul data atau
instrumen minimal memiliki dua dari empat tipe pengukuran validitas, yaitu:
a) Face validity
Face validity
paling mudah dicapai dan menjadi dasar bagi bermacam-macam pengukuran validitas
lainnya. Face validity atau validitas
tampang dapat dicapai dari penampilan fisik instrumen seperti tata tulis,
penggunaan kalimat, tata bahasa, dan pencetakan instrumen. Setelah hal tersebut
tercapai, kemudian instrumen disimak kebenaran definisi, kecocokan istiah yang
digunakan dengan tingkat pendidikan dan usia responden yang akan mengisinya.
b) Content validity
Content validity
atau validitas isi dicapai
setelah validitas tampang terpenuhi. Validitas isi dicapai melalui cara
memeriksa kesesuaian isi instrumen
dengan teori.
Selain itu, juga dikoreksi keterwakilan tiap-tiap indikator/konstruk teori oleh butir-butir yang
dikembangkan.Apabila peneliti mengembangkan beberapa konstruk, masing-masing
konstruk juga perlu dicek keseimbangan jumlah butir-butir yang digunakan.
Validitas dan reliabilitas mudah dicapai
apabila isi instrumen tiap-tiap konstruk/indikator terwakili, seimbang dan
tidak overlaping.Pembuktian validitas isi dapat dilakukan dengan meminta
pertimbangan ahli (expert judgment)
yang sesuai.Instrumen tentang manajemen
dimintakan pertimbangan kepada ahli manajemen.Instrumen tentang evaluasi
dimintakan pertimbangan kepada ahli evaluasi. Melalui pertimbangan ahli
tersebut diharapkan tidak akan terjadi kesalahan pengukuran, atau dengan kata
lain instrumen tersebut dinyatakan benar mengukur apa yang hendak diukur
(valid).
c) Construct
validity
Validitas konstruk (construct validity) digunakan untuk seperangkat alat ukur yang memiliki indikator ganda.Alat ukur yang valid memperoleh data yang
konsisten meskipun indikator yang digunakan bervariasi.Agar tidak terjadi
overlaping pengukuran antar indikator, maka perlu ada definisi konseptual yang jelasbatasan-batasannya.Validitas konstruk dibedakan
menjadi dua yaitu validitas
konvergen dan divergen atau diskriminan(discriminant
validity).
Validitas konvergenditerapkan ketika indikator indikator
yang digunakan dalam satu variabel konvergen atau saling berasosiasi antara indikator
yang satu indikator dengan indikator
yang lainnya. Validitas divergen dinamakan juga
validitas diskriminan.
Validitas divergen
mempunyai peranan yang berlawanan dengan validitas konvergen yaitu indikator yang satu
tidak saling tergantung dengan indikator yang lainnya. Ini berarti bahwa dalam satu variabel dapat
tersusun indikator yang
saling tergantung dan
berasosiasi positif atau
konvergen tetapi dapat pula terdapat
indikator-indikator yang berasosiasi
negatif atau divergen. Validitas divergen
ditemukan apabila dua konstruk
A dan B sangat berbeda, dan hasil pengukuran A dan B tidak berasosiasi. Contoh
materi konvergen adalah
|
|
Konvergen
(dua indikator
yang berkaitan, selaras, MC)
|
Divergen
(dua indikator yang sangat berbeda)
|
Validitas konstruk dapat dianalisis dari data uji coba instrumen. Skor butir
pertanyaan yang mengukur konstruk yang sama dijumlah, kemudian dikorelasikan
dengan jumlah skor seluruh butir. Uji validitas butir juga menggunakan cara
yang sama yaitu mengkorelasikan satu kolom skor butir dengan satu kolom skor
total. Cara analisis validitas konstruk dan butir lebih midah dilakukan dengan
program excel. Ilustrasi pengujian validitas konstruk terdapat pada gambar 2
Indikator 3
|
Indikator 2
|
Indikator 1
|
KORELASI
|
Total
1
2
3
|
Cara analisis data menggunakan program excel. Rumus yang
digunakan adalah korelasi point biserial
1) Input data kuesioner, jumlah skor responden
2) Letakkan kursor pada sel di sudut kiri bawah (kasus
terakhir, nomor butir pertama, kemudian tulis “=CORREL” Setelah itu akan muncul
permintaan kolom mana yang akan
dikorelasikan CORREL(array1; array2).
3)
Jalankan kursor pada kolom
nomor butir mulai dari nomor responden 1 sampai terakhir (B4:B32) untuk array 1
dan kolom total skor (Q3:Q32) untuk array 2 sehingga secara keseluruhan muncul
=CORREL(B4:B32;Q3:Q32), kemudian tekan enter.
4)
Lakukan cara yang sama pada
kolom butir berikutnya, kemudian kunci variabel tetap (skor total) dengan
menyisipkan simbol $ disela-sela huruf yang menunjukkan kolom sehingga menjadi seperti
ini ;$Q$3:$Q$32. Contoh lengkap =CORREL(C3:C32;$Q$3:$Q$32), tekan enter
5)
Copy rumus untuk butir
berikutnya.
d) Validitas kriteria.
Validitas kriteria (criterion validity)digunakan untuk membandingkan
hasil pengukuran dari instrumen baru dengan beberapa hasil pengukuran dari
instrumen yang standar atau
kriteria yang sudah ditetapkan
sebelumnya.Validitas kriteria
dapat dicapai apabila konstruk
yang dibandingkan pada dua alat pengukur
tersebut sama.
Ada dua tipe validitas ini yaitu: concurrent
validity dan predictive validity. Konsep pengukuran validitas kriteria terdapat pada gambar 3
Alat
ukur sekarang
|
Alat ukur yg ada sebelumnya
|
Alat ukur yg ada sesudahnya
|
Prediksi
|
Kongruence
|
Gambar 3. Konsep Pengukuran Validitas Kriteria
e) Validitas
Penilaian Kinerja
Cara-cara pengendalian validitas hasil
observasi pada penilaian kinerja dilakukan melalui pengujian validitas inter rater atau interobserver. Jika hasil penilaian dari penilai (rater) pertama
dan kedua sudah selaras, maka hasil penilaian sudah dinyatakan valid.Agar dapat
selaras, maka masing-masing penilai memiliki kesepahaman tentang kriteria kinerja yang dinilai. Keselarasan hasil penilaian dapat dibuktikan dengan
korelasi Produk Moment
2. Reliabilitas
Reliabilitas dapat
berarti keterikatan, ketergantungan,ketetapan atau keajegan hasil pengukuran. Contoh: instrumen tes menunjukkan
reliabiltas tinggi apabila diujikan beberapa kali ke siswa akan menghasilkan
nilai yang relatif tetap.
Konsep Dasar Reliabilitas
a) Stabilitas
Reliabilitas
mempunyai stabilitas antar waktu. Reliabilitas menjawab pertanyaan tentang
apakah alat pengukuruan mempunyai jawaban yang sama ketika diterapkan pada
periode waktu yang berbeda dengan subjek yang sama. Dalam hal ini, reliabilitas
dibuktikan dengan metode test-retest.
Alat pengukuran menunjukkan reliabilitas tinggi apabila hasil pengukuran pada
tes pertama sama dengan hasil pengukuran pada tes kedua, di bawah kondisi yang
sama pada kelompok orang yang sama. Selain menggunakan metode test-retes, stabilitas dapat pula diukur dengan menggunakan
sebuah bentuk tes alternatif, tetapi bentuk tes alternatif tersebut harus
sangat mirip.Variasi
kedua ini dinamakan parallel test.
Pada parallel test ini, indikator yang dikembangkan dalam perangkat tes
dirancang sama dan butir-butir instrumen yang digunakan juga memiliki kesamaan
isi. Cara ini jarang digunakan karena peneliti harus membuat dua instrumen yang
setara isinya sehingga tentu saja sulit dilakukan.
b) Representatif
Reliabilitas
representatif dibuktikan dengan menyebarkan instrumen pada beberapa kelompok
siswa yang berbeda. Sebuah indikator mempunyai reliabilitas yang tinggi apabila
memperoleh hasil yang sama ketika diterapkan pada kelas yang berbeda. Untuk
memperoleh hasil pengukuran yang reliabel ini, tiap-tiap kelompok yang diukur
sebaiknya representatif, mewakili seluruh karakteristik siswa yang
beragam.Hasil analisis menentukan indikator mana yang reliabel pada beberapa kelompok orang
yang berbeda.
c) Equivalence
Reliabilitas ekuivalensi diterapkan ketika
penilai menggunakan
indikator ganda dalam mengukur
kemampuan siswa. Butir pertanyaan
atau pernyataan disusun sedemikian rupa sehingga semua indikator yang terdapat dalam
variabel tersebut memiliki bobot yang seimbang.Contoh
kongkret misalnya sebuah tes terdiri dari empat indikator dan setiap indikator
memiliki jumlah butir yang seimbang.Reliabilitas terbukti apabila data yang diperoleh
cukup konsisten untuk
beberapa indikator yang berbeda. Apabila sejumlah indikator yang berbeda berfungsi mengukur variabel yang sama,
pengukuran yang reliabel akan memberi hasil yang sama untuk semua indikator.
Reliabilitas untuk
membuktikan equivalensi dapat dilakukan melalui metode split half (belah dua) dan parallel test. Maksud ekuivalen di sini adalah ada dua benda yang
dibandingkan. Pengukuran reliabilitas dengan metode split half menganut konsep konsistensi
internal, yaitu peneliti
cukup membuat satu instrumen dan satu kali
pengukuran, namun sudah memenuhi syarat pengukuran reliabilitas. Caranya
adalah: butir butir pertanyaan yang mengukur konstruk/indikator yang sama
dibagi menjadi dua secara acak, ganjil-genap atau awal-akhir. Apabila analisis
data menunjukkan hasilyang konsisten atau berkorelasi tinggi antara kelompok
butir yang telah dibagi dua tersebut, maka instrumen tersebut dinyatakan
reliabel.
Reliabilitas
ekuivalensi juga
diterapkan pada beberapa tipe pengukuran yang sering terjadi pada penjurian uji
kompetensi, lomba memasak, atau jenis lomba lainnya. Pada saat satu orang
dinilai atau diamati oleh beberapa orang (interater
dan intercoder) maka reliabilitas ekuivalensi akan tercapai apabila data
hasil penilaian/pengamatan dari beberapa penilai/pengamat tersebut konsisten,
tidak banyak selisihnya. Sebuah pengukuran reliabel apabila masing-masing penilai/pengamat
menyetujui hasil penilaian/pengamatan teman sejawatnya..
Instrumen yang
berkualitas dituntut memiliki reliabilitas yang tinggi. Apabila intrumen tersebut
belum dapat memenui kriteria reliabilitas yang ditetapkan, maka ada kemungkinan
proses pengukuran perlu diperbaiki. Ada 4 cara yang dapat dilakukan untuk memperbaiki
reliabilitas
instrumen, yaitu: (1) memperjelas konseptualisasi materi, (2) meningkatkan ketelitian
pengukuran, (3) menggunakan indikator ganda, (4) menggunakan uji coba tes.
1) Reliabilitas akan
meningkat apabila
ruang lingkup materi yang diujikan jelas
batasannya. Tes dikembangkan berdasarkan indikator (kisi-kisi) yang telah
ditentukan. Instrumen yang baik akan mengukur indikator dengan beberapa
pertanyaan/pernyataan yang masing-masing memiliki jawaban tunggal. Indikator
yang baik akan saling mendukung dan tidak saling tumpang tindih (overlaping).
Masing-masing indikator mempunyai ciri spesifik sehingga pertanyaan/pernyataan
seharusnya tidak overlaping. Meskipun indikator sudah spesifik, pengembangan
pertanyaan/pernyataan yang digunakan dalam pengukuran indikator juga tidak
boleh berlawanan dengan indikator lainnya.
2) Meningkatkan ketelitian pengukuran.
Ketelitian pengukuran mutlak diperlukan
dari sisi konseptualnya dan analisis datanya. Dari sisi konseptualnya,
bacalah butir-butir pertanyaan dan pernyataan secara berulang-ulang dan cobalah
untuk menjawab semua butir yang tertulis. Tanyakanlah pada diri sendiri, apakah
semua pertanyaan/pernyataan yang tertulis tersebut mudah untuk dijawab, jelas
kriterianya, dan jawaban yang dikehendaki juga cukup spesifik? Dari sisi
analisis data, telitilah data dengan seksama karena kesalahan pengukuran dan kesalahan
entry (memasukkan) data ke dalam
komputer dapat menyebabkan kesalahan hasil analisis data yang cukup fatal.
3) menggunakan
indikator ganda, sebab dua atau lebih indikator dalam satu variabel akan lebih baik
dari pada hanya satu
indikator saja. Indikator ganda akan membawa peneliti untuk memahami isi dan konsep secara luas.Butir-butir instrumen lebih
mudah dikembangkan apabila jumlah indikator yang digunakan cukup banyak. Hasil
pengukuran cenderung lebih stabil pada instrumen yang lebih banyak butirnya.
Jumlah butir yang cukup banyak lebih mudah diatur, yaitu pada saat hasil
pengisian kurang bagus pada salah satu butir, maka butir tersebut dapat dibuang
tanpa mengurangi isi karena sudah terwakili oleh butir-butir lainnya.
4) menggunakan
pretes, pilot studies/try
out/uji coba dan replikasi. Reliabilitas dapat ditingkatkan dengan
menggunakan dua
kali pengukuran. Pada pengukuran pertama, peneliti dapat
mencoba alat ukur tersebut sebelum menerapkan pada situasi yang sebenarnya. Karakteristik jawaban hasil
uji coba instrumen kemudian dianalisis dan diperbaiki kekurangannya. Butir
pertanyaan/pernyataan yang baik adalah
yang memiliki karakteristik jawaban bervariasi, dengan pola jawaban yang sama
berkisar 30% - 70%. Apabila semua responden memiliki jawaban yang sama, maka
butir tersebut perlu dicek kembali untuk diperbaiki, diganti atau dibuang.
Rangkuman
Reliability (dependable
measure)
|
Validity (true measure)
|
v Stabilitas dari waktu ke waktu atau antar dua alat pengukuran (test - retest atau parallel tes)
Contoh: pre and post test
v Representatif
antar sub populasi
Diujikan pada sub populasi yang berbeda hasil tetap
konsisten
v Ekuivalen
antar indikator (konsistensi internal, split
half ganjil genap atau awal akhir dan parallel test
|
v Face -
tampang fisik instrumen menurut
pertimbangan orang lain
|
v Content-
keseluruhan isi instrumen mewakili indikator yang diukur
|
|
v Construct-
konsistensi pengukuan antar indikator
-
convergent –serupa satu
dengan yang lain
-
discriminant - berbeda satu dengan yang lain.
|
|
v Criterian – berasosiasi dengan alat ukur eksternal
-
Concurrent- berasosiasi dengan pengukuran sebelumnya
-
Predictive- berasosiasi dengan pengukuran berikutnya
|
d). ReliabilitasPenilaian Kinerja
Penilaian kinerja menggunakan
pengamatan yang cara pembuktiannya berbeda karena hasil pengukurannya tidak
memperoleh data kuantitatif. Reliabilitas berarti keterkaitan atau
konsistensi. Penilaian
kinerja menggunakan variasi teknik observasi yang konsisten. Untuk mencapai konsistensi (tidak berubah-ubah) perilaku subjek yang diteliti dari waktu
kewaktu, peneliti
melakukan observasi berulang-ulang
seperti prinsip-prinsip stabilitas dalam pengukuran reliabilitas penilaian tes objektif.
DAFTAR BACAAN
Endang
Mulyatiningsih. (2012). Metode Penelitian Terapan Bidang Pendidikan. Bandung:
Alfabeta
Likert, R. (1932). A Technique for the Measurement of
Attitudes, Archives of Psychology 140: 1–55. Diperoleh
dari http://id.wikipedia.org/wiki/pada tanggal 10
Januari 2010
Neuman, W. L.
(2003). Social research methods,
qualitative and quantitative approaches, (5th. ed.) Boston: Allyn &
Bacon
Nitko, A. L; & Brookhart,
S. M. (2011). Educational assessment of students 6th edition.
Boston: Pearson
Osgood, C. E., May, W. H., & Miron, M. S. (1975) Cross-Cultural
Universals of Affective Meaning. Urbana, IL: University of Illinois Press
Osgood, C.E., Suci, G., & Tannenbaum,
P. (1975) The measurement of
meaning. Urbana, IL: University of Illinois Press
Wiersma, W. (1986).Research methods in education an introduction, 4th .
Boston: Allyn and Bacon, Inc.
Tidak ada komentar:
Posting Komentar