BAB I
PENDAHULUAN
A.
Latar
Belakang
Evaluasi memiliki arti penting dalam kegiatan
belajar mengajar yang dilaksanakan oleh seorang guru. Diantara tujuan dari
evaluasi adalah untuk menilai ketercapaian tujuan pendidikan oleh anak didik,
sarana untuk mengetahui apa yang telah anak didik ketahui dalam kegiatan
belajar mengajar, dan memotivasi anak didik. Untuk mengevaluasi hasil belajar
dan proses belajar siswa, seorang guru menggunakan berbagai macam alat atau
instrumen evaluasi seperti tes tertulis, tes lisan, ceklis-observasi,
angket-wawancara, dan dokumentasi.
Keberhasilan mengungkap hasil dan proses belajar ini
sebagaimana adanya (objektivitas hasil penilaian) sangat bergantung pada
kualitas alat penilainya, di samping itu juga yang tidak kalah pentingnya tergantung
pada cara pelaksanaannya. Suatu alat penilaian dikatakan mempunyai kualitas
yang baik apabila alat tersebut memiliki atau memenuhi dua hal, yaitu validitas
(ketepatan) dan reliabilitas (ketetapan atau keajegan) alat tes terjamin
kualitasnya. Alat tes yang bagaimana dan seperti apa yang dikatakan memiliki
validitas dan reliabilias ini, selanjutnya akan kita bahas dalam makalah ini
berjudul “Reliabilitas dan Validitas Tes” ini.
B.
Rumusan
Masalah
1.
Apa
pengertian reliabilitas ?
2.
Apa
pengertian validitas ?
3.
Sebutkan
jenis-jenis reliabilitas dan validitas ?
BAB II
PEMBAHASAN
A.
Reliabilitas
Walizer (1987) menyebutkan pengertian Reliability
(Reliabilitas) adalah keajegan pengukuran.
Menurut John M. Echols dan Hasan Shadily (2003: 475)
reliabilitas adalah hal yang dapat dipercaya. Popham (1995: 21) menyatakan
bahwa reliabilitas adalah "...the degree of which test score are free
from error measurement"
Menurut Masri Singarimbun, realibilitas adalah
indeks yang menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau dapat
diandalkan. Bila suatu alat pengukur dipakai dua kali – untuk mengukur gejala
yang sama dan hasil pengukuran yang diperoleh relative konsisten, maka
alat pengukur tersebut reliable. Dengan kata lain, realibitas
menunjukkan konsistensi suatu alat pengukur di dalam pengukur gejala yang sama.
Menurut Brennan (2001:295) reliabilitas merupakan
karakteristik skor, bukan tentang tes ataupun bentuk tes.
Menurut Sumadi Suryabrata (2004:28) reliabilitas
menunjukkan sejauhmana hasil pengukuran dengan alat tersebut dapat dipercaya.
Hasil pengukuran harus reliabel dalam artian harus memiliki tingkat konsistensi
dan kemantapan.
Dalam pandangan Aiken (1987: 42) sebuah tes
dikatakan reliabel jika skor yang diperoleh oleh peserta relatif sama meskipun
dilakukan pengukuran berulang-ulang.[1]
Reliabilitas adalah karakter lain dari hasil
evaluasi. Reliabilitas juga dapat diartikan sama dengan konsistensi atau
keajegan. Suatu instrumen evaluasi, dikatakan mempunyai nilai reliabilitas yang
tinggi apabila tes yang dibuat mempunyai hasil yang konsisten dalam mengukur
yang hendak diukur. Ini berarti semakin reliabel suatu tes, semakin yakin kita
dapat menyatakan bahwa dalam hasil suatu tes mempunyai hasil yang sama
dan bisa dipakai di suatu tempat sekolah, ketika dilakukan tes tersebut.
Reliabilitas soal merupakan ukuran yang menyatakan
tingkat keajegan atau kekonsistenan suatu tes soal. Untuk mengukur tingkat
keajegan soal ini digunakan perhitungan Alpha Cronbach. Rumus yang
digunakan dinyatakan dengan:
R11
=
Keterangan:
n =
banyaknya butir soal
Si2 = jumlah varians tiap skor
St2 = varians skor total
Rumus
untuk mencari varians adalah:
Si2 =
Interpretasi
nilai r11 mengacu pada pendapat Guilford (Ruseffendi, 1991b: 191):
rii < 0,20 reliabilitas sangat rendah
0,20 < rii 0,40 reliabilitas rendah
0,420 < rii 0,70 reliabilitas sedang
0,70 < rii
0,90 reliabilitas tinggi
0,90 < rii
1,00 reliabilitas sangat tinggi.[2]
B.
Validitas
Menurut Azwar (1986) Validitas berasal dari kata
validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat
ukur dalam melakukan fungsi ukurnya.
Suatu skala atau instrumen pengukur dapat dikatakan
mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi
ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya
pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan
menghasilkan data yang tidak relevan dengan tujuan pengukuran.[3]
Validitas merupakan derajat kemampuan suatu tes yang
mengukur apa yang hendak diukur. Secara tidak langsung itu meliputi tes dan
skala yang terdiri atas sejumlah tugas yang dipilih untuk berfungsi sebagai
indikator hasil belajar. Validitas berkenaan dengan ketetapan alat penilaian
terhadap konsep yang dinilai sehingga betul-betul menilai apa yang yang
seharusnya dinilai. Sebagai contoh menilai kemampuan siswa dalam matematika.
Misalnya diberikan soal dengan kalimat yang panjang dan berbelit-belit sehingga
sukar ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak
memahami pertanyaannya. Validitas tidak berlaku universal sebab bergantung pada
situasi dan tujuan penilaian. Alat penilaian yang telah valid untuk suatu
tujuan tertentu belum otomatis akan valid untuk tujuan yang lain.
Dalam menggunakan validitas suatu tes, ada beberapa
hal yang perlu diperhatikan, yaitu :
a.
Mengacu pada materi
yang hendak diujikan.
b.
Mengacu pada hasil dari
suatu tes atau instrument evaluasi yang dikenakan pada sekelompok individu.
c.
Berkaitan dengan
derajar dengan istilah validasi tinggi, sedang, rendah.
d.
Mengacu pada penggunaan
hasil evaluasi.[4]
Validitas suatu instrumen evaluasi mempunyai
beberapa makna penting diantaranya adalah sebagai berikut:
1.
Validitas berhubungan
dengan ketepatan interpretasi hasil tes atau instrumen evaluasi untuk grup
individual dan bukan instrumen itu sendiri.
2.
Validitas diartikan
sebagai derajat yang menunjukkan kategori yang bisa mencakup kategori yang bisa
mencakup kategori rendah, menengah, dan tinggi.
3.
Prinsip suatu tes
valid, tidak universal. Validitas suatu tes yang perlu diperhatikan oleh para
peneliti adalah bahwa ia hanya valid untuk suatu tujuan saja.[5]
Ada dua unsur penting dalam validitas tes. Unsur
tersebut adalah sebagai berikut:
1.
Validitas suatu tes
harus menunjukkan suatu derajat tertentu, ada yang sempurna, ada yang sedang,
dan ada pula yang rendah.
2.
Validitas selalu
dihubungkan dengan suatu putusan atau tujuan spesifik. Sebagaimana pendapat R.
L Thorndike dan H. P Hagen bahwa “validiti is always in relation to a
specific decision or use”[6]
C.
Jenis-jenis
Validitas dan Reliabilitas
a.
Validitas
Secara garis besar ada dua macam validitas, yaitu
validitas logis dan validitas empiris.
1)
Validitas Logis
Istilah “validitas logis” mengandung kata “logis”
berasal dari kata “logika” atau validitas logis sering juga disebut sebagai
analisis kualitatif yaitu berupa penalaran atau penelaahan. Dengan makna
demikian maka validitas logis untuk sebuah instrumen yang memenuhi persyaratan
valid berdasarkan hasil penalaran. Kondisi valid tersebut dipandang terpenuhi
karena instrumen yang bersangkutan sudah dirancang secara baik, mengikuti teori
dan ketentuan yang ada. Sebagaimana pelaksanaan tugas lain misalnya membuat
sebuah karangan, jika penulisan sudah mengikuti aturan mengarang, tentu secara
logis karangannya sudah baik. Berdasarkan penjelasan tersebut maka instrumen
yang sudah disusun berdasarkan teori penyusunan instrumen, secara logis sudah
valid. Dari penjelasan tersebut dapat dipahami bahwa validitas logis dapat
dicapai apabila instrumen disusun mengikuti ketentuan yang ada. Dengan
demikian, dapat disimpulkan bahwa validitas logis tidak perlu diuji kondisinya
tetapi langsung diperoleh sesudah instrumen tersebut selesai disusun.
2)
Validitas Empiris
Istilah “validitas empiris” memuat kata “empiris” yang
artinya “pengalaman”. Sebuah instrumen dapat dikatakan memiliki validitas
empiris apabila sudah diuji dari pengalaman. Analisis soal secara kuantitatif
menekankan pada analisis karakteristik internal tes melalui data yang diperoleh
secara empiris. Karakteristik internal secara kuantitatif dimaksudkan meliputi
parameter soal tingkat kesukaran, daya pembeda dan reliabilitas. Khusus
soal-soal pilihan ganda, dua tambahan parameter yaitu dilihat dari peluang
untuk menebak atau menjawab soal benar dan berfungsi tidaknya pilihan jawaban,
yaitu penyebaran semua alternative jawaban dari subyek-subyek yang dites. Salah
satu tujuan dilakukannya analisis adalah untuk meningkatkan kualitas soal,
yaitu apakah suatu soal dapat diterima karena telah didukung oleh data statistik
yang memadai, diperbaiki karena terbukti terdapat beberapa kelemahan atau
bahkan tidak digunakan sama sekali karena terbukti secara empiris tidak
berfungsi sama sekali.
Ada empat jenis validitas yang sering digunakan,
yakni:
a)
Validitas isi (content validity)
Sebuah tes dikatakan memilki validitas isi apabila
mengukur tujuan khusus tertentu yang sejajar dengan materi atau isis pelajaran
yang diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum maka
validitas isi ini sering juga disebut validitas kurikuler.
Validitas isi berkenaan dengan kesanggupan alat
penilaian data mengukur isi yang seharusnya. Artinya, tes tersebut mampu
mengungkapkan isi suatu konsep atau variabel yang hendak diukur. Misalnya tes
hasil belajar bidang studi IPS harus bisa mengungkapkan isi bidang studi
tersebut. Hal ini bisa dilakukan dengan cara menyusun tes yang bersumber dari
kurikulum bidang studi yang hendak diukur. Disamping kurikulum dapat juga
diperkaya dengan melihat atau mengkaji buku sumber.
b)
Validitas konstruksi (construct validity)
Sebuah tes dikatakan memiliki validitas konstruksi
apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek
berfikir seperti yang disebutkan dalam tujuan instruksional khusus. Dengan kata
lain jika butir-butir soal mengukur aspek berfikir tersebut sudah sesuai dengan
aspek berfikir yang menjadi tujuan instruksional.
c)
Validitas “ada sekarang” (concurrent validity)
Validitas ini lebih umum dikenal dengan validitas
empiris. Sebuah tes dikatakan memiliki validitas empiris jika hasilnya sesuai
dengan pengalaman. Jika ada istilah “sesuai” tentu ada dua hal yang
dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman.
Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman
tersebut sekarang sudah ada (ada sekarang, concurrent).
Dalam membandingkan hasil sebuah tes maka diperlukan
suatu kriterium atau alat banding. Maka hasil tes merupakan sesuatu yang
dibandingkan.
d)
Validitas prediksi (predictive validity)
Memprediksi artinya meramal, dengan meramal selalu
mengenai hal yang akan datang jadi sekarang belum terjadi. Sebuah tes dikatakan
memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan
untuk meramalkan apa yang akan terjadi pada masa yang akan datang.
Sebagai alat pembanding validitas prediksi adalah
nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran di Perguruan
Tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam
ujian semester 1 dibandingkan dengan yang dahulu nilai tesnya lebih rendah maka
tes masuk yang dimaksud tidak memiliki validitas prediksi.[7]
b.
Reliabilitas
Walizer (1987) menyebutkan bahwa ada dua cara umum
untuk mengukur reliabilitas, yaitu:
1.
Relibilitas stabilitas.
Menyangkut usaha memperoleh nilai
yang sama atau serupa untuk setiap orang atau setiap unit yang diukur setiap
saat anda mengukurnya. Reliabilitas ini menyangkut penggunaan indicator yang
sama, definisi operasional, dan prosedur pengumpulan data setiap saat, dan
mengukurnya pada waktu yang berbeda. Untuk dapat memperoleh reliabilitas
stabilitas setiap kali unit diukur skornya haruslah sama atau hampir sama.
2.
Reliabilitas ekivalen.
Menyangkut usaha memperoleh nilai
relatif yang sama dengan jenis ukuran yang berbeda pada waktu yang sama.
Definisi konseptual yang dipakai sama tetapi dengan satu atau lebih indicator
yang berbeda, batasan-batasan operasional, paeralatan pengumpulan data, dan /
atau pengamat-pengamat. Menguji reliabilitas dengan menggunakan ukuran ekivalen
pada waktu yang sama bias menempuh beberapa bentuk. Bentuk yang paling umum
disebut teknik belah-tengah. Cara ini seringkali dipakai dalam survai.Apabila
satu rangkaian pertanyaan yang mengukur satu variable dimasukkan dalam
kuesioner, maka pertanyaan-pertanyaan tersebut dibagi dua bagian persis lewat
cara tertentu. (Pengacakan atau pengubahan sering digunakan untuk teknik belah
tengah ini.) Hasil masing-masing bagian pertanyaan diringkas ke dalam skor,
lalu skor masing-masing bagian tersebiut dibandingkan. Apabila dalam skor
kemudian skor masing-masing bagian tersebut dibandingkan. Apabila kedua skor
itu relatif sama, dicapailah reliabilitas belah tengah.
Reliabilitas ekivalen dapat juga
diukur dengan menggunakan teknik pengukuan yang berbeda. Kecemasan misalnya, telah
diukur dengan laporan pulsa. Skor-skor relatif dari satu indikator macam ini
haruslah sesuai dengan skor yang lain. Jadi bila seorang subyek nampak cemas
pada ”ukuran gelisah” orang tersebut haruslah menunjukkan tingkatan kecermatan
relatif yang sama bila tekanan darahnya yang diukur.[8]
BAB III
PENUTUP
KESIMPULAN
Reliabilitas adalah karakter lain
dari hasil evaluasi. Reliabilitas juga dapat diartikan sama dengan konsistensi
atau keajegan.
Validitas merupakan derajat
kemampuan suatu tes yang mengukur apa yang hendak diukur.
Secara garis besar ada dua macam
validitas, yaitu validitas logis dan validitas empiris.
Ada empat jenis validitas yang sering digunakan,
yakni:
a)
Validitas isi (content validity)
b)
Validitas konstruksi (construct validity)
c)
Validitas “ada sekarang” (concurrent validity)
d)
Validitas prediksi (predictive validity)
Ada dua cara umum untuk mengukur reliabilitas,
yaitu:
a)
Relibilitas stabilitas.
b)
Reliabilitas ekivalen
DAFTAR PUSTAKA
Arifin. Zainal, Evaluasi Pembelajaran,
Bandung: Remaja Rosdakarya, 2011
Jihad. Asep dan Haris. Abdul, Evaluasi
Pembelajaran, Yogyakarta:
Multi Pressindo, 2008
Sukardi, Evaluasi
pendidikan Prinsip dan Operasionalnya, Jakarta: Bumi Aksara, 2009
[1] http://merlitafutriana0.blogspot.com/p/validitas-dan-reliabilitas.html,
diakses pada tanggal 30 Maret 2105.
[3] http://merlitafutriana0.blogspot.com/p/validitas-dan-reliabilitas.html,
diakses pada tanggal 30 Maret 2105
[4] http://sangbyyou.blogspot.com/2013/05/makalah-evaluasi-pembelajaran.html,
diakses pada tanggal 30 Maret 2015.
[7] http://mathsamah1989.blogspot.com/2012/10/validitas-dan-reliabilitas-tes-hasil.html,
diakses pada tanggal 30 Maret 2015.
[8] http://merlitafutriana0.blogspot.com/p/validitas-dan-reliabilitas.html,
diakses pada tanggal 30 Maret 2015.
izin copy....
BalasHapus