BAB I
PENDAHULUAN
PENDAHULUAN
A.
Latar belakang masalah
Reliabilitas sebetulnya merupakan sifat yang
ada pada data atau skor yang dihasilkan oleh instrumen, namun untuk memudahkan
reliabilitas dapat dikatakan merupakan sifat dari insrumen juga reliabilitas
bukanlah bersifat dikotomis, tetapi merupakan rentangan yang biasnya dinyatakan
dengan bentuk angka 0 (0) sampai 1 (satu). Dengan demikian kurang tepat kiranya
kalau dipertanyakan apakah suatu instumen itu memiliki reliabilitas atau tidak,
akan tetapi tepatnya adalah suatu instrumen dapat menghasilkan data atau skor
yang memiliki tingkat reliabilitas yang memadai atau tidak. Suatu instrumen
memiliki tingakat reliabilitas yang tinggi, sedang, atau rendah.
.Hampir sama dengan pengertian tersebut, bahwa
keberadaan reliabilitas tiada semata-mata brupa dua pilihan, reliabel atau kah
tidak reliabel, akan tetapi merupakan rentang yang berjenjang dari tingkat yang
paling tinggi sampai tingkat yang palinng rendah. Reliabilitas tingkat paling
tinggi yang secara statistik ditulis sebagai 1,00 yang menandakan adanya
keajegan mutlak tanpa perbedaan dan penyimpangan sedikitpun Karena pentinganya
reliabilitas dalam evaluasi maka pemakalah mencoba akan mengambil judul
reliabilitas.
A.
Rumusan Masalah
1.
Apakah Reliabilitas itu ?
2.
Bagaimanakah Tehnik penilaian reliabilitas tes
?
3.
Bagaimana Tingkat reliabilitas suatu instrumen
atau tes ?
4.
Apakah Reliabilitas
Tes Acuan Patokan ?
5.
Apakah Faktor
–faktor Yang Mempengaruhi Reliabilitas ?
BAB II
PEMBAHASAN
PEMBAHASAN
A.
Pengertian reliabilitas
Arti Reliabilitas Bagi Sebuah Tes Kata
realibilitas diambil dari bahasa Inggris reliability dari kata asalal reli. able
yang artinya dapat dipercaya.
Reliabilitas diartikan dengan keajekan (konsistensi) bila
mana tes tersebut diuji berkali-kali hasilnya relatif sama, artinya setelah
hasil tes yang pertama dengan tes yang berikutnya dikorelasikan terdapa hasil
korelasi yang signifikan.
Ada juag yang mengartikan dengan keandalan (reliability) artinya ketetapan/ketelitian suatu alat evaluasi. Suatu tes/alat evaluasi dikatakan andal jika ia dapat dipercaya, konsisten, atau stabil dan produktif. Jadi yang dipentingakan disini adalah ketelitian sejauh mana tes/alat tersebut dapat dipercaya kebenarannya.
Ada juag yang mengartikan dengan keandalan (reliability) artinya ketetapan/ketelitian suatu alat evaluasi. Suatu tes/alat evaluasi dikatakan andal jika ia dapat dipercaya, konsisten, atau stabil dan produktif. Jadi yang dipentingakan disini adalah ketelitian sejauh mana tes/alat tersebut dapat dipercaya kebenarannya.
Sudah dikatakan dalam persyaratan tes, bahwa reliabilitas
berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai
taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang
tetap maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan
hasil tes. Atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat
dikatakan tidak berarti.[1]
Reliabilitas alat penilaian adalah ketetapan atau keajegan
alat tersebut dalam menilai apa yang dinilainya. Artinya, kapanpun alat
penilain tersebut digunakan akan memberikan hasil yang relatif sama.
Tes hasil belajar dikatakan ajeg apabila hasil pengukuran
saat ini menunjukkan kesamaan hasil pada saat yang berlainan waktunya terhadap
siswa yang sama. Misalnya siswa kelas V pada hari ini di tes kemampuan
matematikanya. Minggu berikutnya siswa tersebut di tes kembali. Hasil dari ke
dua tes relatif sama. Sungguhpun demikian, masih mungkin terjadi ada perbedaan
hasil untuk hal-ha tertentu akibat faktor kebetulan, selang waktu, atau
terjadinya perubahan pandangan siswa terhadap soal yang sama. Jika itu terjadi,
kelamahan terletak pada tes itu, yang tidak memiliki kepastian jawaban atau
meragukan siswa. Dengan kata lain, derajat reliabilitasnya masih rendah.
B.
Tehnik Reliabilitas tes
Kandalan suatu tes dinyatakan dengan coefisient of
reliability (r), yaitu dengan jalan mencari korelasi misalnya:
1.
Tehnik ulangan
Mencari reliabilitas suatu tes dengan tehnik ulangan ialah dengan jalan memberikan
tes tersebut kepada sekelompok siswa dalam dua kesempatan yang berlainan.
Misalnya suatu tes diberikan kepada grup a. selang tiga hari atau seminggu
kemudian tes tersebut diberikan lagi kepada grup a dengan syarat- syarat
tertentu (misalnya soal soal dalam tes tidak dibicarakan selama waktu antara
itu, situasi tempat dibuat sama dan
sebagainya ). Skor yang diperoleh siwa pada periode pertama
dikorelasikan dengan skor yang mereka peroleh dalam periode kedua. Besar
kecilnya koefisien korelasi yang diperoleh menunjukkan reliabilitas dari tes
tersebut.[2]
Contoh:
Siswa
|
Tes Pertama
|
Tes Kedua
|
||
Skor
|
Rengking
|
Skor
|
Rengking
|
|
A
|
15
|
3
|
20
|
3
|
B
|
20
|
1
|
25
|
1
|
C
|
9
|
5
|
15
|
5
|
D
|
18
|
2
|
23
|
2
|
E
|
12
|
4
|
18
|
4
|
Walaupun
tampak skornya naik, akan tetapi kenaikannya dialami oleh semua siswa.[3]
2.
Reliabilitas bentuk ekuivalensi
Sesuai dengan namanya ekivalen, maka tes evaluasi hendak
diukur reliabilitasnya dibuat identik dengaan tes acuan. Setiap tampilannya,
kecuali subtansi item yang ada, dapat berbeda. Kedua tes tersebut sebaliknya
mempunyai karakteristik yang sama. Karakteristik yang dimaksud misalnya
mengukur variable yang sama, struktur yang sama, mempunyai tingkat kesulitan
dan mempunyai petunjuk, cara penskoran, dan interpretasi yang sama. [4]
Jadi tes ini juga terdiri atasdua tes yang disusun dalam
bentuk yang berbeda tapi berdasarkan spesifikasi derajat kesukaran yang
seimbang. Dengan demikian murid akan dihadapkan kepada dua jenis (yang pararel)
pada saat yang sama. Reliabilitas pengukuran kedua bentuk ini diperoleh dengan
jalan mengkorelasikan skor-skor hasil kedua pengukuran[5]
Jika dibandingka dengan tehnik
ulangan, tehnik bentuk ini lebih menguntungkan karena:
a.
Item- item yang digunakan tidak sama, sehingga pengaruh
latihan dapat dihindarkan.
b.
Tidak adanya tenggang waktu maka perbedaan
faktor-faktor yang mempengaruhi pelaksanaan tes boleh dikatakan tidak ada.
Misalnya faktor situasi tes, administrasi, pengawasan dan sebagainya.[6]
3.
Tehnik belah dua
Dalam tehnik ini, tes yang telah diberikan kepada sekelompok
subyek dibelah dua bagian. Kemudian tiap-tiap bagian diberikan skor secara
terpisah. Ada dua prosedur yang dapat digunakan untuk membelah dua suatu tes
yaitu:
a.
Prosedur ganjil genap, artinya seluruh item yang
bernomor ganjil dikumpulkan menjadi satu kelompok, dan seluruh item yang
bernomor genap menjadi kelompok yang lain.
b.
Prosedur secara random, misalnya dengan jalan lotre, atau
dengan jalan menggunakan table bilangan random. [7]
Kelemahan penggunaan
metode dua tes dua kali percobaan dan satu tes dua kali percobaan
diatasi dengan metode ketiga ini yaitu metode belah dua. Dalam menggunakan
metode ini pengetes hanya meggunakan sebuah tes dan dicobakan satu kali.
Disebut juga single-test-sinle-method.[8]
Contoh:
Untuk mengetahui reliabilitas tes harus digunakan rumus
sperman-brown sebagai berkut
dimana
r
=
kirelasi antara skor-skor setiap belahan tes.
r11=koefisien
reliabilitas yang sudah disesuaikan.
Reliabilitas
Contoh:
Korelasi
antara belahan tes= 0,60
Maka
reliabilitas tes =
Banyak pengguna metode ini salah
membelah hasil tes pada waktu, menganalisis. Yang mereka lakukan adalah
mengelompokan hasil separo subjek peserta tes dan separo yang lain kemudian
hasil kedua kelompok ini dikorelasikan. Yang benar adalah membelah item atau
butir soal. Tidak akan keliru kiranya bagi pemakai metode ini harus ingat bahw
banyaknya butir soal harus genap agar dapat dibelah[9]
C.
Tingkat reliabilitas suatu instrumen atau tes
Tingkat
reliabilitas suatu instrumen atau tes dipengaruhi oleh banyak hal antara lain:
1.
Jumlah butir soal, banyaknya soal pada suatu instrumen
ikut mempengaruhi derajat reliabilitasnya, dengan semakin banyaknya soal-soal
maka tes yang bersangkutan cenderung untuk menjadi semakin reliabel,
sebagaimana yang dinyatakan dalam rumus spearmen-brown.
Hubungan
antar jumlah butir dengan rekiabilitas dapat dilihat pada keadaan berikut:
Jumlah Butir Reliabilitas
Jumlah Butir Reliabilitas
5 0,20
10
0,33
20
0,50
40
0,67
80
0,80
160
0,89
320
0,94
640
0,97
Gambaran diatas menunjukkan bahwa semakin tinggi tingkatan
reliabilitas instrumen, semakin sedikit peningakatan yang terjadi akibat
pelipat gandaan butirnya. Gejala yang terlihat dari pemakaian rumus tersebut
akan berlaku apabila dua asumsinya terpenuhi, yaitu
a.
Butir-butir instrumen yang ditambahkan tersebut
memiliki karakteristik yang sama dengan butir-butir yang sudah ada, misalnya
tidak lebih mudah atau lebih sulit.
b.
Subjek yang mengisi instrumen atau mengerjakan test
tersebut tidak terpengaruh secra psikologis dengan bertambahnya jumlah
butir-butir, misalnya tidak menjadi lelah dan lain sebagainya.
2.
Homoginitas soal test, soal yang memiliki homoginitas
yang tinggi cenderung mengarah kepada tingginya tingkat reliabilita. Dua buah
test yang sama butirnya akan tetapi berbeda isinya, misalnya yang satu mengukur
pengetahuan kebahasaan dan yang lainya mengukur kemampuan fisika akan
menghasilkan tingkat reliabilitas berbeda. Test fisika cederung menghasilka
tingkat reliabilitas yang lebih tinggi daripada test kebahasaan karena dari
segi isi kemampuan menyelesaikan soal fisika lebih homogen daripada pengetahuan
kebahasaan.
3.
Waktu yang diperluka untuk menyelesaikan test, semakin
terbatasnya waktu dalam pengejaan test maka akan mendorong test untuk cenderung
memiliki reliabilitas yang tinggi, hl ini terutama apabila realiabilitas
diperoleh dengan cara splithalf (belah dua).
4.
Keseragaman kondisi pada saat test diberikan, kondisi
pelaksanaan test yanhg semakin seragam akan memunculkan reliabilitas yang
semakin tinggi.
5.
Kecocokan tingkat kesukaran terhadap peserta test
6.
Heteroginitas kelompok, bahwa semakin hiterogen suatu
kelompok dalam pengerjaan suatu test maka test terebut semakin cenderung untuk
menunjukan tingkat reliabilitas yang tinggi.
7.
Variabel skors instrumen yang mengahasilkan rentangan
skor yang lebih luas atau lebih tinggi variabilitasnya akan memiliki tingkat
reliabilitas yang lebih tinggi daripada yang menghaslkan menghsilkan rentang
skor yang lebih sempit. Seperti test bentuk pilihan ganda cenderung
menghasilakan tingkat reliabilitas lebih tinggi dari pada test bentuk benar
salah.
8.
Motivasi
individu.
Faktor-faktor yang dapat mempengaruhi keadaan suatu tes:
1. Luas tidaknya sampling yang diambil
1. Luas tidaknya sampling yang diambil
2. Perbedaan bakat kemampuan murid yang dites.
3. Suasana atau kondisi testing
4. Kandalan tes
D.
Reliabilitas
Tes Acuan Patokan
Reliabilitas
tes acuan patokan mengacu pada konsistensi tes mengukur apa yang diukur.
Perhatian tes acuan patokan adalah asesmen derajat stabilitas atau kesetaraan,
yakni reliabilitas bentuk tes ulamg dan kesetaraan.
1) Tes acuan patokan non-materi
Walaupun secara
teoritik variabilitas skor yang dicapai siswa tidak ada dalam tes acuan
patokan, namun demikian variabilitas itu tetap ada. Oleh karena itu apabila tes
acuan patokan itu diterapkan dan tingkat kinerja setiap siswa dicatat, maka
hampir selalu terjadi variabilitas skor. Derajat variabilitas itu akan
bervariasi dari kelompok ke kelompok dan dari tes ke tes lainnya.
Apabila
terdapat variabilitas skor, maka dapat digunakan pengukuran tradisional untuk
menghitung reliabilitas. Pendekatan yang digunakan untuk menghitung koefisien reliabilitas
pada tes acuan patokan hingga sekarang ini belum ada yang diterima oleh semua
pihak.
2) Tes acuan patokan materi
Livingston
telah mengusulkan pendekatan untuk membuat estimasi reliabilitas tes acuan
patokan. Rumus yang digunakan pada dasarnya adalah generalisasi dari teori
reliabilitas klasik. Rumus yang digunakan itu menghitung reliabilitas tes acuan
patokan dengan cara pertama-tama menghitung reliabilitas tradisional, seperti
pada acuan tes normatif, kemudian menyesuaikan berdasrkan pada kriteria skor
tes acuan patokan. Rumus yang digunakan hanya cocok untuk jenis tes materi.
E. Faktor –faktor Yang Mempengaruhi
Reliabilitas
Banyak faktor mempengaruhi reliabilitas, beberapa faktor dberkaitan dengan tes itu
sendiri, siswa yang mengikuti ujian, lingkungan dimana ujian itu diselenggarakan, administrassi tes dan prossedur
pensekoran. Faktor-faktor
tersebut akan dapat digunakan sebagai bahan untuk memperbaiki proseddur
pengembangan tes, pemakain tes, dan
analisis informasi tes.
Pertimabngan tentang faktor-faktor yang mempengaruhi realiabilitas tes ini buakn saja membantu guru dalam
menasirkan kofisien reliabilitass tes standar searalebih
baik,melainkan juga membantu kita didalam merumuskan tes yang lebih
reliable. Bebrapa
faktor yang dimaksud secara ringkas dijelaskan sebagai berikut:
1. Panjang
Tes (length of test)
Kemunginan cara paling rasional
untuk meningkatkan reliabilitas adalah menambah jumlah butiran
soal.penambahan butiran soal akan memperbaiki sampel ranah perilaku
yang diujikan, perbaikan
sampel ranah perilaku itu akan menghasilkan
validitas lebih tinggi dan mengurangi faktor kebetulan seperti tekanan.
Walaupun sampel perilaku itu banyak
dan dapat menjaddikan butir soal semakn banyak pula,namun perlu diperhatiakan
adalah butiran soal itu jangan terlalau banyak sehinnga waktu yang disediakan
untuk ujian tidak cukup untuk siswa yang mengerjakannya. Pendeknya, semakin banyak butir soal yang ada
pada suatu tes maka semakin baik sampel perilaku yang diukur didalam tes tersebut.
2. Sebaran
skor (spread of scores)
Metode korelasi untuk mmengestimasi reliabilitas memerlukan
sebaran sekor. Jika
sebaran sekor itu sempit, maka
koefisien reliabilitas akan menjadi
randah.begitu pula jika sebaran skor itu luas, maka koefisien reliabiltas akan
menjadi tinggi.
Sebaran skor yang diperoleh siswa pada suatu tes adalah tergantung pada tingkat kesulitan butir soal yang disajikan dan kemampuan siswa dalam
mengerjakan soal.
3. Keobjektivan
skor (score objectivity)
Tes objektif merupakan tes yang
mampu mengurangi subjektivitas penskoran, artinya: setiap orang yang menskor hassil tes akan menemukan
skor yang sama pada siswa yang sama. Untuk meningkatkan objektivitas, proses pensekoran harus dilakuakan
seobjektif mungkin dan mengurangi pengaruh guru dalam
menskor hassil ujian siswa.
BAB III
PENUTUP
A.
Kesimpulan
Reliabilitas
diartikan dengan keajekan (konsistensi) bila mana tes tersebut diuji
berkali-kali hasilnya relatif sama, artinya setelah hasil tes yang pertama
dengan tes yang berikutnya dikorelasikan terdapa hasil korelasi yang signifikan
2. Methode-methode yang diguanakan untuk mengukur tingakat reliabel antara lain: Dengan metode dua tes, Dengan metode satu tes, Metode spit half (masih dengan 1 tes), Dengan methode kuder-Richardo.
2. Methode-methode yang diguanakan untuk mengukur tingakat reliabel antara lain: Dengan metode dua tes, Dengan metode satu tes, Metode spit half (masih dengan 1 tes), Dengan methode kuder-Richardo.
Tingkat
reliabilitas suatu instrumen atau tes dipengaruhi oleh banyak hal antara lain:
Jumlah butir soal, Homoginitas soal test, Waktu yang diperluka untuk
menyelesaikan test, Keseragaman kondisi pada saat test diberikan, Kecocokan
tingkat kesukaran terhadap peserta test, Heteroginitas kelompok, Motivasi
individu.
[1]Suharsimi
Arikunto, Dasar-Dasar Evaluasi Pendidikan, Jakarta: Bumi Angkasa, h. 86.
2002.
[2] Wayan
Nurkancana dk, Evaluasi hasil belajar, Surabaya: Usaha Nasional, h. 145.1990
[3]Suharsimi
Arikunto, Dasar-Dasar Evaluasi Pendidikan, op…cit. h.92.
[4]Sukardi, Evaluasi
Pendidikan, Rawamangun: Sinar Grafika Offset, h. 46. 2008
[5]Oemar Hamalik, Tehnik
pengukuan dan evaluasi pendidikan, Bandung: Mandar Maju, h. 144.
[6]Wayan
Nurkancana dk, Evaluasi hasil belajar,. … op.cit h. 145.
[7] Ibid. h. 146.
Tidak ada komentar:
Posting Komentar