BAB
I
PENDAHULUAN
A.
Latar Belakang
Analisis
kualitas instrumen evaluasi atau istilah lainnya kualitas alat evaluasi
merupakan hal penting dalam melakukan evaluasi karena kita merasa bahwa
instrumen atau alat ukur yang dibuat ada banyak kelemahannya dari beberapa sisi.
Kelemahan itu bisa terjadi karena alat untuk mengevaluasi tidak tepat untuk
mengevaluasi, berbobot mudah, sedang, dan sukar bagi siswa. Soal yang terlalu
sukar untuk menilai peserta didik menyebabkan harapan dalam pembelajaran tidak
tercapai. Demikian pula halnya dengan instrumen yang terlalu mudah untuk
dijawab, menyebabkan kesukaran dalam mengkategorisasikan mana siswa yang pintar
dan yang tidak pintar. Kualitas alat
evaluasi dimunculkan ke permukaan ketika seorang guru melakukan tes selesai
proses pembelajaran selama empat bulan kemudian hasilnya dicermati dan ternyata
tidak sesuai dengan apa yang diharapkan yakni menunjukkan apa di bawah rerata
yang dicapai guru. Di manakah letak kesalahannya? Apakah ada di guru atau di
siswa?
Kalau kesalahan ada pada guru maka
menjadi persoalan baru adalah bagaimana metode mengajar yang dilakukan guru?
Bagaimanakah keadaan alat evaluasi itu?
Ada
cara dengan mengumpulkan rencana pelaksanaan pembelajaran selama empat bulan
dilihat dan dianalisis tujuan pembelajaran yang ditulis tidak terlalu tinggi,
sesuai dangan tingkat perkembangan siswa. Dilihat dari sisi lain yaitu proses
pelaksanaan pembelajaran yang dilakukan guru, berjalan dengan baik sesuai
dengan acuan rencana pelaksanaan pembelajaran seperti memilih metode,
pendekatan, startegi, dan media yang baik untuk mendukung proses pembelajaran.
Ada
hubungan timbal balik antara tujuan pembelajaran, proses pembelajaran dan
penilaian hasil belajar. Bila kedua hal yakni tujuan dan proses pembelajaran
tidak bermasalah maka persoalan yang ada dengan nilai hasil belajar rendah
tidak sesuai dengan yang diharapkan, adalah alat penilaian. Dipertanyakan alat
kualitas penilaian apakah sudah baik atu belum untuk mengukur tujuan
pembelajaran dan indikator kompetensi yang telah ditentukan?
Menguji
instrumen dalam hal ini perlu sekali, di samping kesesuaian instrumen yang
dibuat dengan objekyang akan diuji diakatakan juga bahwaperlu diuji kualitas
instrumen untuk dapat dipakai pada lain kesempatan dan objek lain dalam satuan
pendidikan yang sama. Kadangkala kita menemui instrumen seperti tes soal
matematika yang tidak dapat diapakai untukmenguji objek sekolah yang berbeda
walaupun sama satuan pendidikannya. Kualitas instrumen evaluasi yang rendah
menyebabkan produk lulusan yang tidak baik.
Beberapa
manfaat dan kepentingan lain perlunya kualitas instrumen evaluasi yang baik
antara lain untuk:
1. membentuk
bank soal standar
2. menentukan
grade tingkat mutu lembaga pendidikan
3. memudahkan
mengambil data lapangan yang berkualitas.
Dalam menganalisis
kualitas instrumen evaluasi dilakukan uji validitas, uji realibiltas, daya beda
instrumen dan tingkat kesukaran instrumen.
B.
Rumusan
Masalah
1.
Apa yang dimaksud validitas instrumen
dan jenisnya?
2.
Apa yang dimaksud reliabilitas instrumen
dan jenisnya?
3.
Bagaimanakah menentukan daya beda
instrumen?
4.
Apa yang dimaksud indeks kesukaran
instrumen?
5.
Bagaimanakah menentukan efektifitas opsi?
C.
Tujuan
Penulisan
1.
Untuk mengetahui pengertian validitas
instrumen dan jenisnya.
2.
Untuk mengetahui pengertian reliabilitas
instrumen dan jenisnya.
3.
Untuk mengetahui cara menentukan daya
beda instrumen.
4.
Untuk mengetahui pengertian indeks
kesukaran instrumen.
5.
Untuk mengetahui cara menentukan
efektifitas opsi.
D.
Manfaat
Penulisan
Manfaat yang dapat diperoleh dari penulisan makalah ini mencakup beberapa
yang terkait diantaranya sebagai berikut :
1.
Bagi Mahasiswa
Makalah ini dapat digunakan sebagai bahan referensi
atau masukan tentang kualitas alat penilaian. Kualitas alat penilaian ini
sangat bermanfaat bagi mahasiswa sebagai calon guru.
2.
Bagi Masyarakat
umum
Sebagai bahan bacaan yang bermanfaat untuk menambah
pengetahuan tentang evaluasi pembelajaran bahas, serta untuk menambahkan peran
aktif masyarakat dalam pendidikan.
BAB
II
PEMBAHASAN
A.
Validitas Instrumen dan Jenisnya
Validitas
berasal dari kata validity yang
berarti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan
fungsi ukurnya. Menurut Scarvia B. Anderson dkk suatu tes dikatakan valid
apabila tes tersebut mengukur apa yang hendak diukur. Valid berarti shahih,
artinya keabsahan instrumen itu tidak diragukan lagi. Suatu tes atau nontes
dari alat ukur atau instrmen pengukuran diikatakan memiliki valiidtas yang tngg
apabla alat tersebut menjalankan fungsi ukurnya atau memberikan hasil ukur yang
sesuai dengan maksud dilakukannya pengukuran itu. Hasil ukur dari pengukuran
merupakan besaran yang mencerminkan secara tepat dan fakta atau keadaan yang
sesungguhnya dari apa yang diukur. Diberikan tes kepada sekelompok orang
misalkan berhubungan dengan kemampuan mekanik terhadap mobil, maka skor yang
diperoleh berhubungan dengan kemampuan seseorang dalam mengendarai dan
memperbaiki mobil bukan kemampuan seseorang berkenaan dengan pengetahuan
tentang mobil seperti macam-macam mobil, jenis mobil yang baik, dan sebagainya.
Contoh lain misalkan gurumemberi tes tentang penalaran kritis seorang siswa
berkaitan dengan soal konsep matematika, bukan skor yang berkaitan dengan
kemampuan penerapan konsep matematika ataukemampuan menyelesaikan soal cerita
dalam matematika.
Validitas
instrumen mempermasalahkan apakah instrumen atau tes tersebut benar-benar mengukur
apa yang hendak diukur. Cureton dalam tahun 1978 yang dikutip Djaali menagatkan
“ the essential question of test validity
iis how well a test does the job it employed to do”. Maksudnya seberapa
jauh suatu tesmampu mengungkapkan dengan tepat cir atau keadaan yang
sesungguhnya dari objek ukur akan tergantung dari tingkat validitas tes yang
bersangkutan.
Ada
suatu sikap yang dbangun pada peneliti atau guru bahwa soal yang dibuat belum
tentu sempurna dan perlu diuji keabsahannya, karena bisa saja ada beberapa soal
tes yang dibuat invalid sehiingga akan bias hasilnya ketika akan diminta siswa
untuk menyelesaikannya. Validitas berasal dari kata validity yang berarti
sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi
ukurnya.
Pada
tahun 1975 Cronbach menyatakan bahwa suatu alat ukur yang valid untuk tujuan
tertentu atau pengambilan keputusan tertentu mungkin tidak valid untuk
tujuan atau pengambilan keputusan lain.
Validitas suatu tes atau alat ukur harus dikaitkan dengan tujuan atau
pegambilan keputusan lain. Validitas suatu tes atau alat ukur harus dikaitka
dengan tujuan, agar soal tes atau nontes yang disusun terarah berangkat dari
tujuan pembelejaran yang ditentukan. Untuk itu perlu dipahami keberadaan
indikator kompetensi suatu pokok bahasan atau subpokok bahasan.
Berdasarkan
pengertian di atas tentang validitas dapatlah dismpulkan definisi validitas
adalah derajat yang menunjukkan sejauh mana ketepatan dan kecermatan suatu alat
ukur tes atau nontes dalam melakukan fungsi ukurnya benar-benar mengukur apa
yang hendak diukur. Alat ukur iitu hanya valid untuk suatu tujuan, tidak
universal. Contoh seorang guru membuat suatu tes matematika yang valid untuk
satuan pendidikan SMA belum tentu valid untuk SMK, walaupun pokok bahasannya
sama misalkan statistik. Derajat validitas hanya berlaku untuk suatu kelompok
tertentu yang memang telah direncanakan pemakainya oleh si pembuat instrumen.
Validitas
suatu instrumen tes secara umum dibagi dua yaitu validitas teori dan validitas
empirik. Pembagan lain dari macam validitas menjadiempat bagian yaitu validitas
isi, konstruk, konkuren, dan prediksi. Validitas konkuren dan validitas
prediksi masuk dalam validitas empirik. Pembagian lain dari validitas adalah
validitas logik dan validitas empirik.
Validitas Secara Umum Dikelompokkan Menjadi Dua :
1.
Validitas teori
Validitas teoritik atau validitas logik adalah
validitas alat evaluasi yang dilakukan berdasarkan pertimbangan (judgement)
teoritik atau logika yang dilakukan oleh para ahli atau orang yang dianggap
ahli. Validitas teori ini pula terbagi atas dua yaitu:
a.
Validitas isi (content validity)
Validitas
isi adalah suatu tes yang mempermasalahkan seberapa jauh suatu tes mengukur
tingkat penguasaan terhadap isi suatu materi tertentu yang seharusnya dikuasai
sesuai dengan tujuan pengajaran. Dalam pengertian lain validitas isi mengacu
pada seberapa banyak materi tes tersebut dapat mengukur keseluruhan bahan atau
materi yang telah diajarkan, merupakan tuntutan yang harus dipenuhi oleh tes
hasil belajar. Validitas isi menurut Sukari adalah derajat di mana sebuah tes
mengukur cakupan substansi yang ingin diukur. Tes yang mempunyai validitas isi
yang baik ialah tes yang benar-benar mengukur penguasan materi yang seharusnya
dikuasai sesuai dengan konten pengajaran yang tercantum dalam garis-garis besar
program pengajaran, tugas atau butir dalam suatu tes atau instrumen mampu
mewakili secara keseluruhan dan proporsional perilaku sampel yang dikenal tes
tersebut. Menurut Suharsini Arikunto “sebuah tes dikatakan memiliki validitas
isi apabila mengukur tujuan pembelajaran tertentu yang sejajar dengan materi
atau isi pembelajaran yang diberikan. Oleh karena itu materi yang diajarkan
tertera dalam kurikulum maka validitas isi ini dikatakan validitas kurikuler.
Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara
memerinci atau materi buku pelajaran. Tes mencerminkan keseluruhan konten atau
materi yang diujikan atau yang seharusnya dikuasai secara proporsional. Untuk
menhgetahui apakah tes itu valid atau tidak harus dilakukan melalui penelaahan
kisi-kisi tes untuk memastikan bahwa soal-soal tes itu sudah mewakili atau
mencerminkan keseluruhan konten atau materi yang seharusnya dikuasai secara
proporsional. Oleh karena itu, validitas isi suau tes tidak mempunyai besaran
tertentu yang dihitung secara statistika, tetapi dipahami bahwa tes itu sudah
valid berdasarkan telaah kisi-kisi tes.
Wierma
dan Jurs (1991) menyatakan bahwa validitas isi sebenarnya mendasarkan pada
analisis logika jadi tidak merupakan suatu koefisien validitas yang dihitung
secara statistika. Untuk memperbaiki validitas suatu tes maka isi suatu tes
harus diusahakan agar mencakup suatu pokok atau subpokok bahasan yang hendak
diukur. Kriteria untuk menentukan proporsi masing-masing pokok atau subpokok
bahasan yang tercakup dalam suatu tes ialah berdasarkan pada banyaknya isi atau
materi masing-masing pokok bahasan atau subpokok bahasan seperti tercantum
dalam kurikulum atau garis-garis besar program pengajaran. Selain itu penentuan
proporsi tersebut dapat pula didasarkan pendapat para ahli dalam bidang yang
bersangkutan. Dengan demikian, dapat dikatakan suatu tes akan mempunyai
validitas isi yang baik jika tes tersebut terdiri dari item-item yang mewakili
semua materi yang hendakdiukur. Salah satu cara yang biasa dilakukan untuk
memperbaiki validitas isi suatu tes ialah dengan menggunakan blue print untuk
menentukan kisi-kisi tes.
b.
Validitas
konstruk (construct validity)
Validitas konstruk adalah validitas
yang mempermasalahkan seberapa jauh item-item tes mampu mengukur apa yang
benar-benar hendak diukur sesuai dengan konsep khusus atau definisi konseptual
yang telah diterapkan. Validitas konstruk biasanya digunakan untuk
instrumen-instrumen yang dimaksudkan untuk mengukur variabel-variabel konsep
baik yang sifatnya performansi tipikal seperti instrumen untuk mengukur sikap,
minat, konsep diri, fokus kontrol, gaya kepemimpinan, motivasi berprestasi, dan
sebagainya maupun yang sifatnya performansi maksimum seperti instrumen untuk
mengukur bakat, intelegensi, kecerdasan emosional, dan sebagainya. Untuk
menentukan validitas konstruk suatu instrumen harus dilakukan proses penelaahan
teoritis dari suatu konsep dari variabel yang hendak diukur, mulai dari
perumusan konstruk, penentuan dimensi dan indikator, sampai kepada penjabaran
dan penulisan butir-butir item instrumen. Perumusan konstruk harus dilakukan
berdasarkan sintesis dari teori-teori mengenai konsep variabel yang hendak
diukur melalui proses analisis dan komparasi yang logik dan cermat. Dimensi dan
indikator dijabarkan dari konstruk yang telah dirumuskan dengan memperhatikan
hal-hal:
1.
Seberapa jauh
indikatoor tersebut merupakan indikator yang tepat dan konstruk yang telah
dirumuskan.
2.
Indikator-indikator
dari suatu konstruk harus homogen, konsisten, dan konvergen untuk mengukur
konstruk dari variabel yang hendak diukur.
3.
Indikator-indikator
tersebut harus lengkapuntuk menguukur suatu konstruk secara utuh.
Butir-butir
instrumen yang ditulis untuk masing-masing indikator harus benar-benar dapat
mengukur secara tepat indikator yang hendak diukur. Jumlah butir untuk mengukur
setiap indikator harus disesuaikan dengan bobot atau penilaian masing-masing
indikator sebagai penanda konsep variabel yang hendak diukur. Validitas
konstruk suatu instrumen harus dilakukan melalui penelaahan atau justifikasi
pakar atau melalui penialaian sekelompok panel yang terdiri dari orang-orang
yang menguasai substansi atau konten dari variabel yang hendak diukur.
2.
Validitas Empiris
Validitas
empiris sama dengan validitas kriteria yang berarti bahwa validitas ditentukan
berdasarkan kriteria baik kriteria internal maupun kriteria eksternal. Kriteria
internal adalah tes atau instrumen itu sendiri yang menjadi kriteria, sedangkan
kriteria eksternal adalah hasil ukur instrumen atau tes lain diluar instrumen
itu sendiri yang menjadi kriteria. Ukuran lain yang dianggap sudah baku atau
dapat dipercaya dapat pula dijadikan sebagai kriteria eksternal. Validitas yang
ditentukan berdasarkan kriteria internal disebut validitas internal sedangkan
validitas yang ditentukan berdasarkan kriteria eksternal disebut validitas
eksternal. Validitas eksternal dapat dijadikan menjadi dua macam yaitu
1.
Validitas
konkuren
Validitas konkuren atau “ada
sekarang” lebih dikenal dengan validitas empiris, dimana suatu tes dikatakan
memeiliki validitas “ada sekarang” jika hasilnya sesuai dengan pengalaman. Kata
sesuai mempunyai konotasi ada dua hal yang dipasangkan dalam hal ini hasil tes
dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hasil yang telah
lampau sehingga data pengalaman tersebut sekarang sudah ada. Misalkan seorang
guru matematika ingin tes sumatif yang disusun sudah valid atau belum untuk itu
diperlukan suatu kriteria masa lalu yang sekarang datanya dimiliki misalkan
nilai ulangan harian atau nilai ulangan sumatif.
2.
Validitas
prediksi
Validitas prediksi adalah tes yang
mempunyai kemampuan meramalkan apa yang akan terjadi pada masa yang akan
datang. Misalkan tes masuk perguruan tinggi diamana ada tes potensi akademik,
tes matematika, tes ipa dan lain-lain, diperkirakan mampu meramal keberhasilan
peserta tes dalam mengikuti kuliah dimasa yang akan datang. Calon yang disaring
berdasarkan hasil tes diharapkan mencerminkan tinggi rendah kemampuan mengikuti
perkuliahan. Jika nilai tesnya tinggi tentu menjamin keberhasilannya dalam
bidang akademik, demikian sebaliknya. Sebagai alat pembanding validitas
prediksi adalah nilai-nilai yang diperoleh peserta tes mengikuti pelajaran di
perguruan tinggi. Jika ternyata siapa yang memiliki nilai tes yang lebih tinggi
gagal dalam ujian semester dibandingkan dengan mahasiswa yang dahulu nilai
tesnya lebih rendah maka tes masuk yang dimaksud itu tidak memiliki validitas
prediksi.
Sedangkan validitas internal
termasuk kelompok validitas kriteria yang merupakan validitas yang diukur
dengan besaran yang menggunakkan instrumen sebagai suatu kesatuan sebagai
kriteria untuk menentukan validtas item atau butir dari instrumen itu. Dengan
demikian internal mempermasalahkan validitas butir atau item suatu instrumen
dengan manggunakan hasil ukur instrumen tersebut konsisten dengan hasil ukur
secara keseluruhan. Oleh karena itu, validitas butir tercermin pada besaran
koefisien korelasi antara skor butir dengan skor total instrumen positif dan
signifikan maka butir tersebut dapat dianggap valid berdasarkan ukuran
validitas internal. Apabila besaran koefisien korelasi yang tinggi antara skor
dan butir dengan skor total instrumen mencerminkan tingginya konsistensi antara
hasil ukur keseluruhan instrumen dengan hasil ukur butir instrumen atau dapat
dikatakan bahwa butir instrumen tersebut konvergen dengan butir-butir lainnya
dalam mengukur suatu konsep atau konstruk yang hendak diukur. Untuk menghitung
koefisien korelasi antara skor butir dengan dengan skor total instrumen
digunakan rumus statistika yang sesuai dengan jenis skor butir dari koefisien
korelasi antara skor butir kontinum maka untuk menghitung koefisien korelasi
antara skor butir dengan skor total instrumen digunakan instrumen digunakan
koefisien korelasi product moment (r)
B.
Reliabilitas Instrumen dan Jenisnya
Realibitas
berasal darikata reliability berarti
sejauh mana hasil suatu pengukuran dapat dipercaya. Suatu hasil pengukuran
hanya dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap
kelompok yang sama diperoleh hasil pengukuran yang relative sama selama aspek yang diukur dalam diri subjek memang
belum berubah. Konsep realibitas dalam arti realibitas alat ukur berkaitan erat
dengan masalah eror pengukuran terjadi apabila dilakukan pengukuran ulang terhaap
kelompok subjek yang sama. Sedangkan konsep relibitas dalam arti reliabilitas
hasil ukur bherkaitan erat dengan error
dalam pengambilan sampel yang mengacu pada kelompok yang berbeda.
Salah
satu syarat agar hasil ukur suatu tes dapat dipercaya ialah tes tersebut harus
mempunyai reliabilitas yang memadai. Hasil pengukuran dikatakan mempunyai
reliabilitas yang tinggi jika hasil pengukuran pertama hamper sama dengan hasil
pengukuran kedua, begitu pula sebaliknya hasil pengukuran mempunyai
reliabilitas yang rendah bila hasil pengukuran pertama jauh berbeda dengan
hasil pengukuran kedua. Bila kita mempunyai tes matematika dan ingin mengetahui reliabilitas tes tersebut termasuk
tinggi atau rendah dapat kita lakukan dengan cara mengujikan set tes tersebut
pada kelas yang sama sebanyak dua kali dengan selisih waktu tidak boleh terlalu
lama dan tidak boleh terlalu dekat. Tenggang waktunya tidak boleh terlalu lama di
khawatirkan adanya penambahan pengetahuan selama selang waktu kedua pengukuran
ini menyebabkan hasilnya bias. Persyaratan tidak boleh terlalu dekat
dikhwatirkan soal tes pada pengukuran
pertama masih kuat dalam ingatan siswa ketika ia menjawab pengukuran kedua. Dikatakan
reliabilitasnya tinggi bila skor tes yang diperoleh siswa mendekati sama antara
pengukuran pertama dan pengukuran kedua. Skor yang sama berarti ajeg/ tetap /
mantap atau realibitasnya tinggi.
rₓₓ=
Jrₓₓ/1+(J-1)rᵧᵧ
rᵧᵧ =
reliabilitaas sebelum penambahan
rₓₓ = reliablitaas sesudah penambahan
J
= rasio jumlah butir soal setelah dan sebelum penambahan
Ada beberapa hal yang mempengaruhi hasil tes yaitu
panjang tes dan kualitas butir soal, berhubungan dengan tercoba, berhubungan
dengan penyelenggara , metode tes ulang, metode belah dua
Kita
juga harus mengukur reliabilitas instrumen penelitian. Reliabilitas adalah
ketepatan atau keajegan hasil yang diperoleh dari suatu pengukuran ( Gronlund
dan Linn, 1990).
Reliabilitas konsistensi tanggapan
responden mempersoalkan apakah tanggapan responden atau objek terhadap tes
sudah baik atau konsisten. Apakah responden terhadap item-item itu tetap mantap
dan masih konsisten ketika dilakukan pengukuran kembali pada obyek yang sama.
Bila pengukuran kedua menunjukkan ketidakkonsistensian maka jelas hasil
pengukuran itu tidak mencerminkan keadaan obyek
yang sesungguhnya. Hasil ukur tes itu tidak dapat dipercaya atau tidak
reliabel. Kita katakan untuk mengetahui apakah tanggapan terhadap tes atau
instrument itu mantap, konsisten dapat dilakukan dengan cara memberikan tes
yang sama secara berulangkali kepada objek ukur responden yang sama. Pengetesan dua kali merupakan syarat
minimal untuk mengetahui apakah
tanggapan objek ukur terhadap tes rersebut konsisten atau tidak. Dalam
pelaksanaan pengetasaan dua kali dapat ditempuh berbagai cara yaitu pengetesan dua kali dengan tes yang sama terhadap objek
ukur yang sama atau dengan melakukan pengetesan sekali dengan menggunakan dua tes
item itemnya setara. Jika kita menggunakan pengetesan sekali maka kesamaan atau
kesetaraan tes yang digunakan mereupakan syarat mutlak yang harus dipenuhi,
karena kemantapan atau konsisten tanggapan terhadap item item itulah yang akan
diperiksa.
Cara mencari besarnya reliabilitas
dapat dilakukan dengan teknik
menggunakan rumus korelasi product moment untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes.
Metode kriteria mencari reliabilitas dibagi menjadi
tiga yaitu:
1.
Metode bentuk
paralel (equivalent)
2.
Metode tes ulang
tes (retest method)
3.
Metode belah dua
(split half method)
Langkah
langkah Penghitungan Reliabilitas tes uraian
sebagai berikut:
1.
Menetukan nilai
varians skor tiap tiap soal. Misal nomor 1: = 2,60110
2.
Menentukan nilai
jumlah varians semua soal.
3.
Menentukan nilai
varians total
4.
Mentukan n =
banyaknya soal
5.
Menetukan nilai
6.
Berdasarkan kriteria
reliabilitas, nilai = 0,82355 berada di antara interval nilai 0,80-1,00 maka
tes uraian tersebut memiliki tingkat reliabilitas tinggi.
Mencari
besar kofisien reliabilitas dengan
metode bentuk paralel atau tes paralel atau tes ekuivalen adalah dua
buah tes yang mempunyai kesamaan tujuan ,tingkat kesukaran dan susunan, tetapi
butur-butir soalnya berbeda dengan istilah alternative form method
( paralel from ). Dua buah tes yang paralel missal tes matematika seri A
yang akan sama, dan hasilnya dikorelasikan, mantap/ ajeg, dapat digunakan sebagai
alat pengetasan yang terandal. Dengan demikian pengetes harus mennyiapkan dua
perangkat tes masing-masing dicobakan pada kelompok yang sama. Metode tes
paralel dikenal juga dengan nama double
test double trial method. Karena
siswa dihadapkan pada dua tes maka tidak
ada faktor masih ingat soalnya yang dalam evaluasi disebut practice effect dan carry
over effect artinya ada faktor yang dibawa oleh testee karena sudah
mengerjakan soal tersebut.
Metode
tes ualang adalah pengetes hanya memiliki satu tes, tetapi dicobakan dua kali.
Istilahnya single tes double trial method.
Kemudian hasil dari kedua kali tes itu dihitung korelasinya. Ada tes yang
banyak mengungkap pengetahuan atau ingatan dan pemahaman. Menggunakan cara ini
tidak tepat karena tercoba akan masih ingat tentang butir-butir soalnya. Solusi masalah
ini tenggang waktu tes pertama dan tes kedua tidak terlalu sempit dan
tidak terlalu lama. Hanya pengalaman yang akan menentukan secara tepat tenggang
waktu ini. Selain itu pada kenyataannya hasil yang kedua cenderung lebih baik
dari pada hasil tes ;pertamaa
karena adanya practice effect atau over
effect . Kepetingan kita dalam mencari
nilai reliabilitas dengan metede ini adalah kesejajaran hasil atau ketetapan
hasil yang ditunjukkan oleh koefisien
korelasi yang tinggi .
Mencari reliabilitas dengan metode belah dua yakni
pengetes hanya menggunakan sebuah tes dan di cobahkan satu kali sehingga
didapat dikofisien korelasi setelah membelah dua dan mengkorelasikan duabelahan
itu. Kemudiaan baru diketahui separuh belahan tes.
Macam pembelahan yaitu pembelahan ganjil genap dan
pembelahan awal akhir yaitu 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 dan kelompok
genap yaitu 2, 4, 6, 8, 10, 12, 14, 16, 18, dan 20. Pembelahan awal akhir
misalkan butir soal awal adalah 1, 2, 3,
4, 5, 6, 7, 8, 9 dan 10 kemudian butir soal yang terakhir adalah 11, 12, 13, 14,
15, 16, 17, 18, 19, dan 20 banyaknya butir soal harus genap misal 20 soal 30 , 36, dan seharusnya, sehingga pembelahannya
sama.
C.
Potensi
Daya Beda Instrumen
Analisis butir soal untuk melihat
daya beda perlu dilakukan agar soal yang kita buat berfungsi dengan baik bagi
guru, siswa maupun proses pembelajaran yang kita lakukan. Secara tidak langsung
menganalisis daya beda butir soal maka kita telah melakukan akan dapat
meningkatkan kualitas butir soal tersebut sehingga kita akan dapat mengukur
hasil belajar dengan tepat dan baik. Dalam menganalisis butir soal ada
karekteristik butir soal yang perlu kita perhatikan yaitu tingkat kesukaran dan
daya beda.
Daya beda butir soal yaitu butir
soal tersebut dapat membedakan kemampuan individu pesreta didik. Karena butir
soal yang didukung oleh potensi daya beda yang baik akan mampu membedakan
peserta didik yang memiliki kemamuan tinggi atau pandai dengan peserta didik yang
memiliki kemampuan rendah atau kurang pandai.
Dalam penyusunan butir soal seperti
tes sebaiknya ada sifat yang menunjukkan kualitasnya sehingga:
1.
Tidak dapat dijawab benar baik oleh siswa
kelompok atas maupun siswa kelomok bawah.
2.
Dapat dijawab benar oleh siswa kelompok
atas tetapi tidak dapat dijawab oleh siswa kelompok bawah.
3.
Dapat dijawab benar oleh siswa kelomok
atas maupun siswa kelompok bawah
Apabila
nomor 1 dan 2 terjadi maka dikatakan soal mempunyai daya pembeda artinya, butir
soal itu dapat membedakan antara siswa yang pandai dengan siswa yang kuramng
pandai. Penggunaan indeks daya pembeda untuk menyeleksi soal pun tidak dapat
diterima sepenuhnya. Konsep daya pembeda mengharuskan ada siswa yang menjawab
salah soal tersebut. Konsekuensinya soal-soal yang mudah dinilai sebagai soal-soal
yang tidak baik. Kita ketahui soal yang dijawab benar
siswa belum tentu soal yang tidak
baik malah justru sebaliknya yang
sering terjadi. Karena materi untuk
soal-soal seperti itu dinilai esensial
guru mengajarkan sedemikian sampai semua siswa
mengerti, penguasaan materi membuat semua siswa dapat menjawab soal tersebut,
sehingga menjadi dasar penilaian soal itu mempunyai tingkat kesukaran yang
sangat rendah dan tidak memiliki daya pembeda. Namun demikian,
butir soal semacam itu tidak boleh dibuang. Membuat soal yang baik
dengan alasan tingkat kesukaran dan daya pembeda yang rendah dinilai akan
berakibat fatal seperti yamg telah diuraikan dalam bagian tentang kesukaran. Apabila ada butir soal untuk menetapkan daya pembedanya.
Kita juga harus mengukur daya
pembeda dari suatu alat ukur atau instrumen daya pembeda instrument seperti tes adalah kemampuan dari tes tersebut dalam memisahkan antar obyek (
kadang kala ditulis subyek ) yang pandai dengan subyek yang kurang pandai. Dalam
mencari daya beda subyek peserta tes dipisahkan menjadi dua sama besar
berdasarkan skor yang mereka peroleh. Rumus yang digunakan untuk
mengetahui daya pembeda setiap butir tes adalah
D
=
Dimana
D = daya
pembeda butir
Rumus
lain menentukan daya beda butir
soal menurut Noehi dkk:
D =PA – PB
D = indeks daya beda butir soal
PA = proporsi kelompok atas yang
menjawab benar
PB = proporsi kelompok bawah yang
menjawab benar
Proporsi kelompok atas adalah
perbandingan jumlah yang benar dari kelompok atas dibagi dengan jumlah kelompok
atas. Proporsi kelompok bawah adalah
jumlah yang benar dari kelompok bawah dibagi dengan jumlah kelompok bawah .
Kelompok atas adalah mereka yang
termasuk mempunyai nilai tinggi dari hasil tes, sedangkan kelompok bawah adalah
mereka mempunyai nilai rendah dari hasil
tesnya. Antara kelompok atas dan bawah ada dikenal dengan keolmpok tengah.
Penentuan kelompok atas dan bawah dilakukan dengan menetapkan 27% dari
keseluruhannya ada pada bagian atas yakni yang tinggi nilainya 27%a da dari
total peserta yang rendah dari nilainya.
Misalkan dari 100 peserta tes ada 27 siswa kelompok bernilai tinggi dan ada 27
siswa yang masuk kelompok yang bernilai rendah. Berarti sebanyak 46 siswa ada
pada kelompok tengah.
Nilai indeks daya beda soal
berangkat dari -1 sampai + 1 semakin
tinggi indeks daya beda hal itu menunjukkan bahwa butir soal tersebut semakin
dapat membedakan antara siswa yang pandai dengan siswa yang kurang. Indeks daya
beda sebesar = 1 akan tercapai apabila semua siswa kelompok atas dapat menjawab
soal dengan benar dan semua kelompok bawah dapat menjawab salah , sebaliknya indeks
daya beda = -1 akan tercapai apabila semua siswa kelompok atas dapat menjawab
salah dan semua kelompok bawah menjawab benar. Sementara itu, indeks beda = 0
akan tercapai apabila proporsi siswa yang menjawab benar dalam kelompok atas dan bawah adalah sama . Ditinjau dari kunci jawaban
butir butir soal yang kunci jawaban mempunyai indeks daya beda negatif adalah
butir soal yang kurang baik karena butir soal tersebut tidak dapat membedakan
siswa yang pandai dengan siswa yang kurang pandai. Dalam hal ini siswa yang
kurang pandai lebih banyak menjawab soal
dengan benar dari pada siswa yang pandai. Jawabanya mempunyai indeks daya beda
positif dan alternatif jawabannya mempunyai daya beda negatif.
D =
D.
Indeks
Kesukaran Instrumen
Tingkat kesukaran butir soal
merupakan salah satu indikator yang dapat menunjukkan kualitas butir soal tersebut
apakah yang termasuk sukar, sedang atau mudah. Suatu soal dikatakan mudah bila
sebagian besar siswa dapat menjawabnya dengan benar dan suatu soal dikatakan
mudah bila sebagian besar siswa tidak dapaat dijawab dengan benar.
Tingkat kesukaran diperoleh dari menghitung presentase
siswa yang dapat menjawab benar soal tersebut. Semakin banyak siswa yang dapat
menjawab benar suatu soal semakin mudah soal itu. Sebaliknya semakin banyak
siswa tidak dapat menjawab soal itu maka semakin sukar soal tersebut.
Tingkat kesukaran dihitung dimulai dari
indeks kesukaran difficulty index yaitu
angka yang menunjukkan proporsi siswa yang menjawab benar soal tersebut. Sebaliknya
semakin kecil angka indeks kesukaran semakin sukar soal tersebut.Indeks
kesukaran disingkat D
Perosedur untuk mencari besarnya
tingkat kesukaran tiap soal. Langkah
Langkahnya sebagai berikut :
1.
Susunlah lembar jawaban berurutan mulai
yang mendapat skor paling tinggi sampai dengan paling rendah.
2.
Membuat dua kelompok dari lembar jawaban
itu yakni satu kelompok mulai dari skor tertinggi dan satu kelompok mulai dari
skor yang terendah.
3.
Untuk setiap soal hitunglah jumlah siswa
yang memilih tiap alternatif jawaban yang ada.
4.
Buatlah catatan
5.
Untuk setiap soal hitunglah jumlah siswa
dalam tiap kelompok yang menjawab betul soal tersebut. Caranya ialah menjumlahkan
kedua angka dibawah kunci jawaban yaitu kemungkinan jawaban yang diberi tanda
bintang.
6.
Hitunglah indeks soal dengan menggunakan
rumus tersebut
D
=
Keterangan
D =
Indeks kesukaran soal
Ba
= jumklah yang menjawab betul soal tersebut dari kelompok bawah
Ja = jumlah lembar jawaban kelompok atas
Jb
= jumlah lembar jawaban kelompok
bawah
Rumus
untuk menghitung kesukaran yaitu:
D
D
= Indeks kesuukaran indeks yang dicari
B
= Jumlah jawaban yang benar
Js
= jumlah semua lembar jawabsan
Dari
indeks kesukaran tiap soal itu dapat dihitung indeks kesukaran seluruh tes.
Caranya ialah dengan menjumlahkan semua indeks dari soal-soal yang dipakai
untuk analisis soal dibagi jumlah semua lembar jawaban (jumlah lembar) kelompok
atas ditambah jumlah lembar jawaban kelompok bawah.
Ada
juga mengistilahkan indeks kesukaran dengan istilah taraf kesukaran. Kita juga
perlu mengetahui taraf kesukaran dari tes yang akan diberikan. Taraf kesukaran
tes adalah kemampuan tes tersebut dalam menjaring banyaknya subyek peserta tes yang dapat mengerjakan dengan
betul. Rumus yang dikembangkan Suharsimi Arikunto tentang taraf kesukaran suatu
soal yang berbeda dalam istilahnya saja. Suharsimi Arikunto memakai taraf kesukaran
tes dinyatakan dalam indeks kesukaran yang dapat dicari dengn rumus :
Dimana
:
P
= Taraf kesukaran
B
= banyaknya subyek yang menjawab betul
J
= Banyaknya yang mengikuti tes
Ada
pendapat bahwa soal yang baik adalah soal yang tidak terlalu sukar dan tidak
terlalu mudah. Alasannya soal yang terlalu mudah tidak merangsang siswa untuk
mempertinggi usaha memecahkan soal tersebut, sedangkan soal yang terlalu sukar
akan menyebabkan siswa putus asa karena pemecahan soal itu berada di luar
kemampuannya lalu tidak lagi semangat mencobanya. Isu demikian tidak dapat lagi
diterima secara mutlak harus dipahami lebih lanjut. Mereka yang beranggappan
soal yang terlalu mudah harus dibuang dan diganti dengan soal yang tiingkat
kesukarannya sedang, dianggap berpandangan keliru. Karena akan mengorbankan
soal yang baik yang dapat dijawab oleh semua siswa.
Ada
butir soal yang mudah, dapat dijawab oleh siswa. Kenapa mereka bisa menjawab
dengan benar? jawabannya karena soal itu
menanyakan materi yang dapat dimengerti
oleh siapapun tanpa usaha sungguh-sungguh . Yang kedua adalah soalnya sungguh-sungguh
memerlukan pemikiran yang serius untuk menjawabnya. Menyadari hal itu guru
mengajarkan pokok bahasan dan subpokok bahasannya, dengan segala macam cara,
pendekatan metode, model pembelajaran sehingga hampir semua siswa benar-benar
memahami kenyataan walaupun soalnya sukar, siswa-siswa telah dilatih dan
mengerti serta paham maka murid dapat mengajarkannya dengan benar dan baik.
Pada
kenyataannya ada bahan atau materi yang
esensial dan sukar, ada materi yang sukar tapi esensial. Maka dalam membuat alat
ukur seperti tes bahan tersebut dirancang sebagai soal tes. Melihat urgensinya
bahan yang sukar dan esensial itu diajarkan sampai siswa mengerti dalam konsep
dan penerapan soalnya. Harapannya ketika
siswa mengerjakan soal yang materi sukar ini maka mereka bisa mengerjakan
dengan nilai terbaik. Dengan demikian, kedudukan jenis soal dengan materi yang
sukar dan esensial harus tetap diberikan agar mutu pendidikan berkembang. Bila
setiap ada kesempatan soal-soal materi yang sukar dan esensial senantiasa diketengahkan
maka tidak mustahil pada akhirnya kita mempunyai siswa-siswa yang pemahaman
matematikanya kelas tinggi.
Penilaian
tingkat kesukaran butir soal sebaiknya dilakukan sebagai penilaian proses dari
suatu penilaian sistematis dari suatu penilaian dimana ahli- ahli yang ada
bekerja sama melakukan penilaian itu. Dalam penilaian butir soal parah ahli itu
serta secara terpisah membaca dan menilai butir soal mempunyai tingkat kesukaran sekian besar.
Langkah-langkah
perhitungan tingkat kesukaraan tingkat kesukaran tes uraian adalah:
1.
Menentukan nilai B = jumlah siswa yang
menjawab benar
2.
Menentukan nilai JS = jumlah skor
maksimun ntuk soal tersebut
3.
Tingkat klesukaran tes
4.
Mengklafikasikan tingkat kesukaran nilai
5.
Perhitungan tingkat kesukaran yang sama
Satu contoh soal
perhubungan dengan cara menganalisis tes uaraian menurut Whitneydan Sabers
yang dikutip Noehi dkk. Dengan prosedur sebagai berikut .
1.
Menentukan jumlah siswa yang termasuk
kelompok soal atas sebanyak 25%
2.
Menentukan jumlah skor kelompok atas dan
jumlah skor kelompok bawah
3.
Hitung tingkat kesukaran dan daya beda
setiap butir soal
P =
P
= indeks tingkat kesukaran
N = 25% peserta didik
Skor maks = skor maksimal setiap
butir tes
Skor min = skor minimal setiap butir
tes
D =
P
=
P
= Indeks
tingkat kesukaran
B
= Jumlah peserta tes yang menjawab benar
N
= jumlah keseluruh peserta tes
D = PA – PB
D
= indeks daya beda
PA
= proporsi kelompok atas yang menjawab benar
PB
= proporsi kelompok bawah yang menjawab benar
E.
Efektifitas
Opsi
Opsi berarti pilihan-pilihan yang diajukan dimana ada
pilihan yang menjadi kunci jawaban dan pilihan pengecoh atau distraktor.
Pilihan ditentukan pembuat soal dengan adanya jalan penyelesaian soal bukan
sembarang. Walaupun jawaban itu salah.
Opsi yang menjadi destraktor atau pengecoh dicantumkan dalam pembuatan soal
harus dikarenakan ( 1) salah konsep ( 2)
salah hitung ,atau (3) salah prosedur. Misalkan ada soal pilihan ganda di bawah
ini:
Seorang ibu membeli kue
bolu di pasar. Sesampai di rumah kue itu akan dibagikan kepada dua tetangga dan
sisanya untuk makan sendiri. Kedua tetangga dibagi masing-masing 1/3 dan ¼,
sisanya untuk keluarga. Berapa besar sisa kue itu dibagi keluarga?
A.1/6 B.5/12 C.5/7
D. 11/12
Kunci B = 5/12
1-(1/3+1/4) = 5/12
Pengecoh 1 salah konsep penjumlahan
1-(1/3+1/4) = 1-2/7 = 5/7
Pengecoh 2 salah konsep pengurangan
1-(1/3+1/4) = 1-4/12-3/12=1-1/12=11/12
Pengecoh 3 salah konsep penjumlahan dan
pengurangan
1-(1/3+1/4) = 1-2/7 =1/1-2/7 = -1/-6 =1/6
Berdasarkan contoh tersebut jelaslah pembuatan
destraktor hars efektif sehingga tidak ada kesan asal jadi atau sembarangan.
BAB
III
PENUTUP
A.
Kesimpulan
Menguji
instrument dalam hal ini perlu sekali, disamping kesesuaian instrument yang
dibuat dengan obyek yang akan diuji dikatakan juga bahwa perlu diuji
kualitasnya intrumen untuk dapat dipakai pada lain kesempatan dan obyek yang
lain dalam satuan pendidikan yang sama. Karena kadang kala ditemukan instrument
seperti tes soal matematika tidak dapat dipakai untuk menguji obyek sekolah
yang berbeda walaupun sama satuan
penndidikannya. Kualitas instrument evaluasi diperlukan karena dengan
kualitas yang tinggi kita dapat mengukur pesrta didik sesuai dengan tingkat
kemampuannya.
B.
Saran
Demikianlah makalah ini kami buat, semoga apa yang telah
disajikan akan memberikan ilmu dan informasi. Selanjutnya demi kesempurnaan
makalah ini kami memohon saran dan kritik guna memperbaiki makalah dikemudian
hari.
DAFTAR
PUSTAKA
Hamzah,ali.2014. Evaluasi
Pembelajaran Matematika.Jakarta: Kharisma Putra Utama Offset.
LAMPIRAN
SOAL-SOAL
1.
Jelaskan yang dimaksud validitas isi?
Jawab:
Validitas
isi adalah suatu tes yang mempermasalahkan seberapa jauh suatu tes mengukur
tingkat penguasaan terhadap isi suatu materi tertentu yang seharusnya dikuasai
sesuai dengan tujuan pengajaran. Dalam pengertian lain validitas isi mengacu
pada seberapa banyak materi tes tersebut dapat mengukur keseluruhan bahan atau
materi yang telah diajarkan, merupakan tuntutan yang harus dipenuhi oleh tes
hasil belajar. Validitas isi menurut Sukari adalah derajat di mana sebuah tes
mengukur cakupan substansi yang ingin diukur.
2.
Jelaskan reliabilitas teknik belah dua
dari Spearman Brown!
Jawab:
Mencari
besar kofisien reliabilitas dengan
metode bentuk paralel atau tes paralel atau tes ekuivalen adalah dua
buah tes yang mempunyai kesamaan tujuan ,tingkat kesukaran dan susunan, tetapi
butur-butir soalnya berbeda dengan istilah alternative form method
( paralel from ). Dua buah tes yang paralel missal tes matematika seri A
yang akan sama, dan hasilnya dikorelasikan, mantap/ ajeg, dapat digunakan sebagai
alat pengetasan yang terandal. Dengan demikian pengetes harus mennyiapkan dua
perangkat tes masing-masing dicobakan pada kelompok yang sama.
3.
Jelaskan tentang efektifitas opsi!
Jawab:
Opsi berarti pilihan-pilihan
yang diajukan dimana ada pilihan yang menjadi kunci jawaban dan pilihan
pengecoh atau distraktor. Pilihan ditentukan pembuat soal dengan adanya jalan
penyelesaian soal bukan sembarang. Walaupun jawaban itu salah. Opsi yang menjadi destraktor atau
pengecoh dicantumkan dalam pembuatan soal harus dikarenakan ( 1) salah konsep ( 2) salah hitung ,atau (3) salah
prosedur.
4.
Jelaskan validitas empirik tipe
internal!
Jawab:
Kriteria internal
adalah tes atau instrumen itu sendiri yang menjadi kriteria, maksudnya butir
soal itu sendiri yang menjadi dasar dalam proses evaluasi.
5.
Jelaskan tentang indeks kesukaran suatu
butir soal!
Jawab:
Tingkat
kesukaran butir soal merupakan salah satu indikator yang dapat menunjukkan
kualitas butir soal tersebut apakah yang termasuk sukar, sedang atau mudah.
Suatu soal dikatakan mudah bila sebagian besar siswa dapat menjawabnya dengan
benar dan suatu soal dikatakan mudah bila sebagian besar siswa
tidak dapaat dijawab dengan benar.
Tingkat kesukaran diperoleh dari menghitung presentase
siswa yang dapat menjawab benar soal tersebut. Semakin banyak siswa yang dapat
menjawab benar suatu soal semakin mudah soal itu. Sebaliknya semakin banyak
siswa tidak dapat menjawab soal itu maka semakin sukar soal tersebut.
Tingkat kesukaran dihitung dimulai dari
indeks kesukaran difficulty index yaitu
angka yang menunjukkan proporsi siswa yang menjawab benar soal tersebut. Sebaliknya
semakin kecil angka indeks kesukaran semakin sukar soal tersebut.
6.
Jelaskan yang dimaksud daya pembeda
suatu butir soal!
Jawab:
Daya beda butir soal
yaitu butir soal tersebut dapat membedakan kemampuan individu pesreta didik.
Karena butir soal yang didukung oleh potensi daya beda yang baik akan mampu
membedakan peserta didik yang memiliki kemamuan tinggi atau pandai dengan
peserta didik yang memiliki kemampuan rendah atau kurang pandai.
7.
Jelaskan apa yang dimaksud dengan
validitas!
Jawab:
Validitas berasal dari kata validity yang berarti sejauh mana
ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya.
8.
Jelaskan apa yang dimaksud dengan
reliabilitas!
Jawab:
Konsep reliabilitas
dalam arti reliabilitas alat ukur
berkaitan erat dengan masalah error pengukuran yang dimana error
pengukuran menunjukkan sejauh mana inkonsistensi hasil pengukurn terjadi
apabila dilakukan pengukuran ulang terhadap kelompok subyek yang sama.
9.
Jelaskan apa yang dimaksud dengan
validitas konkuren!
Jawab:
Validitas
konkuren atau “ada sekarang” lebih dikenal dengan validitas empiris, dimana
suatu tes dikatakan memeiliki validitas “ada sekarang” jika hasilnya sesuai
dengan pengalaman. Kata sesuai mempunyai konotasi ada dua hal yang dipasangkan
dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu
mengenai hasil yang telah lampau sehingga data pengalaman tersebut sekarang
sudah ada. Misalkan seorang guru matematika ingin tes sumatif yang disusun
sudah valid atau belum untuk itu diperlukan suatu kriteria masa lalu yang
sekarang datanya dimiliki misalkan nilai ulangan harian atau nilai ulangan
sumatif.
10. Jelaskan
apa yang dimaksud dengan validitas prediksi!
Jawab:
Validitas
prediksi adalah tes yang mempunyai kemampuan meramalkan apa yang akan terjadi
pada masa yang akan datang. Misalkan tes masuk perguruan tinggi diamana ada tes
potensi akademik, tes matematika, tes ipa dan lain-lain, diperkirakan mampu
meramal keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan
datang.
SOAL DISKUSI
Bagaimanakah
seharusnya cara membuat instrumen evaluasi yang tepat dan ajeg sehingga proses
evaluasi nantinya dimana isntrumen evaluasi nantinya tidak mudah, sedang atau
sukar bagi siswa dalam menjawabnya?
0 komentar:
Post a Comment