IF YOU WANT, YOU CAN

MAKALAH KUALITAS INSTRUMEN EVALUASI

BAB I
PENDAHULUAN
A.      Latar Belakang
Analisis kualitas instrumen evaluasi atau istilah lainnya kualitas alat evaluasi merupakan hal penting dalam melakukan evaluasi karena kita merasa bahwa instrumen atau alat ukur yang dibuat ada banyak kelemahannya dari beberapa sisi. Kelemahan itu bisa terjadi karena alat untuk mengevaluasi tidak tepat untuk mengevaluasi, berbobot mudah, sedang, dan sukar bagi siswa. Soal yang terlalu sukar untuk menilai peserta didik menyebabkan harapan dalam pembelajaran tidak tercapai. Demikian pula halnya dengan instrumen yang terlalu mudah untuk dijawab, menyebabkan kesukaran dalam mengkategorisasikan mana siswa yang pintar dan yang tidak pintar.  Kualitas alat evaluasi dimunculkan ke permukaan ketika seorang guru melakukan tes selesai proses pembelajaran selama empat bulan kemudian hasilnya dicermati dan ternyata tidak sesuai dengan apa yang diharapkan yakni menunjukkan apa di bawah rerata yang dicapai guru. Di manakah letak kesalahannya? Apakah ada di guru atau di siswa?
            Kalau kesalahan ada pada guru maka menjadi persoalan baru adalah bagaimana metode mengajar yang dilakukan guru? Bagaimanakah keadaan alat evaluasi itu?
Ada cara dengan mengumpulkan rencana pelaksanaan pembelajaran selama empat bulan dilihat dan dianalisis tujuan pembelajaran yang ditulis tidak terlalu tinggi, sesuai dangan tingkat perkembangan siswa. Dilihat dari sisi lain yaitu proses pelaksanaan pembelajaran yang dilakukan guru, berjalan dengan baik sesuai dengan acuan rencana pelaksanaan pembelajaran seperti memilih metode, pendekatan, startegi, dan media yang baik untuk mendukung proses pembelajaran.
Ada hubungan timbal balik antara tujuan pembelajaran, proses pembelajaran dan penilaian hasil belajar. Bila kedua hal yakni tujuan dan proses pembelajaran tidak bermasalah maka persoalan yang ada dengan nilai hasil belajar rendah tidak sesuai dengan yang diharapkan, adalah alat penilaian. Dipertanyakan alat kualitas penilaian apakah sudah baik atu belum untuk mengukur tujuan pembelajaran dan indikator kompetensi yang telah ditentukan?
Menguji instrumen dalam hal ini perlu sekali, di samping kesesuaian instrumen yang dibuat dengan objekyang akan diuji diakatakan juga bahwaperlu diuji kualitas instrumen untuk dapat dipakai pada lain kesempatan dan objek lain dalam satuan pendidikan yang sama. Kadangkala kita menemui instrumen seperti tes soal matematika yang tidak dapat diapakai untukmenguji objek sekolah yang berbeda walaupun sama satuan pendidikannya. Kualitas instrumen evaluasi yang rendah menyebabkan produk lulusan yang tidak baik.
Beberapa manfaat dan kepentingan lain perlunya kualitas instrumen evaluasi yang baik antara lain untuk:
1.      membentuk bank soal standar
2.      menentukan grade tingkat mutu lembaga pendidikan
3.      memudahkan mengambil data lapangan yang berkualitas.
Dalam menganalisis kualitas instrumen evaluasi dilakukan uji validitas, uji realibiltas, daya beda instrumen dan tingkat kesukaran instrumen.

B.       Rumusan Masalah
1.         Apa yang dimaksud validitas instrumen dan jenisnya?
2.         Apa yang dimaksud reliabilitas instrumen dan jenisnya?
3.         Bagaimanakah menentukan daya beda instrumen?
4.         Apa yang dimaksud indeks kesukaran instrumen?
5.         Bagaimanakah menentukan efektifitas opsi?

C.      Tujuan Penulisan
1.         Untuk mengetahui pengertian validitas instrumen dan jenisnya.
2.         Untuk mengetahui pengertian reliabilitas instrumen dan jenisnya.
3.         Untuk mengetahui cara menentukan daya beda instrumen.
4.         Untuk mengetahui pengertian indeks kesukaran instrumen.
5.         Untuk mengetahui cara menentukan efektifitas opsi.

D.      Manfaat Penulisan
            Manfaat yang dapat diperoleh dari penulisan makalah ini mencakup beberapa yang terkait diantaranya sebagai berikut :
1.        Bagi Mahasiswa
Makalah ini dapat digunakan sebagai bahan referensi atau  masukan tentang kualitas alat penilaian. Kualitas alat penilaian ini sangat bermanfaat bagi mahasiswa sebagai calon guru.


2.        Bagi Masyarakat umum
Sebagai bahan bacaan yang bermanfaat untuk menambah pengetahuan tentang evaluasi pembelajaran bahas, serta untuk menambahkan peran aktif masyarakat dalam pendidikan.



















BAB II
PEMBAHASAN
A.      Validitas Instrumen dan Jenisnya
Validitas berasal dari kata validity yang berarti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Menurut Scarvia B. Anderson dkk suatu tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Valid berarti shahih, artinya keabsahan instrumen itu tidak diragukan lagi. Suatu tes atau nontes dari alat ukur atau instrmen pengukuran diikatakan memiliki valiidtas yang tngg apabla alat tersebut menjalankan fungsi ukurnya atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran itu. Hasil ukur dari pengukuran merupakan besaran yang mencerminkan secara tepat dan fakta atau keadaan yang sesungguhnya dari apa yang diukur. Diberikan tes kepada sekelompok orang misalkan berhubungan dengan kemampuan mekanik terhadap mobil, maka skor yang diperoleh berhubungan dengan kemampuan seseorang dalam mengendarai dan memperbaiki mobil bukan kemampuan seseorang berkenaan dengan pengetahuan tentang mobil seperti macam-macam mobil, jenis mobil yang baik, dan sebagainya. Contoh lain misalkan gurumemberi tes tentang penalaran kritis seorang siswa berkaitan dengan soal konsep matematika, bukan skor yang berkaitan dengan kemampuan penerapan konsep matematika ataukemampuan menyelesaikan soal cerita dalam matematika.
Validitas instrumen mempermasalahkan apakah instrumen atau tes tersebut benar-benar mengukur apa yang hendak diukur. Cureton dalam tahun 1978 yang dikutip Djaali menagatkan “ the essential question of test validity iis how well a test does the job it employed to do”. Maksudnya seberapa jauh suatu tesmampu mengungkapkan dengan tepat cir atau keadaan yang sesungguhnya dari objek ukur akan tergantung dari tingkat validitas tes yang bersangkutan.
Ada suatu sikap yang dbangun pada peneliti atau guru bahwa soal yang dibuat belum tentu sempurna dan perlu diuji keabsahannya, karena bisa saja ada beberapa soal tes yang dibuat invalid sehiingga akan bias hasilnya ketika akan diminta siswa untuk menyelesaikannya. Validitas berasal dari kata validity yang berarti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya.
Pada tahun 1975 Cronbach menyatakan bahwa suatu alat ukur yang valid untuk tujuan tertentu atau pengambilan keputusan tertentu mungkin tidak valid untuk tujuan   atau pengambilan keputusan lain. Validitas suatu tes atau alat ukur harus dikaitkan dengan tujuan atau pegambilan keputusan lain. Validitas suatu tes atau alat ukur harus dikaitka dengan tujuan, agar soal tes atau nontes yang disusun terarah berangkat dari tujuan pembelejaran yang ditentukan. Untuk itu perlu dipahami keberadaan indikator kompetensi suatu pokok bahasan atau subpokok bahasan.
Berdasarkan pengertian di atas tentang validitas dapatlah dismpulkan definisi validitas adalah derajat yang menunjukkan sejauh mana ketepatan dan kecermatan suatu alat ukur tes atau nontes dalam melakukan fungsi ukurnya benar-benar mengukur apa yang hendak diukur. Alat ukur iitu hanya valid untuk suatu tujuan, tidak universal. Contoh seorang guru membuat suatu tes matematika yang valid untuk satuan pendidikan SMA belum tentu valid untuk SMK, walaupun pokok bahasannya sama misalkan statistik. Derajat validitas hanya berlaku untuk suatu kelompok tertentu yang memang telah direncanakan pemakainya oleh si pembuat instrumen.
Validitas suatu instrumen tes secara umum dibagi dua yaitu validitas teori dan validitas empirik. Pembagan lain dari macam validitas menjadiempat bagian yaitu validitas isi, konstruk, konkuren, dan prediksi. Validitas konkuren dan validitas prediksi masuk dalam validitas empirik. Pembagian lain dari validitas adalah validitas logik dan validitas empirik.
Validitas Secara Umum Dikelompokkan Menjadi Dua :
1.        Validitas teori
Validitas teoritik atau validitas logik adalah validitas alat evaluasi yang dilakukan berdasarkan pertimbangan (judgement) teoritik atau logika yang dilakukan oleh para ahli atau orang yang dianggap ahli. Validitas teori ini pula terbagi atas dua yaitu:
a.         Validitas isi (content validity)
Validitas isi adalah suatu tes yang mempermasalahkan seberapa jauh suatu tes mengukur tingkat penguasaan terhadap isi suatu materi tertentu yang seharusnya dikuasai sesuai dengan tujuan pengajaran. Dalam pengertian lain validitas isi mengacu pada seberapa banyak materi tes tersebut dapat mengukur keseluruhan bahan atau materi yang telah diajarkan, merupakan tuntutan yang harus dipenuhi oleh tes hasil belajar. Validitas isi menurut Sukari adalah derajat di mana sebuah tes mengukur cakupan substansi yang ingin diukur. Tes yang mempunyai validitas isi yang baik ialah tes yang benar-benar mengukur penguasan materi yang seharusnya dikuasai sesuai dengan konten pengajaran yang tercantum dalam garis-garis besar program pengajaran, tugas atau butir dalam suatu tes atau instrumen mampu mewakili secara keseluruhan dan proporsional perilaku sampel yang dikenal tes tersebut. Menurut Suharsini Arikunto “sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan pembelajaran tertentu yang sejajar dengan materi atau isi pembelajaran yang diberikan. Oleh karena itu materi yang diajarkan tertera dalam kurikulum maka validitas isi ini dikatakan validitas kurikuler. Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara memerinci atau materi buku pelajaran. Tes mencerminkan keseluruhan konten atau materi yang diujikan atau yang seharusnya dikuasai secara proporsional. Untuk menhgetahui apakah tes itu valid atau tidak harus dilakukan melalui penelaahan kisi-kisi tes untuk memastikan bahwa soal-soal tes itu sudah mewakili atau mencerminkan keseluruhan konten atau materi yang seharusnya dikuasai secara proporsional. Oleh karena itu, validitas isi suau tes tidak mempunyai besaran tertentu yang dihitung secara statistika, tetapi dipahami bahwa tes itu sudah valid berdasarkan telaah kisi-kisi tes.
Wierma dan Jurs (1991) menyatakan bahwa validitas isi sebenarnya mendasarkan pada analisis logika jadi tidak merupakan suatu koefisien validitas yang dihitung secara statistika. Untuk memperbaiki validitas suatu tes maka isi suatu tes harus diusahakan agar mencakup suatu pokok atau subpokok bahasan yang hendak diukur. Kriteria untuk menentukan proporsi masing-masing pokok atau subpokok bahasan yang tercakup dalam suatu tes ialah berdasarkan pada banyaknya isi atau materi masing-masing pokok bahasan atau subpokok bahasan seperti tercantum dalam kurikulum atau garis-garis besar program pengajaran. Selain itu penentuan proporsi tersebut dapat pula didasarkan pendapat para ahli dalam bidang yang bersangkutan. Dengan demikian, dapat dikatakan suatu tes akan mempunyai validitas isi yang baik jika tes tersebut terdiri dari item-item yang mewakili semua materi yang hendakdiukur. Salah satu cara yang biasa dilakukan untuk memperbaiki validitas isi suatu tes ialah dengan menggunakan blue print untuk menentukan kisi-kisi tes.
b.      Validitas konstruk (construct validity)
            Validitas konstruk adalah validitas yang mempermasalahkan seberapa jauh item-item tes mampu mengukur apa yang benar-benar hendak diukur sesuai dengan konsep khusus atau definisi konseptual yang telah diterapkan. Validitas konstruk biasanya digunakan untuk instrumen-instrumen yang dimaksudkan untuk mengukur variabel-variabel konsep baik yang sifatnya performansi tipikal seperti instrumen untuk mengukur sikap, minat, konsep diri, fokus kontrol, gaya kepemimpinan, motivasi berprestasi, dan sebagainya maupun yang sifatnya performansi maksimum seperti instrumen untuk mengukur bakat, intelegensi, kecerdasan emosional, dan sebagainya. Untuk menentukan validitas konstruk suatu instrumen harus dilakukan proses penelaahan teoritis dari suatu konsep dari variabel yang hendak diukur, mulai dari perumusan konstruk, penentuan dimensi dan indikator, sampai kepada penjabaran dan penulisan butir-butir item instrumen. Perumusan konstruk harus dilakukan berdasarkan sintesis dari teori-teori mengenai konsep variabel yang hendak diukur melalui proses analisis dan komparasi yang logik dan cermat. Dimensi dan indikator dijabarkan dari konstruk yang telah dirumuskan dengan memperhatikan hal-hal:
1.      Seberapa jauh indikatoor tersebut merupakan indikator yang tepat dan konstruk yang telah dirumuskan.
2.      Indikator-indikator dari suatu konstruk harus homogen, konsisten, dan konvergen untuk mengukur konstruk dari variabel yang hendak diukur.
3.      Indikator-indikator tersebut harus lengkapuntuk menguukur suatu konstruk secara utuh.
Butir-butir instrumen yang ditulis untuk masing-masing indikator harus benar-benar dapat mengukur secara tepat indikator yang hendak diukur. Jumlah butir untuk mengukur setiap indikator harus disesuaikan dengan bobot atau penilaian masing-masing indikator sebagai penanda konsep variabel yang hendak diukur. Validitas konstruk suatu instrumen harus dilakukan melalui penelaahan atau justifikasi pakar atau melalui penialaian sekelompok panel yang terdiri dari orang-orang yang menguasai substansi atau konten dari variabel yang hendak diukur.






2.        Validitas Empiris
Validitas empiris sama dengan validitas kriteria yang berarti bahwa validitas ditentukan berdasarkan kriteria baik kriteria internal maupun kriteria eksternal. Kriteria internal adalah tes atau instrumen itu sendiri yang menjadi kriteria, sedangkan kriteria eksternal adalah hasil ukur instrumen atau tes lain diluar instrumen itu sendiri yang menjadi kriteria. Ukuran lain yang dianggap sudah baku atau dapat dipercaya dapat pula dijadikan sebagai kriteria eksternal. Validitas yang ditentukan berdasarkan kriteria internal disebut validitas internal sedangkan validitas yang ditentukan berdasarkan kriteria eksternal disebut validitas eksternal. Validitas eksternal dapat dijadikan menjadi dua macam yaitu
1.        Validitas konkuren
            Validitas konkuren atau “ada sekarang” lebih dikenal dengan validitas empiris, dimana suatu tes dikatakan memeiliki validitas “ada sekarang” jika hasilnya sesuai dengan pengalaman. Kata sesuai mempunyai konotasi ada dua hal yang dipasangkan dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hasil yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada. Misalkan seorang guru matematika ingin tes sumatif yang disusun sudah valid atau belum untuk itu diperlukan suatu kriteria masa lalu yang sekarang datanya dimiliki misalkan nilai ulangan harian atau nilai ulangan sumatif.
2.        Validitas prediksi
            Validitas prediksi adalah tes yang mempunyai kemampuan meramalkan apa yang akan terjadi pada masa yang akan datang. Misalkan tes masuk perguruan tinggi diamana ada tes potensi akademik, tes matematika, tes ipa dan lain-lain, diperkirakan mampu meramal keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan datang. Calon yang disaring berdasarkan hasil tes diharapkan mencerminkan tinggi rendah kemampuan mengikuti perkuliahan. Jika nilai tesnya tinggi tentu menjamin keberhasilannya dalam bidang akademik, demikian sebaliknya. Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh peserta tes mengikuti pelajaran di perguruan tinggi. Jika ternyata siapa yang memiliki nilai tes yang lebih tinggi gagal dalam ujian semester dibandingkan dengan mahasiswa yang dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud itu tidak memiliki validitas prediksi.
            Sedangkan validitas internal termasuk kelompok validitas kriteria yang merupakan validitas yang diukur dengan besaran yang menggunakkan instrumen sebagai suatu kesatuan sebagai kriteria untuk menentukan validtas item atau butir dari instrumen itu. Dengan demikian internal mempermasalahkan validitas butir atau item suatu instrumen dengan manggunakan hasil ukur instrumen tersebut konsisten dengan hasil ukur secara keseluruhan. Oleh karena itu, validitas butir tercermin pada besaran koefisien korelasi antara skor butir dengan skor total instrumen positif dan signifikan maka butir tersebut dapat dianggap valid berdasarkan ukuran validitas internal. Apabila besaran koefisien korelasi yang tinggi antara skor dan butir dengan skor total instrumen mencerminkan tingginya konsistensi antara hasil ukur keseluruhan instrumen dengan hasil ukur butir instrumen atau dapat dikatakan bahwa butir instrumen tersebut konvergen dengan butir-butir lainnya dalam mengukur suatu konsep atau konstruk yang hendak diukur. Untuk menghitung koefisien korelasi antara skor butir dengan dengan skor total instrumen digunakan rumus statistika yang sesuai dengan jenis skor butir dari koefisien korelasi antara skor butir kontinum maka untuk menghitung koefisien korelasi antara skor butir dengan skor total instrumen digunakan instrumen digunakan koefisien korelasi product moment (r)
B.       Reliabilitas Instrumen dan Jenisnya
Realibitas berasal darikata reliability berarti sejauh mana hasil suatu pengukuran dapat dipercaya. Suatu hasil pengukuran hanya dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok yang sama diperoleh hasil pengukuran yang relative sama selama aspek yang diukur dalam diri subjek memang belum berubah. Konsep realibitas dalam arti realibitas alat ukur berkaitan erat dengan masalah eror pengukuran terjadi apabila dilakukan pengukuran ulang terhaap kelompok subjek yang sama. Sedangkan konsep relibitas dalam arti reliabilitas hasil ukur bherkaitan erat dengan error  dalam pengambilan sampel yang mengacu pada kelompok yang berbeda.
Salah satu syarat agar hasil ukur suatu tes dapat dipercaya ialah tes tersebut harus mempunyai reliabilitas yang memadai. Hasil pengukuran dikatakan mempunyai reliabilitas yang tinggi jika hasil pengukuran pertama hamper sama dengan hasil pengukuran kedua, begitu pula sebaliknya hasil pengukuran mempunyai reliabilitas yang rendah bila hasil pengukuran pertama jauh berbeda dengan hasil pengukuran kedua. Bila kita mempunyai tes matematika dan ingin  mengetahui reliabilitas tes tersebut termasuk tinggi atau rendah dapat kita lakukan dengan cara mengujikan set tes tersebut pada kelas yang sama sebanyak dua kali dengan selisih waktu tidak boleh terlalu lama dan tidak boleh terlalu dekat.  Tenggang waktunya tidak boleh terlalu lama di khawatirkan adanya penambahan pengetahuan selama selang waktu kedua pengukuran ini menyebabkan hasilnya bias. Persyaratan tidak boleh terlalu dekat dikhwatirkan soal tes pada  pengukuran pertama masih kuat dalam ingatan siswa ketika ia menjawab pengukuran kedua. Dikatakan reliabilitasnya tinggi bila skor tes yang diperoleh siswa mendekati sama antara pengukuran pertama dan pengukuran kedua. Skor yang sama berarti ajeg/ tetap / mantap atau realibitasnya tinggi.
Realibitas tes dapat ditingkatkan dengan menambahkan butir soal kedalam butir soal tersebut. Setiap penambahan butir soal belum tentu dapat meningkatkan kualitas reliabilitas, bisa meningkatkan bila penambahan butir soal adalah homogen dengan butir soal yang sudah ada. Homogen yang dimaksud disini adalah butir soal yang mengukur hal yang sama dengan butir soal yang sudah ada. Rumus mencari kofisien reliabilitas yang baru adalah :
                                    rₓₓ= Jrₓₓ/1+(J-1)rᵧᵧ
       rᵧᵧ =  reliabilitaas sebelum penambahan
       rₓₓ = reliablitaas sesudah penambahan
       J   = rasio jumlah butir soal setelah dan sebelum penambahan
Ada beberapa hal yang mempengaruhi hasil tes yaitu panjang tes dan kualitas butir soal, berhubungan dengan tercoba, berhubungan dengan penyelenggara , metode tes ulang, metode belah dua
            Kita juga harus mengukur reliabilitas instrumen penelitian. Reliabilitas adalah ketepatan atau keajegan hasil yang diperoleh dari suatu pengukuran ( Gronlund dan Linn, 1990).
            Reliabilitas konsistensi tanggapan responden mempersoalkan apakah tanggapan responden atau objek terhadap tes sudah baik atau konsisten. Apakah responden terhadap item-item itu tetap mantap dan masih konsisten ketika dilakukan pengukuran kembali pada obyek yang sama. Bila pengukuran kedua menunjukkan ketidakkonsistensian maka jelas hasil pengukuran itu tidak mencerminkan keadaan obyek  yang sesungguhnya. Hasil ukur tes itu tidak dapat dipercaya atau tidak reliabel. Kita katakan untuk mengetahui apakah tanggapan terhadap tes atau instrument itu mantap, konsisten dapat dilakukan dengan cara memberikan tes yang sama secara berulangkali kepada objek ukur responden yang  sama. Pengetesan dua kali merupakan syarat minimal untuk mengetahui  apakah tanggapan objek ukur terhadap tes rersebut konsisten atau tidak. Dalam pelaksanaan pengetasaan dua kali dapat ditempuh berbagai cara yaitu pengetesan  dua kali dengan tes yang sama terhadap objek ukur yang sama atau dengan melakukan pengetesan sekali dengan menggunakan dua tes item itemnya setara. Jika kita menggunakan pengetesan sekali maka kesamaan atau kesetaraan tes yang digunakan mereupakan syarat mutlak yang harus dipenuhi, karena kemantapan atau konsisten tanggapan terhadap item item itulah yang akan diperiksa.
Cara mencari besarnya reliabilitas dapat  dilakukan dengan teknik menggunakan rumus korelasi product moment untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes.
Metode kriteria mencari reliabilitas dibagi menjadi tiga yaitu:
1.        Metode bentuk paralel (equivalent)
2.        Metode tes ulang tes (retest method)
3.        Metode belah dua (split half method)
Langkah langkah Penghitungan Reliabilitas tes uraian  sebagai berikut:
1.        Menetukan nilai varians skor tiap tiap soal. Misal nomor 1: = 2,60110
2.        Menentukan nilai jumlah  varians semua soal.
3.        Menentukan nilai varians total
4.        Mentukan n = banyaknya  soal
5.        Menetukan nilai
6.        Berdasarkan kriteria reliabilitas, nilai = 0,82355 berada di antara interval nilai 0,80-1,00 maka tes uraian tersebut memiliki tingkat reliabilitas tinggi.
            Mencari besar kofisien reliabilitas dengan  metode bentuk paralel atau tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan ,tingkat kesukaran dan susunan, tetapi butur-butir soalnya berbeda dengan istilah alternative form  method  ( paralel from ). Dua buah tes yang paralel missal tes matematika seri A yang akan sama, dan hasilnya dikorelasikan, mantap/ ajeg, dapat digunakan sebagai alat pengetasan yang terandal. Dengan demikian pengetes harus mennyiapkan dua perangkat tes masing-masing dicobakan pada kelompok yang sama. Metode tes paralel dikenal juga dengan nama double test  double trial method. Karena siswa dihadapkan pada dua tes maka  tidak ada faktor masih ingat soalnya yang dalam evaluasi disebut practice effect dan carry over effect artinya ada faktor yang dibawa oleh testee karena sudah mengerjakan soal tersebut.
            Metode tes ualang adalah pengetes hanya memiliki satu tes, tetapi dicobakan dua kali. Istilahnya single tes double trial method. Kemudian hasil dari kedua kali tes itu dihitung korelasinya. Ada tes yang banyak mengungkap pengetahuan atau ingatan dan pemahaman. Menggunakan cara ini tidak tepat karena tercoba akan masih ingat tentang butir-butir soalnya. Solusi  masalah  ini tenggang waktu tes pertama dan tes kedua tidak terlalu sempit dan tidak terlalu lama. Hanya pengalaman yang akan menentukan secara tepat tenggang waktu ini. Selain itu pada kenyataannya hasil yang kedua cenderung lebih baik dari pada  hasil tes ;pertamaa karena  adanya practice effect atau over effect . Kepetingan  kita dalam mencari nilai reliabilitas dengan metede ini adalah kesejajaran hasil atau ketetapan hasil yang  ditunjukkan oleh koefisien korelasi yang tinggi .
Mencari reliabilitas dengan metode belah dua yakni pengetes hanya menggunakan sebuah tes dan di cobahkan satu kali sehingga didapat dikofisien korelasi setelah membelah dua dan mengkorelasikan duabelahan itu. Kemudiaan baru diketahui separuh belahan tes.
Macam pembelahan yaitu pembelahan ganjil genap dan pembelahan awal akhir yaitu 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 dan kelompok genap yaitu 2, 4, 6, 8, 10, 12, 14, 16, 18, dan 20. Pembelahan awal akhir misalkan  butir soal awal adalah 1, 2, 3, 4, 5, 6, 7, 8, 9 dan 10 kemudian butir soal yang terakhir adalah 11, 12, 13, 14, 15, 16, 17, 18, 19, dan 20 banyaknya butir soal harus genap misal 20 soal  30 , 36, dan seharusnya, sehingga pembelahannya sama.
C.      Potensi Daya Beda Instrumen
            Analisis butir soal untuk melihat daya beda perlu dilakukan agar soal yang kita buat berfungsi dengan baik bagi guru, siswa maupun proses pembelajaran yang kita lakukan. Secara tidak langsung menganalisis daya beda butir soal maka kita telah melakukan akan dapat meningkatkan kualitas butir soal tersebut sehingga kita akan dapat mengukur hasil belajar dengan tepat dan baik. Dalam menganalisis butir soal ada karekteristik butir soal yang perlu kita perhatikan yaitu tingkat kesukaran dan daya beda.
            Daya beda butir soal yaitu butir soal tersebut dapat membedakan kemampuan individu pesreta didik. Karena butir soal yang didukung oleh potensi daya beda yang baik akan mampu membedakan peserta didik yang memiliki kemamuan tinggi atau pandai dengan peserta didik yang memiliki kemampuan rendah atau kurang pandai.
            Dalam penyusunan butir soal seperti tes sebaiknya ada sifat yang menunjukkan kualitasnya sehingga:
1.        Tidak dapat dijawab benar baik oleh siswa kelompok atas maupun siswa kelomok bawah.
2.        Dapat dijawab benar oleh siswa kelompok atas tetapi tidak dapat dijawab oleh siswa kelompok bawah.
3.        Dapat dijawab benar oleh siswa kelomok atas maupun siswa kelompok bawah
Apabila nomor 1 dan 2 terjadi maka dikatakan soal mempunyai daya pembeda artinya, butir soal itu dapat membedakan antara siswa yang pandai dengan siswa yang kuramng pandai. Penggunaan indeks daya pembeda untuk menyeleksi soal pun tidak dapat diterima sepenuhnya. Konsep daya pembeda mengharuskan ada siswa yang menjawab salah soal tersebut. Konsekuensinya soal-soal yang mudah dinilai sebagai soal-soal yang tidak baik. Kita ketahui soal yang dijawab benar siswa belum tentu soal yang tidak  baik  malah justru sebaliknya yang sering terjadi. Karena  materi untuk soal-soal seperti  itu dinilai esensial guru mengajarkan sedemikian sampai semua siswa  mengerti, penguasaan materi membuat semua siswa dapat menjawab soal tersebut, sehingga menjadi dasar penilaian soal itu mempunyai tingkat kesukaran yang sangat rendah dan tidak memiliki daya pembeda. Namun  demikian,  butir soal semacam itu tidak boleh dibuang. Membuat soal yang baik dengan alasan tingkat kesukaran dan daya pembeda yang rendah dinilai akan berakibat fatal seperti yamg telah diuraikan dalam bagian tentang  kesukaran. Apabila ada butir soal untuk  menetapkan daya pembedanya.
            Kita juga harus mengukur daya pembeda dari suatu alat ukur atau instrumen daya pembeda instrument seperti tes adalah kemampuan dari tes  tersebut dalam memisahkan antar obyek ( kadang kala ditulis subyek ) yang pandai dengan subyek yang kurang pandai. Dalam mencari daya beda subyek peserta tes dipisahkan menjadi dua sama besar berdasarkan skor yang mereka peroleh. Rumus yang digunakan untuk mengetahui  daya  pembeda setiap butir tes adalah


           
                                    D =
            Dimana
D  =  daya pembeda butir
             banyaknya kelompok atas yang menjwab betul
             banyaknyya  kelompok bawah yang menjawab betul
              banyanksubjek kelompok bawah
Rumus lain menentukan daya beda  butir soal  menurut Noehi dkk:
            D =PA – PB
            D = indeks daya beda butir soal
            PA = proporsi kelompok atas yang menjawab benar
            PB = proporsi kelompok bawah yang menjawab benar
            Proporsi kelompok atas adalah perbandingan jumlah yang benar dari kelompok atas dibagi dengan jumlah kelompok atas. Proporsi  kelompok bawah adalah jumlah yang benar dari kelompok bawah dibagi dengan jumlah kelompok bawah . Kelompok atas adalah  mereka yang termasuk mempunyai nilai tinggi dari hasil tes, sedangkan kelompok bawah adalah mereka mempunyai nilai  rendah dari hasil tesnya. Antara kelompok atas dan bawah ada dikenal dengan keolmpok tengah. Penentuan kelompok atas dan bawah dilakukan dengan menetapkan 27% dari keseluruhannya ada pada bagian atas yakni yang tinggi nilainya 27%a da dari total peserta yang rendah  dari nilainya. Misalkan dari 100 peserta tes ada 27 siswa kelompok bernilai tinggi dan ada 27 siswa yang masuk kelompok yang bernilai rendah. Berarti sebanyak 46 siswa ada pada kelompok tengah.
            Nilai indeks daya beda soal berangkat dari -1  sampai + 1 semakin tinggi indeks daya beda hal itu menunjukkan bahwa butir soal tersebut semakin dapat membedakan antara siswa yang pandai dengan siswa yang kurang. Indeks daya beda sebesar = 1 akan tercapai apabila semua siswa kelompok atas dapat menjawab soal dengan benar dan semua kelompok bawah dapat menjawab salah , sebaliknya indeks daya beda = -1 akan tercapai apabila semua siswa kelompok atas dapat menjawab salah dan semua kelompok bawah menjawab benar. Sementara itu, indeks beda = 0 akan tercapai apabila proporsi siswa yang menjawab benar  dalam kelompok atas dan bawah  adalah sama . Ditinjau dari kunci jawaban butir butir soal yang kunci jawaban mempunyai indeks daya beda negatif adalah butir soal yang kurang baik  karena  butir soal tersebut tidak dapat membedakan siswa yang pandai dengan siswa yang kurang pandai. Dalam hal ini siswa yang kurang  pandai lebih banyak menjawab soal dengan benar dari pada siswa yang pandai. Jawabanya mempunyai indeks daya beda positif dan alternatif jawabannya mempunyai daya beda negatif.
Rumus lain  tentang  daya pembeda
            D =
             banyaknya kelompok atas  yang menjawab  betul
             banyaknya kelompok bawah yang menjawab betul
             banyaknya subyek kelompok atas
             = banyaknya subyek kelompok bawah
D.      Indeks Kesukaran Instrumen
            Tingkat kesukaran butir soal merupakan salah satu indikator yang dapat menunjukkan kualitas butir soal tersebut apakah yang termasuk sukar, sedang atau mudah. Suatu soal dikatakan mudah bila sebagian besar siswa dapat menjawabnya dengan benar dan suatu soal dikatakan mudah bila sebagian besar  siswa  tidak dapaat dijawab dengan benar.
            Tingkat  kesukaran diperoleh dari menghitung presentase siswa yang dapat menjawab benar soal tersebut. Semakin banyak siswa yang dapat menjawab benar suatu soal semakin mudah soal itu. Sebaliknya semakin banyak siswa tidak dapat menjawab soal itu maka semakin sukar soal tersebut. Tingkat  kesukaran dihitung dimulai dari indeks kesukaran difficulty index yaitu angka yang menunjukkan proporsi siswa yang menjawab benar soal tersebut. Sebaliknya semakin kecil angka indeks kesukaran semakin sukar soal tersebut.Indeks kesukaran disingkat D
            Perosedur untuk mencari besarnya tingkat kesukaran tiap soal. Langkah  Langkahnya sebagai berikut :
1.        Susunlah lembar jawaban berurutan mulai yang mendapat skor paling tinggi sampai dengan paling rendah.
2.        Membuat dua kelompok dari lembar jawaban itu yakni satu kelompok mulai dari skor tertinggi dan satu kelompok mulai dari skor yang terendah.
3.        Untuk setiap soal hitunglah jumlah siswa yang memilih tiap alternatif jawaban yang ada.
4.        Buatlah catatan
5.        Untuk setiap soal hitunglah jumlah siswa dalam tiap kelompok yang menjawab betul soal tersebut. Caranya ialah menjumlahkan kedua angka dibawah kunci jawaban yaitu kemungkinan jawaban yang diberi tanda bintang.
6.        Hitunglah indeks soal dengan menggunakan rumus  tersebut
D =
            Keterangan
D   = Indeks kesukaran soal
Ba = jumklah yang menjawab betul soal tersebut dari kelompok bawah
Ja  = jumlah lembar jawaban kelompok atas
Jb  = jumlah lembar jawaban kelompok bawah 
Rumus untuk menghitung kesukaran yaitu:
                             D
D = Indeks kesuukaran indeks yang dicari
B = Jumlah jawaban yang benar
Js = jumlah semua lembar jawabsan
Dari indeks kesukaran tiap soal itu dapat dihitung indeks kesukaran seluruh tes. Caranya ialah dengan menjumlahkan semua indeks dari soal-soal yang dipakai untuk analisis soal dibagi jumlah semua lembar jawaban (jumlah lembar) kelompok atas ditambah jumlah lembar jawaban kelompok bawah.
Ada juga mengistilahkan indeks kesukaran dengan istilah taraf kesukaran. Kita juga perlu mengetahui taraf kesukaran dari tes yang akan diberikan. Taraf kesukaran tes adalah kemampuan tes tersebut dalam menjaring banyaknya subyek  peserta tes yang dapat mengerjakan dengan betul. Rumus yang dikembangkan Suharsimi Arikunto tentang taraf kesukaran suatu soal yang berbeda dalam istilahnya saja. Suharsimi Arikunto memakai taraf kesukaran tes dinyatakan dalam indeks kesukaran  yang dapat dicari dengn rumus :
                                    P =   
Dimana :
P = Taraf kesukaran
B = banyaknya subyek yang menjawab betul
J = Banyaknya yang mengikuti tes
Ada pendapat bahwa soal yang baik adalah soal yang tidak terlalu sukar dan tidak terlalu mudah. Alasannya soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkan soal tersebut, sedangkan soal yang terlalu sukar akan menyebabkan siswa putus asa karena pemecahan soal itu berada di luar kemampuannya lalu tidak lagi semangat mencobanya. Isu demikian tidak dapat lagi diterima secara mutlak harus dipahami lebih lanjut. Mereka yang beranggappan soal yang terlalu mudah harus dibuang dan diganti dengan soal yang tiingkat kesukarannya sedang, dianggap berpandangan keliru. Karena akan mengorbankan soal yang baik yang dapat dijawab oleh semua siswa.
Ada butir soal yang mudah, dapat dijawab oleh siswa. Kenapa mereka bisa menjawab dengan benar? jawabannya karena soal  itu menanyakan materi yang  dapat dimengerti oleh siapapun tanpa usaha sungguh-sungguh . Yang kedua adalah soalnya sungguh-sungguh memerlukan pemikiran yang serius untuk menjawabnya. Menyadari hal itu guru mengajarkan pokok bahasan dan subpokok bahasannya, dengan segala macam cara, pendekatan metode, model pembelajaran sehingga hampir semua siswa benar-benar memahami kenyataan walaupun soalnya sukar, siswa-siswa telah dilatih dan mengerti serta paham maka murid dapat mengajarkannya dengan benar dan baik.
Pada kenyataannya ada bahan atau materi  yang esensial dan sukar, ada materi yang sukar tapi esensial. Maka dalam membuat alat ukur seperti tes bahan tersebut dirancang sebagai soal tes. Melihat urgensinya bahan yang sukar dan esensial itu diajarkan sampai siswa mengerti dalam konsep dan penerapan  soalnya. Harapannya ketika siswa mengerjakan soal yang materi sukar ini maka mereka bisa mengerjakan dengan nilai terbaik. Dengan demikian, kedudukan jenis soal dengan materi yang sukar dan esensial harus tetap diberikan agar mutu pendidikan berkembang. Bila setiap ada kesempatan soal-soal materi yang sukar dan esensial senantiasa diketengahkan maka tidak mustahil pada akhirnya kita mempunyai siswa-siswa yang pemahaman matematikanya kelas tinggi.
Penilaian tingkat kesukaran butir soal sebaiknya dilakukan sebagai penilaian proses dari suatu penilaian sistematis dari suatu penilaian dimana ahli- ahli yang ada bekerja sama melakukan penilaian itu. Dalam penilaian butir soal parah ahli itu serta secara terpisah membaca dan menilai butir soal mempunyai  tingkat kesukaran sekian besar.
Langkah-langkah perhitungan tingkat kesukaraan tingkat kesukaran tes uraian adalah:
1.                   Menentukan nilai B = jumlah siswa yang menjawab benar
2.                   Menentukan nilai JS = jumlah skor maksimun ntuk soal tersebut
3.                   Tingkat klesukaran tes
4.                   Mengklafikasikan tingkat  kesukaran nilai
5.                   Perhitungan tingkat kesukaran yang sama
Satu contoh soal perhubungan dengan cara menganalisis tes uaraian menurut Whitneydan  Sabers  yang dikutip Noehi dkk. Dengan prosedur sebagai berikut .
1.        Menentukan jumlah siswa yang termasuk kelompok soal atas sebanyak 25%
2.        Menentukan jumlah skor kelompok atas dan jumlah skor kelompok bawah
3.        Hitung tingkat kesukaran dan daya beda setiap butir soal 
Rumus  yang ditentukan itu adalah
 P =
            P    =  indeks tingkat kesukaran
              jumlah skor kelompok atas
             = jumlah skor kelompok bawah
            N = 25% peserta didik
            Skor maks = skor maksimal setiap butir tes
            Skor min = skor minimal setiap butir tes        



                                     D =  
 Menghitung tingkat kesukaran soal yaitu
                                    P =
P =  Indeks  tingkat kesukaran
B =  Jumlah peserta tes yang menjawab benar
N =  jumlah keseluruh  peserta tes
Menghitung beda soal yaitu
                        D = PA – PB
D = indeks daya beda
PA = proporsi kelompok atas yang menjawab benar
PB = proporsi kelompok bawah yang menjawab benar

E.       Efektifitas Opsi
            Opsi berarti pilihan-pilihan yang diajukan dimana ada pilihan yang menjadi kunci jawaban dan pilihan pengecoh atau distraktor. Pilihan ditentukan pembuat soal dengan adanya jalan penyelesaian soal bukan sembarang. Walaupun jawaban  itu salah. Opsi yang menjadi destraktor atau pengecoh dicantumkan dalam pembuatan soal harus dikarenakan ( 1)  salah konsep ( 2) salah hitung ,atau (3) salah prosedur. Misalkan ada soal pilihan ganda di bawah ini:
Seorang ibu membeli kue bolu di pasar. Sesampai di rumah kue itu akan dibagikan kepada dua tetangga dan sisanya untuk makan sendiri. Kedua tetangga dibagi masing-masing 1/3 dan ¼, sisanya untuk keluarga. Berapa besar sisa kue itu dibagi keluarga?
A.1/6   B.5/12 C.5/7  D. 11/12
Kunci B = 5/12
1-(1/3+1/4) = 5/12
Pengecoh 1 salah konsep penjumlahan
1-(1/3+1/4) = 1-2/7 = 5/7
Pengecoh 2 salah konsep pengurangan
1-(1/3+1/4) = 1-4/12-3/12=1-1/12=11/12
Pengecoh 3 salah konsep penjumlahan dan pengurangan
1-(1/3+1/4) = 1-2/7 =1/1-2/7 = -1/-6 =1/6
 Berdasarkan contoh tersebut jelaslah pembuatan destraktor hars efektif sehingga tidak ada kesan asal jadi atau sembarangan.















BAB III
PENUTUP
A.      Kesimpulan
Menguji instrument dalam hal ini perlu sekali, disamping kesesuaian instrument yang dibuat dengan obyek yang akan diuji dikatakan juga bahwa perlu diuji kualitasnya intrumen untuk dapat dipakai pada lain kesempatan dan obyek yang lain dalam satuan pendidikan yang sama. Karena kadang kala ditemukan instrument seperti tes soal matematika tidak dapat dipakai untuk menguji obyek sekolah yang berbeda walaupun sama satuan  penndidikannya. Kualitas instrument evaluasi diperlukan karena dengan kualitas yang tinggi kita dapat mengukur pesrta didik sesuai dengan tingkat kemampuannya.

B.       Saran
Demikianlah makalah ini kami buat, semoga apa yang telah disajikan akan memberikan ilmu dan informasi. Selanjutnya demi kesempurnaan makalah ini kami memohon saran dan kritik guna memperbaiki makalah dikemudian hari.






DAFTAR PUSTAKA
Hamzah,ali.2014. Evaluasi Pembelajaran Matematika.Jakarta: Kharisma Putra Utama Offset.




















LAMPIRAN
SOAL-SOAL
1.        Jelaskan yang dimaksud validitas isi?
Jawab:
Validitas isi adalah suatu tes yang mempermasalahkan seberapa jauh suatu tes mengukur tingkat penguasaan terhadap isi suatu materi tertentu yang seharusnya dikuasai sesuai dengan tujuan pengajaran. Dalam pengertian lain validitas isi mengacu pada seberapa banyak materi tes tersebut dapat mengukur keseluruhan bahan atau materi yang telah diajarkan, merupakan tuntutan yang harus dipenuhi oleh tes hasil belajar. Validitas isi menurut Sukari adalah derajat di mana sebuah tes mengukur cakupan substansi yang ingin diukur.
2.        Jelaskan reliabilitas teknik belah dua dari Spearman Brown!
Jawab:
Mencari besar kofisien reliabilitas dengan  metode bentuk paralel atau tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan ,tingkat kesukaran dan susunan, tetapi butur-butir soalnya berbeda dengan istilah alternative form  method  ( paralel from ). Dua buah tes yang paralel missal tes matematika seri A yang akan sama, dan hasilnya dikorelasikan, mantap/ ajeg, dapat digunakan sebagai alat pengetasan yang terandal. Dengan demikian pengetes harus mennyiapkan dua perangkat tes masing-masing dicobakan pada kelompok yang sama.

3.        Jelaskan tentang efektifitas opsi!
Jawab:
Opsi berarti pilihan-pilihan yang diajukan dimana ada pilihan yang menjadi kunci jawaban dan pilihan pengecoh atau distraktor. Pilihan ditentukan pembuat soal dengan adanya jalan penyelesaian soal bukan sembarang. Walaupun jawaban  itu salah. Opsi yang menjadi destraktor atau pengecoh dicantumkan dalam pembuatan soal harus dikarenakan ( 1)  salah konsep ( 2) salah hitung ,atau (3) salah prosedur.
4.        Jelaskan validitas empirik tipe internal!
Jawab:
Kriteria internal adalah tes atau instrumen itu sendiri yang menjadi kriteria, maksudnya butir soal itu sendiri yang menjadi dasar dalam proses evaluasi.
5.        Jelaskan tentang indeks kesukaran suatu butir soal!
Jawab:
Tingkat kesukaran butir soal merupakan salah satu indikator yang dapat menunjukkan kualitas butir soal tersebut apakah yang termasuk sukar, sedang atau mudah. Suatu soal dikatakan mudah bila sebagian besar siswa dapat menjawabnya dengan benar dan suatu soal dikatakan mudah bila sebagian besar  siswa  tidak dapaat dijawab dengan benar.
Tingkat  kesukaran diperoleh dari menghitung presentase siswa yang dapat menjawab benar soal tersebut. Semakin banyak siswa yang dapat menjawab benar suatu soal semakin mudah soal itu. Sebaliknya semakin banyak siswa tidak dapat menjawab soal itu maka semakin sukar soal tersebut. Tingkat  kesukaran dihitung dimulai dari indeks kesukaran difficulty index yaitu angka yang menunjukkan proporsi siswa yang menjawab benar soal tersebut. Sebaliknya semakin kecil angka indeks kesukaran semakin sukar soal tersebut.
6.        Jelaskan yang dimaksud daya pembeda suatu butir soal!
Jawab:
Daya beda butir soal yaitu butir soal tersebut dapat membedakan kemampuan individu pesreta didik. Karena butir soal yang didukung oleh potensi daya beda yang baik akan mampu membedakan peserta didik yang memiliki kemamuan tinggi atau pandai dengan peserta didik yang memiliki kemampuan rendah atau kurang pandai.
7.        Jelaskan apa yang dimaksud dengan validitas!
Jawab:
Validitas berasal dari kata validity yang berarti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya.
8.        Jelaskan apa yang dimaksud dengan reliabilitas!
Jawab:
Konsep reliabilitas dalam arti reliabilitas alat ukur  berkaitan erat dengan masalah error pengukuran yang dimana error pengukuran menunjukkan sejauh mana inkonsistensi hasil pengukurn terjadi apabila dilakukan pengukuran ulang terhadap kelompok  subyek yang sama.


9.        Jelaskan apa yang dimaksud dengan validitas konkuren!
Jawab:
Validitas konkuren atau “ada sekarang” lebih dikenal dengan validitas empiris, dimana suatu tes dikatakan memeiliki validitas “ada sekarang” jika hasilnya sesuai dengan pengalaman. Kata sesuai mempunyai konotasi ada dua hal yang dipasangkan dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hasil yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada. Misalkan seorang guru matematika ingin tes sumatif yang disusun sudah valid atau belum untuk itu diperlukan suatu kriteria masa lalu yang sekarang datanya dimiliki misalkan nilai ulangan harian atau nilai ulangan sumatif.
10.    Jelaskan apa yang dimaksud dengan validitas prediksi!
Jawab:
Validitas prediksi adalah tes yang mempunyai kemampuan meramalkan apa yang akan terjadi pada masa yang akan datang. Misalkan tes masuk perguruan tinggi diamana ada tes potensi akademik, tes matematika, tes ipa dan lain-lain, diperkirakan mampu meramal keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan datang.

SOAL DISKUSI

Bagaimanakah seharusnya cara membuat instrumen evaluasi yang tepat dan ajeg sehingga proses evaluasi nantinya dimana isntrumen evaluasi nantinya tidak mudah, sedang atau sukar bagi siswa dalam menjawabnya?
Share on Google Plus

About Unknown

This is a short description in the author block about the author. You edit it by entering text in the "Biographical Info" field in the user admin panel.
    Blogger Comment
    Facebook Comment

0 komentar:

Post a Comment