BAB I
PENDAHULUAN
A. Latar Belakang Masalah
Tidak ada usaha guru yang lebih baik selain usaha untuk selalu meningkatkan mutu tes yang disusunnya. Namun, hal ini tidak dilaksanakan karena kecenderungan seseorang untuk beranggapan bahwa hasil karyanya adalah yang terbaik atau setidak-tidaknya sudah cukup baik.
Guru yang sudah banyak berpengalaman, mengajar, dan menyusun soal-soal tes, juga masih sukar menyadari bahwa tesnya masih belum sempurna. Oleh karena itu, cara yang paling baik adalah secara jujur melihat hasil yang diperoleh oleh siswa.
Secara teoretis, siswa dalam satu kelas merupakan populasi atau kelompok yang keadaanya heterogen. Dengan demikian, maka apabila dikenai sebuah tes akan tercemin hasilnya dalam suatu kurva normal. Sebagian besar siswa berada didaerah sedang, sebagian kecil berada diekor kiri, dan sebagian kecil yang lain berada diekor kanan kurva.
Apabila keadaan setelah hasil tes dianalisis tidak seperti yang diharapakan dalam kurva normal, maka tentu ada “apa-apa” dengan soal tesnya.
Apabila hampir seluruh siswa memperoleh skor jelek. Berarti bahwa tes yang disusun mungkin terlalu sukar. Sebaliknya jika seluruh siswa memperoleh skor yang baik dapat diartikan bahwa tesnya terlalu mudah. Tentu saja interpretasi terhadap soal tes akan lain seandainya itu sudah disusun sebaik-baiknya sehingga memenuhi persyaratan
Berikut akan dijelaskan mengenai apa saja hal yang di analasis dalam butir-butir soal.
|
1 |
B. Rumusan Masalah
1. BagaimanaTeknik Analisis Soal Tes (Item Analysis)?
2. BagaimanaTaraf Kesukaran Soal?
3. Bagaimana Daya Pembeda?
4. BagaimanaAnalisis Validitas Tes?
5. Bagaimana Analisis Reliabilitas Tes?
6. Bagaimana Analisisi Fungsi Distraktor?
C. Tujuan
1. Untuk mengetahuiTeknik Analisis Soal Tes (Item Analysis).
2. Untuk mengetahui Taraf Kesukaran Soal.
3. Untuk mengetahuiDaya Pembeda.
4. Untuk mengetahui Analisis Validitas Tes.
5. Untuk mengetahuiAnalisis Reliabilitas Tes.
6. Untuk Mengetahui Analisisi Fungsi Distraktor.
|
2 |
|
3 |
BAB II
PEMBAHASAN
A. Teknik Analisis Soal Tes (Item Analysis)
Salah satu cara untuk memperbaiki proses belajar-mengajar yang paling efektif ialah dengan jalan mengevaluasi tes hasil belajar yang diperoleh dari proses belajar-mengajar itu sendiri. Dengan kata lain, hasil tes itu kita olah sedemikian rupa sehingga dari hasil pengolahan itu dapat diketahui komponen-komponen manakah dari proses belajar-mengajar itu yang masih lemah.
Menurut Thorndike dan Hagen, analisis terhadap soal-soal (items) tes yang telah dijawab oleh murid-murid mempunya dua tujuan penting. Pertama, jawaban-jawaban soal itu merupakan informasi diagnostic untuk meneliti pelajaran dari kelas itu dan kegagalan-kegagalan belajarnya, serta selanjutnya membimbing ke arah belajar yang baik. Kedua, jawaban-jawaban terhadap soal-soal yang terpisah dan perbaikan (review) soal-soal yang didasarkan atas jawaban-jawaban itu merupakan basis bagi penyiapan tes-tes yang lebih baik untuk tahun berikutnya.
Jadi, Analisis soal antara lain bertujuan utuk mengadakan indentifikasi soal-soal yang baik, dan soal yang jelek. Dengan mengetahui soal-soal yang tidak baik itu selanjutnya kita dapat mencari kemungkinan sebab-sebab mengapa item itu tidak baik. Dengan analisis soal dapat diperoleh informasi tentang kejelekan sebuah soal dan “petunjuk” untuk mengadakan perbaikan.
|
4 |
B. Taraf Kesukaran Soal
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena diluar jangkaunnya.
Bilangan yang menunjukkan sukar dan mudahnya sesuatu soal disebut Indeks Kesukaran (difficulty Index). Biasanya indeks kesukaran antara 0,00 sampai dengan 1,0. Indeks kesukaran ini menunjukkan taraf kesukaran soal. Soal dengan indeks kesukaran 0,0 menunjukkan bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukkan bahwa soalnya terlalu mudah.
Didalam istilah evaluasi, indeks kesukaran ini diberi symbol P (p besar), singkatan dari kata “proporsi”. Dengan demikian maka soal dengan P =0,70 lebih mudah jika dibandingkan dengan P=0,20.
Sebaliknya soal dengan P=0,30 lebih sukar daripada soal dengan P=0,80.
Melihat besarnya bilangan indeks ini, maka lebih cocok jika bukan disebut sebagai indeks kesukaran tetapi indeks kemudahan atau undeks fasilitas, karena semakin mudah soal itu, semakin besar pula bilangan indeksnya. Akan tetapi telah disepakati bahwa walaupun semakin tinggi indeksnya menunjukkan soal yang semakin mudah, tetapi tetap disebut indeks kesukaran.
|
5 |
Rumus mencari P adalah: P=
Dimana:
P = indeks kesukaran
B = banyaknya siswa yang menjawab soal itu dengan betul
JS= jumlah seluruh siswa peserta tes
Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut:
1. Soal dengan P 0,00 sampai 0,30 adalah soal sukar
2. Soal dengan P 0,31 sampai 0,70 adalah soal sedang
3. Soal dengan P 0,71 sampai 1,00 adalah soal mudah
Perlu diketahui bahwa soal-soal yang terlalu mudah atau terlalu sukar, lalu tidak berarti tidak boleh digunakan. Hal ini tergantung penggunannya. Jika dari pengikut yang banyak, kita menghendaki yang lulus hanya sedikit, kita ambil siswa yang paling top. Untuk ini maka lebih baik diambilkan butir-butir tes yang sukar.
Sebaliknya jika kekurangan pengikut ujian, kita pilihkan soal-soal yang mudah. Selain itu, soal yang sukar akan menambah gairah belajar bagi siswa yang pandai, sedangkan soal-soal yang terlalu mudah, akan membangkitkan semangat kepada siswa yang lemah.
C. Daya Pembeda
Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan. Antara siswa yang pandai (berkemampuan tinggi) dengan siswa bodoh (berkemampuan rendah). Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi, disingkat D (d besar).[4]Seperti halnya indeks kesukaran, indeks diskriminasi (daya pembeda) ini berkisar antara 0,00 sampai 1,00.
Hanya bedanya, indeks kesukaran tidak mengenal tanda negative (-), tetapi pada indeks diskriminasi ada tanda negative. Tanda negative pada indeks diskriminasi digunakan jika sesuatu soal “terbalik” menunjukkan
|
6 |
kualitas testee. Yaitu anak pandai disebut bodoh dan anak bodoh disebut pandai.
Bagi suatu soal yang dapat dijawab benar oleh siswa pandai maupun siswa bodoh, maka soal itu tidak baik karena tidak mempunyai daya pembeda. Demikian pula jika semua siswa baik pandai maupun bodoh tidak dapat menjawab dengan benar. Soal tersebut tidak baik juga karena tidak mempunyai daya pembeda. Soal yang baik adalah soal yang dapat dijawab benar oleh siswa-siwa yang pandai saja.
Seluruh pengikut tes dikelompokkan menjadi dua, kelompok atas dan kelompok bawah. Jika seluruh kelompok atas dapat menjawab soal tersebut dengan benar, sedang seluruh kelompok bawah menjawab salah maka, soal tersebut mempunyai D paling besar, yaitu 1,00. Sebaliknya jika semua kelompok atas menjawab salah, tetapi semua kelompok bawah menjawab betul, maka nilai D-nya -1,00. Tetapi jika siswa kelompok atas dan siswa kelompok bawah sama-sama menjawab benar atau sma-sama menjawab salah, maka soal tersebut mempunyai nilai D 0,00. Karena tidak mempunyai daya pembeda sama sekali.
a. Cara menentukan daya pembeda ( nilai D)
Untuk ini perlu dibedakan antara kelompok kecil (kurang dari 100) dan kelompok besar (100 orang keatas).
1) Untuk kelompok kecil
Seluruh kelompok testee dibagi dua sama besar, 50% kelompok atas dan 50% kelompok bawah
B 8
C 7 kelompok atas ( )
D 7
E 6
F 5 kelompok bawah ( )
G 3
H 4
|
7 |
I 4
J 3
Seluruh pengikut tes, dideretkan mulai dari skor teratas sampai terbawah, lalu dibagi 2 (dua)
2) Untuk kelompok besar
Mengingat biaya dan waktu untuk menganalisis,
maka untuk kelompok besar biasanya hanya diambil kedua kutubnya saja,
yaitu
27%
skor teratas sebagai kelompok atas (
) dan 27% skor
terbawah sebagai kelompok bawah (
)
= Jumlah kelompok atas
= Jumlah kelompok bawah
Rumus mencari D
Rumus untuk menentukan indeks diskriminasi adalah :
D=
Dimana :
J = Jumlah peserta tes.
banyaknya peserta kelompok atas.
banyaknya peserta kelompok bawah.
banyaknya peserta kelompok atas yang menjawab soal itu dengan benar
banyaknya peserta kelompok bawah yang menjawab soal itu dengan
Benar
|
8 |
proporsi peserta kelompok atas yang menjawab benar ( ingat, p sebagai
Indeks kesukaran)
proporsi peserta kelompok bawah yang menjawab benar.
Marilah kita perhatikan tabel analisis lagi, khusus untuk butir soal nomor1.
a. Dari kelompok atas yang menjawab betul 8 orang
b. Dari kelompok bawah yang menjawab betul 3 orang
Kita terapkan dalam rumus indeks diskriminasi :
= 10 10 = 0,3
= 8 3
Maka, D =
= 0,8 – 0,3
= 0,5.
Dengan demikian maka indeks diskriminasi untuk soal nomor 1 adalah 0,5.
Sekarang kita perhatikan butir soal nomor 8
10 0,8 10 = 0,9
8 =9
Maka, D =
= 0,8- 0,9
= -0,1
Butir soal ini jelek karena lebih banyak dijawab benar oleh kelompok bawah dibandingkan dengan jawaban benar dari kelompok atas. Ini berarti bahwa untuk menjawab soal dengan benar, dapat dilakukan dengan menebak.
|
9 |
Butir-butir soal yang baik adalah butir-butir soal yang mempunyai indeks diskriminasi 0,4 sampai dengan 0,7.
Klasifikasi daya pembeda
D : 0,00 – 0,20 : jelek (poor)
D : 0,21 – 0,40 : cukup (satistifactory)
D : 0,41 – 0,70 : baik (good)
D : 0,71 – 1,00 : baik sekali (excellent)
D : negatif, semuanya tidak baik. Jadi semua butir soal yang mempunyai nilai D negatif sebaiknya dibuang saja.
D. Analisis Validitas Tes
1. Pengertian Validitas Item
Dimaksud dengan validitas item dari suatu tes adalah, ketepatan mengukur yang dimiliki oleh sebutir item (yang merupakan bagian tak terpisahkan dari tes sebagai suatu totalitas), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut.
Dengan kata lain, validitas butir adalah butir tes dapat menjalankan fungsi pengukurannya dengan baik, hal ini dapat diketahui dari seberapa besar peran yang diberikan oleh butir soal tes tersebut dalam mencapai keseluruhan skor seluruh tes.
Apabila kita memperhatikan secara cermat, maka tes-tes hasil belajar yang dibuat atau disusun oleh para pengajar, baik guru, dosen, staf pengajar lainnya, sebenarnya adalah merupakan kumpulandaris sekian banyak item-item dengan item mana para penyusun tes ingin mengukur atau mengungkap hasil belajar yang telah dicapai oleh masing-masing individu atau peserta didik, setelah mereka mengikuti proses pembelajaran. Dalam jangka waktu tertentu pernyataan itu mengandung makna, bahwa sebenarnya setiap butir item yang ada dalam tes hasil belajar itu, adalah merupakan bagian tak terpisahkan dari tes hasil belajar tersebut sebagai suatu totalitas.
|
10 |
Erat hubungan antara butir item dengan tes hasil belajar sebagai suatu totalitas itu kiranya dapat dipahami dari kenyataan, bahwa semakin banyak butir-butir item yang dapat dijawab dengan betul oleh testee,
maka skor-skor total hasil tes tersebut akan semakin tinggi. Begitu juga sebaliknya.
Untuk dapat mengetahui besar kecilnya peran tersebut adalah dengan jalan mengkorelasikan antara skor yang diperoleh dari butir tersebut dengan skor totalnya.
E. Analisis Reliabilitas Tes
Reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Reliabilitas sering diartikan dengan keterandalan, artinya auatu tes memiliki keterandalan bilamana tes tersebut dipakai mengukur berulang-ulang hasilnya sama.Maka pengertian Reliabilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan tidak berarti.
Konsep tentang Reliabilitas ini tidak akan sulit dimengerti apabila pembaca telah memahami konsep validitas. Tuntutan bahwa instrument evaluasi harus valid menyangkut harapan diperolehnya data yang valid, sesuai dengan kenyataan. Dalam hal reliabilitas ini tuntutannya tidak jauh berbeda. Jika validitas terkait dengan ketepatan objek yang tidak lain adalah tidak menyimpangnya data dari kenyataan, artinya bahwa data tersebut benar, maka konsep reliabilitas terkait dengan pemotretan barkali-kali. Instrument yang baik adalah instrument yang dapat dengan ajeg memberikan data yang sesuai dengan kenyataan.
Yang sering ditangkap kurang tepat adalah adanya pendapat bahwa “ajeg” atau “tetap” diartikan sebagai “sama”. Ajeg atau tetap tidak selalu harus sama, tetapi mengikuti perubahan secara ajeg.
|
11 |
Sehubungan dengan reliabilitas, Scarvia B. Anderson dan kawan-kawan menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini penting. Dalam hal ini, validitas lebih penting, dan reliabilitas ini perlu,
karena menyokong terbentuknya validitas. Sebuah tes mungkin reliable tetapi tidak valid. Sebaliknya, sebuah tes yang valid biasanya reliable.
F. Analisisi Fungsi Distraktor
Pada saat membicarakan tentang tes obyektif bentuk multiple choice item telah dikemukakan bahwa pada tes obyektif bentuk multiple choice item tersebut untuk setiap butir item yang dikeluarkan dalam hasil tes belajar telah dilengkapi dengan beberapa kemungkinan jawab, atau yang sering dikenal dengan istilah option atau alternatif.
Option atau alternatif itu jumlahnya berkisar antara tiga sampai dengan lima buah, dan dari kemungkinan-kemungkinan jawab yang terpasang pada setiap butir item itu, salah satu diantaranya adalah merupakan jawaban betul (= kunci jawaban), sedangkan sisanya adalah merupakan jawaban salah. Jawaban-jawaban salah itulah yang biasa dikenal dengan istilah distractor (distraktor = pengecoh).
Menganalisis fungsi distraktor sering dikenal dengan istilah lain, yaitu: menganalisis pola penyebaran jawaban item. Adapun yang dimaksud dengan pola penyebaran jawaban item ialah suatu pola yang dapat menggambarkan bagaimana testee menentukan pilihan jawabnya terhadap kemungkinan-kemungkinan jawab yang telah dipasangkan pada setiap butir.
Pola jawaban soal dapat ditentukan apakah pengecoh (distraktor) berfungsi sebagai pengecoh dengan baik atau tidak. Pengecoh yang tidak dipilih sama sekali oleh testee berarti bahwa pengecoh itu jelek, terlalu menyolok atau menyesatkan. Sebaliknya sebuah distraktor (pengecoh) dapat dikatakan berfungsi dengan baik apabila distarktor tersebut mempunyai daya tarik yang besar bagi pengikut-pengikut tes yang kurang memahami konsep atau kurang menguasai bahan.
|
12 |
Dengan melihat pola jawaban soal, dapat diketahui ;
1) Taraf kesukaraan soal.
2) Daya pembeda soal.
3) Baik dan tidaknya distraktor.
Sesuatu distraktor dapat diperlakukan dengan 3 (tiga) cara;
1) Diterima, karena sudah baik.
2) Ditolak, karena tidak baik, dan
3) Ditulis kembali, karena kurang baik.
Kekuranganya mungkin hanya terletak pada rumusan kalimatnya sehingga perlu ditulis kembali, dengan perubahan seperlunya. Menulis soal adalah suatu perkerjaan yang sulit, sehingga apabila masih dapat diperbaiki saja, tidak dibuang. Suatu distraktor dapat dikatakan berfungsi baik jika paling sedikit dipilih oleh 5% pengikut tes.
Dalam setiap tes obyekif selalu digunakan alternatif jawaban yang mengendung dua unsure sekaligus, yaitu jawaban tepat dan jawaban yang salah sebagai penyesat (distraktor). Tujuan pemakaian distraktor ini adalah mengecohkan mereka yang kurang mampu (tidak tahu) untuk dapat dibedakan dengan yang mampu. Oleh karena itu distraktor yang baik adalah yang dapat dihindari oleh anak-anak yang pandai dan terpilih oleh anak-anak yang kurang pandai.
Tujuan utama dari pemasangan distraktor pada setiap butir item itu adalah, agar dari sekian banyak testee yang mengikuti hasil tes belajar ada yang tertarik atau terangsang untuk memilihnya, sebab mereka menyangka bahwa distraktor yang mereka pilih itu merupakan jawaban betul.
BAB III
PENUTUP
A. Kesimpulan
Analisis soal antara lain bertujuan utuk mengadakan indentifikasi soal-soal yang baik, dan soal yang jelek. Dengan mengetahui soal-soal yang tidak baik itu selanjutnya kita dapat mencari kemungkinan sebab-sebab mengapa item itu tidak baik. Dengan demikian kita juga harus menganalisis taraf kesukaran butir soal, Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Selain itu kita juga harus memperhatikan daya pembeda pada butir soal, Daya pembeda soal adalah kemampuan sesuatu soal untuk membedakan, Antara siswa yang pandai (berkemampuan tinggi) dengan siswa bodoh (berkemampuan rendah).
Kemudian sebuah soal diuji validitasnya dalam sebuah tes, Dimaksud dengan validitas item dari suatu tes adalah, ketepatan mengukur yang dimiliki oleh sebutir item, sedangkan Reliabilitas adalah keterandalan, artinya auatu tes memiliki keterandalan bilamana tes tersebut dipakai mengukur berulang-ulang hasilnya sama. Dan dalam sebuah butir soal harus ada distraktor yaitu pengecoh yang bertujuan agar dari sekian banyak testee yang mengikuti hasil tes belajar ada yang tertarik atau terangsang untuk memilihnya, sebab mereka menyangka bahwa distraktor yang mereka pilih itu merupakan jawaban betul.
B. Saran
Sebagai manusia biasa setiap orang pasti mempunyai kekurangan dan kelebihan,diantaranya adalah pola pikir tiap individu yang berbeda-beda,ada yang cerdas,pintar dan kurang pintar, untuk itu dalam suatu lembaga pendidikan inilah yang sangat diperhatikan.cara pengukuran pola pikir yang dilakukan lembaga pendidikan (sekolah) yaitu melalui tes.tes-tes yang dilakukan pendidik harus mempunyai bobot soal yang dianggap baik,dan soal-soal itu harus benar-benar diperhatikan cara penyusunan.
|
13 |
DAFTAR PUSTAKA
Mulyadi, Evaluasi Pendidikan (Malang:UIN-MALIKI PRESS,2010), hlm.107
Ngalim Purwanto, Prinsip-prinsip dan Teknik Evaluasi Pengajaran (Bandung:PT Remaja Rosdakarya,2004) hlm.118
Suharsimi Arikunto, Dasar-Dasar Evaluasi Pendidikan Edisi 2, (Jakarta:PT Bumi Aksara,2012) hlm.222-223
|
14 |
0 Komentar "ANALISIS SOAL TES"