Makalah Tentang Analisis Kualitas Butir Soal

Makalah Tentang : Analisis Kualitas Butir Soal
Makalah Tentang Analisis Kualitas Butir Soal

A.  Tingkat kesukaran soal (difficulty index)
Perhitungan tingkat kesukaran soal adalah pengukuran seberapa besar derajat kesukaran suatu soal. Jika suatu soal memiliki tingkat kesukaran seimbang (proporsional), maka dapat dikatakan bahwa soal tersebut baik. Suatu soal tes hendaknya tidak terlalu sukar dan tidak pula terlalu mudah.
1.      Menghitung tingkat kesukaran soal bentuk objektif
Untuk menghitung tingkat kesukaran soal bentuk objektif dapat  digunakan dengan dua cara, yaitu :
Cara Pertama, menggunakan rumus Tingkat Kesukaran (TK) :

TK =
(WL + WH)
X 100%
(nL + nH) 10

Keterangan :
WL  = Jumlah peserta didik yang menjawab salah dari kelompok bawah
WH  = Jumlah peserta didik yang menjawab salah dari kelompok atas
nL    = Jumlah kelompok bawah
nH   = Jumlah kelompok atas

Sebelum menggunakan rumus di atas, maka Anda harus menempuh terlebih dahulu langkah-langkah sebagai berikut :
a.       Menyusun lembar jawaban peserta didik dari skor tertinggi sampai dengan skor terendah.
b.      Mengambil  27  %  lembar  jawaban  dari    atas  yang  selanjutnya  3 disebut kelompok atas (higher group), dan 27 % lembar jawaban dari bawah yang selanjutnya disebut kelompok bawah (lower group). Sisa sebanyak 46% disisihkan.
c.       Membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap peserta didik, baik untuk kelompok atas maupun kelompok bawah. Jika jawaban peserta didik benar, diberi tanda + (plus), sebaliknya jika jawaban peserta didik salah, diberi tanda - (minus).
Contoh :
KELOMPOK ATAS/KELOMPOK BAWAH

d.      Membuat tabel seperti berikut :

Contoh :
36  orang  peserta  didik  Madrasah  Tsanawiyah  
ujian  akhir  semester dalam mata pelajaran Aqidah-Akhlak. Berdasarkan hasil ujian tersebut kemudian disusun lembar jawaban peserta didik dari yang mendapat skor tertinggi sampai dengan skor terendah.Selanjutnya, diambil 27% dari skor tertinggi, yaitu 27% x 36 orang = 9,72 = 10 orang(dibulatkan) dan 27% dari skor terendah, yaitu 27% x 36 orang = 9,72 = 10 orang(dibulatkan).Setelah diketahui jumlah sampel kelompok atas dan kelompok bawah, kemudian membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap peserta didik dalam kelompok tersebut.
Kelompok Atas
Kelompok Bawah


a.       Untuk soal nomor 1 pada kelompok bawah yang salah 6 orang, dan pada kelompok atas yang salah 4 orang.
b.      Untuk soal nomor 2 pada kelompok bawah yang salah 6 orang, dan pada kelompok atas yang salah 2 orang.
c.       Untuk soal nomor 3 pada kelompok bawah yang salah 6 orang, dan pada kelompok atas yang salah 3 orang.
d.      Untuk soal nomor 4 pada kelompok bawah yang salah 6 orang, dan pada kelompok atas yang salah 1 orang.
e.       Untuk soal nomor 5 pada kelompok bawah yang salah 6 orang dan pada kelompok atas yang salah 3 orang.
f.       Untuk soal nomor 6 pada kelompok bawah yang salah 3 orang, dan pada kelompok atas yang salah 2 orang.
g.      Untuk soal nomor 7 pada kelompok bawah yang salah 5 orang, dan pada kelompok atas yang salah 3 orang.
h.      Untuk soal nomor 8 pada kelompok bawah yang salah 4 orang, dan pada kelompok atas yang salah 4 orang.
i.        Untuk soal nomor 9 pada kelompok bawah yang salah 5 orang, dan pada kelompok atas yang salah 4 orang.
j.        Untuk soal nomor 10 pada  kelompok bawah yang salah 5 orang, dan pada kelompok atas yang salah 3 orang.

Berdasarkan data diatas dapat dibuat tabel seperti berikut :

Adapun kriteria penafsiran tingkat kesukaran soal adalah :
a.       Jika jumlah persentase sampai dengan 27% termasuk mudah.
b.      Jika jumlah persentase 28% - 72% termasuk sedang.
c.       Jika jumlah persentase 73% ke atas termasuk sukar.

Berdasarkan kriteria di atas, maka hasil perhitungan tingkat kesukaran soal dapat ditafsirkan seperti berikut :
Tabel Penafsiran Hasil Perhitungan Tingkat Kesukaran Soal

Tabel Klasifikasi Soal Berdasarkan Proporsi Tingkat Kesukarannya



Untuk memperoleh prestasi belajar yang baik, sebaiknya proporsi antara tingkat kesukaran soal tersebar secara normal. Perhitungan proporsi tersebut dapat diatur sebagai berikut :
a.       Soal sukar 25%, soal sedang 50%, soal mudah 25%, atau
b.      Soal sukar 20%, soal sedang 60%, soal mudah 20%, atau
c.       Soal sukar 15%, soal sedang 70%, soal mudah 15%.

Seharusnya, penyusunan suatu soal dilakukan dengan mempertimbangkan tingkat kesukaran soal, sehingga hasil yang dicapai peserta didik dapat menggambarkan prestasi yang sesungguhnya.


B.   Daya Pembeda (discriminating power)
Perhitungan daya pembeda adalah pengukuran sejauhmana suatu butir soal mampu membedakan peserta didik yang sudah menguasai kompetensi dengan peserta didik yang belum/kurang menguasai kompetensi berdasarkan kriteria tertentu. Semakin tinggi koefisien daya pembeda suatu butir soal, semakin mampu butir soal tersebut membedakan antara peserta didik yang menguasai kompetensi dengan peserta didik yang kurang menguasai kompetensi. Untuk menghitung daya pembeda setiap butir soal dapat digunakan rumus sebagai berikut :
DP =
(WL – WH)
n
Keterangan :
DP    = Daya pembeda
WL   = Jumlah peserta didik yang gagal dari kelompok bawah
WH   = Jumlah peserta yang gagal dari kelompok atas n= 27% x N


Contoh :
Jumlah peserta didik (N)   = 40
Jumlah sampel (n)              = 27% x 40 = 10,8 = 11 (dibulatkan)
WL                                    = 10
WH                                    = 2

Jadi, daya pembedanya (DP) =
10 - 2
= 0,73
11

C.  Analisis Pengecoh
Pada soal bentuk pilihan-ganda ada alternatif jawaban (opsi) yang merupakan pengecoh. Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta didik yang menjawab salah. Sebaliknya, butir soal yang kurang, pengecohnya akan dipilih secara tidak merata.
Pengecoh dianggap baik bila jumlah peserta didik yang memilih pengecoh itu sama atau mendekati jumlah ideal. Indeks pengecoh dihitung dengan rumus :
IP =
P
X 100%
-(N – B) / (n-1)

Keterangan :
IP = Indeks pengecoh
P   = Jumlah peserta didik yang memilih pengecoh
N  = Jumlah peserta didik yang ikut tes
B  = Jumlah peserta didik yang menjawab benar pada setiap soal
N  = Jumlah alternatif jawaban (opsi)
1   = Bilangan tetap

Catatan :
Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai kunci jawaban), maka IP = 0 yang berarti soal tersebut jelek. Dengan demikian, pengecoh tidak berfungsi.

Contoh :
50 orang peserta didik di tes dengan 10 soal bentuk pilihan-ganda. Tiap soal memiliki5 alternatif jawaban (a, b, c, d dan e). Kunci jawaban (jawaban yang benar) soal nomor 8 adalah c. Setelah soal nomor 8 diperiksa untuk semua peserta didik, ternyata dari 50orang peserta didik, 20 peserta didik menjawab benar dan 30 peserta didik menjawabsalah. Idealnya, pengecoh dipilih secara merata, artinya semua pengecoh secara merata ikut menyesatkan peserta didik. Perhatikan contoh soal nomor 8 berikut ini :


Alternatif jawaban             a  b  c   d  e
Distribusi jawaban peserta didik  7  8  20 7  8
IP                   93%  107%    ** 93%  107%
Kualitas pengecoh         ++++**++++
Keterangan :
**   : kunci jawaban
++   : sangat baik
+     : baik
-      : kurang baik
_     : jelek
_ _ : sangat jelek

Pada contoh di atas, IP butir a, b, d, dan e adalah 93%, 107%, 93% dan 107%. Semuanya dekat dengan angka 100%, sehingga digolongkan sangat baik, sebab semua pengecoh itu berfungsi. Jika pilihan jawaban peserta didik menumpukpada satu alternatif jawaban, misalnya seperti berikut :
Alternatif jawaban             a  b  c   d  e
Distribusi jawaban peserta didik  20 2  20 8  0
IP                   267%    27%  ** 107%    0%
Kualitas pengecoh         _  -   ** ++_
Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik, pengecoh (e) dan (b) tidak berfungsi, pengecoh (a) menyesatkan, maka pengecoh (a) dan (e) perlu diganti karena termasuk jelek, dan pengecoh (b) perlu direvisi karena kurang baik. Adapun kualitas pengecoh berdasar indeks pengecoh adalah :
Sangat baik  IP  = 76% - 125%
Baik IP              = 51% - 75% atau 126% - 150%
Kurang baik IP  = 26% - 50% atau 151% - 175%
Jelek IP             = 0%   - 25% atau 176% - 200%
Sangat jelek IP  = lebih dari 200%
Untuk analisis pengecoh perlu dibuat tabel khusus agar setiap butir soal diketahui berapa banyak peserta didik yang menjawab a, b, c dan seterusnya. Hal ini tentu saja sangat memakan waktu dan tenaga. Jika diolah dengan komputer dan data sudah dimasukkan dalam disket, pengolahan ini hanya memerlukan waktu beberapa detik saja.


D.  Analisis Homoginitas Soal
Homogin  tidaknya  butir  soal  diketahui  dengan  menghitung  koefisien korelasi antara skor tiap butir soal dengan skor total. Perhitungan dilakukan sebanyak  butir  soal  dalam  tes  bersangkutan.  Jika  jumlah  soal  ada  100, maka perhitungan koefisien korelasi sebanyak 100 kali. Skor setiap butir soal adalah 1 atau 0, sedang skor total tiap peserta didik akan bervariasi. Salah satu teknik korelasi yang dapat digunakan adalah korelasi product- moment atau korelasi point biserial. Butir soal dikatakan homogin, apabila koefisien korelasinya sama atau di atas batas signifikansi (harga kritik korelasi). Sebaliknya, butir soal   dikatakan tidak homogin, jika koefisien korelasinya negatif atau lebih kecil dari batas signifikansi. Butir soal yang tidak homogin kemungkinan besar mengukur aspek lain di luar materi/ bahan yang diajarkan, karena tidak sesuai dengan kompetensi yang telah ditetapkan. Butir soal yang demikian sebaiknya direvisi atau dibuang.

E.   Efektifitas Fungsi Opsi
Setelah tingkat kesukaran soal, daya pembeda, homogenitas dan analisis pengecoh dihitung, selanjutnya Anda perlu mengetahui pula apakah suatu opsi (alternatif jawaban) dari setiap soal berfungsi secara efektif atau tidak. Untuk itu, Anda dapat menggunakan langkah-langkah sebagai berikut :
1.    Menentukanjumlahpesertadidik(N).
2.    Menentukan jumlah sampel (n), baik untuk kelompok atas maupun kelompokbawah,yaitu27%xN
3.    Membuattabelpengujianefektifitasopsisepertiberikut:
4.    Menghitung jumlah alternatif jawaban yang dipilih peserta didik, baik untuk kelompok atas maupun kelompok bawah.
5.    Menentukan efektifitas fungsi opsi dengan kriteria :
a.    Untukopsikunci:
1)      Jumlahpemilihkelompokatasdankelompokbawahberadadiantara25%-75%.
Rumusnya adalah:  PKA+ PKBx 100%


 
                  n1+n2

Keterangan:
PKA =jumlahpemilihkelompokatas
PKB =jumlahpemilihkelompokbawah
n1         =jumlahsampelkelompokatas(27%)
n2         =jumlahsampelkelompokbawah(27%)
2)      Jumlah pemilih kelompok atas harus lebih besar daripada jumlah pemilih kelompok bawah.

b.    Untuk opsi pengecoh :
1)      Jumlah pemilih kelompok atas dan kelompok bawah tidak kurang dari :
25%x
1
x(Ka+Kb)
2(d)
Keterangan :
d    =jumlahopsipengecoh
Ka =kelompokatas
Kb =kelompokbawah
1)      Jumlah pemilih kelompok bawah harus lebih besar daripada jumlah pemilih kelompok atas.
Contoh:
Jumlahpesertadidik(N)       =40orang
n (27%x40)                         =10,80=11(dibulatkan)
Jumlahsoal                          =10.
Bentuksoal                          =pilihan-ganda.
Jumlahopsi                          =5(a,b,c,d,e)
Kuncijawaban(opsikunci)soalnomor1(misalnya)adalah(c)danopsi pengecohnyaadalah(a),(b),(d),dan(e).
Distribusipilihanpesertadidikterhadapopsiuntukkelompokatas adalah:opsi(a)=0;opsi(b)=1;opsi(c)=7;opsi(d)=3;opsi(e)=0.
Distribusipilihanpesertadidikterhadapopsiuntukkelompokbawah adalah:opsi(a)=2;opsi(b)=6;opsi(c)=2;opsi(d)=1;opsi(e)=0.
Dengan demikian, kita dapat membuat tabel distribusi seperti berikut :

DistribusiPilihanPesertaDidikTerhadapOpsiSoal

OpsiKelompok
A
b
c
d
e
Atas
0
1
7
3
0
Bawah
2
6
2
1
0

Berdasarkan tabel di atas, Anda dapat menentukan efektif tidaknya fungsi opsi sebagai berikut :
a)      Untukopsi(c)sebagaiopsikunciberfungsiefektif,karenajumlah pemilih atas dan kelompok bawah 7+2 x 100% =
                                                                       2240,91%.Angkainiberadadiantara25%-75%.Disampingitu,jumlahpemilihkelompokatas(7orang)lebihbesardaripadajumlahpemilih kelompok bawah (2 orang).
b)      Untuk opsi (a) sebagai opsi pengecoh berfungsi efektif, karena jumlah pemilih kelompok atas dan kelompok bawah 2 orang. Jumlah ini di atas minimal dari :
25%x
1
x(11+11)= 25 % x 2,75 = 0,69
2 . 4
Disamping itu jumlah pemilihkelompokbawah(2orang)lebihbesardaripadajumlahpemilih kelompok atas (tidak ada pemilih).
c)      Untuk opsi (b) sebagai opsi pengecoh berfungsi efektif, karena jumlah pemilih kelompok atas dan kelompok bawah 7 orang. Jumlah ini di atas minimal dari :
25%x
1
x22=0,69 .
2 . 4
Disampingitu,jumlahpemilihkelompokbawah(6 orang) lebih besar daripada jumlah pemilih kelompok atas (1 orang).
d)     Untuk opsi (d) sebagai opsi pengecoh tidak berfungsi secara efektif, karena jumlah pemilih kelompok atas (3 orang) lebih besar daripada jumlah pemilih kelompok bawah (1 orang).
e)      Untuk opsi (e) sebagai opsi pengecoh tidak berfungsi secara efektif, karena jumlah pemilih kelompok atas dan kelompok bawah kurang dari 0,69.


KESIMPULAN
Ada dua hal pokok yang harus diperhitungkan dalam menganalisis butir soal ini, yaitu tingkat kesukaran soal dan daya pembeda butir  soal. Perhitungan tingkat kesukaran soal adalah pengukuran seberapa besar derajat kesukaran suatu butir soal. Jika suatu soal memiliki tingkat kesukaran seimbang (proporsional), maka dapat dikatakan bahwa soal tersebut baik. Suatu butir soal hendaknya tidak terlalu sukar dan tidak pula terlalu mudah. Untuk menghitung tingkat kesukaran soal bentuk objektif dapat  digunakan  dengan dua cara, yaitu (1) menggunakan rumus tingkat kesukaran (2) menggunakan tabel batas tingkat kesukaran. Seharusnya, penyusunan suatu soal dilakukan dengan mempertimbangkan tingkat kesukaran soal, sehingga hasil yang dicapai peserta didik dapat menggambarkan prestasi yang sesungguhnya. Dalam analisis soal secara klasikal, tingkat kesukaran dapat diperoleh dengan beberapa cara, antara lain : skala kesukaran linier, skala bivariat, indeks davis, dan proporsi menjawab benar. Cara menghitung tingkat kesukaran untuk soal bentuk uraian adalah  menghitung berapa persen peserta didik yang gagal menjawab benar atau ada di bawah batas lulus (passing grade) untuk tiap- tiap soal.
Perhitungan daya pembeda adalah pengukuran sejauhmana suatu butir soal mampu membedakan peserta didik yang sudah menguasai kompetensi dengan peserta didik yang belum/kurang menguasai kompetensi berdasarkan kriteria tertentu. Semakin tinggi koefisien daya pembeda suatu butir soal, semakin mampu butir soal tersebut membedakan antara peserta didik yang menguasai kompetensi dengan peserta didik yang kurang menguasai kompetensi. Teknik yang digunakan untuk menghitung daya pembeda soal bentuk uraian adalah menghitung perbedaan dua rata-rata (mean), yaitu antara rata-rata dari kelompok atas dengan rata-ratadari kelompok bawah untuk tiap-tiap soal. Setelah tingkat kesukaran soal dan daya pembeda dihitung, selanjutnya  perlu diketahui pula apakah suatu opsi (pilihan jawaban) dari setiap soal berfungsi secara efektif atau tidak.

DAFTAR PUSTAKA 

Arifin, Zainal, (2011), Evaluasi Pembelajaran : Prinsip-Teknik-Prosedur, Cetakan Ke-3, Bandung : PT.Remaja Rosdakarya.
Arifin, Zainal, (2006), Konsep Guru Tentang Evaluasi dan Aplikasinya Dalam Proses Pembelajaran PAI, Tesis, Bandung : Universitas Pendidikan Indonesia.
Anastasi, A., (1976) Psychological Testing, New York : The Macmillan Company, Inc.
Dimyati dan Mudjiono (1994) Belajar dan Pembelajaran, Jakarta : P3MTK-Ditjen Dikti-Depdikbud.
Gronlund, N.E. (1985) Measurement and Evaluation in Teaching, Fifth Edition, New York : Mc Millan Publishing Co., Inc.
Kerlinger, Fred.N., (1986) Foundation of Behaviour Research, Halt-Rinehart and Winston, Inc.
Stamboel, C. S., (1986) Prinsip dan Teknik Pengukuran dan Penilaian di Dalam Dunia Pendidikan, Cetakan Ke-2, Jakarta : Mutiara Sumber Widya.
Thorndike, R. L., and Hagen, H.P., (1977) Measurement and Evaluation in Psychology and Education, New York : John Willey & Sons, Ltd.
Back To Top