Makalah Tentang Analisis Kualitas Butir Soal
a. Untuk soal nomor 1 pada kelompok bawah yang salah 6 orang, dan pada kelompok atas yang salah 4 orang.
A.
Tingkat kesukaran soal (difficulty index)
Perhitungan tingkat kesukaran soal
adalah pengukuran seberapa besar derajat kesukaran suatu soal. Jika suatu soal
memiliki tingkat kesukaran seimbang (proporsional), maka dapat dikatakan bahwa
soal tersebut baik. Suatu soal tes hendaknya tidak terlalu sukar dan tidak pula
terlalu mudah.
1. Menghitung
tingkat kesukaran soal bentuk objektif
Untuk menghitung tingkat kesukaran soal bentuk objektif dapat digunakan dengan dua cara, yaitu :
Cara Pertama, menggunakan rumus Tingkat Kesukaran (TK) :
TK =
|
(WL + WH)
|
X 100%
|
(nL + nH) 10
|
Keterangan
:
WL =
Jumlah peserta didik yang menjawab salah dari kelompok bawah
WH =
Jumlah peserta didik yang menjawab salah dari kelompok atas
nL =
Jumlah kelompok bawah
nH =
Jumlah kelompok atas
Sebelum menggunakan rumus di atas, maka
Anda harus menempuh terlebih dahulu langkah-langkah sebagai berikut :
a. Menyusun
lembar jawaban peserta didik dari skor tertinggi sampai dengan skor terendah.
b. Mengambil 27
% lembar jawaban
dari atas yang
selanjutnya 3 disebut kelompok
atas (higher group), dan 27 % lembar jawaban dari bawah yang selanjutnya
disebut kelompok bawah (lower group). Sisa sebanyak 46% disisihkan.
c. Membuat
tabel untuk mengetahui jawaban (benar atau salah) dari setiap peserta didik,
baik untuk kelompok atas maupun kelompok bawah. Jika jawaban peserta didik
benar, diberi tanda + (plus), sebaliknya jika jawaban peserta didik salah,
diberi tanda - (minus).
Contoh :
KELOMPOK ATAS/KELOMPOK BAWAH
d. Membuat
tabel seperti berikut :
Contoh :
36 orang peserta
didik Madrasah Tsanawiyah
ujian akhir semester dalam mata pelajaran Aqidah-Akhlak. Berdasarkan hasil ujian tersebut kemudian disusun lembar jawaban peserta didik dari yang mendapat skor tertinggi sampai dengan skor terendah.Selanjutnya, diambil 27% dari skor tertinggi, yaitu 27% x 36 orang = 9,72 = 10 orang(dibulatkan) dan 27% dari skor terendah, yaitu 27% x 36 orang = 9,72 = 10 orang(dibulatkan).Setelah diketahui jumlah sampel kelompok atas dan kelompok bawah, kemudian membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap peserta didik dalam kelompok tersebut.
ujian akhir semester dalam mata pelajaran Aqidah-Akhlak. Berdasarkan hasil ujian tersebut kemudian disusun lembar jawaban peserta didik dari yang mendapat skor tertinggi sampai dengan skor terendah.Selanjutnya, diambil 27% dari skor tertinggi, yaitu 27% x 36 orang = 9,72 = 10 orang(dibulatkan) dan 27% dari skor terendah, yaitu 27% x 36 orang = 9,72 = 10 orang(dibulatkan).Setelah diketahui jumlah sampel kelompok atas dan kelompok bawah, kemudian membuat tabel untuk mengetahui jawaban (benar atau salah) dari setiap peserta didik dalam kelompok tersebut.
a. Untuk soal nomor 1 pada kelompok bawah yang salah 6 orang, dan pada kelompok atas yang salah 4 orang.
b. Untuk
soal nomor 2 pada kelompok bawah yang salah 6 orang, dan pada kelompok atas
yang salah 2 orang.
c. Untuk
soal nomor 3 pada kelompok bawah yang salah 6 orang, dan pada kelompok atas yang
salah 3 orang.
d. Untuk
soal nomor 4 pada kelompok bawah yang salah 6 orang, dan pada kelompok atas
yang salah 1 orang.
e. Untuk
soal nomor 5 pada kelompok bawah yang salah 6 orang dan pada kelompok atas yang
salah 3 orang.
f. Untuk
soal nomor 6 pada kelompok bawah yang salah 3 orang, dan pada kelompok atas
yang salah 2 orang.
g. Untuk
soal nomor 7 pada kelompok bawah yang salah 5 orang, dan pada kelompok atas
yang salah 3 orang.
h. Untuk
soal nomor 8 pada kelompok bawah yang salah 4 orang, dan pada kelompok atas
yang salah 4 orang.
i.
Untuk soal nomor 9 pada kelompok bawah yang
salah 5 orang, dan pada kelompok atas yang salah 4 orang.
j.
Untuk soal nomor 10 pada kelompok bawah yang salah 5 orang, dan pada
kelompok atas yang salah 3 orang.
Adapun kriteria penafsiran tingkat
kesukaran soal adalah :
a. Jika
jumlah persentase sampai dengan 27% termasuk mudah.
b. Jika
jumlah persentase 28% - 72% termasuk sedang.
c. Jika
jumlah persentase 73% ke atas termasuk sukar.
Berdasarkan kriteria di atas, maka hasil
perhitungan tingkat kesukaran soal dapat ditafsirkan seperti berikut :
Untuk memperoleh prestasi belajar yang
baik, sebaiknya proporsi antara tingkat kesukaran soal tersebar secara normal.
Perhitungan proporsi tersebut dapat diatur sebagai berikut :
a. Soal
sukar 25%, soal sedang 50%, soal mudah 25%, atau
b. Soal
sukar 20%, soal sedang 60%, soal mudah 20%, atau
c. Soal
sukar 15%, soal sedang 70%, soal mudah 15%.
Seharusnya, penyusunan suatu soal
dilakukan dengan mempertimbangkan tingkat kesukaran soal, sehingga hasil yang
dicapai peserta didik dapat menggambarkan prestasi yang sesungguhnya.
B.
Daya Pembeda (discriminating power)
Perhitungan daya pembeda adalah pengukuran
sejauhmana suatu butir soal mampu membedakan peserta didik yang sudah menguasai
kompetensi dengan peserta didik yang belum/kurang menguasai kompetensi
berdasarkan kriteria tertentu. Semakin tinggi koefisien daya pembeda suatu
butir soal, semakin mampu butir soal tersebut membedakan antara peserta didik
yang menguasai kompetensi dengan peserta didik yang kurang menguasai
kompetensi. Untuk menghitung daya pembeda setiap butir soal dapat digunakan
rumus sebagai berikut :
DP =
|
(WL – WH)
|
n
|
Keterangan :
DP = Daya pembeda
WL = Jumlah peserta didik yang
gagal dari kelompok bawah
WH = Jumlah peserta yang gagal
dari kelompok atas n= 27% x N
Contoh :
Jumlah peserta didik (N) = 40
Jumlah sampel (n) = 27%
x 40 = 10,8 = 11 (dibulatkan)
WL =
10
WH =
2
Jadi, daya
pembedanya (DP) =
|
10 - 2
|
= 0,73
|
11
|
C.
Analisis Pengecoh
Pada soal bentuk pilihan-ganda ada alternatif jawaban (opsi) yang
merupakan pengecoh. Butir soal yang baik, pengecohnya akan dipilih secara
merata oleh peserta didik yang menjawab salah. Sebaliknya, butir soal yang
kurang, pengecohnya akan dipilih secara tidak merata.
Pengecoh dianggap baik bila jumlah peserta didik yang memilih pengecoh
itu sama atau mendekati jumlah ideal. Indeks pengecoh dihitung dengan rumus :
IP =
|
P
|
X 100%
|
-(N – B) / (n-1)
|
Keterangan :
IP = Indeks
pengecoh
P = Jumlah
peserta didik yang memilih pengecoh
N = Jumlah
peserta didik yang ikut tes
B = Jumlah
peserta didik yang menjawab benar pada setiap soal
N = Jumlah
alternatif jawaban (opsi)
1 = Bilangan
tetap
Catatan :
Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai
kunci jawaban), maka IP = 0 yang berarti soal tersebut jelek. Dengan demikian,
pengecoh tidak berfungsi.
Contoh :
50 orang peserta didik di tes dengan 10 soal bentuk pilihan-ganda. Tiap
soal memiliki5 alternatif jawaban (a, b, c, d dan e). Kunci jawaban (jawaban
yang benar) soal nomor 8 adalah c. Setelah soal nomor 8 diperiksa untuk semua
peserta didik, ternyata dari 50orang peserta didik, 20 peserta didik menjawab
benar dan 30 peserta didik menjawabsalah. Idealnya, pengecoh dipilih secara
merata, artinya semua pengecoh secara merata ikut menyesatkan peserta didik.
Perhatikan contoh soal nomor 8 berikut ini :
Alternatif jawaban
a b c
d e
Distribusi jawaban peserta didik
7 8 20 7 8
IP 93% 107%
** 93% 107%
Kualitas pengecoh ++++**++++
Keterangan :
** : kunci jawaban
++ : sangat baik
+ : baik
- :
kurang baik
_ : jelek
_ _ : sangat jelek
Pada contoh di atas, IP butir a, b, d, dan e adalah 93%, 107%, 93% dan 107%.
Semuanya dekat dengan angka 100%, sehingga digolongkan sangat baik, sebab semua
pengecoh itu berfungsi. Jika pilihan jawaban peserta didik menumpukpada satu
alternatif jawaban, misalnya seperti berikut :
Alternatif jawaban
a b c
d e
Distribusi jawaban peserta didik
20 2 20 8 0
IP 267% 27%
** 107% 0%
Kualitas pengecoh _ - **
++_
Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik, pengecoh
(e) dan (b) tidak berfungsi, pengecoh (a) menyesatkan, maka pengecoh (a) dan
(e) perlu diganti karena termasuk jelek, dan pengecoh (b) perlu direvisi karena
kurang baik. Adapun kualitas pengecoh berdasar indeks pengecoh adalah :
Sangat baik IP = 76% - 125%
Baik IP = 51% - 75%
atau 126% - 150%
Kurang baik IP = 26% - 50% atau
151% - 175%
Jelek IP = 0% - 25% atau 176% - 200%
Sangat jelek IP = lebih dari 200%
Untuk analisis pengecoh perlu dibuat tabel khusus agar setiap butir soal diketahui
berapa banyak peserta didik yang menjawab a, b, c dan seterusnya. Hal ini tentu
saja sangat memakan waktu dan tenaga. Jika diolah dengan komputer dan data
sudah dimasukkan dalam disket, pengolahan ini hanya memerlukan waktu beberapa
detik saja.
D.
Analisis Homoginitas Soal
Homogin
tidaknya butir soal
diketahui dengan menghitung
koefisien korelasi antara skor tiap butir soal dengan skor total.
Perhitungan dilakukan sebanyak butir soal
dalam tes bersangkutan.
Jika jumlah soal
ada 100, maka perhitungan
koefisien korelasi sebanyak 100 kali. Skor setiap butir soal adalah 1 atau 0,
sedang skor total tiap peserta didik akan bervariasi. Salah satu teknik
korelasi yang dapat digunakan adalah korelasi product- moment atau korelasi
point biserial. Butir soal dikatakan homogin, apabila koefisien korelasinya
sama atau di atas batas signifikansi (harga kritik korelasi). Sebaliknya, butir
soal dikatakan tidak homogin, jika
koefisien korelasinya negatif atau lebih kecil dari batas signifikansi. Butir
soal yang tidak homogin kemungkinan besar mengukur aspek lain di luar materi/
bahan yang diajarkan, karena tidak sesuai dengan kompetensi yang telah
ditetapkan. Butir soal yang demikian sebaiknya direvisi atau dibuang.
E.
Efektifitas Fungsi Opsi
Setelah tingkat kesukaran soal, daya pembeda,
homogenitas dan analisis pengecoh dihitung, selanjutnya Anda perlu mengetahui
pula apakah suatu opsi (alternatif jawaban) dari setiap soal berfungsi secara
efektif atau tidak. Untuk itu, Anda dapat menggunakan langkah-langkah sebagai
berikut :
1. Menentukanjumlahpesertadidik(N).
2. Menentukan jumlah sampel (n),
baik untuk
kelompok atas maupun kelompokbawah,yaitu27%xN
4. Menghitung
jumlah alternatif jawaban yang dipilih peserta didik, baik untuk kelompok atas
maupun kelompok bawah.
5. Menentukan
efektifitas fungsi opsi dengan kriteria :
a. Untukopsikunci:
1) Jumlahpemilihkelompokatasdankelompokbawahberadadiantara25%-75%.
Rumusnya adalah: ∑PKA+
∑PKBx 100%
n1+n2
Keterangan:
∑PKA =jumlahpemilihkelompokatas
∑PKB =jumlahpemilihkelompokbawah
n1 =jumlahsampelkelompokatas(27%)
n2 =jumlahsampelkelompokbawah(27%)
2) Jumlah
pemilih kelompok atas harus lebih besar daripada jumlah pemilih kelompok bawah.
b. Untuk opsi
pengecoh :
1) Jumlah
pemilih kelompok atas dan kelompok bawah tidak kurang dari :
25%x
|
1
|
x(Ka+Kb)
|
2(∑d)
|
Keterangan :
d =jumlahopsipengecoh
Ka =kelompokatas
Kb =kelompokbawah
1) Jumlah
pemilih kelompok bawah harus lebih besar daripada jumlah pemilih kelompok atas.
Contoh:
Jumlahpesertadidik(N) =40orang
n (27%x40) =10,80=11(dibulatkan)
Jumlahsoal =10.
Bentuksoal =pilihan-ganda.
Jumlahopsi =5(a,b,c,d,e)
Kuncijawaban(opsikunci)soalnomor1(misalnya)adalah(c)danopsi pengecohnyaadalah(a),(b),(d),dan(e).
Distribusipilihanpesertadidikterhadapopsiuntukkelompokatas adalah:opsi(a)=0;opsi(b)=1;opsi(c)=7;opsi(d)=3;opsi(e)=0.
Distribusipilihanpesertadidikterhadapopsiuntukkelompokbawah adalah:opsi(a)=2;opsi(b)=6;opsi(c)=2;opsi(d)=1;opsi(e)=0.
Dengan demikian, kita dapat
membuat tabel distribusi seperti berikut
:
DistribusiPilihanPesertaDidikTerhadapOpsiSoal
OpsiKelompok
|
A
|
b
|
c
|
d
|
e
|
Atas
|
0
|
1
|
7
|
3
|
0
|
Bawah
|
2
|
6
|
2
|
1
|
0
|
Berdasarkan
tabel di atas, Anda dapat menentukan efektif tidaknya fungsi opsi sebagai
berikut :
a) Untukopsi(c)sebagaiopsikunciberfungsiefektif,karenajumlah
pemilih atas dan kelompok bawah 7+2 x 100% =
2240,91%.Angkainiberadadiantara25%-75%.Disampingitu,jumlahpemilihkelompokatas(7orang)lebihbesardaripadajumlahpemilih
kelompok bawah (2 orang).
b)
Untuk opsi (a)
sebagai opsi pengecoh berfungsi efektif, karena jumlah pemilih kelompok atas
dan kelompok bawah 2 orang. Jumlah ini di atas minimal dari :
25%x
|
1
|
x(11+11)= 25 % x 2,75 = 0,69
|
2 . 4
|
Disamping itu jumlah pemilihkelompokbawah(2orang)lebihbesardaripadajumlahpemilih
kelompok atas (tidak ada pemilih).
c)
Untuk opsi (b)
sebagai opsi pengecoh berfungsi efektif, karena jumlah pemilih kelompok atas
dan kelompok bawah 7 orang. Jumlah ini di atas minimal dari :
25%x
|
1
|
x22=0,69
.
|
2 . 4
|
Disampingitu,jumlahpemilihkelompokbawah(6 orang)
lebih besar daripada jumlah pemilih kelompok atas (1 orang).
d)
Untuk opsi (d)
sebagai opsi pengecoh tidak berfungsi secara efektif, karena jumlah pemilih
kelompok atas (3 orang) lebih besar daripada jumlah pemilih kelompok bawah (1
orang).
e)
Untuk opsi (e)
sebagai opsi pengecoh tidak berfungsi secara efektif, karena jumlah pemilih
kelompok atas dan kelompok bawah kurang dari 0,69.
KESIMPULAN
Ada dua hal pokok yang harus
diperhitungkan dalam menganalisis butir soal ini, yaitu tingkat kesukaran soal
dan daya pembeda butir soal. Perhitungan
tingkat kesukaran soal adalah pengukuran seberapa besar derajat kesukaran suatu
butir soal. Jika suatu soal memiliki tingkat kesukaran seimbang (proporsional),
maka dapat dikatakan bahwa soal tersebut baik. Suatu butir soal hendaknya tidak
terlalu sukar dan tidak pula terlalu mudah. Untuk menghitung tingkat kesukaran
soal bentuk objektif dapat
digunakan dengan dua cara, yaitu
(1) menggunakan rumus tingkat kesukaran (2) menggunakan tabel batas tingkat
kesukaran. Seharusnya, penyusunan suatu soal dilakukan dengan mempertimbangkan
tingkat kesukaran soal, sehingga hasil yang dicapai peserta didik dapat
menggambarkan prestasi yang sesungguhnya. Dalam analisis soal secara klasikal,
tingkat kesukaran dapat diperoleh dengan beberapa cara, antara lain : skala
kesukaran linier, skala bivariat, indeks davis, dan proporsi menjawab benar. Cara
menghitung tingkat kesukaran untuk soal bentuk uraian adalah menghitung berapa persen peserta didik yang
gagal menjawab benar atau ada di bawah batas lulus (passing grade) untuk tiap-
tiap soal.
Perhitungan daya pembeda adalah
pengukuran sejauhmana suatu butir soal mampu membedakan peserta didik yang
sudah menguasai kompetensi dengan peserta didik yang belum/kurang menguasai
kompetensi berdasarkan kriteria tertentu. Semakin tinggi koefisien daya pembeda
suatu butir soal, semakin mampu butir soal tersebut membedakan antara peserta
didik yang menguasai kompetensi dengan peserta didik yang kurang menguasai
kompetensi. Teknik yang digunakan untuk menghitung daya pembeda soal bentuk
uraian adalah menghitung perbedaan dua rata-rata (mean), yaitu antara rata-rata
dari kelompok atas dengan rata-ratadari kelompok bawah untuk tiap-tiap soal.
Setelah tingkat kesukaran soal dan daya pembeda dihitung, selanjutnya perlu diketahui pula apakah suatu opsi
(pilihan jawaban) dari setiap soal berfungsi secara efektif atau tidak.
DAFTAR PUSTAKA
Arifin, Zainal, (2011), Evaluasi Pembelajaran :
Prinsip-Teknik-Prosedur, Cetakan Ke-3, Bandung : PT.Remaja Rosdakarya.
Arifin, Zainal, (2006), Konsep Guru Tentang Evaluasi dan
Aplikasinya Dalam Proses Pembelajaran PAI, Tesis, Bandung : Universitas
Pendidikan Indonesia.
Anastasi,
A., (1976) Psychological Testing, New York : The Macmillan Company, Inc.
Dimyati
dan Mudjiono (1994) Belajar dan Pembelajaran, Jakarta : P3MTK-Ditjen
Dikti-Depdikbud.
Gronlund,
N.E. (1985) Measurement and Evaluation in Teaching, Fifth Edition, New
York : Mc Millan Publishing Co., Inc.
Kerlinger,
Fred.N., (1986) Foundation of Behaviour Research, Halt-Rinehart and
Winston, Inc.
Stamboel,
C. S., (1986) Prinsip dan Teknik Pengukuran dan Penilaian di Dalam Dunia
Pendidikan, Cetakan Ke-2, Jakarta : Mutiara Sumber Widya.
Thorndike, R. L., and Hagen, H.P., (1977) Measurement
and Evaluation in Psychology and Education, New York : John Willey &
Sons, Ltd.
Labels:
Kumpulan Makalah
Thanks for reading Makalah Tentang Analisis Kualitas Butir Soal. Please share...!
0 Comment for "Makalah Tentang Analisis Kualitas Butir Soal"