Teori Tes Modern, Teori Tes Klasik, Keunggulan dan Kelemahan Antara Teori Tes Moderndengan Teori
Tes Klasik
Oleh: Feliks
I.PENDAI. PENDAHULUAN
1.1 Latar 1.1 Belakang
Penyelenggaraan pendidikan secara administrasi (pengaturan) dan manajemen (pelaksanaan/implementasi pengaturan) melekat dengan pencernaan, pelaksanaan, pengontrolan dan evaluasi. Sebuah perencanaan yang baik adalah pencernaan berbasis data. Melalui penyediaan data yang akurat dapat menilai dan memutuskan (lanjut atau hentikan) kemajuan, kemunduran atau keberhasilan suatu program.
Pekerjaan menyiapkan dan menganalisis program tersebut adalah domain evaluasi. Evaluasi (evaluation) merupakan proses untuk menentukan, menilai, menemukan informasi tentang suatu kondisi di mana tujuan telah dapat dicapai (Sukardi, 2010; Kusuma, 2010). Bila dalam konteks pendidikan, maka evaluasi pendidikan adalah proses atau kegiatan penilaian dalam rangka memperoleh informasi untuk dapat menentukan pencapaian dan kemajuan atau mutu pendidikan sesuai tujuan yang telah ditetapkan, dan melalui evaluasi dapat memberi umpan balik (feed back) terhadap suatu program sehingga menjadi sumber untuk melakukan penyempurnaan (Sudijono, 2012).
Evaluasi sebagai suatu kegiatan ilmiah dan sistematis untuk melakukan pengukuran (measurement) dan penilaian (asesmen) membutuhkan instrumen yang akurat. Instrumen evaluasi secara umum terdiri dari instrumen tes dan non tes. Proses penyusunan instrumen evaluasi (tes dan non tes) merupakan proses yang kompleks dan memerlukan perencanaan yang matang untuk memperoleh hasil evaluasi yang akurat. Selain itu, dalam perkembangan teori tes terdiri dari teori tes klasik dan teori tes modern. Kedua teori tersebut mendasari perkembangan metode dan jenis instrumen evaluasi. Sebelum mendalami instrumen tes dan non tes, penting untuk mengetahui secara singkat tentang teori tes klasik dan toeri tes modern.
1.2 Batasan
Bahwasanya banyak aspek dan faktor yang mendasari munculnya teori tes klasik dan teori tes modern, termasuk sejarah perkembangan teori tersebut. Namun karena beberapa bertimbaangan, maka fokus harian ini adalah membahas gambaran umum teori tes klasik dan teori tes modern.
1.3 Rumusan Masalah dan Tujuan
Berdasarkan batasan masalah, maka rumusan masalah urian ini adalah bagaimana menjelaskan secara singkat teori tes modern, teori tes klasik, keunggulan dan kelemahan antara teori tes modern dengan teori tes klasik ?. Tujuan penulisan makalah singkat ini adalah untuk menjelaskan secara singkat teori tes modern, teori tes klasik, keunggulan dan kelemahan antara teori tes modern dengan teori tes klasik
II.PEMBAHASAN
2.1 Teori Tes Modern
Teori tes modern berkembang seiring
berkembangnya penggunaan komputer. Teori tes modern sering dikenal dengan Item
Response Theory atau (IRT) Laten (Latent Trait Theory (LTT) atau lengkungan
karakteristik butir (Item) dan Characteristic Curve-ICC) atau Fungsi
Karakteristik Butir (Items Characteristic Function-ICF) (Wahyuni, 2019). Model
IRT dipopulerkan oleh Hambleton dan Swaminathan pada tahun 1985 dengan
menggunakan konsep matematis, yang menyatakan kemungkinan subjek menjawab suatu
soal dengan benar bergantung pada kemampuan subjek dan karakteristik soal,
artinya seseorang dengan kemampuan tinggi atau sifat laten akan bereaksi
berbeda terhadap suatu item dibandingkan dengan seseorang dengan kemampuan
rendah (Hanlbleton et al., 1992; Setiawati, 2013)
Item response theory (IRT) adalah
pendekatan yang dapat digunakan untuk pengembangan, evaluasi dan administrasi,
psikologi dan bidang lainya; Ada tigs fungsi IRT, yaiutu (a) fungsi respons
item, (b) fungsi informasi, dan (c) invarian (Reise et al., 2005). Berdasarkan
fungsi tersebut, Demars menjelaskan model IRT mununjukan adanya hubungan antara
kemampuan atau sifat (dilambangkan θ) yang diukur oleh instrumen terhadap
responden (Wahyuni et al, 2020).
Dengan menggunakan IRT dapat mengetahui dan menilai kelayakan butir dengan membandingkan rerata penampilan butir soal terhadap kemampuan kelompok yang diramalkan menurut modus atau model. Tujuan utama dari IRT adalah memberikan kenyamanan antara statistik soal dan perkiraan kemampuan. IRT memiliki dua prinsip dasar, yaitu (1) Kinerja siswa dalam mengerjakan tes yang dijelaskan oleh beberapa faktor yaitu kemampuan laten (sifat laten), kinerja tersebut dapat diukur dengan mengetahui nilai soal dan (2) hubungan antara kinerja siswa mengenai jawaban peserta tes dengan kemampuan siswa dapat digambarkan oleh fungsi grafik naik disebut juga dengan Item Characteristic Curve atau ICC (Hanlbleton et al., 1992; Setiawati, 2013; Maulani & Rahardjo, 2014).
Banyak hal yang melekat dalam teori tes modern, beberapa diantaranya adalah (a) daya pembeda soal atau butir item tes artinya kemampuan suatu item atau butir soal membedakan kemampuan subyek tes (testee), yakni yang berkemampuan tinggi dan rendah, (b) Tingkat kesulitan/kesukaran soal atau butir, artinya membandingkan jumlah subjek yang menjawab soal dengan benar dengan seluruh subjek.
Ada beberapa asumsi dalam teori tes
modern, yaitu (1) Unidimensi, artinya setiap butir tes hanya mengukur satu
kemampuan. Namun pada praktiknya, asumsi unidimensi sulit dilakukan karena
adanya faktorfaktor kognitif, kepribadian dan faktor-faktor pelaksanaan tes,
seperti kecemasan, motivasi, dan tendensi untuk menebak. Oleh karena itu,
asumsi unidimensi dapat ditunjukkan hanya jika tes mengandung satu komponen
dominan yang mengukur prestasi subjek; (2) Independensi lokal , artinya sikap
kemampuan yang mempengaruhi suatu tes adalah konstan, maka respon peserta tes
pada setiap butir soal adalah independen secara statistik; (3) Invariansi
parameter artinya bahwa karakteristik butir soal tidak tergantung pada
distribusi parameter kemampuan peserta tes dan parameter yang menjadi ciri
peserta tes tidak bergantung dari ciri butir (Sarea & Ruslan, 2019)
Disimpulkan, Teori Tes Modern memberikan
asumsi, bahwa performansi subjek dalam mengerjakan suatu tes dapat diprediksi
dengan sejumlah intervensi model yang digunakan sesuai keadaan subjek testee,
jenis dan tujuan evaluasi
2.2 Teori Tes Klasik
Classical Test Theory (CTT) adalah suatu model pengukuran berdasarkan informasi yang didapatkan pada level skor test, dengan menggunakan tiga konsep skor yaitu test score/observed score, true score dan error score (Maulani & Rahardjo, 2014). CTT didasarkan pada model aditif dan memiliki beberapa komponen seperti teori validitas, reliabilitas, objektivitas, teori analisis tes, teori analisis butir dan sebagainya (Maulani & Rahardjo, 2014; Polat et al., 2022) Teori tes klasik sangat terikat dengan sampel yang digunakan. Akibatnya, bila tes atau pengukuran dilakukan pada sampel yang memiliki kemampuan rata-rata tinggi, maka instrumen tersebut akan memiliki tingkat kesukaran yang rendah, sebaliknya jika perangkat tes tersebut diujikan pada sampel yang memiliki tingkat kemampuan rata-rata rendah maka tingkat kesulitan butir tes tersebut akan tinggi (Wahyuni et al, 2020).
Dengan penjelasan lain bahwa, CTT menyebabkan estimasi kemampuan peserta akan rendah jika soal yang diberikan berada di atas kemampuannya. Sebaliknya, estimasi kemampuan peserta akan tinggi bila soal yang diujikan berada dibawah tingkat kemampuannya. Sehingga Abraham Gyamfi (2020) mengungkapkan dalam CTT, skor tes apa pun yang diamati adalah fungsi dari dua komponen hipotesis, yakni skor sebenarnya dan kesalahan acak. Secara matematis, dinyatakan sebagai: X = T + E; di mana X adalah skor tes yang diamati, T adalah skor sebenarnya dari individu tersebut, dan E adalah kesalahan acak. Skor yang diamati adalah skor hasil tes, sementatara skor sebenarnya adalah nilai yang diharapkan (Gyamfi, 2022), dikaitkan dengan sejumlah asumsi yang melekat dalam CTT.
Beberapa asumsi
dalam CTT: Pertama, instrumen hanya memiliki satu dimensi. Kedua, estimasi
kesalahan pengukuran tidak berinteraksi dengan estimasi sebenarnya. Ketiga,
skor kesalahan tidak berkorelasi dengan skor aktual dan skor kesalahan pada tes
lain oleh subjek yang sama. Keempat, skor kesalahan rata-rata adalah nol.
Asumsi ini digunakan sebagai dasar untuk mengembangkan formula yang digunakan
untuk menghitung reliabilitas suatu tes (Mardapi et al., 2012; Gyamfi,
2022).
Area |
TEORI TES |
|||
TEORI TES MODERN |
TEORI TES KLASIK |
|||
Keunggulan |
Kelemahan |
Keunggulan |
Kelemahan |
|
Asumsi |
Relatif mudah diterapkan dalam banyak
situasi pengujian |
Relatif lemah dan sulit menyamakan tes dalam pengujian adaptif terkomputerisasi |
Kuat (yaitu lebih sulit digunakan) |
Relatif sulit diterapkan dalam banyak
situasi pengujian |
Item Tes |
Terikat dengan testee/ |
Tingkat kesulitan butir item
tergantung kemampuan testee |
Daya pembeda & tingkat kesulitan
independen |
Hasil tes mudah diprediksi |
Control Item |
Tidak ditentukan |
Tingkat kesulitan butir item
tergantung kemampuan testee |
Tingkat kesulitan dan daya pembeda
dikontrol sebelum tes |
Mengabaikan karakteristik kelompok tes |
item dan subyek/testee/ Parameter tes |
Bergantung pada sampel, Varian, Random
Sampling & generalisasi hasil tes |
Ketergantungan yang tinggi pada sampel
& mengancam reliabilitas tes, hasil tes sulit ditafsirkan |
Tidak tergantung pada testee dan
parameter sampel invarian |
independen sampel dan hasil tes relatif
dianggap lebih mudah untuk ditafsirkan |
III. KESIMPULAN
Dua hal yang membedakan sekaligus menjadi kekurangan dan kelebihan antara teori tes modern danteori tes klasik adalah karakteristik peserta ujian dan karakteristik tes. Masing-masing teori memiliki asumsi sebagai dasar penerapannya. Pemilihan model tes berdasarkan dua teori tersebut adalah tergantung tujuan dan jenis pelaksanaan evaluasi atau tes.
Rekomendasi Rujukan:
Hatam, Feliks.B. (2023) Teori Tes Modern, Teori Tes Klasik, Keunggulan dan Kelemahan Antara Teori Tes Moderndengan Teori Tes Klasik. felikshatam.id.com. [Link: https://www.felikshatamid.com/2023/07/teori-tes-modern-teori-tes-klasik.html]
Daftar Rujukan
- Bichi, A. A., Embong, R. B., Mamat, M., & Maiwada, D. A. (2015). Australian Journal of Basic and Applied Sciences Comparison of Classical Test Theory and Item Response Theory : A Review of Empirical Studies. Australian Journal of Basic and Applied Sciences, 9(April), 549–556. https://www.ajbasweb.com/
- Gyamfi, A. (2022). Application of Classical Test Theory (CTT) in the Validation of Teacher Made Mathematics Multiple Choice Test (MMCT) Items. Asian Journal of Advanced Research and Reports, 1–12. https://doi.org/10.9734/ajarr/2022/v16i11434
- Hanlbleton, R. K., Swaminathan., H., & Rogers, D. J. (1992). Review: FUNDAMENTALS OF ITEM RESPONSE THEORY. In Sage Publications, Ltd. https://www.jstor.org/stable/24311224
- Kusuma, M. (2010). Evaluasi Pendidikan. Jakarta: PT. Multi Kreasi Satudelapan.
- Mardapi, D., Haryanto., H., & Hadi., S. (2012). Pengujian hasil belajar dan penilaian pendidikan berbantuan komputer. Jurnal Kependidikan, 42(2).
- Maulani, M. R., & Rahardjo, B. (2014). Teori Pengukuran Pendidikan Menggunakan Classical Test Theory Dan Item Response Theory. Competitive, 9(1), 1–6.
- Polat, M., Turhan, N. S., & Toraman, Ç. (2022). Comparison of Classical Test Theory vs. Multi-Facet Rasch Theory. Pegem Egitim ve Ogretim Dergisi, 12(2), 213–225. https://doi.org/10.47750/pegegog.12.02.21
- Reise, S. P., Ainsworth., A. T., & Haviland, M. G. (2005). Item Response Theory: Fundamentals, Applications, and Promise in Psychological Research. Current Directions in Psychological Science, 14(2), 95–107. https://www.jstor.org/stable/20182996
- Sarea, M. S. ., & Ruslan, R. (2019). t KARAKTERISTIK BUTIR SOAL: CLASSICAL TEST THEORY VS ITEM RESPONSE THEORY? Didakta: Jurnal Kependidikan, 13(1), 1–16.
- Setiawati, F. A. (2013). “Penskalaan Tipe Likert dan Thurstone dengan Teori Klasik dan Modern: Studi pada Instrumen Multiple Intelligenses.” Bimbingan dan Konseling.
- Subali, B., Kumaidi, & Aminah, N. S. (2020). The Comparison of Item Test Characteristics Viewed from Classic and Modern Test Theory. International Journal of Instruction, 14(1), 647–660. https://doi.org/10.29333/IJI.2021.14139A
- Sudijono, A. (2012). Pengantar Evaluasi Pendidikan. PT: Rajagrafindo Persada.
- Sukardi. (2010). Evaluasi Pendidikan Prinsip & Operasionalnya (Edisi-4). PT. Bumi Aksara.
- Wahyuni, Putri., Alzaber., Sindi Amelia, F. (2020). Pengenalan Software Bilog Untuk Evaluasi Pendidikan Bagi Guru-Guru SMA Plus Bina Bangsa Pekanbaru. Community Education Engagement Journal, 2(1), PP: 73-82. http://journal.uir.ac.id/index.php/ecej
- Wahyuni, A. (2019). Pentingnya Pemanfaatan Sistem Informasi Manajemen Dalam Meningkatkan Sistem Penjaminan Mutu Pendidikan. Journal of Chemical Information and Modeling.