Oleh : Syamsir Alam
Mantan Staf Teknis Puspendik, Balitbang Depdiknas
Mantan Staf Teknis Puspendik, Balitbang Depdiknas
Pic : ujiannasional.info |
Ujian (Akhir) Nasional alias UN selama ini sepertinya hanya
diperlakukan semacam upacara ritual tahunan tanpa memberikan pengaruh berarti
terhadap upaya pembina dan pengelola serta pelaksana pendidikan pada tingkat
sekolah untuk memperbaiki dan meningkatkan kualitas pendidikan. Masukan berupa
informasi pendidikan yang diperoleh lewat Ujian Akhir Nasional hanya
diperlakukan sebagai barang pajangan dan menjadi dokumen mati.
Apabila sumber data ujian itu dipakai, pemanfaatannya pun
hanya sebatas pada bahan kajian beberapa peneliti Pusat Penilaian Pendidikan
(Puspendik) untuk kepentingan cum jabatan peneliti; sedangkan para pejabat
pengelola kebijakan pada tingkat pusat (direktorat, Puspendik, dan pusat
kurikulum) hampir dapat dipastikan tidak akan menyentuh dan memperbincangkannya
lagi sampai masa ujian berikutnya.
Keteguhan sikap Menteri Pendidikan Nasional (Mendiknas)
untuk tetap mempertahankan praktik UN pada sistem pendidikan menengah patut
dihormati. Namun, pandangan dan pemikiran kritis terhadap praktik ujian akhir
itu harus diutarakan agar sasaran yang dibuat dapat lebih proporsional,
terarah, dan pencapaiannya dapat dimaksimalkan.
Meskipun praktik ujian akhir dapat digunakan untuk
memengaruhi kualitas pendidikan, namun sebagaimana dikemukakan Ken Jones,
asumsi dan rasionalitas yang digunakan pada high stake exams (seperti UN ini)
pada umumnya sering bertentangan dengan kenyataan lapangan. Sebagaimana
diketahui bahwa realitas pendidikan (sekolah) di Tanah Air sangat beragam,
apakah itu sarana-prasarana pendidikan, sumber daya guru, dan school
leadership. Diskrepansi kualitas pendidikan yang begitu lebar sebagai akibat
dari keterbatasan kemampuan pengelola pendidikan pada tingkat pusat, daerah,
dan sekolah semakin menguatkan tuduhan masyarakat selama ini bahwa penggunaan
instrumen UN untuk menentukan kelulusan (sertifikasi) dan seleksi berpotensi
misleading, bias, dan melanggar keadilan dalam tes.
Selain itu, instrumen UN yang akan digunakan pun sebenarnya
masih menyimpan berbagai pertanyaan mendasar yang menuntut jawaban (baca:
pembuktian), khususnya menyangkut metodologi, terutama pada saat melakukan
interpretasi terhadap hasil skor tes dan pemanfaatannya agar sesuai dengan tujuan
diselenggarakannya UN (validity evidence).
Pemanfaatan ganda (multiple purposes) hasil skor ujian yang
bersifat tunggal semacam UN sebenarnya menyimpan berbagai potensi permasalahan
mendasar secara metodologis, yang sebenarnya sudah sangat diketahui dan dipahami
jajaran Puspendik Departemen Pendidikan Nasional (Depdiknas). Namun, yang agak
mencengangkan dan mengundang pertanyaan, mengapa potensi kesalahan seperti
pemanfaatan hasil skor UN untuk berbagai keperluan dan tujuan secara bersamaan
tidak dikemukakan secara jujur kepada masyarakat pemakai (users) produk
pendidikan dan stakeholders. Kenapa Puspendik tidak mengusulkan pemanfaatan
hasil skor UN hanya sebatas pada alat pengendali mutu pendidikan nasional,
sebagaimana yang dilakukan pada National Assessment of Educational Progress
(NAEP) di Amerika Serikat, dan bukan untuk penentuan kelulusan (sertifikasi),
apalagi sebagai tujuan untuk seleksi dan memecut mutu pendidikan sehingga
persoalan metodologi yang mungkin timbul dapat dihindarkan.
TULISAN ini ditujukan sebagai masukan konstruktif bagi
Mendiknas yang berkaitan dengan konsep dan praktik penilaian pendidikan di
Tanah Air. Ujian atau tes sebenarnya berfungsi sebagai alat rekam dan/atau
prediksi. Sebagai alat rekam untuk memotret, tes biasanya diselenggarakan untuk
mengetahui sejauh mana pemahaman siswa terhadap suatu materi atau sejumlah
materi dan keterampilan yang sudah diajarkan/dipelajari sesuai dengan tujuan
kurikulum sehingga guru dapat menentukan langkah-langkah program pengajaran
berikutnya.
Selain itu, tes juga bisa digunakan sebagai alat prediksi
sebagaimana yang lazim digunakan pada tes seleksi masuk perguruan tinggi atau
tes-tes yang digunakan untuk menerima pegawai baru atau promosi jabatan pada
suatu perusahaan atau instansi pemerintah. Sebagai alat prediksi, hasil tes
diharapkan mampu memberikan bukti bahwa seorang dapat melakukan tugas atau
pekerjaan yang akan diamanatkan kepadanya. Apabila hasil tes yang digunakan
mampu menunjukkan bukti terhadap peluang keberhasilan seorang kandidat mahasiswa
atau calon pegawai melakukan tugas dan pekerjaan di hadapannya, tes itu
diyakini memiliki kelayakan validity evidences.
Ujian atau tes sebenarnya hanyalah sebuah alat (bukan
tujuan) yang digunakan untuk memperoleh informasi pencapaian terhadap proses
pendidikan yang sudah dilakukan dan/atau yang akan diselenggarakan. Ujian atau
tes tidak berfungsi untuk memecut, apalagi memiliki kemampuan mendorong mutu.
Namun, ujian atau tes memiliki kemampuan untuk memengaruhi
proses pembelajaran di tingkat kelas sehingga menjadi lebih baik dan terarah
sesuai dengan tuntutan dan tujuan kurikulum. Karena ujian hanya mampu
memengaruhi pada proses pembelajaran pada tingkat kelas, maka pengaruh yang
diakibatkannya tidak senantiasa positif. Sebaliknya, pengaruh itu dapat juga
sangat bersifat destruktif terhadap kegiatan pendidikan, seperti apabila guru
hanya memfokuskan kegiatan pembelajaran pada latihan-latihan Ujian Akhir
Nasional atau pimpinan sekolah sengaja mengundang dan membiarkan Bimbingan Tes
Alumni (BTA) masuk ke dalam sistem sekolah untuk mengedril siswa yang akan
menempuh ujian akhir itu.
Dalam bahasa testing kegiatan itu disebut teaching for the
test. Praktik pendidikan semacam itu sangat bertentangan dengan tujuan
diselenggarakannya pendidikan formal di negara mana pun karena akan menyebabkan
terjadinya proses penyempitan kurikulum (curriculum contraction).
UNSUR yang paling pokok dan sangat penting yang harus
diperhatikan sebagai bahan pertimbangan dalam membuat interpretasi hasil skor
tes siswa peserta ujian adalah validitas. Konsep validitas ini sebelumnya
dipahami sebagai sebuah konsep yang terfragmentasi sehingga sering mengantarkan
praktisi penilaian pendidikan kepada kebingungan dan berpikir secara keliru.
Studi validitas dilakukan untuk membuktikan bahwa kegiatan
interpretasi dan pemanfaatan hasil skor tes yang ada sudah sesuai dengan tujuan
diselenggarakan ujian. Sebagai misal, apabila kita menyusun seperangkat tes
kemampuan/keterampilan membaca yang digunakan sebagai alat ukur untuk
menentukan kelulusan (sertifikasi) SMA. Bagaimana cara kita menilai apakah
proses interpretasi hasil ujian itu sudah dilakukan secara valid? Untuk
keperluan itu kita harus membuat sejumlah pertanyaan, antara lain: apakah hasil
skor tes itu sudah merupakan alat ukur yang sesuai dan tepat untuk tujuan di
muka, yaitu untuk mengukur kemampuan/keterampilan membaca.
Sebagaimana diketahui bahwa salah satu fungsi ujian akhir
adalah untuk memberikan sertifikasi bahwa siswa sudah belajar atau menguasai
keterampilan membaca sebagaimana yang diminta pada kurikulum. Atas dasar itu,
bukti-bukti validitas yang diperlihatkan harus mampu membuktikan bahwa skor
yang diperoleh benar sudah mengukur keterampilan membaca, sebagaimana yang
dijabarkan pada tujuan kurikulum.
Terdapat banyak sekali bukti yang harus dikumpulkan untuk
melakukan kegiatan interpretasi terhadap hasil skor tes itu. Kita dapat
menunjukkan bahwa instrumen tes yang digunakan sudah sesuai dengan tujuan
pelajaran keterampilan membaca pada kurikulum. Selain itu, kita juga harus mampu
menunjukkan bahwa jumlah jawaban yang benar pada soal tes betul-betul sudah
sejalan dengan penekanan kegiatan pengajaran membaca pada kurikulum. Lebih dari
itu, kita juga harus mampu menunjukkan bahwa keterampilan membaca teks singkat
yang tercermin dari kemampuan siswa menjawab dengan benar soal pilihan ganda
itu memiliki kualifikasi yang sama apabila yang bersangkutan diberikan teks
bacaan yang lebih panjang, atau membaca novel, artikel surat kabar. Kita juga
harus mampu membuktikan bahwa konten bacaan yang disajikan pada soal tes sudah
merupakan representasi dari isi bacaan yang dianggap penting dan challenging
yang mampu menggali kemampuan/keterampilan membaca siswa yang lebih dalam dan
ekstensif; jadi bukan hanya berupa pertanyaan-pertanyaan yang bersifat
superficial, faktual, atau trivial.
Apabila kita tidak mampu menunjukkan seluruh bukti di muka,
validitas interpretasi yang dibuat terhadap hasil skor tes sangat lemah. Selain
itu, kita juga harus mampu membuktikan bahwa skor yang tinggi yang diperoleh
siswa bukan semata-mata sebagai akibat dari test wiseness, yaitu kemampuan
siswa menjawab soal dengan benar sebagai akibat dari format soal pilihan ganda,
tutorial khusus yang diberikan menjelang tes, seperti kegiatan bimbingan tes,
menyontek, dan seterusnya. Lebih dari itu kita juga harus mampu menunjukkan
bahwa skor rendah yang diperoleh siswa bukan hanya semata-mata disebabkan oleh
faktor kegugupan pada diri siswa pada saat ujian. Selain itu, kita juga harus
mampu menunjukkan bahwa latar belakang budaya siswa tidak membawa pengaruh
terhadap kemampuan mereka menjawab soal tes dengan benar.
Semua faktor yang disajikan di muka dapat merupakan ancaman
terhadap interpretasi validitas sebuah alat ukur yang bersifat tunggal (seperti
pada UN) yang digunakan untuk mendeteksi kemampuan/keterampilan membaca.
Apabila kita tidak mampu menunjukkan bukti (evidences), hasil ujian berupa skor
tes untuk mengukur kemampuan/keterampilan membaca memiliki tingkat validitas
yang rendah.
Kesimpulan yang dapat ditarik dari uraian di muka bahwa kita
harus mampu menunjukkan bukti dan penalaran yang logis untuk membuat keputusan
pemanfaatan atas hasil skor tes. Untuk keperluan itu kita tidak bisa hanya
berpatokan pada hasil satu kali studi dan mengklaim bahwa kita sudah memiliki tes
valid yang dapat digunakan untuk berbagai keperluan.
Sumber : http://www.kompas.com/kompas-cetak/0506/27/Didaktika/1838832.htm