Cari Blog Ini

Rabu, 27 Maret 2013

syarat test yang baik

A. Syarat-syarat (Ciri-Ciri) Tes yang Baik Telah dijelaskan di muka bahwa tes merupakan sebuah alat ukur, seperti halnya alat ukur panjang (mistar), alat ukur berat (timbangan), alat ukur suhu (termometer), dan sebagainya. Perbedaannya adalah tes dimaksudkan untuk mengukur aspek perilaku manusia. Oleh sebab itu, segala persyaratan bagi sebuah alat ukur yang baik, berlaku pula bagi sebuah tes (dalam hal ini tes hasil belajar). Persyaratan atau ciri tersebut setidaknya mencakup lima hal, yaitu validitas, reliabilitas, daya pembeda, tingkat kesukaran, dan kepraktisan. 1. Validitas Validitas menunjukkan tingkat ketepatan suatu alat (tes) dalam mengukur aspek yang hendak diukur, atau mengungkap data yang hendak diungkap. Setiap alat ukur harus hanya mengukur satu dimensi atau aspek saja. Suatu tes hasil belajar dikatakan valid kalau hanya mengungkap hasil belajar tertentu saja. Mistar hanya mengukur panjang atau jarak, timbangan hanya mengkur berat, tes matematika soal-soalnya harus hanya mengukur pengetahuan matematika saja, dan sebagainya. Tidak mustahil, dalam soal matematika terdapat unsur bahasa atau bentuk soal yang belum dikenal oleh siswa, sehingga berhasil tidaknya siswa menjawab soal tersebut tidak semata-mata ditentukan oleh pengetahuan di bidang matematika, malainkan ditentukan pulan oleh kemampuan memahami bahasa, bentuk soal, dsb. Tes seperti ini kurang valid. Suatu tes yang hanya mengukur satu dimansi, biasanya soal yang satu dengan soal yang lain memiliki keterkaitan yang erat. Karena itu disyaratkan bahwa setiap aspek/subtes/soal harus berkorelasi tinggi dengan satu sama lain sehingga dapat dijadikan bukti bahwa semua aspek tersebut memang merupakan bagian dari aspek yang lebih luas. Jika tidak, konsekwensinya skor-skor untuk masing-masing soal jangan dijumlahkan begitu saja sebagai skor total. Berdasarkan konsep di atas, maka validitas itu akan selalu terkait dengan pertanyaan: valid dalam hal apa dan untuk siapa? Tes yang valid untuk mengukur bakat, tidak akan valid jika digunakan untuk mengukur minat. Demikian juga tes yang valid untuk siswa SMU kelas III, tidak akan valid untuk mahasiswa PPKKT. Dengan demikian, menguji validitas suatu tes berarti kita membandingkan tes yang kita buat dengan suatu kriteria tertentu. Berdasarkan cara/prosedur pengujiannya kita akan mengenal validitas rasional dan validitas empirik. Berdasarkan standar yang digunakan, kita akan mengenal validitas permukaan (face validity), validitas isi (content validity), dan validitas kriteria (criterion validity) yang terdiri dari construct validity dan predictive validity. 2. Reliabilitas Reliabilitas tes menunjukkan tingkat keajegan suatu tes, yaitu sejauhmana tes tersebut dapat dipercaya untuk menghasilkan skor yang ajeg/konsisten. Kecermatan hasil pengukuran ditentukan oleh banyaknya informasi yang dihasilkan dan sangat berkaitan dengan satuan ukuran dan jarak rentang (range) dari skala yang digunakan. Dalammengukur berat sebuah cincin emas, pengukuran dengan timbangan yang bersatuan miligram dan berjarak rentang antara 0 - 1000 mg, tentu akan menghasilkan ukuran yang lebih teliti dari pada menggunakan timbangan drngan satuan kilogram dengan berjarak rentang 0 – 100 kg. Begitu pula dengan tes prestasi belajar. Sebuah tes dengan jumlah soal yang banyak dan seluruh soalnya bertaraf kesukaran sedang (on-target) bagi orang yang menempuh, tentu akan menghasilkan informasi yang lebih teliti mengenai orang yang diukur, jika dibandingkan dengan tes yang soalnya sedikit dan tingkat kesukarannya rendah (off-target). Dengan kata lain soal-soal sebuah tes jangan terlalu di bawah atau di atas kemampuan tingkat pencapaian belajar siswa, dan tingkat kesukaran butir soalnya harus relatif homogen.. Menurut Balitbangdikbud (1998), mengenai keajegan (consistency) dari skor suatu tes, dapat dibedakan menjadi keajegan internal dan keajegan eksternal. Keajegan internal ialah sejauhmana butir-butir soal sebuah tes itu homogen baik dari segi tingkat kesukaran maupun dari segi bentuk soal/prosedur menjawabnya. Jadi tingkat kesukaran soal harus sesuai dengan tingkat kemampuan siswa.Tingkat keterhandalan skor tes dalam arti (1) homogenitas butir soal dan (2) kehandalan butir-butir soal dalam mengungkap perbedaan kemampuan yang terdapat di kalangan siswa, dapat diukur dengan sebuah indeks yang disebut indeks alfa dari Cronbach yang telah disederhanakan oleh Kuder dan Richardson. Keajegan eksternal adalah sejauhmana skor yang dihasilkan dari tes tersebut kepada sekelompok orang akan tetap sama sepanjang orang tersebut belum berubah. Hal ini dapat diuji dengan indkes korelasi dari tes re-test atau dengan paralel form (disederhanakan dengan splithalp menthod). 3. Daya Pembeda (Discriminating Power/Discriminating Indeks) Soal-soal dari suatu tes yang baik akan mampu membedakan antara testee yang benar-benar mampu dengan testi yang kurang mampu, antara tesi yang benar-benar belajar dengan testi yang tidak belajar. Secara empirik hal ini akan ditunjukkan dengan adanya perbedaan skor/hasil yang diperoleh oleh orang yang termasuk kelompok unggul dengan skor yang diperoleh oleh orang dari kelompok asor. Jadi orang-orang dari kelompok ungul akan lebih banyak benar dibandingkan dengan orang dari kelompok asor. 4. Tingkat Kedukaran (Dificulty Indeks) Soal-soal suatu tes yang baik akan memiliki tingkat kesukaran yang seimbang. Seimbang disini berarti berkenaan dengan proporsi penyebaran soal mudah, sedang, dan sukar. Proporsinya bisa 20% mudah, 60% sedang, dan 20% sukar, atau komposisi yang lain (1:2:1). Soal yang mudah diperlukan untuk memberikan motivasi kerja, sedangkan soal yang sukar diperlukan untuk seleksi. 5. Kepraktisan Suatu tes yang baik harus praktis dilihat dari cara menggunakannya, parktis melaksanakannya, serta praktis pula pengadministrasikannya. Semaik mudah ter itu diadministrasikan tes itu akan semakin baik 3. Penulisan Soal Penulisan soal merupakan langkah penting untuk dapat menghasilkan alat ukur atau tes yang baik. Penulisan soal adalah penjabaran indikator jenis dan tingkat perilaku yang hendak diukur menjadi pernyataan-pernyataan yang karakteristiknya sesuai dengan rincian dalam kisi-kisi. Dalam soal harus jelas apa yang dinyatakan dan jawaban apa yang dituntut. Mutu setiap soal akan menentukan mutu tes secara keseluruhan. Untuk mendapatkan mutu soal yang baik, berikut ini diberikan beberapa kaidah penulisan soal untuk tiap-tiap tipe/jenis soal. a. Kaidah Penulisan Soal Pilihan Ganda Secara umum setiap soal pilihan ganda akan terdiri dari pokok soal (stem) dan pilihan jawaban (option). Pilihan jawaban terdiri atas kunci jawaban (jawaban yang benar atau paling benar), dan pengecoh atau distractor (jawaban tidak benar yang diharapkan/mungkin dapat mengecoh seseorang yang tidak menguasai bahan pelajaran). Keunggulan soal bentuk pilihan ganda adalah dapat di skor dengan mudah, cepat, objektif, dan dapat mencakup ruang lingkup yang luas. Namun soal ini relatif lebih susah/lama disusun, susah membuat pengecoh yang homogen, dan terdapat peluang untuk menebak jawaban. Beberapa kaidah penulisan yang harus diperhatikan adalah berkenaan dengan materi soal, konstruksi dan bahasa. Materi • Soal harus sesuai dengan indikator. Artinya soal harus menanyakan perilaku dan materi yang hendak diukur sesuai dengan tuntutan indikator. Contoh: Indikator Karyasiswa dapat menjelaskan konsep sifat-sifat cahaya yang berkaitan dengan fungsi bagian-bagian mata pada manusia. Soal yang tidak sesuai dengan indikator misalnya: Alat optik yang dapat membantu manusia melihat sesuatu yang jauh menjadi lebih jelas adalah …. a. mikroskop b. kamera c. teleskop d. proyektor Soal yang sesuai dengan indikator adalah: Bagian mata yang mengatur banyaknya cahaya yang masuk adalah …. a. pupil b. retina c. kornea d. selaput iris • Pengecoh harus logis dan berfungsi Contoh soal yang salah: “Bukan satu, bukan dua, bukan sepuluh, tetapi sudah beratus-ratus tokoh yang tamat dari lembaga ini”. Kalimat di atas menggunakan majas …. a. klimaks b. sastra c. ilmiah d. anti klimaks Soal yang lebih baik adalah: “Bukan satu, bukan dua, bukan sepuluh, tetapi sudah beratus-ratus tokoh yang tamat dari lembaga ini”. Kalimat di atas menggunakan majas …. a. klimaks b. anti klimaks c. paralelisme d. repetisi • Setiap soal harus mempunyai satu jawaban yang benar atau paling benar. Artinya satu soal hanya mempunyai satu kunci jawaban. Jika terdapat beberapa jawaban yang benar, maka kunci jawaban adalah jawaban yang paling benar. Contoh soal yang salah (kunci jawaban lebih dari satu): Bentuk pengamalan pancasila yang sesuai dengan sila kelima (keadilan sosial bagi seluruh rakyat Indonesia) adalah …. a. tidak bergaya hidup mewah b. saling mencintai sesama manusia c. menghormati hak-hak orang lain d. mengembangkan sikap tenggang rasaContoh soal yang lebih baik (setelah diperbaiki): Bentuk pengamalan pancasila yang sesuai dengan sila kelima (keadilan sosial bagi seluruh rakyat Indonesia) adalah …. a. berani membela kebenaran dan keadilan b. saling mencintai sesama manusia c. menghormati hak-hak orang lain d. mengembangkan sikap tenggang rasa Konstruksi • Pokok soal harus dirumuskan secara jelas dan tegas. Artinya soal tidak bermakna ganda, dan setiap soal harus hanya mengandung satu persoalan. Conton pokok soal yang tidak jelas dan tidak tegas: Presiden Republik Indonesia ialah …. a. Soekarno b. Suharto c. B.J. Habibi d. Abdurachman Wahid Soal yang lebih baik adalah: Presiden Republik Indonesia yang kedua adalah … a. Soekarno b. Suharto c. B.J. Habibi d. Abdurachman Wahid • Rumusan pokok soal dan pilihan jawaban harus merupakan pernyataan yang diperlukan saja. Contoh soal yang mengandung informasi yang tidak diperlukan: Majelis Permusyawaratan Rakyatmerupakan lembaga tertinggi negara RI. Penulisan singkatan kata Majelis Permusyawaratan Rakyat yang benar adalah … a. MPR b. M.P.R c. MPR. d. M.P.R. Soal tersebut cukup ditulis: Penulisan singkatan kata Majelis Permusyawaratan Rakyat yang benar adalah … a. MPR b. M.P.R c. MPR. d. M.P.R. Pokok soal jangan memberikan petunjuk ke arah jawaban yang benar. Artinya pada pokok soal jangan terdapat kata, prase, atau ungkapan yang dapat memberikan petunjuk ke arah jawaban yang benar. Contoh soal yang memberi petunjuk kepada kunci jawaban yang benar: Generator listrik di PLTA Saguling digerakan oleh tenaga …. a. air b. upa panas c. gas bumi d. matahari Soal yang lebih memadai adalah : Generator listrik Saguling digerakan oleh tenaga …. a. air b. upa panas c. gas bumi d. matahari • Pokok soal jangan mengandung pernyataan yang bersifat negatif ganda. Artinya dalam setiap soal jangan mengandung dua kata atau lebih yang mengandung arti negatif, supaya terhindar dari kesalahan penafsiran oleh testee. Contoh soal yang mengandung pernyataan negatif ganda: Hewan-hewan yang hidup di air dibawah ini tidak berkembang biak dengan cara melahirkan, kecuali …. a. ikan mujair b. ikan gurame c. ikan paus d. ikan mas Contoh soal yang lebih memadai adalah Di bawah ini adalah hewan-hewan yang hidup di air yang berkembang biak dengan cara bertelur, kecuali …. a. ikan mujair b. ikan gurame c. ikan paus d. ikan mas • Pilihan jawaban harus homogen dan logis ditinjau dari segi materi. Artinya semua pilihan jawaban harus berasal dari materi yang sama seperti yang dinyatakanoleh pokok soal, penulisannya harus setara, dan semua pilihan jawaban harus berfungsi. Contoh soal yang salah Diantara nama-nama berikut, yang tidak pernah menjabat sebagai Mentri Pendidikan dan Kebudayaan Republik Indonesia adalah …. a. Fuad Hasan b. Yahya Muhaimin c. Mahatmagandhi d. Nugroho Notosusanto Soal yang lebih memadai adalah Diantara nama-nama berikut, yang tidak pernah menjabat sebagai Mentri Pendidikan dan Kebudayaan Republik Indonesia adalah …. a. Fuad Hasan b. Yahya Muhaimin c. Fuad Bawazir d. Nugroho Notosusanto • Panjang rumusan pilihan jawaban harus relatif sama. Karena pilihan jawaban yang panjang itu lebih lengkap dan akan merujuk ke pilihan jawaban benar. Contoh soal yang salah Orangtua memelihara dan mendidik anak merupakan perwujudan …. a. hak azasi manusia b. pelaksanaan cita-cita anak c. cinta dan kasih sayang orangtua terhadap anaknya supaya anak menjadi pintar dan terhormat di masa depannya d. penghormatan anak kepada orang tua Soal yang lebih memadai adalah Orang tua memelihara dan mendidik anak merupakan perwujudan …. a. pelaksanaan cita-cita anak b. pelaksanaan cita-cita orang tua c. cinta kasih sayang orang tua d. penghormatan anak kepada orang tua • Pilihan jawaban jangan mengandung pernyataan “semua pilihan di atas benar” atau “semua pilihan jawaban di atas salah”. Contoh Menurut William Stern, faktor-faktor yang mempengaruhi pertumbuhan dan perkembangan anak adalah …. a. pembawaan b. lingkungan c. kematangan d. semuanya benar Contoh soal yang lebih baik Menurut William Stern, faktor-faktor yang mempengaruhi pertumbuhan dan perkembangan anak adalah …. a. pembawaan dan lingkungan b. lingkungan dan kematangan c. kematangan dan pembawaan d. pembawaan, lingkungan, dan kematangan • Pilihan jawaban yang berbentuk angka, harus disusun berdasarkan urutan besar kecilnya nilai angka tersebut . Boleh dari yang besar ke yang kecil, atau sebaliknya. Demikian juga pilihan jawaban yang menunjukkan waktu harus disusun secara kronologis. Pola pengurutan tersebut dimaksudkan untuk memudahkan siswa memilih pilihan jawabannya. Contoh soal yang kurang baik a. 5 Juli b. 2 Mei c. 28 Oktober d. 30 Oktober Soal yang lebih baik adalah Hari Sumpah Pemuda diperingatu setiap tanggal …. a. 2 Mei b. 5 Juli c. 28 Oktober d. 30 Oktober • Gambar, grafik, tebel, diagram, dan sejenisnya yang terdapat pada soal harus jelas dan berfungsi. Artinya apa saja yang menyertai suatu soal yang ditanyakan harus jelas, terbaca, dapat dimengerti oleh siswa. Contoh soal yang tidak jelas Gambar ini menunjukkan kedudukan matahari, bulan, dan bumi. Peristiwa yang sedang terjadi adalah …. a. gerhana matahari b. herhana bulan c. gerhana bumi d. revolusi bumi Contoh soal yang lebih memadai adalah Matahari Gambar ini menunjukkan kedudukan matahari, bulan dan bumi. Peristiwa yang sedang terjadi adalah …. a. gerhana matahari b. herhana bulan c. gerhana bumi d. revolusi bumi Butir soal jangan bergantung pada jawaban soal sebelumnya. Soal yang tergantung pada jawaban soal sebelumnya, akan menyebabkan siswa tidak dapat menjawabnya dengan benar pada soal tersebut. Contoh Zat yang diperlukan untuk proses pembakaran adalah …. a. CO2 c. N2 b. O2 d. H2O Berapa persen dari zat yang dihasilkan pada jawaban di atas terdapat di sekitar kita ? a. 10 % c. 25 % b. 20 % d. 59 % Soal di atas lebih baik diubah menjadi Berapa persenkah zat O2 yang terdapat di udara sekitar kita ? a. 10 % c. 25 % b. 20 % d. 59 % Bahasa • Setiap soal harus menggunakan bahasa yang sesuai dengan dengan kaidah bahasa Indonesia yang benar. Contoh Partai Demokrasi Indonesia, kongresnya yang ke dua dilaksanakan pada tahun …. a. 1990 b. 1994 c. 1996 d. 1997 Soal tersebut dibuat menjadi lebih baik seperti : Kongres Partai Demokrasi Indonesia yang ke dua diselenggarakan pada tahun …. a. 1990 c. 1996 b. 1994 d. 1997 • Bahasa yang dgunakan harus komunikatif, sehingga mudah dimengerti testee. Contoh bahasa yang kurang komunikatif Hurup pada kata-kata berikut yang diucapkan berbeda terdapat pada kata …. a. bebas c. heran b. beli d. merah Soal yang menggunakan bahasa yang lebih komunikatif adalahBunyi /e/ yang berbeda terdapat pada kata …. a. bebas b. beli c. heran d. merah • Jangan menggunakan bahasa yang berlaku setempat, jika soal akan digunakan untuk daerah lain atau nasional. Contoh soal yang menggunakan istilah bahasa setempat : Enyeng termasuk binatang yang berkembangbiak dengan cara …. a. bertelur b. membelah diri c. melahirkan d. generatif Soal yang lebih memadai Kucing termasuk binatang yang berkembang biak dengan cara …. a. bertelur b. membelah diri c. melahirkan d. generatif • Pilihan jawaban jangan mengulang kata/frase yang bukan merupakan suatu kesatuan pengertian. Letakkanlah kata atau frase tersebut pada pokok soal. Contoh: “Have you ever been to Bali?” “Yes, ….” a. I have been to Bali twice b. I have been to Bali for two years c. I have been to Bali in 1994 d. I have been to Bali since January Soal tersebut sebaiknya dibuat menjadi “Have you ever been to Bali?” “Yes, I have been to Bali …. ” a. twice b. for two years c. in 1994 d. since January b. Kaidan Penulisan Soal Bentuk Uraian Soal bentuk uraian adalah suatu soal yang jawabannya menuntut testee untuk mengingat dan mengorganisasikan gagasan-gagasan atau hal-hal yang telah dipelajarinya dengan cara mengemukakan atau mengekspresikan gagasan tersebut dalam bentuk uraian tertulis. Berdasarkan nya soal bentuk uraian dapat dibedakan menjadi uraian objektif dan uraian non-objektif. Soal uraian objektif adalah suatu soal atau atau pernyataan yang menuntut sehimpunan jawaban dengan pengertian/konsep tertentu, sekingga penyekorannya dapat dilakukan secara objektif. Soal bentuk uraian non-objektif adalah suatu soal yang menuntut sehimpunan jawaban dengan pengertian/konsep menurut pendapat masing-masing siswa, sehingga penyekorannya mengandung unsur subjektfitas (sukar untuk dilakukan secara objektif). Jadi perbedaan yang prinsip adalah pada kepastian penyekorannya. Pada soal uraian objektif, kunci jawaban dan pedoman penyekorannya lebih pasti (diuraikan secara jelas hal atau konponenyang diskor dan berapa besarnya skor untuk setiap komponen tersebut. Pada bentuk uraian non-objektif, bentuk pedoman penyekorannya paling banter dalam bentuk rentang skor, dan karena pengaruh subjektifitas penilai walaupun rentang skor dan garis besar jawaban sudah ada, tetap akan ada perbedaan skor jika dilakukan penilaian/koreksi oleh orang yang berbeda. Dalam menulis soal bentuk uraian, penulis soal harus mempunyai gambaran tentang ruang lingkup materi yang ditanyakan dan lingkup jawaban yang diharapkan, kedalaman dan panjang jawaban, atau rincian jawaban yang mungkin diberikan oleh siswa. Dengan adanya batasan ruanglingkup, kemungkinan terjadinya ketidakjelasan soal dapat dihindari, serta dapat mempermudah pembuatan kriteria atau pedoman penyekoran. Karena itu kaidah umum yang terpenting dalam menulis soal bentuk uraian adalah, segera tulis kunci jawaban atau pokok-pokok jawaban yang mungkin diberikan oleh testee beserta kriteria atau rentang skor yang mungkin diberikan, begitu selesai menulis soal. Kaidah khusus penulisan soal bentuk uraian adalah sebagai berikut: Materi • Soal harus sesuai dengan indikator pada kisi-kisi. Artinya soal harus menyatakan perilaku dan materi yang hendak diukur sesuai dengan tuntutan indikator.  Batasan pertanyaan dan jawaban yang diharapkan (ruang lingkup) harus jelas. Contoh yang tidak baik Apa yang anda ketahui tentang PAP dan PAN ? Soal yang lebih memadai Jelaskan sekurang-kurangnya tiga perbedaan pokok antara PAP dan PAN dalam proses penilaian !  Isi materi sesuai dengan tujuan pengukuran.  Isi materi yang ditanyakan sesuai dengan jenjang, jenis sekolah dan tingkat kelas. Konstruksi  Rumusan kalimat soal atau pertanyaan harus menggunakan kata tanya atau perintah yang menuntut jawaban terurai; seperti : mengapa, uraikan, jelaskan, hubungkan, tafsirkan, buktikan, hitunglah, dsb.  Jangan menggunakan kata tanya yang tidak menuntut jawaban uraian, misalnya: siapa, dimana, kapan. Demikian juga kalimat tanya yang menuntut jawaban “ya” atau “tidak”, jangan digunakan.  Buatlah petunjuk yang jelas tentang cara mengerjakan soal.  Buatlah pedoman penyekoran segera setelah soal selesai ditulis dengan cara menguraikan komponen yang akan dinilai atau kriteria penyekorannya, besarnyaskor bagi setia komponen, serta rentang skor yang dapat diperoleh untuk soal yang bersangkutan.  Hal-hal lain yang menyertai soal (grafik, tabel, gambar, peta, dsj.) harus jelas dan terbaca, sehingga tidak menimbulkan penafsiran yang berbeda. Bahasa  Rumusan kalimat soal harus komunikatif, yaitu menggunakan bahasa yang sederhana, dan menggunakan kata-kata yang sudah dikenal testee.  Butir soal menggunakan bahasa Indonesia yang baik dan benar.  Rumusan soal tidak menggunakan kata/kalimat yang menimbulkan penafsiran yang berbeda (salah pengertian).  Jangan menggunakan bahasa yang berlaku setempat, jika soal peserta berasal dari berbagai daerah.  Rumusan soal tidak menggunakan kata-kata yang dapat menyinggung perasaan testee. Contoh Penyusunan Pedoman Penyekoran Pedoman penyekoran merupakan panduan atau petunjuk yang menjelaskan tentang: Batasan atau kata-kata kunci untuk melakukan penyekoran terhadap soal-soal bentuk uraian objektif. Kriteria-kriteria jawaban yang digunakan untuk melakukan penyekoran terhadap soal-soal uraian non-objektif. Uraian Objektif Indikator : Siswa dapat menghitung isi bangun ruang (balok) dan mengubah satuan ukurannya. Butir Soal : Sebuah bak penampung air berbentuk balok berukuran panjang 150 cm, lebar 80 cm, dan tinggi 75 cm. Berapa literkah ini bak penampung air tersebut ? Pedoman Penyekoran Langkah Kunci Jawaban Skor 1. Rumus isi balok = panjang x lebar x tinggi 1 2 = 150 cm x 80 cm x 75 cm 1 3 = 900.000 cm3 1 4 Isi balok dalam liter 900.000 = ----------- liter 1000 1 5 = 900 liter 1 Skor maksimum 5 Uraian Non-objektif Butir Soal : Jelaskan alasan apa saja yang membuat kita perlu bangga sebagai bangsa Indonesia ! Kriteria Jawaban: Jawaban boleh bermacam-macam, namun pada pokoknya jawaban dapat dikompokkan sebagai berikut: Kriteria Jawaban Rentang Skor Kebanggaan yang berkaitan dengan kekayaan alam Indonesia 0 – 2 Kebanggaan yang berkaitan dengan keindahan tanah air Indonesia (pemandangan alam, geografis, dsb.). 0 – 2 Kebanggaan yang berkaitan dengan keanekaragaman budaya, suku, adat istiadat, tetapi dapat bersatu 0 – 3 Keganggaan yang berkaitan dengan keramahtamahan masyarakat Indonesia 0 – 2 Skor maksimum 9 Penelaahan soal (Review dan revisi soal) Langkah ini merupakan hal yang penting untuk diperhatikan, karena seringkali kekurangan yang terdapat pada suatu soal tidak terlihat oleh penulis soal. Review dan revisi soal ini idealnya dilakukan oleh orang lain (bukan penulis soal, ahli lain, judger) dan terdiri dari satu tim penelaah yang terdiri dari ahli-ahli bidang studi, pengukuran, dan bahasa. Hal ini sulit untuk dilakukan karena berbagai keterbatasan (waktu, dana, dsb). Sebagai jalan keluarnya, si penulis soal dapat melakukannya sendiri dengan mengambil waktu. Misalnya soal ditulis malam hari, besok siangnya si penulis dapat menelaah/membacanya sendiri dengan menggunakan kartu telaah. Telaahan mutu soal atau analisis secara kualitatif pada dasarnya adalah penelaahan butir soal ditinjau dari segi kaidah penulisan soal, yaitu menelaah soal dilihat dari segi (1) isi atau materi, (2) konstruksi, dan (3) bahasa. Telaah isi soal. Suatu soal dapat ditelaah untuk mengetahui apakah isi atau materi soal yang dinyatakan sesuai dengan tujuan pertanyaan yang tersirat dalam indikator. Misalnya menelaah soal-soal IPS, apakah yang ditanyakan memang masalah IPS dan bukan hal lainnya. Atau soal matematika, mungkin bukan hanya menanyakan materi matematika tetapi juga menuntut pemahaman bahasa, karena soal tersebut menggunakan kalimat yang panjang. Telaah mengenai kesesuaian termaksud, dapat didasarkan pada buku acuan kurikulum. Telaah Konstruksi soal. Soal yang baik harus memenuhi kaidah-kaidah penulisan soal. Pada soal pilihan ganda, misalnya, pokok soal jangan memberikan petunjuk kearah jawaban yang benar, pilihan jawaban harus homogen dan logis, gambar atau grafik harus berfungsi dan jelas keterkaitannya dengan soal, dan sebagainya. Telaah Bahasa dan Budaya. Telaah dari segi bahasa adalah untuk melihat apakah bahasa dari suatu soal sudah jelas dan komunikatif, sehingga mudah dimengerti testee, dan tidak menimbulkan pengertian atau penafsiran yang berbeda. Dari segi budaya, perlu dilihat apakah suatu soal dapat menguntungkah kelompok budaya tertentu dan merugikan kelompok budaya lain (aspek bias). Untuk melakukan telaahan terhadap soal (baik objektif maupun uraian) berikut ini diberikan contoh kartu telaah. Kartu ini digunakan untuk tiap soal (soal demi soal). Uji coba Soal Ujicoba pada prinsipnya bertujuan untuk mendapatkan data/informasi secara emprik mengenai sejauhmana sebuah soal dapat mengukur apa yang hendak diukur. Informasi empirik tersebut pada umumnya menyangkut segala hal yang dapat mempengaruhi validitas soal, seperti aspek keterbacaan soal, tingkat kesukaran soal, pola jawaban, daya pembeda, pengaruh budaya, dan sebagainya. Uji coba dilakukan terhadap testee yang memiliki kesamaan karakteristik dengan testee yang akan di tes sesungguhnya dengan tes tersebut. Data hasil uji coba dianalisis/digunakan untuk memperbaiki kualitas soal yang dianggap jelek. Perakitan Soal Agar skor hasil tes dapat dipercaya, diperlukan soal yang banyak. Oleh karena itu dalam penyajiannya butir-butir soal yang banyak itu dirakit menjadi suatu alat ukur yang terpadu. Urutan nomor soal, pengelompokkan butir atau bentuk-bentuk soal (kalau terdapat beberapa bentuk soal), tata lay-out soal, akan memepengaruhi validitas skor-skor tes. Hal yang harus diperhatikan dalam merakit soal adalah: a. Memberi petunjuk pengerjaan untuk setiap bagian b. Pengurutan nomor soal harus sesuai dengan nomor yang ada pada kisi-kisi. c. Setiap soal tidak boleh memberi petunjuk jawaban terhadap soal yang lain. d. Penyebaran kunci jawaban harus acak, tidak berpola. e. Masing-masing pilihan jawaban yang merupakan kunci jawaban harus mengikuti rumus: Jumlah soal - Jumlah maksimum = --------------------------- + 3 Jumlah pilihan jawaban Jumlah soal - Jumlah maksimum = --------------------------- - 3 Jumlah pilihan jawaban Penggunaan (Penyajian Tes) Setelah disusun (dirakit), naskah tes diperbanyak sejumlah peserta, tes sudah siap digunakan. Hal yang perlu diperhatikan dalam pelaksanaan tes adalah waktu, petunjukcara mengerjakan atau menjawab tes (langsung pada lembar soal atau pada lembaran khusus), dan ruangan/ tempat duduk Skoring Pada prinsipnya skoring harus dilaksanakan secara objektif. Ini dapat dilihat dari hasil yang diperoleh, jika diperiksa ulang atau diperiksa oleh dua orang akan menghasilkan data/informasi yang berupa angka yang sama. Hal yang harus diperhatikan dalam skoring adalah kunci jawaban dan bobot soal. Setelah diperoleh informasi kuantitatif dari setiap peserta langkah berikut adalah mengolah skor kedalam angka baku tertentu (skala 5, skala 10 atau skala 100). Mengenai pengolahan skor ini akan dibahas lebih lanjut pada bagian khusus. Skoring dalam tes objektif adalah lebih mudah, karena setiap jawaban benar diberi skor 1 dan jika salah adalah 0. Dengan demikian skor yang diperoleh akan sama dengan jumlah jawaban yang benar. Untuk mempermudah pemeriksaan (skoring), dapat digunakan lembar jawaban yang dilubangi atau menggunakan plastik transparan. Berbeda dengan tes uraian (lebih lagi uraian yang non-objektif), skoring lebih sulit. Karena rentang skor untuk setiap soal dapat berbeda, bahkan jawaban yang benar juga dapat mempunyai rentang yang berbeda, subjekitifitas akan mempengaruhi skor yang diperoleh. Untuk mengurangi subjetifitas dan meningkatkan reliabilitas (keajegan) penskoran, dalam memeriksa sual uraian perlu diperhatikan sara-saran berikut. a. Siapkan garis-garis besar jawaban yang dikehendaki terlebih dahulu sebelum penskoran dimulai. b. Tetapkan, bagaimana menangani faktor-faktor yang tidak relevan dengan hasil belajar yang sedang diukur. Yang menonjol misalnya tulisan, ejaan, struktur kalimat, tanda baca, dan kerapihan. Penilai harus berusaha untuk tidak terpengaruh oleh faktorfaktor tersebut. Evaluasilah isinya. Namun bila hal itu akan diperhitungkan, pisahkanlah skornya dari isi jawaban. c. Gunakanlah metoda penskoran yang paling tepat. Ada dua metoda yang dapat digunakan, yaitu point method dan rating method. Dengan point method setiap jawaban dibandingkan dengan jawaban ideal yang telah ditetapkan dalam kunci, dan skor yang diberikan tergantung pada kualitas jawaban yang diberikan.. Sedangkan dengan rating method, setiap jawaban testi ditetapkan dalam salah satu kelompok yang sudah dipilah-pilah sesuai dengan kualitas jawaban. Jadi kalau suatu soal akan diberi skor maksimum 4 maka buatlah jawaban kedalam 5 kelompok. Kelompok yang terbaik mendapat skor 4 dan yang terjelek 0. d. Evaluasilah semua jawaban terhadap satu pertanyaan sebelum pindah ke jawaban berikutnya.Gunakan whole method daripada sparated method. e. Evaluasilah setiap jawaban testi tanpa melihat nama atau identitasnya. f. Lakukanlah pemeriksaan oleh lebih dari satu orang. Pelaporan Hasil tes Setelah selesai diolah langkah berikutnya adalah melaporkan hasil kepada peserta, kepada orangtua, ke lembaga (bagian akademik) atau ke pihak lain yang berkepentingan. Masing-masing pihak yang berkepentingan akan menggunakan hasil tes itu sesuai tujuannya. 10. Pemanfaatan Hasil Tes Hasil pengukuran yang diperoleh melalui hasil pengetesan, dapat dimanfaatkan untuk berbagai kepentingan. Dengan menggunakan kriteria tertentu, hasil tes dapat ditafsirkan. Penggunaan hasil dapat ditujukan untuk memperbaiki atau menyempurnakan KBM, menentukan kelulusan, atau untuk mengambil keputusan dan kebijakan lain yang relevan. Standardisasi Alat Evaluasi Seperti sudah dijelaskan pada bagian sebelumnya, bahwa suatu alat ukur yang baik memiliki beberapa ciri, seperti harus valid, harus reliable, dan butir-butir soalnya harus memiliki daya pembeda dan tingkat kesukaran yang seimbang. Tes yang baik tersebut dinamakan tes standar (standardized test). Untuk mendapatkan tes yang baik, idealnya tes itu harus diujicobakan. Namun demikian sebelum diujicobakan pun tes tersebut harus menunjukkan indikator tes yang baik. Maka idealnya, tes itu harus di analisis baik sebelum ujicoba maupun sesudahnya. Analisis sebelum ujicoba dilakukan didasarkan pada karakteristik yang tampak pada soal sebelum diujicobakab dinamakan analisis rasional. Sedangkan analisis yang dilakukan terhadap data hasil uji coba dinamakan analisis empiris. Prosedur analisis rasional lebih keanalisis validitas item, yaitu menganalisis soal dari segi isi, konstruksi dan bahasa (sudah kita tempuh pada bagian sebelumnya). Berikut ini kita akan mencoba menganalisis soal secara empiris. 1. Analisis Tingkat Kesukaran Tingkat kesukaran soal adalah proporsi jumlah peserta tes yang menjawab benar, yang dapat dicari dengan cara membandingkan jumlah peserta yang menjawab betul untuk suatu soal dengan jumlah peserta tes seluruhnya. Bila diwujudkan dalam bentuk rumus : B P = --------- T P = tingkat kesukaran soal B = jumlah subjek yang menjawab betul untuk soal ke 1 T = jumlah seluruh subjek yang menjawab soal Tingkat kesukaran ini akan berkisar antara 0 sampai 1. Semakin tinggi tingkat kesukaran (semakin mendekati 1) berarti semakin mudahlah soal tersebut. Semakin rendah angka yang diperoleh (semakin dekat dengan 0) berarti soal tersebut semakin sukar. Sebenarnya pendekatan seperti ini lebih tepat kalau disebut tingkat kemudahan, dan bila kita ingin menghitung tingkat kesukaran bisa dihitung sebaliknya, yaitu yang dihitung jumlah yang menjawab salah. Kriterianya adalah : 0,00 - 0,15 = Sangat sukar 0,16 - 0,30 = Sukar 0,31 - 0,70 = Sedang 0,71 - 0,85 = Mudah 0,86 - 1,00 = Sangat Mudah Berikut ini adalah contoh hasil perhitungan tingkat kesukaran dalam bentuk matrik (tabel) Nomor Soal Jumlah yang betul (B) Jumlah pengikut (T) Tingkat Kesukaran (P) Kualifikasi 1 0 40 0,00 Sangat sukar 2 10 40 0,25 Sukar 3 20 40 0,50 Sedang 4 30 40 0,75 Mudah 5 40 40 1,00 Sangat Mudah Fungsi tingkat kesukaran ini biasanya dikaitkan dengan tujuan tes, misalnya untuk seleksi calon siswa (UMPTN), maka soal-soal yang sulit yang digunakan; untuk keperluan sertifikasi seperti EBTANAS, soal yang sedang dan sebagian yang mudah dapat digunakan. Untuk keperluan sehari-hari soal yang sangat mudah atau sangat sukar sebaiknya dibuang saja. 2. Analisis Daya Pembeda Yang dimaksud dengan daya pembeda adalah kemampuan suatu soal untuk membedakan antara siswa yang mampu dengan yang kurang mampu, antara siswa yang termasuk kelompok unggul dengan kelompok asor. Dengan kata lain daya pembeda merupakan kemampuan suatu soal untuk membedakan antara siswa yang menguasai dengan siswa yang tidak menguasai materi pelajaran yang ditanyakan dalam soal. Langkah yang harus ditempuh untuk melakukan analisis ini adalah: a. Susun lembar jawaban yang telah di skor mulai dari yang terbesar (di atas) sampai yang terkecil (di bawah)--- dirangking. b. Tentukan kelompok siswa yang termasuk kelompok unggul (uper group) sebanyak 27% sampai 33% dari peserta, dan kelompok siswa yang termasuk kelompok asor (lower group) dengan jumlah yang sama dengan kelompok unggul. c. Hitung jumlah siswa yang menjawab betul untuk setiap soal, demikian juga untuk kelompok asor d. Hasil perhitungan itu masukan kedalam rumus: SBu - SBa DP = --------------- N DP = daya pembeda soal yang dianalisis SBu = jumlah siswa yang menjawab betul pada kelompok unggul SBa = jumlah siswa yang menjawab betul pada kelompok asor N = jumlah siswa kelompok unggul atau kelompok asor Daya pembeda soal akan berada pada interval –1 sampai dengan 1. Semakin tinggi daya pembeda soal, semakin kuat soal itu membedakan kelompok unggul dengan kelompok asor, dengan demikian soal tersebut semakin baik mutunya. Sebaliknya, semakin kecil daya pembeda maka semakin lemah soal itu membedakan kelompok unggul dengan kelompok asor. Daya pembeda yang negatif ( < 0 ), berarti kelompok asor lebih banyak yang betul. Ini merupakan soalyang jelek. Soal yang dianggap baik adalah soal yang memiliki daya pembeda 0,25 ke atas. Kriteria untuk daya pembeda secara lengkap adalah sebagai berikut: 0,00 - 0,19 = Jelek 0,20 - 0,29 = Cukup 0,30 - 0,39 = Baik 0, 40 ke atas = Baik sekali Contoh Suatu tes diikuti oleh 50 orang siswa. Maka jumlah siswa yang termasuk kelompok unggul (antara 27% sd. 33%) adalah antara 14 sampai 17 orang. Setelah diurutkan skornya ambil saja 15 orang (ranking 15 terbaik). Demikian juga untuk kelompok asor (jumlahnya sama), ambil 15 orang ranking terjelek . Setelah dikelompokkan masukan data yang diperoleh kedalam tabel berikut. Nomor Soal SBu SBa (SBu - SBa)/N Tafsiran Rekomendasi 1 15 3 12/15= 0,80 Baik sekali Digunakan 2 8 8 0/15= 0,00 Jelek Dibuang 3 7 13 -6/15 = -0,4 Jelek/terbalik Dibuang 4 7 3 4/15 = 0,27 Cukup Direvisi 5 12 9 3/15 = 0,2 Jelek Revisi Catatan: untuk menguji tingkat kesukaran juga bisa menggunakan pendekatan ini, dengan rumus: SBu + SBa DP = --------------- 2N 3. Penyebaran (distribusi jawaban) Analisis distribusi jawaban bertujuan untuk menganalisis berfungsi tidaknya jawaban yang disediakan (baik kunci jawaban maupun distractor/pengecoh). Suatu pilihan jawaban (pengecoh) dapat dikatakan berfungsi apabila: a. Paling tidak dipilih oleh 2,5% peserta tes. b. Pengecoh lebih banyak dipilih oleh kelompok bawah. 4. Analisis Kebaikan Perangkat Tes Selain analisis soal seperti diatas, hal lain yang harus diuji adalah analisis perangkat tes secara keseluruhan. Di sini ada dua hal yang harus diuji, yaitu validitas dan reliabilitas tes. a. Analisis validitas Seperti suda dikatakan bahwa validitas merujuk kepada ketepatan suatu tes dalam mengukur aspek yang hendak diukur. Ada beberapa jenis validitas. 1) Validitas permukaan (face validity) Validitas ini dapat diketahui dengan cara analisis rasional. Hal yang dianalisis dalam validitas ini adalah: a) Apakah bahasa dan susunan kalimat pada tiap butir soal cukup jelas dan sesuai dengan kemampuan siswa ? b) Apakah isi jawaban yang diminta tidak membingungkan ? c) Apakah cara menjawab sudah dipahami siswa ? d) Apakah tes (soal-soalnya) itu telah disusun berdasarkan kaidah penulisan soal ? 2) Validitas Isi Validitas ini juga dapat diketahui dengan analisis rasional, yaitu mencocokan setiap butir soal dengan kisi yang telah dikembangkan berdasarkan GBPP. Yang diuji adalah a) Apakah keseluruhan tes telah sesuai dengan kisi-kisi ? b) Apakah tiap butir soal tidak menuntut siswa untuk menguasai bahan diluar mata pelajaran yang bersangkutan ? 3) Validitas Kriteria (Criterion validity) Validitas ini diketahui dengan cara empirik, yaitu menghitung koefisien korelasi antara tes bersangkutan dengan tes lain sebagai kriterianya. Tes lain yang dapat dijadikan kriteria adalah tes yang sudah dianggap valid. Misalnya skor tes bahasa Inggris dikorelasikan dengan skor tes bahasa inggris yang sudah dibakukan. Kesulitannya adalah mencari skor tes yang akan dijadikan kriteria. b. Analisis Reliabilitas Dimuka sudah dikatakan bahwa reliabilitas merujuk kepada keajegan suatu tes dalam menghasilkan skor yang relatif konsisten. Ini berarti bahwa tes yang reliabel akan mampu memberikan skor yang relatif konstan walau pun diberikan pada situasi yang berbeda-beda. Ada tiga cara untuk mengetahui reliabilitas, yang prinsipnya adalah menghitung indeks korelasi. Tiga cara tersebut adalah; 1) Metoda Tes Ulang (Test-retest Method) Metoda ini dilakukan dengan memberikan tes dua kali terhadap subjek dengan jangka waktu tertentu. Skor hasil tes pertama dikorelasikan dengan skor tes kedua. Misalnya hasil dua kali tes terhadap 12 orang siswa sebagai berikut: Nama Siswa Skor hasil tes pertama (X) Skor hasil tes kedua (Y) A 45 49 B 78 75 C 54 63 D 65 68 E 76 72 F 89 72 G 33 43 H 65 67 I 71 74 J 67 62 K 56 63 L 80 80 Dari data di atas, diperoleh N = 12 X = 779 Y = 788 X2 = 53327 Y2 = 53014 dan XY = 52867. Dengan menggunakan rumus perhitungan seperti pada contoh perhitungan validitas (Pearsons Product Moment) maka diperoleh angka koefisien reliabilitas = 0,91 2) Metoda tes paralel (Paralel Test Method) Cara ini menuntut dua tes yang paralel, yaitu tes yang disusun dengan tujuan sama (mengukur hal yang sama tetapi berbeda dalam redaksi atau kalimatnya). Kedua tes ini diberikan kepada siswa yang sama dengan waktu yang berbeda beberapa hari saja. Kemudian skor yang diperoleh dari masing-masing tes itu dihitung indeks korelasinya (seperti di atas). Koefisien korelasi yang diperoleh menunjukkan tingkat reliabilitasnya. 3) Teknik Belah Dua (Split-half Method) Cara ini paling mudah, yaitu dengan cara membagi dua skor total yang diperoleh dari satu kali tes. Pembagian skor itu bisa dengan cara memisahkan skor dari soal-soal yang bernomor ganjil dengan skor dari soal-soal nomor genap, atau dengan cara membelah dua (setengah-setengah). Masing-masing bagian dijadikan satu variabel. Kemudian angka dari masing-masing variabel itu dihitung korelasinya seperti pada contoh di atas, hasilnya adalah koefisien korelasi rhh atau koefisian korelasi ganjil-genap. Karena tes dibelah menjadi dua, maka untuk mendapatkan korelasi seluruh tes, koefisien korelasinya ganjil genap itu dihitung lagi, menjadi rtt dengan rumus: 2 x r hh r tt = ----------------------- 1 + r hh Contoh penggunaan rumus tersebut adalah: Nama siswa Skor kelompok soal gasal (X) Skor kelompok soal genap (Y) Skor total (Ganjil +Genap) A 20 25 45 B 38 40 78 C 28 26 54 D 33 32 65 E 33 43 76 F 44 45 89 G 17 16 33 H 33 32 65 I 36 35 71 J 35 32 67 K 30 26 56 L 42 38 80 S 389 390 779 Dengan menggunakan rumus korelasi Pearson, maka diperoleh harga rxy atau rhh = 0,88. Maka koefisien korelasi atau indeks reliabilitas seluruh tes (rtt) dengan rumus di atas adalah; 2 x 0,88 1,72 rtt = ------------------ = ----------- = 0,94 1 + 0,88 1,88

Tidak ada komentar:

Posting Komentar