Wednesday 21 December 2016

Model Evaluasi Pendidikan (Makalah)


Makalah Model Evaluasi Pendidikan
 
BAB I
PENDAHULUAN


A.    Latar Belakang Masalah
Pada konteks pembelajaran, evaluasi pada umumnya berorientasi pada tujuan pendidikan yang di dalamnya mencakup beberapa macam tujuan termasuk tujuan pendidikan nasional, tujuan institusi, tujuan instruksional umum, dan tujuan instruksional khusus yang di dalamnya mengandung penampilan (Performance). Model evaluasi muncul karena adannya usaha eksplanasi secara kontinu yang diturunkan dari perkembangan pengukuran dan keinginan manusia untuk berusaha menerapkan prinsip-prinsip evaluasi pada cakupan yang lebih abstrak pada bidang ilmu pendidikan, perilaku dan seni.

B.     Rumusan Masalah
Di antara model-model evaluasi yang ada pada makalah ini adalah:
1.      Model CIPP
2.      Model Kirkpatrick
3.      Model Alkin/ UCLA
4.      Model Brinkerhoff
5.      Model Countenance
6.      Model Tyler
7.      Goal Free evaluation Model (Model Bebas Tujuan)


BAB II
PEMBAHASAN
MODEL-MODEL EVALUASI

A.    Model CIPP
            Decision Oriented evaluation Model atau Model CIPP (Contex, Input, Proces, Product) adalah model evaluasi yang dikembangkan oleh Danial Stufflebeam dan kawan-kawan di Ohio State University. Evaluasi ini menitikberatkan pada penilaian program dan penyajian informasi untuk pembuatan keputusan. Keempat model evaluasi tersebut merupakan satu rangkaian yang utuh, tetapi Stufflebeam mengatakan bahwa dalam pelaksanaannya seorang evaluator tidak harus menggunakan keseluruhannya. Keunikan pada model-model tersebut adalah, pada setiap tipe evaluasi terkait pada perangkat pengambilan keputusan dan operasi sebuah program. Dalam hal lain, keempat model evaluasi Stufflebeam tersebut dapat dipadukan dengan model-model evaluasi yang dikembangkan oleh beberapa ahli-ahli lain yang sudah dianggap baku dan standar, serta telah teruji kehandalannya dalam berbagai penerapan pendidikan.
            Ditinjau dari pelaksanaan suatu program, Evaluasi Model CIPP memberikan suatu format evaluasi yang komprehensif pada setiap tahapan evaluasi yaitu: konteks, input, proses, dan output.[1] Secara rinci dijelaskan sebagai berikut:
1.      Evaluasi komponen konteks, sebagai fokus institusi, yaitu mengidentifikasi target populasi dan menilai kebutuhan. Evaluasi konteks dilaksanakan sebagai need assessment atas suatu kebutuhan, memberikan informasi bagi pengambilan keputusan dalam perencanaan suatu program yang akan dijalankan. Menurut Stufflebeam, evaluasi konteks ini adalah evaluasi yang paling mendasar, yang mempunyai misi untuk menyediakan suatu rasional/landasan untuk penentuan tujuan pendidikan, evaluasi konteks berupaya untuk memisahkan masalah dengan kebutuhan yang tidak diinginkan di dalam setting pendidikan, konteks melibatkan analisis secara konseptual yang berhubungan dengan elemen-elemen lingkungan pendidikan yang lebih deskriptif dan komparatif. Menurut Suharsimi Arikunto dan Cepi Safruddin Abdul Jabar  menyatakan bahwa Evaluasi Konteks adalah upaya untuk menggambarkan dan merinci lingkungan, kebutuhan yang tidak terpenuhi, populasi dan sampel yang dilayani, dan tujuan proyek.[2] Sejalan dengan pendapat di atas Djuju Sudjana menyatakan bahwa Evaluasi Konteks program menyajikan data tentang alasan-alasan untuk menetapkan tujuan-tujuan program dan prioritas tujuan. Evaluasi ini menjelaskan mengenai konteks lingkungan yang relevan, menggambarkan kondisi yang ada dan yang diinginkan dalam lingkungan, dan mengidentifikasi kebutuhan-kebutuhan yang belum terpenuhi dan peluang yang belum dimanfaatkan.[3] Berdasarkan uraian di atas dapat disimpulkan bahwa evaluasi konteks meliputi analisis masalah yang berhubungan dengan lingkungan program, kebutuhan yang tidak terpenuhi, populasi dan sampel yang dilayani,   mengidentifikasi kebutuhan-kebutuhan yang belum terpenuhi dan peluang yang belum dimanfaatkan yang secara khusus mempunyai pengaruh terhadap konteks masalah yang menjadi komponen program. Dapat dikatakan pula bahwa evaluasi konteks adalah evaluasi terhadap kebutuhan, yaitu memperkecil kesenjangan antara kondisi faktual dengan kondisi yang diharapkan. Tujuan utama evaluasi konteks adalah mengidentifikasi kekuatan dan kelemahan dari sasaran dan memberikan arah perbaikan.
2.      Evaluasi komponen Input, digunakan sebagai bahan pertimbangan membuat keputusan, penentuan strategi evaluasi, meliputi analisis persoalan yang berhubungan dengan bagaimana penggunaan sumber-sumber yang tersedia, alternatif-alternatif dan strategi yang harus dipertimbangkan untuk mencapai suatu program, desain prosedur untuk strategi implementasi, pembiyaan dan penjualan.[4] Evaluasi input pada program pendidikan baik pendidikan formal maupun nonformal secara menyeluruh, lebih baku, selalu berhubungan dengan peserta didik, pendidik, kurikulum, sarana prasarana dan kelengkapan administrasi. Menurut Djuju Sudjana Evaluasi masukan (input) program menyediakan data untuk menentukan bagaimana penggunaan sumber-sumber yang dapat digunakan untuk mencapai tujuan program. Hal ini berkaitan dengan relevansi, kepraktisan, pembiyaan, efektifitas yang dihendaki, dan alternatif-alternatif yang dianggap unggul.[5] Sejalan dengan pendapat di atas Suharsimi Arikunto dan Cepi Safruddin Abdul Jabar  menyatakan bahwa Evaluasi Input adalah kemampuan awal warga belajar dan sekolah dalam menunjang PMTAS, antara lain kemampuan sekolah dalam menyediakan petugas yang tepat, pengatur menu yang andal, ahli kesehatan yang berkualitas, dan sebagainya.[6]Evaluasi input pada program Paket C sama seperti pada sekolah regular lainnya yakni, warga belajar, guru, dan tenaga kependidikan, bahan ajar, kurikulum serta sarana belajar.
3.      Evaluasi komponen Proses, digunakan dalam program sebagai data untuk mengimplementasikan keputusan, merupakan evaluasi yang dirancang dan diaplikasikan dalam proses (pelaksanaan) atau membimbing dalam implementasi kegiatan, evaluasi program juga digunakan untuk mengidentifikasi kerusakan prosedur implementasi pada tata laksana kejadian dan aktifitas. Setiap aktifitas di monitor dan di catat perubahan-perubahan yang terjadi secara jujur dan cermat. Pentingnya pencatatan aktivitas keseharian sebagai pertimbangan pengambilan keputusan untuk menentukan tindak lanjut dan penyempurnaan program. Menurut Suharsimi Arikunto dan Cepi Safruddin Abdul Jabar  menyatakan bahwa Evaluasi Proses diarahkan pada seberapa jauh kegiatan yang dilaksanakan di dalam program sudah terlaksana sesuai dengan rencana.[7] Sedangkan menurut Djuju Sudjana Evaluasi proses menyeediakan umpan balik yang berkenaan dengan efisiensi pelaksanaan program, termasuk di dalamnya pengaruh system dan keterlaksanaannya. Evaluasi ini mendeteksi atau memprediksi kekurangan dalam rancangan prosedur kegiatan program dan pelaksanaannya, menyediakan data untuk keputusan dalam implementasi program, dan memelihara doumentasi tentang prosuder yang dilakukan. Dalam program pendidikan, evaluasi inipun menyediakan informasi terhadap jenis keputusan yang mungkin dilakukan oleh pendidik.[8]
Dengan demikian, dapat disimpulkan bahwa evaluasi proses adalah pengawasan secara terus menerus pada pelaksanaan program yang sangat berguna dan menentukan kelemahan/hambatan dan kekuatan/pendukung sehingga prosedur dapat dimonitor dan diperbaiki.
4.      Evaluasi komponen Produk/Output, digunakan sebagai bahan pertimbangan menolong keputusan selanjutnya, merupakan kumpulan deskripsi dan judgement dari outcomes, hubungan dengan konteks, masukan dan proses dan kemudian diinterpretasikan harga dan jasa yang diberikan. Evaluasi produk adalah evaluasi yang dilakukan dalam mengukur keberhasilan pencapaian tujuan yang telah ditetapkan, merupakan catatan pencapaian hasil dan keputusan-keputusan untuk perbaikan pelaksanaan atau aktualisasi pengukuran dikembangkan dan diadministrasikan secara cermat dan teliti. Keakuratan analisis data akan menjadi acuan dalam penarikan kesimpulan dan pengajuan saran apakah program diteruskan, dimodifikasi atau dihentikan. Evaluasi produk merupakan tahap akhir, berfungsi untuk membantu penanggungjawab program dalam mengambil keputusan. Dalam analisis hasil ini, diperlukan pembanding antara tujuan yang ditetapkan dalam rancangan dengan hasil program yang dicapai. Pada dasarnya mempertanyakan apakah sasaran yang ingin dicapai pada suatu program telah tercapai. Hasil yang dinilai berupa grafik skor tes, presentasi, data observasi, diagram data , sosiometri dan sebagainya yang masing-masing dapat ditelusuri kaitannya dengan tujuan-tujuan yang lebih rinci. Evaluasi produk/output pada penelitian evaluasi ini adalah hasil belajar warga belajar pada ujian semester (ujian sumatif) dan persentase kelulusan warga belajar dalam mengikuti Ujian Akhir Nasional. Menurut Suharsimi Arikunto dan Cepi Safruddin Abdul Jabar menyatakan bahwa Evaluasi Produk diarahkan pada hal-hal yang menunjukkan perubahan yang terjadi pada masukan mentah. Evaluasi produk merupakan tahap akhir dari serangkaian evaluasi program.[9] Sedangkan menurut Djuju Sudjana Evaluasi Produk mengukur dan menginterpretasi pencapaian program selama pelaksanaan program pada akhir program. Evaluasi ini berkaitan dengan pengaruh utama, pengaruh sampingan, biaya, dan keunggulan program, evaluasi produk melibatkan upaya penetapan criteria, melakukan pengukuran, membandingkan ukuran keberhasilan dengan standar absolut atau relative, dan melakukan interpretasi rasional tentang hasil dan pengaruh dengan menggunakan data tentang konteks, input dan proses.[10]
B.     Model Kirkpatrick
Kirkpatrick salah seorang ahli evaluasi program pelatihan dalam bidang pengembangan sumber daya manusia (SDM). Model evaluasi yang dikembangkan oleh Kirkpatrick dikenal dengan istilah Kirkpatrick Four Levels Evaluation Model. Evaluasi terhadap efektivitas program pelatihan (training) menurut Kirkpatrick (1998) mencakup empat level evaluasi, yaitu: level 1reaction, level 2 learning, level 3 behavior, dan level 4 result.
1.       Evaluasi tahap 1 : Reaksi (Reaction Evaluating).
Mengevaluasi terhadap reaksi peserta pembelajaran berarti mengukur kepuasan siswa. Pembelajaran dianggap efektif apabila proses pembelajaran dirasa menyenangkan dan memuaskan bagi siswa sehingga mereka tertarik dan termotivasi untuk belajar dan berlatih. Dengan kata lain siswa akan termotivasi apabila proses pembelajaran berjalan secara memuaskan bagi siswa yang pada akhirnya akan memunculkan reaksi dari siswa yang menyenangkan. Sebaliknya apabila siswa tidak merasa nyaman terhadap proses pembelajaran yang diikutinya maka mereka tidak akan termotivasi untuk mengikuti pembelajaran lebih lanjut. Partner (2009) mengemukakan “the interest, attention and motivation of the participants are critical to the success of any training program, people learn better when they react positively to the learning environment”. Disimpulkan bahwa keberhasilan proses kegiatan pembelajaran tidak terlepas dari minat, perhatian, dan motivasi peserta pelatihan dalam mengikuti jalannya kegiatan pembelajaran. Siswa akan belajar lebih baik manakala mereka memberi reaksi positif terhadap lingkungan belajar. Kepuasan siswa dapat dikaji dari beberapa aspek, yaitu materi yang diberikan, fasilitas yang tersedia, strategi penyampaian materi yang digunakan oleh guru, media pembelajaran yang tersedia, waktu pelaksanaan pembelajaran, hingga gedung tempat pembelajaran dilaksanakan. Mengukur reaksi dapat dilakukan dengan reaction sheet dalam bentuk angket sehingga lebih mudah dan lebih efektif.
2.      Evaluasi tahap 2 : Evaluasi Belajar (Learning Evaluating)
Kirkpatrick (1998:20) mengemukakan “learning can be defined as the extend to which participans change attitudes, improving knowledge, and/or increase skill as a result of attending the program”. Terdapat tiga hal yang dapat guru ajarkan dalam pelaksanaan program pembelajaran, yaitu pengetahuan, sikap, dan keterampilan. Siswa dikatakan telah belajar apabila pada dirinya telah mengalami perubahan sikap, perbaikan pengetahuan maupun peningkatan keterampilan. Oleh karena itu untuk mengukur efektivitas program pelatihan maka ketiga aspek tersebut perlu untuk diukur. Tanpa adanya perubahan sikap, peningkatan pengetahuan maupun perbaikan keterampilan pada siswa maka program dapat dikatakan gagal. Penilaian evaluating learning ini ada yang menyebut dengan penilaian hasil (output) belajar. Oleh karena itu dalam pengukuran hasil belajar (learning measurement) berarti penentuan satu atau lebih hal berikut: a) pengetahuan yang telah dipelajari, b) perubahan sikap, dan c) keterampilan yang telah dikembangkan atau diperbaiki. Mengukur hasil belajar lebih sulit dan memakan waktu dibandingkan dengan mengukur reaksi. Mengukur reaksi dapat dilakukan dengan reaction sheet dalam bentuk angket sehingga lebih mudah dan lebih efektif. Menurut Kirkpatrick (1998: 40), penilaian terhadap hasil belajar dapat dilakukan dengan: “a control group if practical, evaluate knowledge, skill and/or attitudes both before and after the program, a paper-and-pencil test to measure knowledge and attitudes, and performance test to measure skills”. Dengan demikian untuk menilai hasil belajar dapat dilakukan dengan kelompok pembanding. Kelompok yang ikut pelatihan dan kelompok yang tidak ikut pelatihan diperbandingkan perkembangannya dalam periode waktu tertentu. Dapat juga dilakukan dengan membandingkan hasil pretest dengan posttest, tes tertulis maupun tes kinerja (performance test).
3.       Evaluasi tahap 3 : Tingkah Laku (Behavior Evaluating)
Evaluasi pada level ke 3 (evaluasi tingkah laku) ini berbeda dengan evaluasi terhadap sikap pada level ke 2. Penilaian sikap pada evaluasi level 2 difokuskan pada perubahan sikap yang terjadi pada saat kegiatan pembe;ajaran dilakukan sehingga lebih bersifat internal, sedangkan penilaian tingkah laku difokuskan pada perubahan tingkah laku siswa setelah selesai mengikuti pembelajaran. Sehingga penilaian tingkah laku ini lebih bersifat eksternal. Karena yang dinilai adalah perubahan perilaku setelah mengikuti kegiatan pembelajaran dan kembali ke lingkungan mereka maka evaluasi level 3 ini dapat disebut sebagai evaluasi terhadap outcomes dari kegiatan pelatihan.
4.      Evaluasi tahap 4 : Evaluasi Hasil (Result Evaluating). Evaluasi hasil dalam level ke 4 ini difokuskan pada hasil akhir (final result) yang terjadi karena siswa telah mengikuti suatu program pembelajaran. Termasuk dalam kategori hasil akhir dari suatu program pembelajaran diantaranya adalah peningkatan hasil belajar, peningkatan pengetahuan, dan peningkatan keterampilan (skills). Beberapa program mempunyai tujuan meningkatkan moral kerja maupun membangun teamwork (kerjasama tim) yang lebih baik. Dengan kata lain adalah evaluasi terhadap impact program (pengaruh program). Tidak semua pengaruh dari sebuah program dapat diukur dan juga membutuhkan waktu yang cukup lama. Oleh karena itu evaluasi level 4 ini lebih sulit di bandingkan dengan evaluasi pada level-level sebelumnya. Evaluasi hasil akhir ini dapat dilakukan dengan membandingkan kelompok kontrol dengan kelompok peserta pembelajaran, mengukur kemampuan siswa sebelum dan setelah mengikuti pembelajaran apakah ada peningkatan atau tidak.[11]
C.    Model Alkin/ UCLA
Model evaluasi ini dikembangkan oleh Alkin ketika beliau menjabat sebagai ketua The Centre for the Study of Evaluation di UCLA (University of Californiain at Los Angles). Alkin mengembangkan alur evaluasi yang mirip dengan model CIPP. Alkin mengemukakan lima macam evaluasi, yakni: System Assessment, Program Planning, Program Implementation, Program Improvement, Program Certification.
1.      Sistem assessment, yaitu untuk memberikan informasi tentang keadaan atau posisi dari suatu sistem.
2.      Program planning, yaitu untuk membantu pemilihan program tertentu yang mungkin akan berhasil memenuhi kebutuhan program.
3.      Program implemantation, yaitu untuk menyiapkan informasi apakah suatu program sudah diperkenalkan kepada kelompok tertentu yang tepat sebagaimana yang direncanakan.
4.      Program imporovement, yaitu memberikan informasi tentang bagaimana suatu program dapat berfungsi, bekerja atau berjalan. Apakah sesuai dengan pencapaian tujuan? Apakah hal-hal atau masalah-masalah baru yang muncul secara tiba-tiba.
5.      Program certification, yaitu memberikan informasi tentang nilai atau manfaat suatu program.[12]
D.    Model Brinkerhoff
Model O. Brinkerhoff (1987) mengemukakan ada tiga jenis evaluasi yang disusun berdasarkan penggabungan elemen-elemen yang sama yaitu:
1.      Fixed vs Emergent Evaluation Design
Desain evaluasi fixed (tetap) harus direncanakan dan disusun secara sistemik-terstruktur sebelum program dilaksanakan. Meskipun demikian, desain fixed dapat juga disesuaikan dengan kebutuhan yang sewaktu-waktu dapat berubah. Desain evaluasi ini dikembangakn berdasarkan tujuan program, kemudian disusun pertanyaan-pertanyaan untuk mengumpulkan berbagai informasi yang diperoleh dari sumber-sumber tertentu. Kegiatan evaluasi yang dilakukan dalam desain fixed ini, antara lain menyusun pertanyaan-pertanyaan, menyusun dan menyiapkan instrumen, menganalisis hasil evaluasi, dan melaporkan hasil evaluasi secara formal kepada pihak-pihak yang berkepentingan.
2.      Formative vs Summative Evaluation
Istilah formatif dan sumatif pertama kali dipopulerkan oleh Michael Scriven. Model ini menunjukan adanya tahapan dan lingkup objek yang dievaluasi, yaitu evaluasi yang dilakukan pada waktu program masih berjalan (disebut evaluasi formatif) dan ketika program sudah selesai atau berakhir (disebut evaluasi sumatif).[13] Untuk dapat memahami kedua jenis evaluasi ini dapat dilihat dari fungsinya. Evaluasi formatif berfungsi untuk memperbaiki kurikulum dan pembelajaran, sedangkan evaluasi sumatif berfungsi untuk melihat kemanfaatan kurikulum dan pembelajaran secara menyeluruh. Artinya, jika hasil kurikulum dan pembelajaran memang bermanfaat bagi semua pihak yang terkait (terutama peserta didik) maka kurikulum dan pembelajaran dapat dilanjutkan. Sebaliknya, jika hasil kurikulum dan pembelajaran tidak mempunyai manfaat, maka kurikulum dan pembelajaran dapat dihentikan.
3.      Experimental and quasi experimental design vs natural/ unobstrusiveinquiry
Desain eksperimental banyak menggunakan pendekatan kuantitatif, random sampling, memberikan perlakuan dan mengukur dampak, tujuannya adalah untuk menilai manfaat hasil percobaan program pembelajaran. Untuk itu, perlu dilakukan manipulasi terhadap lingkungan dan pemilihan strategi yang dianggap pantas. Dalam praktiknya, desain evaluasi ini agak sulit dilakukan karena pada umumnya proses pembelajaran sudah atau sedang terjadi. Jika prosesnya sudah terjadi, evaluator cukup melihat dokumen-dokumen sejarah atau menganalisis hasil tes. Jika prosesnya sedang terjadi, evaluator dapat melakukan pengamatan atau wawancara dengan orang-orang yang terlibat.
E.     Model Countenance
Model Countenance adalah model pertama evaluasi kurilulum yang dikembangkan Stake. Pengertian Countenance adalah keseluruhan, sedangkan pengertian lain adalah sesuatu yang disenangi (favourable). Menurut Provus (1972), Tujuan dari model Countenance Stake adalah melengkapi kerangka untuk pengembangan suatu rencana penilaian kurikulum. Perhatian utama Stake adalah hubungan antara tujuan penilaian dengan keputusan berikutnya berdasarkan sifat data yang dikumpulkan. Hal tersebut, karena Stake melihat adanya ketidak-sesuaian antara harapan penilai dan guru.
Penilaian yang dilakukan oleh guru tidak akan sama hasilnya dengan penilaian yang dilakukan oleh ahli penilaian. Jadi, menurut Porvus model Countenance Stake dimaksudkan guna memastikan bahwa semua data yang dikumpulkan dan diolah untuk melengkapi informasi yang dapat digunakan oleh pemakai data. Hal ini berarti bahwa penilai harus mengumpulkan data deskriptif yang lengkap tentang hasil belajar siswa dan data pelaksanaan pengajaran, dan hubungan antara kedua faktor tersebut. Di samping itu juga, judgment data harus dikumpulkan. Sedangkan menurut Howard, H (2008) evaluasi Stake’s orientasinya adalah tujuan dan pendekatan mekanik dalam program pendidikan. Oleh karena itu, Kemble & Charles (2010) mengatakan bahwa model countenance stake sangat berpengaruh pada program pendidikan.
Stake mendasarkan modelnya pada evaluasi formal, suatu kegiatan evaluasi yang sangat tergantung pada pemakaian “checklist, structured visitation by peers, controlled comparisons, and standardized testing of students” (Hasan, 2008, 207). Dalam hal checklist Shepard (1997) menyebutkan bahwa terdapat lima ketegori yaitu:
1.      Obyektivitas atau tujuan evaluasi.
2.      Spesifikasi program meliputi filsafat pendidikan yang dianut pada mata pelajaran, tujuan pembelajaran, dan lain sebagainya.
3.      Outcome program, seperti pengalaman belajar, pencapaian hasil siswa.
4.      Hubungan dan indikator mencakup kongruensi kenyataan dan harapan, kontingensi meliputi sebab akibat.
5.      Judgment nilai.
Oleh karena itu, Hasan (2008; 201) mengatakan bahwa model Countenance stake bersifat arbitraty dan tidak perlu dianggap sebagai suatu yang mutlak. Stake’s mempunyai keyakinan bahwa suatu evaluasi haruslah memberikan deskripsi dan pertimbangan sepenuhnya mengenai evaluan. Dalam model ini stake sangat menekankan peran evaluator dalam mengembangkan tujuan kurikulum menjadi tujuan khusus yang terukur, sebagaimana berlaku dalam tradisi pengukuran behavioristik dan kuantitatif.
Model Countenance Stake terdiri atas dua matriks. Matriks pertama dinamakan matriks deskripsi dan yang kedua dinamakan matriks judgement. Matriks judgement baru dapat dikerjakan oleh evaluator setelah matriks deskripsi diselesaikan. Matriks Deskripsi terdiri atas kategori rencana (intent) dan observasi. Matriks Judgement terdiri atas kategori standard dan judgement. Pada setiap kategori terdapat tiga fokus yaitu antecedents (masukan) yaitu sebuah kondisi yang ada sebelum instruksi yang mungkin berhubungan dengan hasil, contohnya: latar belakang guru, Kurikulum yang sesuai, Ketersediaan sumber daya, transaction (proses) yaitu pertemuan dinamis yang merupakan proses instruksi (kegiatan, proses, dll), contohnya: interaksi guru dan siswa, Komponen partisipasi, Outcomes (hasil) yaitu efek dari pengalaman pembelajaran (pengamatan dan hasil tenaga kerja), contohnya performance guru, Peningkatan kinerja.
1.      Matriks Deskripsi
Kategori pertama adalah sesuatu yang direncanakan pengembang kurikulum atau program. Dalam konteks KTSP, kurikulum tersebut adalah kurikulum yang dikembangkan atau digunakan oleh satu satuan pendidikan. Sedangkan program adalah silabus dan Rencana Program Pengajaran (RPP) yang dikembangkan guru. Guru sebagai pengembang program merencanakan keadaan/persyaratan yang diinginkannya untuk suatu kegiatan kelas tertentu. Misalnya yang berhubungan dengan minat, kemampuan, pengalaman,dan lain sebagainya dari peserta didik.
Kategori kedua dinamakan observasi, berhubungan dengan apa yang sesungguhnya sebagai implementasi yang diinginkan pada kategori yang pertama. Kategori ini juga sebagaimana yang pertama terdiri atas antecendents, transaksi, dan hasil. Evaluator harus melakukan observasi (pengumpulan data) mengenai antecendents, transaksi, dan hasil yang ada di suatu satuan pendidikan.
2.      Matriks Pertimbangan (judgement)
Terdiri atas kategori standard dan pertimbangan, dan fokus antecendents, transaksi, dan outcomes (hasil yang diperoleh). Standar adalah kriteria yang harus dipenuhi oleh suatu kurikulum atau program yang dijadikan evaluan. Standar dapat dikembangkan dari karakteristik yang dimiliki kurikulum, tetapi dapat juga dari yang lain (pre-ordinate, mutually adaptive, proses). Kategori kedua adalah kategori pertimbangan. Kategori ini menghendaki evaluator melakukan pertimbangan dari apa yang telah dilakukan dari kategori yang pertama dan kedua matriks Deskripsi sampai kategori pertama matriks Pertimbangan. Suatu evaluasi harus sampai kepada pemberian pertimbangan. Keseluruhan matriks yang mendukung model Stake ini terdiri dari 12 kotak.



RASIONAL           INTENTES  OBSERVATIONS                           STANDARS   JUDGEMENT




                                                                        ANTECE
                                                                        DENTS



                                                                        TRANSAC
                                                                        TIONS
                                                                     

 
                                                                        OUTCOMES
    
                                  DESCRIPTION  MATRIX                                               JUDGEMENT MATRIX

               
                     Berdasarkan gambar konsep evaluasi countenance di atas, penerapan
evaluasi model countenance dalam proses belajar mengajar adalah sebagai berikut:
Kategori pertama dari matriks deskripsi adalah sesuatu yang direncanakan (intent) pengembang program. Program adalah silabus atau rencana program pengajaran (RPP) yang dikembangkan oleh guru. Seorang guru sebagai pengembang program merencanakan keadaan (persyaratan) yang diinginkannya untuk suatu kegiatan di kelas tertentu. Baik persyaratan tersebut berhubungan dengan peserta didiknya seperti minat, kemampuan, pengalamannya, dan lain sebagainya yang biasa diistilahkan dengan entry                     behaviors, ataupun persyaratan yang berhubungan dengan lingkungan di kelas, yang kesemuanya dapat dicantumkan dalam antecedent yang direncanakan. Lebih lanjut, guru tersebut merencanakan apa yang
diperkirakan akan terjadi pada waktu interaksi di kelas, dan kemampuan apa yang diharapkan dimiliki peserta didik setelah proses interaksi berlangsung.[14]
            Kategori kedua adalah kategori pertimbangan. Kategori ini menghendaki evaluator melakukan pertimbangan dari apa yang telah dilakukan dari kategori pertama dan kedua dari matriks deskripsi dan kategori pertama dari matriks pertimbangan. Evaluator harus mengumpulkan data mengenai pertimbangan tersebut dari sekelompok orang yang dianggap memiliki kualifikasi untuk memberikan pertimbangan tersebut.
Stake mengatakan bahwa apabila kita menilai suatu program pendidikan kita, melakukan perbandingan yang relative antara satu program dengan yang lain, atau perbandingan yang absolute (satu program dengan standard).
Penekanan yang umum atau hal yang penting dalam model ini adalah bahwa evaluator yang membuat penilaian tentang program yang dievaluasi. Stake mengatakan bahwa description disatu pihak berbeda dengan judgement (pertimbangan). Dalam model ini, Antecedents (masukan), transactione (proses), dan outcome (hasil) data dibandingkan tidak hanya untuk menentukan apakah ada perbedaan tujuan dengan keadaan sebenarnya, tetapi juga dibandingkan dengan standard yang absolute, untuk menilai manfaat program. Stake mengatakan bahwa tak ada penelitian dapat diandalkan apabila tidak dinilai.[15]
F.     Model Tyler
Model Tyler dinamakan Black Box karena tidak ada nama resmi yang diberikan oleh pengembangnya. Tyler menuangkan karyanya ini dalam sebuah buku kecil tentang kurikulum. Berkat buku inilah kemudian nama dia menjadi terkenal dan dia disegani. Model evaluasi Tyler di bangun atas dua dasar, yaitu: evaluasi yang ditujukan kepada tingkah laku peserta didik dan evaluasi harus dilakukan pada tingkah laku awal peseta didik sebelum suatu pelaksanaan kurikulum serta pada saat peserta didik telah melaksanakan kurikulum tersebut. Berdasar pada dua prinsip ini maka Tyler ingin mengatakan bahwa evaluasi kurikulum yang sebenarnya hanya berhubungan dengan dimensi hasil belajar.
Adapun prosedur pelaksanaan dari model evaluasi Tyler adalah sebagai berikut:
1.      Menentukan tujuan kurikulum yang akan dievaluasi. Tujuan kurikulum yang dimaksud disini adalah model tujuan behavioral. Dan model ini di Indonesia sudah dikembangkan sejak kurikulum 1975. Adapun untuk kurikulum KTSP saat ini maka harus mengembangkan tujuan behavioral ini jika berkenaan dengan model kurikulum berbasis kompetensi.
2.      Menentukan situasi dimana peserta didik mendapatkan kesempatan untuk memperlihatkan tingkah laku yang berhubungan dengan tujuan. Dari langkah ini diharapkan evaluator memberikan perhatian dengan seksama supaya proses pembelajaran yang terjadi mengungkapkan hasil belajar yang dirancang kurikulum.
3.      Menentukan alat evaluasi yang akan digunakan untuk megukur tingkah laku peserta didik. Alat evaluasi ini dapat berbentuk tes, observasi, kuisioner, panduan wawancara dan sebagainya. Adapun instrument evaluasi ini harus teruji validitas dan reliabilitasnya.
4.       Inilah tiga prosedur dalam evaluasi model Tyler. Adapun kelemahan dari model Tyler ini adalah tidak sejalan dengan pendidikan karena focus pada hasil belajar dan mengabaikan dimensi proses. Padahal hasil belajar adalah produk dari proses belajar. Sehingga evaluasi yang mengabaikan proses berarti mengabaikan komponen penting dari kurikulum. Adapun kelebihan dari model Tyler ini adalah kesederhanaanya. Evaluator dapat memfokuskan kajian evaluasinya hanya pada satu dimensi kurikulum yaitu dimensi hasil belajar. Sedang dimensi dokumen dan proses tidak menjadi fokus evaluasi.[16]
G.    Goal Free evaluation Model (Model Bebas Tujuan)
Goal Free Evaluation Model adalah model evaluasi yang dikembangkan oleh Scriven. Dalam Goal Free Evaluation, Scriven mengemukakan bahwa dalam melaksanakan evaluasi program evaluator tidak perlu memperhatikan apa yang menjadi tujuan program. Yang perlu diperhatikan dalam program tersebut adalah bagaimana kerjanya (kinerja) suatu program, dengan jalan mengidentifikasi penampilan-penampilan yang terjadi (pengaruh) baik hal-hal yang positif (yaitu hal yang diharapkan) maupun hal-hal yang negatif (yang tidak diharapkan).
Evaluasi model goal free evaluation, fokus pada adanya perubahan perilaku yang terjadi sebagai dampak dari program yang diimplementasikan, melihat dampak sampingan baik yang diharapkan maupun yang tidak diharapkan, dan membandingkan dengan sebelum program dilakukan. Evaluasi juga membandingkan antara hasil yang dicapai dengan besarnya biaya yang dikeluarkan untuk program tersebut atau melakukan cost benefit analysis.
Tujuan program tidak perlu diperhatikan karena kemungkinan evaluator terlalu rinci mengamati tiap-tiap tujuan khusus. Jika masing-masing tujuan khusus tercapai, artinya terpenuhi dalam penampilan tetapi evaluator lupa memperhatikan sejauh mana masing-masing penampilan tersebut mendukung penampilan terakhir yang diharapkan oleh tujuan umum maka akibatnya jumlah penampilan khusus ini tidak banyak bermanfaat. Dapat disimpulkan bahwa, dalam model ini bukan berarti lepas dari tujuan tetapi hanya lepas dari tujuan khusus. Model ini hanya mempertimbangkan tujuan umum yang akan dicapai oleh program, bukan secara rinci perkomponen yang ada.
Scriven menekankan bahwa evaluasi itu adalah interpretasi Judgement ataupun explanation dan evaluator yang merupakan pengambil keputusan dan sekaligus penyedia informasi. Ciri – Ciri Evaluasi  Bebas Tujuan yaitu
1.      Evaluator sengaja menghindar untuk mengetahui tujuan program.
2.      Tujuan yang telah dirumuskan terlebih dahulu tidak dibenarkan menyempitkan fokus evaluasi.
3.      Evaluasi bebas tujuan berfokus pada hasil yang sebenarnya, bukan pada hasil yang direncanakan.
4.      Hubungan evaluator dan manajer atau dengan karyawan proyek dibuat seminimal mungkin.
5.      Evaluasi menambah kemungkinan ditemukannya dampak yang tidak diramalkan
Mungkin akan lebih baik apabila evaluasi yang berorientasi pada tujuan dan evaluasi bebas tujuan dikawinkan,karena mereka akan saling mengisi dan melengkapi. Evaluator internal biasanya melakukan evaluasi yang berorientasi pada tujuan,karena ia sulit menghindar atau mau tidak mau ia akan mengetahui tujuan program,akan tidak pantas apabila ia tidak acuh. Menejer progam jelas ingin mengetahui sampai seberapa jauh progam telah dicapai, dan evaluator internal akan dan harus menyediakan informasi untuk menejernya.
Di samping itu, perlu diketahui bagaimana orang luar menilai program bukan hanya untuk mengetahui apa yang seharusnya dilakukan, apa yang dilakukan di semua bagian, pada semua yang telah dihasilkan, secara sengaja atau tidak sengaja. Yang belakangan ini merupakan tugas operator  bebas tujuan yang tidak mengetahui tujuan program. Jadi, evaluasi yang berorientasi pada tujuan dan evaluasi bebas tujuan dapat bekarja sama dengan baik.
Evaluasi bebas tujuan berfokus pada hasil yang sebenarnya bukan pada hasil yang direncanakan.  Dalam evaluasi bebas tujuan ini, memungkinkan evaluator untuk menambah temuan hasil atau dampak yang tidak direncanakan.[17]


BAB III
PENUTUP

Decision Oriented evaluation Model atau Model CIPP (Contex, Input, Proces, Product) adalah model evaluasi yang dikembangkan oleh Danial Stufflebeam dan kawan-kawan di Ohio State University. Evaluasi ini menitikberatkan pada penilaian program dan penyajian informasi untuk pembuatan keputusan.
Kirkpatrick salah seorang ahli evaluasi program pelatihan dalam bidang pengembangan sumber daya manusia (SDM). Model evaluasi yang dikembangkan oleh Kirkpatrick dikenal dengan istilah Kirkpatrick Four Levels Evaluation Model. Evaluasi ini adalah evaluasi program pelatihan (training).
Alkin mengembangkan alur evaluasi yang mirip dengan model CIPP. Alkin mengemukakan lima macam evaluasi, yakni: System Assessment, Program Planning, Program Implementation, Program Improvement, Program Certification.
Model O. Brinkerhoff (1987) mengemukakan ada tiga jenis evaluasi yang disusun berdasarkan penggabungan elemen-elemen yang sama yaitu: fixed vs emergent evaluation design, formative vs summative evaluation, experimental and quasi experimental design vs natural/ unobstrusiveinquiry.
Model Countenance adalah model pertama evaluasi kurilulum yang dikembangkan Stake. Pengertian Countenance adalah keseluruhan, sedangkan pengertian lain adalah sesuatu yang disenangi (favourable). Menurut Provus (1972), Tujuan dari model Countenance Stake adalah melengkapi kerangka untuk pengembangan suatu rencana penilaian kurikulum. Perhatian utama Stake adalah hubungan antara tujuan penilaian dengan keputusan berikutnya berdasarkan sifat data yang dikumpulkan. Hal tersebut, karena Stake melihat adanya ketidak-sesuaian antara harapan penilai dan guru.
Goal Free Evaluation Model adalah model evaluasi yang dikembangkan oleh Scriven. Model ini mengemukakan bahwa dalam melaksanakan evaluasi program evaluator tidak perlu memperhatikan apa yang menjadi tujuan program. 
DAFTAR PUSTAKA

Suharsimi Arikunto dan Cepi Safruddin Abdul Jabar, Evaluasi Program Pendidikan Pedoman Teoritis Praktis Bagi Praktisi Pendidikan (Jakarta: Bumi Aksara), 2007.

Djuju Sudjana, Evaluasi Program Pendidikan Luar Sekolah, (Bandung: Remaja Rosdakarya), 2006.

George F Madaus, Michael S Sriven dan Daniel L Stufflebeam, Evaluation Models,: View point on Educational and Human Services Educations (Boston: Kluwer-Nijhoff Publishing), 1983.

Daniel L Stufflebeam and Antony J Shinkfield, Sistematic Evaluation, A Self Instructional Guide to Theory and Practice (Boston: Kluwer Nijhoff Publissing), 1968.


Farida Yusuf Tayibnafis, Evaluasi Program, (Jakarta: Rineka Cipta), 2000.

Zainal Arifin, Evaluasi Pembelajaran, (Bandung: PT Remaja Rosdakarya), 2011.







[1] George F Madaus, Michael S Sriven dan Daniel L Stufflebeam, Evaluation Models,: Viewpoint on Educational and Human Services Educations (Boston: Kluwer-Nijhoff Publishing, 1983), h.128
[2]Suharsimi Arikunto dan Cepi Safruddin Abdul Jabar, Evaluasi Program Pendidikan Pedoman Teoritis Praktis Bagi Praktisi Pendidikan (Jakarta: Bumi Aksara, 2007), h. 29
[3]Djuju Sudjana, Evaluasi Program Pendidikan Luar Sekolah, (Bandung: Remaja   Rosdakarya, 2006), h. 54-55

[4]Daniel L Stufflebeam and Antony J Shinkfield, Sistematic Evaluation, A Self Instructional Guide to Theory and Practice (Boston: Kluwer Nijhoff Publissing, 1968), h. 169-170
[5]Djuju Sudjana, op.cit., h. 55
[6] Suharsimi Arikunto, Op.Cit, h. 30
[7]Ibid, h. 30
[8] Djuju Sudjana, Op.Cit, h. 56
[9] Suharsimi Arikunto, Op.Cit, h. 30
[10] Djuju Sudjana, Op.Cit, h. 56
[11]Riza Faishol, http://rizafaishol.blogspot.co.id/2010/11/evaluasi-model-kirkpatrick.html, Rabu, 10 November 2010, diakses pada tanggal 21 April pukul 14.27 WITA


[12] Farida Yusuf Tayibnafis, Evaluasi Program, (Jakarta: Rineka Cipta, 2000), h. 15
[13] Zainal Arifin, Evaluasi Pembelajaran, (Bandung: PT Remaja Rosdakarya, 2011), h. 74
[14] S. Hamid Hasan, Evaluasi Kurikulum, (Bandung: Remaja rosda karya, 2008), h. 208
[15]Hakekat pendidikan, http://hakekat pendidikan. blogspot.co.id/2011/10/ evaluasi kurikulum-model countenance.html, Selasa, 25 Oktober 2011, diakses pada tanggal 21 April 2016 pukul 14.36 WITA
[16] Erlina Yuanita, http://elinayuanita.blogspot.co.id/2013/01/model-black-box-tyler.html, Kamis 03 Januari 2013, diakses pada tanggal 21 April 2016 pukul 14.03 WITA

[17] Rinni Septiani, http://rinizaka.blogspot.co.id/2014/01/goal-free-evaluation.html, Selasa, 21 Januari 2014, diakses pada tanggal 21 April pukul 16.28


No comments: