Hybrid Clustering Classification menggunakan Random Forest pada Akreditasi Program Studi Kemipaan di Indonesia
Abstract
Seiring dengan meningkatnya kompleksitas dan volume data, penggabungan metode machine learning yaitu teknik clustering dan klasifikasi menjadi arena penelitian aktif yang sering digunakan dalam beberapa penelitian. Penggabungan kedua teknik machine learning ini disebut dengan metode Hybrid Clustering Classification, yang diyakini mampu mengatasi kesalahan saat mengklasifikasikan data multi kelas yang berskala besar. Penelitian ini akan mengklasifikasikan akreditasi program studi kemipaan di Indonesia yang terdiri dari program studi Matematika, Fisika, Kimia, dan Biologi di seluruh Indonesia. Hal ini dilakukan karena masing-masing perguruan tinggi memiliki karakteristik yang berbeda dalam menentukan akreditasi program studi. Penggunaan metode Hybrid Clustering Classification dilakukan untuk meningkatkan performa akurasi metode klasifikasi. Pada proses clustering, data akan dikelompokkan secara acak untuk mendapatkan anggota cluster terbaik pada tahap klasifikasi. Metode klasifikasi yang digunakan adalah Random Forest dengan harapan dapat memberikan nilai akurasi terbaik pada model yang diperoleh. Akreditasi program studi terdiri dari 4 kelas yaitu Unggul, Sangat Baik, Baik, dan Tidak Terakreditasi. Data yang digunakan adalah data online yang diperoleh dari website SINTA (Science and Technology Index), PDDikti Kemdikbud, Unirank, dan Webometrics.