Klasifikasi Topik Skripsi Menggunakan Kombinasi Naïve Bayes Classifier dan Adaboost (Studi Kasus: Fakultas Ilmu Komputer Universitas Jember)
Abstract
Skripsi merupakan suatu karya ilmiah mahasiswa tingkat akhir yang
mengikuti prinsip kaidah ilmiah sesuai bidang keilmuan program studi. Skripsi
yang telah diselesaikan diunggah ke repository perguruan tinggi yang merupakan
sistem penyimpanan bahan pustaka. Berkembangnya sumber daya digital mendapat
tantangan dalam memanajemen dan mengakses dokumen skripsi dalam repository,
termasuk pencarian yang efisien. Pengklasifikasian skripsi di dalam repository akan
mempermudah proses pencarian informasi mengenai topik skripsi secara efisien .
Penelitian sebelumnya menunjukan bahwa Naïve Bayes baik untuk melakukan
klasifikasi dokumen meskipun data yang sedikit, dan Adaboost juga menunjukan
performas yang baik dalam melakukan klasifikasi dokumen. Namun Naive Bayes
memiliki kelemahan ketika nilai probabilitas yang hampir mirip atau sama akan
menurunkun tingkat performanya. Oleh karena itu penelitian mengkombinasikan
Naïve Bayes dengan Adaboost untuk mengatasi kelemahana Naïve Bayes. Naïve
Bayes akan digunakan sebagai model utama dan Adaboost akan digunakan ketika
nilai probabilitas Naïve Bayes hampir mirip atau sama. Penelitian melibatkan
crawling data, pelabelan, text processing, split data, pembobotan kata,
pengklasifikasian, dan evaluasi model. Hasil penelitian menunjukan terdapat
peningkatan performa pada akurasi sebesar 1,72%. Akurasi yang didapatkan pada
model kombinasi Naïve Bayes dan Adaboost tersebut sebesar 65,36% dan F1-Score
sebesar 0,6691.