SISTEM ANALISIS SENTIMEN REVIEW FILM BERBAHASA INDONESIA MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER
Abstract
Penyebaran informasi merupakan syarat yang mutlak dibutuhkan di dalam
perkembangan ilmu pengetahuan dan teknologi. Dari seluruh informasi yang
beredar, lebih dari 80% berbentuk teks di dalam dokumen. Oleh karena itu .
kemampuan untuk mengolah dan mengekstrak data tekstual sangat penting dan
mutlak dibutuhkan untuk memperoleh informasi dari dokumen. Informasi yang
berbentuk dokumen, terutama yang berfungsi sebagai ulasan atau pembanding,
memiliki sentimen di dalamnya. Terdapat banyak sekali penerapan dari
penggunaan sentimen di dalam dokumen. Salah satu contohnya adalah sentimen
dari review produk dan jasa, semisal film. Oleh karena pentingnya kemampuan
mengolah dan mengestrak data tekstual dari dokumen dan kebutuhan akan
pengklasifikasian dokumen berdasarkan sentimen, maka diperlukan sebuah sistem
yang dapat mengklasifikasikan data yang berupa dokumen review untuk
diklasifikasikan ke dalam dokumen bersentimen positif dan dokumen bersentimen
negatif.
Metode klasifikasi yang digunakan di dalam sistem klasifikasi dokumen ini
adalah metode Naïve Bayes Classifier. Dataset yang digunakan adalah kumpulan
review film berbahasa Indonesia dari situs Movienthusiast. Terdapat 1201 review
dengan rincian 783 review dengan sentimen positif dan 418 review dengan sentimen
negatif yang dipisahkan sebagai data latih dan data uji di dalam proses
pembelajaran berbasis mesin (machine learning). Keluaran dari sistem adalah
pengklasifikasian dokumen review film ke dalam salah satu kelas, yaitu kelas
sentimen positif dan kelas sentimen negatif.