Klasifikasi Sentimen Tweet Kasus Pelecehan Seksual pada Santri di Bandung Menggunakan Algoritma Naive Bayes dengan Teknik Oversampling
Abstract
Klasifikasi Sentimen Tweet Kasus Pelaku Pelecehan Seksual Pada Santri di
Bandung menggunakan Algoritma Naive Bayes dengan Teknik Oversampling; Al
Fikri Zaini Hidayah, 172410101132; 2022, 153 halaman; Program Studi Sistem
Informasi, Fakultas Ilmu Komputer, Universitas Jember.
Klasifikasi sentimen pada twitter merupakan proses memahami, mengekstrak
dan mengolah data tekstual secara otomatis untuk mendapat informasi sentimen yang
terkandung dalam suatu tweet pengguna. Baragam opini dalam tweet pengguna terhadap
kasus pelaku pelecehan seksual pada santri di Bandung miliki sentimen dan pengaruh
yang beragam pula. Perlunya memahami maksud dan persepsi yang disampaikan oleh
pengguna twitter sangat diperlukan agar tidak mudah terpengaruh tweet tersebut.
Klasifikasi sentimen dilakukan pada 3100 data tweet yang telah dikumpulkan,
dengan data positif 62, data negatif 1886, dan data netral 1152 dengan menggunakan
metode Naive Bayes Classifier. Dalam mengatasi ketidakseimbangan data digunakan
bebrapa teknik oversampling seperti Synthetic Minority Oversampling Technique
(SMOTE), borderline-SMOTE dan ADASYN (Adaptive Synthetic). Pada
implementasinya dilakukan percobaan pada empat rasio data yakni 60:40, 70:30, 80:20
dan 90:10, kemudian dengan skenario data naive bayes , naive bayes + SMOTE, naive
bayes + borderline-SMOTE, dan naive bayes + ADASYN . Hasil nilai akurasi yang
tertinggi didapat pada rasio data training dan testing 90:10 sebesar 77,74% pada skenario
menggunakan naive bayes + ADASYN . Untuk precision, recall dan f-measure
didapatkan nilai masingmasing sebesar 80,08% precision, 77,74% recall dan 78,70% fmeasure.