Analisis Sentimen pada Twitter Mengenai Pelayanan Ekspedisi Sicepat Menggunakan Metode Naïve Bayes Classifier dan Support Vector Machine
Abstract
Penelitian ini bertujuan untuk mengetahui tingkat akurasi algoritma Naïve Bayes dan Support Vector Machine dalam melakukan analisis sentimen terhadap kualitas layanan ekspedisi Sicepat pada media sosial Twitter. Data yang digunakan untuk membangun model tersebut diperoleh dari Twitter pada 23 September 2022 hingga 11 Desember 2022 dengan kata kunci “Sicepat ekspres”. Data diambil dengan cara crawling data menggunakan pemograman Python dengan Twitter API, lalu data dilakukan pelabelan manual dengan sentimen positif dan negatif. Data tersebut kemudian dilakukan preprocessing yaitu data dibersihkan dari kata dan simbol yang tidak perlu. Terdapat 1000 data tweet yang akan digunakan dengan komposisi 928 tweet bersentimen negatif dan 72 tweet bersentimen positif. Perbedaan label yang signifikan membuat data perlu diseimbangkan. Proses penyeimbangan data pada penelitian ini menggunakan SMOTE yang diterapkan pada data training untuk membangun model sehingga menghasilkan jumlah data yang sama setiap kelas sentimen. Penelitan ini menggunakan dua metode klasifikasi untuk membangun model analisis sentimen yaitu metode Naïve Bayes Classifier dan Support Vector Machine. Model klasifikasi Naïve Bayes Classifier mampu melakukan klasifikasi dengan akurasi 91%, sedangkan model klasifikasi Support Vector Machine menggunakan kernel linier melakukan klasifikasi dengan baik sebesar 95% nilai akurasi. Hasil komparasi kedua metode menunjukan bahwa Support Vector Machine mendapat akurasi yang lebih baik dari Naïve Bayes Classifier.