Analisis Kinerja SVM Dan KNN Menggunakan Fitur TF IDF Dan TF-ICF Pada Dataset Sentiment140
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Fakultas Ilmu Komputer
Abstract
Penelitian ini bertujuan untuk mengatasi tantangan klasifikasi sentimen pada
data Twitter yang memiliki karakteristik berdimensi tinggi dan tidak terstruktur.
Fokus utama penelitian adalah melakukan analisis komparatif untuk menguji
efektivitas metode pembobotan fitur berbasis kelas, yaitu Term Frequency-Inverse
Class Frequency (TF-ICF), dibandingkan dengan metode konvensional Term
Frequency-Inverse Document Frequency (TF-IDF). Pengujian dilakukan
menggunakan dataset Sentiment140 yang sudah melalui tahap preprocessing dan
penyeimbangan data (balancing) menjadi 50% kelas positif dan 50% kelas negatif
untuk mencegah bias pada algoritma Support Vector Machine (SVM) dan K
Nearest Neighbor (KNN).
Eksperimen menunjukkan bahwa kombinasi algoritma SVM menggunakan
fitur TF-IDF merupakan model terbaik dengan akurasi mencapai 77,08%. Model
ini terbukti stabil dalam memisahkan sentimen positif dan negatif. Sebaliknya,
penerapan fitur TF-ICF justru menghasilkan performa yang rendah pada kedua
algoritma, dengan akurasi hanya berkisar antara 51% hingga 52%. Berdasarkan
hasil tersebut, disimpulkan bahwa metode TF-IDF jauh lebih relevan untuk data
teks pendek dibandingkan TF-ICF, dan algoritma SVM lebih unggul dibandingkan
KNN dalam menangani klasifikasi sentimen pada dataset ini.
Description
Reupload Repositori File 02 Juni 2026_Kholif Basri
:: Finalisasi Repositori File 4 Juni 2026_Kurnadi
