Analisis Kinerja SVM Dan KNN Menggunakan Fitur TF IDF Dan TF-ICF Pada Dataset Sentiment140

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Fakultas Ilmu Komputer

Abstract

Penelitian ini bertujuan untuk mengatasi tantangan klasifikasi sentimen pada data Twitter yang memiliki karakteristik berdimensi tinggi dan tidak terstruktur. Fokus utama penelitian adalah melakukan analisis komparatif untuk menguji efektivitas metode pembobotan fitur berbasis kelas, yaitu Term Frequency-Inverse Class Frequency (TF-ICF), dibandingkan dengan metode konvensional Term Frequency-Inverse Document Frequency (TF-IDF). Pengujian dilakukan menggunakan dataset Sentiment140 yang sudah melalui tahap preprocessing dan penyeimbangan data (balancing) menjadi 50% kelas positif dan 50% kelas negatif untuk mencegah bias pada algoritma Support Vector Machine (SVM) dan K Nearest Neighbor (KNN). Eksperimen menunjukkan bahwa kombinasi algoritma SVM menggunakan fitur TF-IDF merupakan model terbaik dengan akurasi mencapai 77,08%. Model ini terbukti stabil dalam memisahkan sentimen positif dan negatif. Sebaliknya, penerapan fitur TF-ICF justru menghasilkan performa yang rendah pada kedua algoritma, dengan akurasi hanya berkisar antara 51% hingga 52%. Berdasarkan hasil tersebut, disimpulkan bahwa metode TF-IDF jauh lebih relevan untuk data teks pendek dibandingkan TF-ICF, dan algoritma SVM lebih unggul dibandingkan KNN dalam menangani klasifikasi sentimen pada dataset ini.

Description

Reupload Repositori File 02 Juni 2026_Kholif Basri :: Finalisasi Repositori File 4 Juni 2026_Kurnadi

Citation

Endorsement

Review

Supplemented By

Referenced By