Analisis Kinerja SVM Dan KNN Menggunakan Fitur TF IDF Dan TF-ICF Pada Dataset Sentiment140
| dc.contributor.author | Denta Muhammad Febrisuda | |
| dc.date.accessioned | 2026-06-04T06:54:15Z | |
| dc.date.issued | 2026-02-20 | |
| dc.description | Reupload Repositori File 02 Juni 2026_Kholif Basri :: Finalisasi Repositori File 4 Juni 2026_Kurnadi | |
| dc.description.abstract | Penelitian ini bertujuan untuk mengatasi tantangan klasifikasi sentimen pada data Twitter yang memiliki karakteristik berdimensi tinggi dan tidak terstruktur. Fokus utama penelitian adalah melakukan analisis komparatif untuk menguji efektivitas metode pembobotan fitur berbasis kelas, yaitu Term Frequency-Inverse Class Frequency (TF-ICF), dibandingkan dengan metode konvensional Term Frequency-Inverse Document Frequency (TF-IDF). Pengujian dilakukan menggunakan dataset Sentiment140 yang sudah melalui tahap preprocessing dan penyeimbangan data (balancing) menjadi 50% kelas positif dan 50% kelas negatif untuk mencegah bias pada algoritma Support Vector Machine (SVM) dan K Nearest Neighbor (KNN). Eksperimen menunjukkan bahwa kombinasi algoritma SVM menggunakan fitur TF-IDF merupakan model terbaik dengan akurasi mencapai 77,08%. Model ini terbukti stabil dalam memisahkan sentimen positif dan negatif. Sebaliknya, penerapan fitur TF-ICF justru menghasilkan performa yang rendah pada kedua algoritma, dengan akurasi hanya berkisar antara 51% hingga 52%. Berdasarkan hasil tersebut, disimpulkan bahwa metode TF-IDF jauh lebih relevan untuk data teks pendek dibandingkan TF-ICF, dan algoritma SVM lebih unggul dibandingkan KNN dalam menangani klasifikasi sentimen pada dataset ini. | |
| dc.description.sponsorship | Dosen Pembimbing Utama : Tio Dharmawan S.Kom., M.Kom Dosen Pembimbing Anggota: -- | |
| dc.identifier.other | Kholif Basri | |
| dc.identifier.uri | https://repository.unej.ac.id/handle/123456789/8052 | |
| dc.language.iso | other | |
| dc.publisher | Fakultas Ilmu Komputer | |
| dc.subject | klasifikasi sentimen | |
| dc.subject | data Twitter | |
| dc.subject | karakteristik | |
| dc.subject | berdimensi tinggi | |
| dc.subject | dan tidak terstruktur. | |
| dc.title | Analisis Kinerja SVM Dan KNN Menggunakan Fitur TF IDF Dan TF-ICF Pada Dataset Sentiment140 | |
| dc.type | Other |
