Klasifikasi Sentimen pada Sosial Media Berbahasa Indonesia dengan Normalisasi Berbasis Algoritma Levenshtein Distance dan Penanganan Tanda Baca

dc.contributor.authorNauval Achmad Yusufa
dc.date.accessioned2026-04-13T07:54:45Z
dc.date.issued2023-01-22
dc.descriptionReupload file repository 14 April 2026_Ratna
dc.description.abstractMedia sosial memiliki peran yang penting dalam kehidupan masyarakat dan sering digunakan sebagai sumber data dalam analisis sentimen. Salah satu tantangan yang dihadapi ketika menggunakan data dari media sosial adalah keberadaan kata-kata tidak baku, seperti adanya kata singakatan, slang word, dan noise dalam bentuk karakter yang tidak teratur. Untuk mengatasi masalah ini, diterapkan metode normalisasi berbasis Levenshtein Distance dan metode penanganan tanda baca pada tahap preprocessing. Untuk mengetahui pengaruh metode normalisasi, diterapkan 4 skenario pengujian yang dibuat, bervariasi dalam keberadaan metode normalisasi dan penanganan tanda baca pada tahapan preprocessing. Dalam penelitian ini digunakan tiga dataset sekunder: tweet abusif, tweet pilkada, dan tweet COVID dari penelitian terdahulu. Evaluasi dilakukan melalui k-fold cross validation dengan k bernilai 10. Nilai akurasi, presisi, recall dan f1-score dari tiap fold dan digunakan dalam uji paired t-test dan wilcoxon signed rank test untuk memvalidasi secara statistik. Hasil penelitian ini menunjukkan pada sebagian dataset yang digunakan kombinasi dari normalisasi dan penangan tanda baca memberikan performa terbaik. Penerapan normalisasi terdapat peningkatan pada nilai akurasi dan F1-score rata-rata untuk model klasifikasi KNN, sebesar 0,3% dan 0,2% untuk dataset tweet abusif, sebesar 0,4% dan 0,9% untuk dataset pilkada, dan sebesar 0,05% dan 0,15% untuk dataset COVID. Meskipun terdapat peningkatan pada nilai akurasi dan F1-score, dari perhitungan statistik menunjukkan bahwa penerapan normalisasi berbasis Levenshetein Distance tidak berdampak signifikan pada performa kinerja klasifikasi akibat kurang tertanganinya fitur tidak baku.
dc.description.sponsorshipDPU : Priza Pandunata, S.Kom., M.Sc. DPA : M. Arief Hidayat, S.Kom., M.Kom
dc.identifier.urihttps://repository.unej.ac.id/handle/123456789/6990
dc.language.isoother
dc.publisherFakultas Ilmu Komputer
dc.subjectSentimen Analisis
dc.subjectLevenshtein Distance
dc.subjectPenanganan Tanda Baca
dc.subjectNormalisasi
dc.subjectMedia Sosial
dc.titleKlasifikasi Sentimen pada Sosial Media Berbahasa Indonesia dengan Normalisasi Berbasis Algoritma Levenshtein Distance dan Penanganan Tanda Baca
dc.typeOther

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Nauval Achmad Yusufa - 182410103078.pdf
Size:
2.06 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: