Text Mining pada Media Sosial Twitter Studi Khasus: Pilkada DKI 2017 Putaran 2
Abstract
Penelitian ini bertujuan untuk menggunakan metode text mining dalam
mengolah data teks pada media sosial Twitter untuk dapat menemukan suatu
informasi, baik berupa ringkasan dari tweets hingga menggunakannya untuk menduga
hasil dari pencoblosan. Peneliti mengumpulkan data tweets dimana 20.000 data
tweets berhubungan dengan kata “anies” dan 20.000 data tweets berhubungan dengan
kata “ahok” yang di ambil setiap hari selama tanggal 15-19 April 2017 (masa tenang
hingga waktu pencoblosan). Teknik analisis data yang dilakukan adalah model alir
dengan tahap-tahap sebagai berikut; (a) text preprocessing (b) pembobotan (c)
unsupervised learning dan supervised learning (d) pembahasan.
Teknik analisis diawali dengan text preprocessing. Tahap ini bertujuan untuk
membersihkan serta mereduksi data-data yang tidak diperlukan seperti simbol, tanda
baca, alamat link, dan stopwords. Kemudian peneliti memberikan bobot pada masingmasing
data tweets dengan menghitung besar Term Frequency – Inverse Term
Frequence (TF-IDF). Setiap data tweets yang memiliki besar TF-TDF yang rendah
tidak diikutkan dalam proses selanjutnya. Dengan menggunakan metode penentuan
sentimen serta Naive Bayes pada supervised learing dan metode pengelompokkan
dengan K-Means seerta Topic Modeling pada unsupervised learning, peneliti mencari
pola yang terbentuk serta hal menarik lainnya yang dapat menjadi pembahasan.
Selanjutnya dengan memvisualisasikannya (berdasarkan sentimen ataupun kelompok
yang terbentuk), dapat memberikan pembahasan yang lebih menarik.
Penentuan sentimen pada masing-masing tweets dilakukan dengan
membandingkan banyak kata-kata yang bersentimen negatif dan kata-kata yang
bersentimen positif. Apabila dalam satu tweets memiliki jumlah kata yang
bersentimen negatif lebih banyak dari pada kata yang bersentimen positif maka
tweets tersebut bersentimen negatif. Begitu pula sebaliknya apabila jumlah kata
bersentimen positif lebih banyak. Selain itu, tweets bersentimen netral. Sedangkan
metode Naive Bayes digunakan untuk melakukan prediksi terhadap data baru.
Penelitian ini menggunakan metode ini untuk dapat mengetahui sejauh mana metode
ini dapat melakukan prediksi sentimen pada data tersebut.
Metode-metode pengelompokkan bertujuan untuk mengumpulkan data
berdasarkan karakteristik ataupun topik yang muncul. Dengan memperoleh
kelompok-kelompok yang baru (5, 10, 25, 50, 75, dan 100 kelompok) ,
Collections
- MT-Mathematic [100]