Please use this identifier to cite or link to this item:
https://repository.unej.ac.id/xmlui/handle/123456789/84647
Title: | Text Mining pada Media Sosial Twitter Studi Khasus: Pilkada DKI 2017 Putaran 2 |
Authors: | Hadi, Alfian Futuhul Hasan, Moh Bagus, Dimas |
Keywords: | Text Mining |
Issue Date: | 16-Mar-2018 |
Abstract: | Penelitian ini bertujuan untuk menggunakan metode text mining dalam mengolah data teks pada media sosial Twitter untuk dapat menemukan suatu informasi, baik berupa ringkasan dari tweets hingga menggunakannya untuk menduga hasil dari pencoblosan. Peneliti mengumpulkan data tweets dimana 20.000 data tweets berhubungan dengan kata “anies” dan 20.000 data tweets berhubungan dengan kata “ahok” yang di ambil setiap hari selama tanggal 15-19 April 2017 (masa tenang hingga waktu pencoblosan). Teknik analisis data yang dilakukan adalah model alir dengan tahap-tahap sebagai berikut; (a) text preprocessing (b) pembobotan (c) unsupervised learning dan supervised learning (d) pembahasan. Teknik analisis diawali dengan text preprocessing. Tahap ini bertujuan untuk membersihkan serta mereduksi data-data yang tidak diperlukan seperti simbol, tanda baca, alamat link, dan stopwords. Kemudian peneliti memberikan bobot pada masingmasing data tweets dengan menghitung besar Term Frequency – Inverse Term Frequence (TF-IDF). Setiap data tweets yang memiliki besar TF-TDF yang rendah tidak diikutkan dalam proses selanjutnya. Dengan menggunakan metode penentuan sentimen serta Naive Bayes pada supervised learing dan metode pengelompokkan dengan K-Means seerta Topic Modeling pada unsupervised learning, peneliti mencari pola yang terbentuk serta hal menarik lainnya yang dapat menjadi pembahasan. Selanjutnya dengan memvisualisasikannya (berdasarkan sentimen ataupun kelompok yang terbentuk), dapat memberikan pembahasan yang lebih menarik. Penentuan sentimen pada masing-masing tweets dilakukan dengan membandingkan banyak kata-kata yang bersentimen negatif dan kata-kata yang bersentimen positif. Apabila dalam satu tweets memiliki jumlah kata yang bersentimen negatif lebih banyak dari pada kata yang bersentimen positif maka tweets tersebut bersentimen negatif. Begitu pula sebaliknya apabila jumlah kata bersentimen positif lebih banyak. Selain itu, tweets bersentimen netral. Sedangkan metode Naive Bayes digunakan untuk melakukan prediksi terhadap data baru. Penelitian ini menggunakan metode ini untuk dapat mengetahui sejauh mana metode ini dapat melakukan prediksi sentimen pada data tersebut. Metode-metode pengelompokkan bertujuan untuk mengumpulkan data berdasarkan karakteristik ataupun topik yang muncul. Dengan memperoleh kelompok-kelompok yang baru (5, 10, 25, 50, 75, dan 100 kelompok) , |
URI: | http://repository.unej.ac.id/handle/123456789/84647 |
Appears in Collections: | MT-Mathematic |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Dimas Bagus C. W. 151820101014.pdf SDH.pdf | 1.86 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.