Klasifikasi Informasi Wisata Kuliner Indonesia dari Media Sosial Twitter Menggunakan Naive Bayes Classifier
Abstract
Klasifikasi informasi daftar wisata kuliner Indonesia merupakan proses
memahami, mengklasifikasi, dan mengolah data tekstual secara otomatis untuk
mendapat informasi daftar wisata kuliner Indonesia. Konten tweet sangat beragam
dan salah satu pembahasan yang cukup populer saat ini yaitu mengenai wisata
kuliner. Keberagaman konten tweet mengenai kuliner tidak hanya tweet yang
terkait dengan wisata kuliner, namun juga tweet tentang cara pembuatan, rasa,
bahan, harga hingga bentuk makanan yang sebenarnya tidak terkait dengan
informasi wisata kuliner.
Pendekatan text mining menjadi alternatif terbaik untuk mengartikan
makna dari setiap tweet. Text mining merupakan proses mengeksplorasi dan
menganalisis sejumlah besar data teks tidak terstruktur yang dapat
mengidentifikasi konsep, pola, topik, kata kunci, dan atribut lainnya dalam sebuah
data. Salah satu metode yang sering digunakan dalam pengelompokan informasi
berbasis teks adalah Naive Bayes Classifier. Naive Bayes Classifier merupakan
salah satu metode yang banyak digunakan berdasarkan probabilitas P atribut x
dari setiap kelas y data yang didasarkan pada asumsi naif atau independen yang
kuat. Pengembangan pendekatan klasifikasi daftar wisata kuliner berbasis metode
Naïve Bayes Classifier terhadap 5000 dataset yaitu 80% data training untuk
membangun model dan 20% data testing untuk menguji model terhadap 10 kelas
klasifikasi yaitu: soto, gudeg, mie, sate, rujak, pempek, rendang, pecel, kuliner
lain, dan bukan kuliner menghasilkan nilai uji akurasi sebesar 86.5%.