Identifikasi Prioritas Perbaikan Objek Wisata Alam di Kabupaten Jember Menggunakan Pendekatan Text Mining
Abstract
Salah satu penghasil terbesar dari perekonomian di Indonesia adalah
memanfaatkan sumber daya alam. Sumber daya alam dapat dimanfaatkan sebagai
tempat pariwisata. Potensi pariwisata di Indonesia sangat besar, tidak terkecuali
Kabupaten Jember. Salah satu yang membuat tempat pariwisata tidak berkembang
adalah kurangnya kreativitas dan pengembangan dari masyarakat serta pemerintah.
Pengembangan bisa dilakukan melalui kritik dan saran dari pengunjung. Untuk
mendapatkan kritik serta saran terkadang sulit karena membutuhkan wawancara
atau memberikan masukan melalui kotak kritik dan saran yang seringkali tidak diisi
oleh pengunjung. Oleh sebab itu, penggunaan metode text mining serta NLP dapat
digunakan untuk memperoleh kekurangan yang ada pada tempat pariwisata.
Data diperoleh dengan melakukan web scraping dari Google Maps dengan
rentang waktu 2020 – 2023. Data yang diperoleh merupakan data mentah yang tidak
baku dan terdapat data kosong. Untuk mengurangi permasalahan tersebut,
dilakukan preprocessing data agar data dapat lebih mudah diolah. Tahapan
selanjutnya adalah melakukan pembobotan menggunakan TF-RF dan melakukan
normalisasi menggunakan normalisasi Z-Score.
Tahapan selanjutnya adalah melakukan klasifikasi data menggunakan
Support Vector Machine untuk membagi antara data positif dan data negatif serta
dilakukan evaluasi menggunakan confusion matrix. Setelah itu, data negatif
digunakan untuk melihat apa saja kritik yang ditulis oleh pengunjung. Gunakan
Latent Dirichlet Allocation untuk melihat topik apa saja yang ada di masing-masing
tempat wisata. Tahapan selanjutnya yaitu mencari kata benda dan kata sifat dengan
model POS Tagging. Ada 5 model yang digunakan dan hasil terbaik ditunjukkan
oleh model Perceptron Tagger dengan menghasilkan pemilihan kata benda dan kata
sifat yang lebih baik daripada 4 model lainnya seperti kata benda “Pantai” dan kata
sifat “Kotor”. Hasil dari POS Tagging akan diurutkan dengan jumlah kemunculan
kata terbanyak dan diinterpretasikan sesuai hasil tersebut. Contohnya seperti “Tiket
Mahal” menempati posisi terbanyak di Pantai Papuma.