Analisis Sentimen Terhadap Produk Tanaman Transgenik Menggunakan Lexicon-Based Dan Naive Bayes
Abstract
Tanaman transgenik merupakan hal baru sebagai salah satu solusi permasalahan pada pangan. Disamping keuntungannya, transgenik juga membawa dampak buruk bagi kesehatan dan lingkungan. Sehingga, penggunaan tanaman transegnik masih menuai pro dan kontra dalam masyarakat. Oleh sebab itu, diperlukan opini untuk pengembangan produk pangan tanaman transgenik ini. Untuk mengidentifikasi dan mengektraksi informasi dari sebuah opini, dibutuhkan suatu metode analisis sentimen. Pada penelitian ini, metode analisis sentimen yang digunakan adalah metode lexicon based dan naïve bayes, serta dilakukan pengelompokkan data dengan topic modelling. Data yang digunakan penelitian ini berupa data teks yang diperoleh dari opini mahasiswa Universitas Jember sebanyak 268 opini. Analisis diawali dengan text preprocessing. Tahap ini bertujuan untuk membersihkan dan mengurangi data-data yang tidak diperlukan seperti simbol, tanda baca, dan kata-kata yang dianggap tidak memiliki makna (stopwords). Selanjutnya data akan diolah untuk memahami sentimen sosial dari produk tanaman transgenik. Penentuan sentimen pada metode Lexicon Based dilakukan dengan pencocokkan data pada kamus. Apabila dalam satu opini memiliki jumlah kata positif lebih banyak, maka opini tersebut bersentimen positif. Begitu pula sebaliknya apabila dalam satu opini memiliki jumlah kata negatif, maka opini tersebut bersentimen negatif. Dan apabila jumlah kata positif sama dengan kata negatif, maka opini tersebut bersentimen netral. Sedangkan penentuan sentimen pada metode klasifikasi Naïve Bayes dilakukan secara manual oleh penulis. Kemudian dari data yang telah terlabeli, akan dilakukan pelatihan untuk membentuk sebuah model classifier. Model tersebut digunakan untuk melakukan prediksi terhadap data baru. Kedua metode tersebut akan diuji kinerjanya dalam melakukan prediksi dengan tepat. Model yang paling baik akan digunakan untuk memprediksi data set. Hasil sentimen diklasifikasikan menjadi 3 bagian, yaitu sentimen positif, negatif, dan netral. Sentimen positif menunjukkan, mahasiswa beropini bahwa tanaman transgenik membawa keuntungan sehingga setuju dengan adanya penggunaan tanaman transgenik sebagai bahan pangan dan mendukung perkembangannya. Begitu pula sebaliknya, sentimen negatif menunjukkan, mahasiswa beropini bahwa tanaman transgenik membawa dampak buruk sehingga tidak setuju dengan penggunaan tanaman transgenik sebagai bahan pangan. Sedangkan pada sentimen netral terjadi dua kemungkinan. Pertama, mahasiswa menganggap bahwa tanaman transgenik membawa dampak buruk tetapi tetap setuju dengan penggunaan tanaman transgenik sebagai bahan pangan dan mendukung pengembangannya. Dan yang kedua, mahasiswa menganggap bahwa tanaman transgenik membawa keuntungan, tetapi tidak setuju dengan penggunaan tanaman transgenik sebagai bahan pangan. Sedangkan pada pengelompokkan, metode topic Modelling dilakukan untuk mendapatkan topik yang dominan dibahas oleh mahasiswa tentang tanaman transgenik. Metode yang digunakan untuk memprediksi data set adalah klasifikasi naïve bayes dikarenakan nilai akurasinya lebih tinggi dari lexicon based yaitu 70%. Analisis sentimen yang dilakukan menghasilkan 175 sentimen positif, 29 sentimen negatif, dan 64 sentimen netral. Sedangkan hasil dari proses pengelompokkan dengan Topic Modelling adalah menghasilkan 10 topik. Berdasrkan hasil tersebut dapat disimpulkan bahwa mayoritas dari mahasiswa beropini bahwa tanaman transgenik bermanfaat dan membantu dalam hal pangan. Selain itu tanaman transgenik juga menguntungkan kepada pihak petani dan masyarakat karena dapat meningkatkan hasil pangan. Tetapi adanya bahaya yang ditimbulkan, mtanaman transgenik masih perlu dilakukan pengembangan agar lebih bermutu dan aman untuk di konsumsi.