Sistem Temu Kembali (Information Retrieval System) Dokumen Berita Online menggunakan Metode Matriks Studi Kasus: Tiga Situs Berita Populer di Indonesia
Abstract
Website adalah salah satu teknologi yang saat ini telah berkembang sebagai
sarana penyebaran informasi yang sangat cepat. Saat ini penetrasi pengguna internet
di Indonesia naik dari 64,8% pada tahun 2018 menjadi 73,7% di tahun 2020 dari
populasi atau setara 196,7 juta pengguna (Asosiasi Penyelenggara Jasa Internet
Indonesia, 2020). Kenaikan jumlah penggguna itu antara lain disebabkan beberapa
faktor, seperti infrastruktur internet cepat atau broadband di Indonesia semakin
merata dengan adanya Palapa Ring, transformasi digital semakin masif akibat
pembelajaran online dan kebijakan bekerja dari rumah (work from home) akibat
pandemi Covid-19 sejak Maret tahun 2020.
Sistem temu kembali (Information Retrieval System) merupakan suatu
konsep untuk mengembalikan suatu koleksi relevan kepada pengguna dengan
mengidentifikasi kemiripan antara kata kunci pencarian dengan koleksi yang ada.
Sistem Temu kembali dapat dikembangkan dengan menggunakan berbagai metode,
diantaranya menggunakan metode berbasis ruang vektor dan metode matriks.
Metode matriks digunakan untuk merepresentasikan koleksi berupa dokumen teks
(konten dokumen berita) kedalam format penulisan matriks dan membuat vektor
koleksi berdasarkan matriks yang dihasilkan kemudian menghitung kemiripan
antara vektor dokumen dan vektor kata kunci pencarian (query). Isi dari matriks
akhir yang digunakan hanya akan memuat dokumen yang mengandung kata
tertentu dan tidak menyimpan jumlah frekuensi kemunculan kata dasar pada setiap
dokumen sampel.
Sampel dalam penelitian ini diambil dari tanggal publikasi terbaru dari
sejumlah data yang dimiliki peneliti. Data yang dimiliki sebanyak 1000 dokumen
berita yang diambil dari database di server STIE-Mandala, namun untuk kasus penelitian ini peneliti mengambil sampel sebanyak 100 dokumen berita. Dimana
dari 100 dokumen sampel yang diambil dari tanggal terbaru didapatkan sebanyak
68 dokumen berita dari Liputan6.com, 32 dokumen berita dari Tribunnews.com dan
tidak ada berita dari sumber detik.com. Sebanyak 100 dokumen berita yang menjadi
sampel mempunyai rata-rata jumlah kata dasar sebanyak 210 kata dasar. Jumlah
kata terbanyak dalam sampel dokumen berita yaitu sebanyak 952 kata dasar dan
jumlah kata yang paling sedikit dalam sampel dokumen berita yaitu 20 kata dasar.
Berdasarkan tahapan analisis dan desain sistem temu kembali (information
retrieval system) dokumen berita online membutuhkan tujuh serangkaian proses
besar yaitu, pertama text mining kata dasar dokumen dan kata dasar kata kunci
pencarian, kedua penyimpanan kata dasar dan kata dokumen, ketiga array
representation (triples) pada desain database, keempat pembentukan matriks akhir
dokumen berita dan vektor dokumen (matriks kolom), kelima pembentukan vektor
query dengan acuan matriks akhir, keenam perhitungan cosine vektor dokumen dan
vektor query dan ketujuh penentuan threshold cosine. Berdasarkan desain dan
analisis telah berhasil dikembangkan nilai cosine (threshold) yang dibutuhkan
untuk mendapatkan dokumen relevan dengan kata kunci pencarian yaitu dokumen
tersebut harus memiliki nilai cosine lebih besar atau sama dengan 0,0840.
Dokumen tersebut akan ditampilkan atau dikembalikan kepada pengguna karena
secara sistem sudah dianggap memenuhi standar relevan dengan kata kunci
pencarian. Nilai akurasi yang dihasilkan menggunakan teknik perhitungan
precision memperoleh hasil sebesar 96,6%. Nilai tersebut tergolong dalam kualitas
pengembangan sistem yang tinggi berdasarkan tiga kriteria nilai dalam format
persentase, yaitu kriteria rendah antara 0 – 33%, kriteria sedang antara 34% - 66%
dan kriteria tinggi 67% - 100%
Collections
- MT-Mathematic [100]