Pengembangan Sistem Deteksi Time Frame Dokumen Berita Berbasis Vector Space Model
Abstract
Berkembangnya website sebagai salah satu bentuk media massa
mengakibatkan tajamnya peningkatan jumlah informasi berupa artikel berita. Hasil
pengamatan dari tiga situs berita (yaitu Tribunnews.com, Detik.com, dan
Liputan6.com) dengan teknik scraping, pada bulan Agustus sampai dengan
Desember 2018 ditemukan sebanyak 109.061 berita yang telah terpublikasi.
Apabila dilihat dari sisi jumlah, pembaca berita sangat cukup mendapatkan
referensi dari informasi yang ingin diketahuinya. Namun demikian, dengan
banyaknya informasi tersebut, pembaca juga menemui kesulitan ketika ingin
mengetahui rentang waktu sebuah topik yang diberitakan. Secara manual, pembaca
harus mencari semua dokumen pada situs berita yang ada serta menentukan apakah
dokumen berita tersebut sesuai dengan topik yang dimaksud atau tidak.
Selanjutnya, pembaca juga diharuskan memetakan seluruh dokumen yang sesuai
topik berdasarkan tanggal terbitnya. Langkah tersebut dilakukan untuk mengetahui
durasi kejadian secara manual, Dengan demikian untuk mengetahui rentang sebuah
topik yang diberitakan akan memakan waktu yang lama.