PENCARIAN KATA PADA DOKUMEN DENGAN CLUSTERING MENGGUNAKAN POLA VARIAN HILL CLIMBING
Abstract
RINGKASAN
Pencarian Kata pada Dokumen dengan Clustering menggunakan Pola
Varian Hill Climbing. Tiara Kurnia Mahisa, 091810101038; 2013: 38 halaman;
Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas
Jember.
Information Retrieval merupakan cabang ilmu yang membahas tentang
pencarian informasi, baik berupa dokumen, referensi ilmiah, ataupun pengetahuan
lainnya. Banyaknya informasi maupun referensi yang tidak disajikan secara digital
menyulitkan pembaca untuk mencari secara manual. Selain itu, pembaca juga sulit
untuk menemukan referensi yang memiliki pembahasan yang relevan dengan topik
bacaan yang akan dicari. Tugas akhir ini mengaplikasikan algoritma clustering pada
pencarian informasi menggunakan uji pola varian Hill Climbing, dan membuat
program algoritma clustering dengan PHP dan MySQL.
Penelitian dilakukan dalam beberapa langkah, yaitu mengolah data berupa
dokumen artikel ilmiah yang telah diperoleh, menjadi data penyimpanan dalam
database. Langkah selanjutnya yaitu membuat algoritma pemograman menggunakan
algoritma clustering dan pengujian Hill Climbing, membuat program berdasarkan
algoritma menggunakan bahasa pemograman PHP dan MySQL, dan langkah terakhir
yaitu menampilkan hasil dokumen yang dicari menggunakan program yang sudah
dibuat.
Program aplikasi pencari kata yang telah dibuat mampu menampilkan
dokumen yang dicari dan dokumen-dokumen yang mempunyai pembahasan yang
terkait satu dengan yang lain. Dokumen yang dimunculkan pada output dengan
mengaplikasikan pencarian kata menggunakan clustering tidak tergantung pada
dokumen yang mengandung jumlah kata kunci paling banyak. Pemilihan clustering
viii
yang terbaik dapat dicari dengan pengujian pola varian Hill Climbing, yaitu dengan
memilih clustering yang mempunyai nilai varian terbesar. Salah satu hasil pencarian
program tersebut adalah pencarian pada kata ”penyebaran penyakit”. Setelah
dilakukan clustering pada kata tersebut, pemilihan clustering yang tepat setelah diuji
dengan Hill Climbing adalah pada saat dibentuk sebanyak 3 cluster, karena pada
pembentukan cluster tersebut menghasilkan nilai varian tertinggi yang berarti
kedekatan dokumen dalam cluster tersebut sangat besar. Begitu juga dengan
pencarian kata ”pencarian jarak minimal” mempunyai nilai varian tertinggi saat
dibentuk sebanyak 6 cluster setelah diuji dengan Hill Climbing.