Please use this identifier to cite or link to this item: https://repository.unej.ac.id/xmlui/handle/123456789/125889
Full metadata record
DC FieldValueLanguage
dc.contributor.authorASY'ARI, Muhammad Hasyim-
dc.date.accessioned2025-03-27T07:05:24Z-
dc.date.available2025-03-27T07:05:24Z-
dc.date.issued2023-07-24-
dc.identifier.nim192410101047en_US
dc.identifier.urihttps://repository.unej.ac.id/xmlui/handle/123456789/125889-
dc.descriptionvalidasi_repo_firli_maret_2025_19 :: Finalisasi unggah file repositori tanggal 27 Maret 2025_Kurnadien_US
dc.description.abstractDalam text mining, diperlukan seleksi fitur untuk mengurangi dimensi kata suatu dokumen dan meningkatkan hasil clustering. Pada penelitian sebelumnya, metode SFS dan TF-RF menghasilkan performa terbaik dalam feature selection. Kedua metode tersebut memiliki kelebihan masing-masing. SFS dapat mengukur tingkat kemiripan kata antar kelas, sedangkan TF-RF dapat menghitung frekuensi suatu kata dan relevansinya terhadap kelas yang berkaitan. Pada penelitian sebelumnya, dilakukan penggabungan dua jenis metode seleksi fitur menggunakan TF-IDF dan Lexical Chain. Berdasarkan penelitian tersebut, menggabungkan dua jenis metode seleksi fitur dapat memberikan hasil yang lebih baik dalam text clustering. Oleh karena itu, dilakukan penelitian untuk menggabungkan metode seleksi fitur SFS dan TF-RF atau dapat disebut sebagai Symbolic Relevance. Dengan penggabungan tersebut, diharapkan kelebihan dari kedua metode tersebut dapat meningkatkan performa text clustering. Dalam penelitian ini, dilakukan 144 jenis skenario percobaan dengan membandingkan antara metode gabungan Symbolic Relevance, tanpa menggabungkan, serta tanpa menggunakan feature selection. Selanjutnya, hasil seleksi fitur diimplementasikan ke dalam clustering K-Means++ dan Spherical K-Means. Selain itu juga dilakukan analisis performa menggunakan Silhouette Coefficient, Purity, AMI, dan Accuracy. Berdasarkan hasil penelitian, metode Symbolic Relevance mampu menyeleksi fitur dengan jumlah rata-rata 17.5% dibandingkan dengan fitur awalnya. Namun percobaan tanpa feature selection memiliki performa tertinggi dikarenakan penggunaan feature selection mengakibatkan banyak informasi yang hilang. Symbolic Relevance memiliki selisih fitur 82.5% (19823 fitur), selisih skor Silhouette Coefficient 0.064, selisih skor Purity 0.306, selisih skor AMI 0.430, selisih Accuracy 0.017, dan selisih waktu eksekusi hingga 293.93 detik dibandingkan metode tanpa feature selection.en_US
dc.description.sponsorshipDPU: Achmad Maududie ST, M.Sc. DPA: Tio Dharmawan S.Kom., M.Komen_US
dc.language.isootheren_US
dc.publisherFakultas Ilmu Komputeren_US
dc.subjectText Miningen_US
dc.subjectClusteringen_US
dc.subjectFeature Selectionen_US
dc.subjectSFSen_US
dc.subjectTF-RFen_US
dc.titleMetode Seleksi Fitur Gabungan menggunakan Symbolic Relevance dalam Text Clusteringen_US
dc.typeSkripsien_US
dc.identifier.prodiSistem Informasien_US
dc.identifier.pembimbing1Achmad Maududie ST, M.Sc.en_US
dc.identifier.pembimbing2Tio Dharmawan S.Kom., M.Komen_US
dc.identifier.validatorvalidasi_repo_firli_maret_2025_19en_US
Appears in Collections:UT-Faculty of Computer Science

Files in This Item:
File Description SizeFormat 
Skripsi Watermark.pdf
  Until 2028-07-24
Muhammad Hasyim Asy’ari_1924101010472.32 MBAdobe PDFView/Open Request a copy


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

Admin Tools