• Login
    View Item 
    •   Home
    • UNDERGRADUATE THESES (Koleksi Skripsi Sarjana)
    • UT-Faculty of Computer Science
    • View Item
    •   Home
    • UNDERGRADUATE THESES (Koleksi Skripsi Sarjana)
    • UT-Faculty of Computer Science
    • View Item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Metode Seleksi Fitur Gabungan menggunakan Symbolic Relevance dalam Text Clustering

    Thumbnail
    View/Open
    Muhammad Hasyim Asy’ari_192410101047 (2.262Mb)
    Date
    2023-07-24
    Author
    ASY'ARI, Muhammad Hasyim
    Metadata
    Show full item record
    Abstract
    Dalam text mining, diperlukan seleksi fitur untuk mengurangi dimensi kata suatu dokumen dan meningkatkan hasil clustering. Pada penelitian sebelumnya, metode SFS dan TF-RF menghasilkan performa terbaik dalam feature selection. Kedua metode tersebut memiliki kelebihan masing-masing. SFS dapat mengukur tingkat kemiripan kata antar kelas, sedangkan TF-RF dapat menghitung frekuensi suatu kata dan relevansinya terhadap kelas yang berkaitan. Pada penelitian sebelumnya, dilakukan penggabungan dua jenis metode seleksi fitur menggunakan TF-IDF dan Lexical Chain. Berdasarkan penelitian tersebut, menggabungkan dua jenis metode seleksi fitur dapat memberikan hasil yang lebih baik dalam text clustering. Oleh karena itu, dilakukan penelitian untuk menggabungkan metode seleksi fitur SFS dan TF-RF atau dapat disebut sebagai Symbolic Relevance. Dengan penggabungan tersebut, diharapkan kelebihan dari kedua metode tersebut dapat meningkatkan performa text clustering. Dalam penelitian ini, dilakukan 144 jenis skenario percobaan dengan membandingkan antara metode gabungan Symbolic Relevance, tanpa menggabungkan, serta tanpa menggunakan feature selection. Selanjutnya, hasil seleksi fitur diimplementasikan ke dalam clustering K-Means++ dan Spherical K-Means. Selain itu juga dilakukan analisis performa menggunakan Silhouette Coefficient, Purity, AMI, dan Accuracy. Berdasarkan hasil penelitian, metode Symbolic Relevance mampu menyeleksi fitur dengan jumlah rata-rata 17.5% dibandingkan dengan fitur awalnya. Namun percobaan tanpa feature selection memiliki performa tertinggi dikarenakan penggunaan feature selection mengakibatkan banyak informasi yang hilang. Symbolic Relevance memiliki selisih fitur 82.5% (19823 fitur), selisih skor Silhouette Coefficient 0.064, selisih skor Purity 0.306, selisih skor AMI 0.430, selisih Accuracy 0.017, dan selisih waktu eksekusi hingga 293.93 detik dibandingkan metode tanpa feature selection.
    URI
    https://repository.unej.ac.id/xmlui/handle/123456789/125889
    Collections
    • UT-Faculty of Computer Science [1025]

    UPA-TIK Copyright © 2024  Library University of Jember
    Contact Us | Send Feedback

    Indonesia DSpace Group :

    University of Jember Repository
    IPB University Scientific Repository
    UIN Syarif Hidayatullah Institutional Repository
     

     

    Browse

    All of RepositoryCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

    My Account

    LoginRegister

    Context

    Edit this item

    UPA-TIK Copyright © 2024  Library University of Jember
    Contact Us | Send Feedback

    Indonesia DSpace Group :

    University of Jember Repository
    IPB University Scientific Repository
    UIN Syarif Hidayatullah Institutional Repository