Please use this identifier to cite or link to this item:
https://repository.unej.ac.id/xmlui/handle/123456789/104284
Title: | Diagnosisi Penderita Penyakit Kkanker Paru Menggunakan Support Vector Machine Dan Naive Bayes |
Authors: | Anggraeni, Dian Hadi, Alfian Futuhul HELMI, Muhammad Iqbal Yunan |
Keywords: | Penyakit Kkanker Paru Support Vector Machine Naive Bayes |
Issue Date: | 4-Jan-2021 |
Publisher: | FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM |
Abstract: | Kanker merupakan masalah paling utama dalam bidang kedokteran, menurut data jenis kanker yang menjadi penyebab kematian terbanyak adalah kanker paru, mencapai 1,7 juta kematian pertahun. Ada beberapa faktor yang dapat mempengaruhi terjangkitnya kanker paru, salah satu penyebabnya yaitu mutasi ekspresi genetika sel paru. Jumlah ekspresi genetika tersebut sangat banyak sehingga dibutuhkan sebuah sistem klasifikasi kanker paru yang dapat mengklasifikasikan antara sel yang beresiko kanker paru dan sel sehat. Beberapa metode yang dapat digunakan untuk pengklasifikasi kanker paru dalam ilmu satatistika antara lain Naïve Bayes dan Support Vector Machine(SVM). Konsep dasar SVM sebenarnya merupakan kombinasi harmonis dari teori-teori komputasi yang telah ada puluhan tahun sebelumnya, seperti margin hyperplane. SVM adalah metode learning machine yang bekerja atas prinsip Structural Risk Minimization (SRM) dengan tujuan menemukan hyperplane terbaik yang memisahkan dua buah class pada inputspace. Prinsip dasar SVM adalah linear classifier, dan selanjutnya dikembangkan agar dapat bekerja pada kasus non-linear dengan memasukkan konsep kernel trick pada ruang kerja berdimensi tinggi. Sedangkan Naïve Bayes atau disebut juga dengan Bayesian Classification merupakan metode pengklasifikasian statistik yang didasarkan pada teorema bayes yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu kelas. Naïve Bayes handal dalam menangani dataset yang berukuran besar serta dapat menangani data yang tidak relevan. Penelitian ini akan menggunakan data ekspresi gen microarray yang terdiri dari 80 individu dengan 2408 variabel gen kanker paru yang kemudian dibagi menjadi data training dan data testing. Data tersebut dibagi menjadi 75:25 dengan proporsi sama tiap-tiap kelas klasifikasi. Pengujian data training dan data testing ix dilakukan menggunakan metode SVM dan Naïve Bayes. Untuk mendapat model yang optimal digunakan metode k-fold cross validation pada SVM dan Naïve Bayes. Hasil pengujian pada data training menggunakan SVM menghasilkan tingkat akurasi sebesar 100% untuk fungsi kernel linear, 85% untuk fungsi kernel polynomial, 100% untuk fungsi kernel radial, dan 100% untuk fungsi kernel sigmoid. Kemudian dilakukan tuning parameter untuk mencari parameter terbaik dan nilai error terkecil dari setiap fungsi kernel. Tuning parameter yang dilakukan berupa parameter cost yang bernilai 0.001, 0.01, 0.1, 1, 10, 100 terhadap setiap fungsi kernel menggunakan metode 5-fold dan 10-fold cross validation. Dari hasil pengujian dan proses tuning didapatkan bahwa kernel linear merupakan fungsi kernel terbaik dibandingkan dengan ketiga kernel lainnya. Kernel linear juga memiliki nilai error terkecil pada 5 fold yang sudah dilakukan dengan cost parameternya sebesar 0,001. Pengujian data testing model SVM akan digunakan fungsi kernel linear dengan metode 5 fold cross validation. Hasil pengujian pada data training menggunakan Naïve Bayes menghasilkan tingkat akurasi sebesar 98,33%. Kemudian dilakukan pengoptimalan model menggunakan metode 5-fold dan 10-fold cross validation. Dari hasil pengujian dan proses ini didapatkan bahwa 10-fold cross validation mampu melakukan klasifikasi yang lebih baik dari pada 5-fold cross validation ditandai dengan nilai error yang lebih kecil. Pengujian data testing model Naïve Bayes akan digunakan metode 10-fold cross validation. Hasil pengujian metode Naive bayes dan SVM terhadap data ekspresi genetika kanker paru, dapat diambil kesimpulan bahwa metode SVM memiliki hasil klasifikasi yang lebih baik dari metode Naïve Bayes. Pengujian metode SVM memiliki tingkat ketepatan klasifikasi sebesar 90%, sedangkan untuk metode Naïve Byaes memiliki ketepatan klasifikasi sebesar 75%. Klasifikasi SVM dari data sel kanker paru menghasilkan 18 data terklasifikasi secara benar dan ada 2 data kesalahan. Klasifikasi Naïve Bayes dari sel kanker paru menghasilkan 15 data terklasifikasi secara benar dan ada 5 data kesalahan. |
URI: | http://repository.unej.ac.id/handle/123456789/104284 |
Appears in Collections: | UT-Faculty of Mathematics and Natural Sciences |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Muhammad Iqbal Yunan Helmi - 161810101019.pdf | 1.1 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
Admin Tools