Show simple item record

dc.contributor.advisorAnggraeni, Dian
dc.contributor.advisorHadi, Alfian Futuhul
dc.contributor.authorHELMI, Muhammad Iqbal Yunan
dc.date.accessioned2021-04-21T03:42:07Z
dc.date.available2021-04-21T03:42:07Z
dc.date.issued2021-01-04
dc.identifier.nim161810101019
dc.identifier.urihttp://repository.unej.ac.id/handle/123456789/104284
dc.description.abstractKanker merupakan masalah paling utama dalam bidang kedokteran, menurut data jenis kanker yang menjadi penyebab kematian terbanyak adalah kanker paru, mencapai 1,7 juta kematian pertahun. Ada beberapa faktor yang dapat mempengaruhi terjangkitnya kanker paru, salah satu penyebabnya yaitu mutasi ekspresi genetika sel paru. Jumlah ekspresi genetika tersebut sangat banyak sehingga dibutuhkan sebuah sistem klasifikasi kanker paru yang dapat mengklasifikasikan antara sel yang beresiko kanker paru dan sel sehat. Beberapa metode yang dapat digunakan untuk pengklasifikasi kanker paru dalam ilmu satatistika antara lain Naïve Bayes dan Support Vector Machine(SVM). Konsep dasar SVM sebenarnya merupakan kombinasi harmonis dari teori-teori komputasi yang telah ada puluhan tahun sebelumnya, seperti margin hyperplane. SVM adalah metode learning machine yang bekerja atas prinsip Structural Risk Minimization (SRM) dengan tujuan menemukan hyperplane terbaik yang memisahkan dua buah class pada inputspace. Prinsip dasar SVM adalah linear classifier, dan selanjutnya dikembangkan agar dapat bekerja pada kasus non-linear dengan memasukkan konsep kernel trick pada ruang kerja berdimensi tinggi. Sedangkan Naïve Bayes atau disebut juga dengan Bayesian Classification merupakan metode pengklasifikasian statistik yang didasarkan pada teorema bayes yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu kelas. Naïve Bayes handal dalam menangani dataset yang berukuran besar serta dapat menangani data yang tidak relevan. Penelitian ini akan menggunakan data ekspresi gen microarray yang terdiri dari 80 individu dengan 2408 variabel gen kanker paru yang kemudian dibagi menjadi data training dan data testing. Data tersebut dibagi menjadi 75:25 dengan proporsi sama tiap-tiap kelas klasifikasi. Pengujian data training dan data testing ix dilakukan menggunakan metode SVM dan Naïve Bayes. Untuk mendapat model yang optimal digunakan metode k-fold cross validation pada SVM dan Naïve Bayes. Hasil pengujian pada data training menggunakan SVM menghasilkan tingkat akurasi sebesar 100% untuk fungsi kernel linear, 85% untuk fungsi kernel polynomial, 100% untuk fungsi kernel radial, dan 100% untuk fungsi kernel sigmoid. Kemudian dilakukan tuning parameter untuk mencari parameter terbaik dan nilai error terkecil dari setiap fungsi kernel. Tuning parameter yang dilakukan berupa parameter cost yang bernilai 0.001, 0.01, 0.1, 1, 10, 100 terhadap setiap fungsi kernel menggunakan metode 5-fold dan 10-fold cross validation. Dari hasil pengujian dan proses tuning didapatkan bahwa kernel linear merupakan fungsi kernel terbaik dibandingkan dengan ketiga kernel lainnya. Kernel linear juga memiliki nilai error terkecil pada 5 fold yang sudah dilakukan dengan cost parameternya sebesar 0,001. Pengujian data testing model SVM akan digunakan fungsi kernel linear dengan metode 5 fold cross validation. Hasil pengujian pada data training menggunakan Naïve Bayes menghasilkan tingkat akurasi sebesar 98,33%. Kemudian dilakukan pengoptimalan model menggunakan metode 5-fold dan 10-fold cross validation. Dari hasil pengujian dan proses ini didapatkan bahwa 10-fold cross validation mampu melakukan klasifikasi yang lebih baik dari pada 5-fold cross validation ditandai dengan nilai error yang lebih kecil. Pengujian data testing model Naïve Bayes akan digunakan metode 10-fold cross validation. Hasil pengujian metode Naive bayes dan SVM terhadap data ekspresi genetika kanker paru, dapat diambil kesimpulan bahwa metode SVM memiliki hasil klasifikasi yang lebih baik dari metode Naïve Bayes. Pengujian metode SVM memiliki tingkat ketepatan klasifikasi sebesar 90%, sedangkan untuk metode Naïve Byaes memiliki ketepatan klasifikasi sebesar 75%. Klasifikasi SVM dari data sel kanker paru menghasilkan 18 data terklasifikasi secara benar dan ada 2 data kesalahan. Klasifikasi Naïve Bayes dari sel kanker paru menghasilkan 15 data terklasifikasi secara benar dan ada 5 data kesalahan.en_US
dc.language.isoInden_US
dc.publisherFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAMen_US
dc.subjectPenyakit Kkanker Paruen_US
dc.subjectSupport Vector Machineen_US
dc.subjectNaive Bayesen_US
dc.titleDiagnosisi Penderita Penyakit Kkanker Paru Menggunakan Support Vector Machine Dan Naive Bayesen_US
dc.typeThesisen_US
dc.identifier.prodiMATEMATIKA
dc.identifier.kodeprodi1810101


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record