Claim Missing Document
Check
Articles

Found 14 Documents
Search
Journal : eProceedings of Engineering

Implementasi Minimum Redundancy Maximum Relevance Sebagai Teknik Reduksi Dimensi Pada Klasifikasi Kanker Usus Besar Menggunakan Random Forest I.G.N.P.Vasu Geramona; Adiwijaya Adiwijaya; Widi Astuti
eProceedings of Engineering Vol 7, No 1 (2020): April 2020
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Kanker merupakan penyakit yang mematikan. Mengutip informasi dari kementrian kesehatan Republik Indonesia pada tahun 2017 sembilan juta orang meninggal akibat kanker. Oleh sebab itu diperlukan sebuah metode untuk mendeteksi kanker salah satunya dengan gen expression. Microarray adalah salah satu teknik dari gen expression. Microarray sendiri memiliki feature yang banyak, feature yang banyak ini tidaklah selalu berkaitan dengan masalah yang sedang dihadapi. Sehingga dibutuhkan teknik reduksi dimensi untuk menyeleksi feature yang bersesuaian dengan masalah yang sedang dihadapi. Pada tugas akhir ini digunakan teknik reduksi dimensi menggunakan Minimum Redundancy Maximum Relevance yang selanjutnya akan disingkat dengan MRMR. Adapun Classifier yang digunakan adalah Random Forest, dimana teknik ini membuat beberapa tree untuk mengklasifikasi data lalu dilakukan voting untuk hasil terbanyak. Persamaan MRMR yang digunakan adalah FCD dan FCQ karena data yang digunakan bernilai kontinu. Setelah semua proses telah dilakukan, diperoleh hasil akurasi dari klasifikasi data microarray dengan menggunakan FCQ sebesar 83,87% dan dengan FCD 61,29%. Kata kunci : microarray, gen expression, random forest, MRMR Abstract Cancer is a deadly disease. Quoting information from the Ministry of Health of the Republic of Indonesia in 2017 nine million people died from cancer. Therefore we need a method to detect cancer, one of which is by gene expression. Microarray is a technique of gene expression. Microarray itself has many features, many of these features are not always related to the problem being faced. So we need a dimension reduction technique to select features that correspond to the problem being faced. In this final project a dimension reduction technique will be used using the Minimum Redundancy Maximum Relevance which will then be abbreviated as MRMR. The Classifier that will be used is Random Forest, where this technique creates several trees to classify data and then will vote for the most results. The MRMR equation used is FCD and FCQ because the data used is continuous. After the process done, the result from classify microarray data using FCQ is 83.87% and with FCD 61.29% Keywords: microarray, gen expression, random forest, MRMR
Identifikasi Teks Gereflekter Pada Buku Anak Dengan Algoritma K-nearest Neighbor I Kadek Ananda Prana Widya; Widi Astuti
eProceedings of Engineering Vol 7, No 1 (2020): April 2020
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Buku anak merupakan salah satu sumber pengetahuan bagi pembaca, khususnya anak. Ketika buku itu dibaca, anak akan berusaha memaknai setiap kata dan kalimat di dalamnya. Terdapat permasalahan ketika ditemukan kesalahan konten pada buku tersebut. Konten yang dimaksud yaitu kata maupun kalimat yang memiliki makna kurang sopan, seksual, serta kata kasar. Bagi anak-anak di tingkat sekolah dasar konten tersebut menjadi hal yang bermakna gereflekter (tabu). Berdasarkan permasalah tersebut, maka dilakukan penelitian tugas akhir terhadap cerita anak yang diambil dari buku fiksi dan buku pelajaran. Penelitian ini dilakukan dengan membangun sistem untuk mendeteksi konten gereflekter pada teks cerita yang dijadikan sebagai dataset. Penelitian dilakukan dengan membangun model menggunakan algoritma klasifikasi teks k-Nearest Neighbor dengan pendekatan distance measure. Distance measure yang digunakan adalah Euclidean Distance dan Manhattan Distance. Sistem dievaluasi dengan menggunakan precision, recall, dan F1 score. Berdasarkan hasil evaluasi, skenario pengujian menggunakan Euclidean distance dan Manhattan distance mendapatkan nilai precision 0.915, recall 0.845, dan F1 score 0.895. Kata kunci : buku anak, distance measure, gereflekter, k-Nearest Neighbor Abstract Children's books are one source of knowledge for readers, especially children. When the book is read, the child will try to make sense of every word and sentence in it. There was a problem when a content error was found in the book. The content in question is words and sentences that have meanings that are not polite, sexual, and rude words. For children at the elementary school level, the content becomes meaningful reflectivity (taboo). Based on these problems, a final assignment research was carried out on children's stories taken from fiction books and textbooks. This research was conducted by building a system for detecting reflector content on story text that is used as a dataset. The study was conducted by building a model using the k-Nearest Neighbor text classification algorithm with a distance measure approach. Distance measure used is Euclidean Distance and Manhattan Distance. The system is evaluated using precision, recall, and F1 score. Based on the evaluation results, testing scenarios using Euclidean distance and Manhattan distance get a precision value of 0.915, recall 0.845, and F1 score 0.895. Keywords: children’s book, distance measure, gereflekter, k-Nearest Neighbor
Klasifikasi Teks Artikel Berita Hoaks Covid-19 Dengan Menggunakan Algotrima K-nearest Neighbor Berlian Kaida Palma; Danang Triantoro Murdiansyah; Widi Astuti
eProceedings of Engineering Vol 8, No 5 (2021): Oktober 2021
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Peran internet dan pertumbuhan informasi yang diberitakan di media sosial membuat perkembangan dan penyebaran berita semakin mudah, begitu pun dalam mengaksesnya. Pada masa pandemi Covid-19 saat ini banyak sekali berita yang tersebar sehingga masyarakat luas mencari atau mendapat informasi tentang virus ini. Berita berjudul Covid-19 ini banyak berisi informasi tidak penting bahkan memberitakan informasi hoaks. Hal ini membuat masyarakat internasional khususnya Indonesia resah akan berita yang beredar selama masa Covid-19. Oleh karena itu, penulis membuat sebuah model sistem untuk melakukan klasifikasi berita yang sesuai terjadi di lapangan. Informasi yang tersebar di media sosial sangat variatif sehingga banyak berita yang tidak penting bahkan berisikan informasi hoaks. Klasifikasi berita akan dilakukan dengan K-Nearest Neighbor (KNN). Berita yang ada dibagi menjadi beberapa kelas berdasarkan kategorinya, kemudian berita dilakukan klasifikasi teks dengan metode K-Nearest Neighbor (KNN) dan k-fold cross validation sebagai validasi model yang dibuat. Proses klasifikasi dilakukan dengan skema menggunakan 80% data train dan 20% data test serta mengubah parameter nilai k pada K-Nearest Neighbor dengan k = 3, k = 5, k = 7, k = 9, dan pada k-fold cross validation sebanyak k = 5 dan k = 10. Untuk evaluasi digunakan confusion matrix. Akhirnya, dari setiap model yang dilakukan dengan mengubah nilai k pada K-Nearest Neighbor didapatkan hasil akurasi terbaik dengan F1-Score sebesar 48% dari nilai k = 5, hasil validasi dari k-fold cross validation k = 5 sebesar 42% dan k = 10 sebesar 45%. Kata Kunci : Covid-19, K-Nearest Neighbor, Hoax, intenet, klasifikasi.
Analisis Perbandingan Klasifikasi Microarray Menggunakan Naïve Bayes Dan Support Vector Machine (svm) Untuk Deteksi Kanker Dengan Feature Extraction Pca Vina Mutiara Purnama; Widi Astuti; Adiwijaya Adiwijaya
eProceedings of Engineering Vol 8, No 5 (2021): Oktober 2021
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Kanker merupakan salah satu penyebab kematian manusia terbanyak di dunia. Diperkirakan penderita kanker terus meningkat setiap tahunnya. Kanker yang dapat terdeteksi lebih dini memiliki probabilitas lebih tinggi untuk mendapatkan penanganan yang lebih cepat dan tepat. Salah satu caranya dengan menggunakan teknologi Microarray. Teknologi Microarray dapat menganalisis ribuan profil gene expression dalam waktu yang bersamaan. Dengan melakukan analisa terhadap data Microarray selanjutnya dapat diketahui apakah seseorang terkena kanker atau tidak. Namun, permasalahan dalam data Microarray adalah jumlah atribut yang jauh lebih banyak dibandingkan sampel sehingga perlu dilakukannya reduksi dimensi. Untuk mengatasi hal tersebut, penulis menggunakan salah satu teknik reduksi dimensi yaitu Principal Component Analysis (PCA) dan menggunakan 2 metode klasifikasi yaitu Naïve Bayes dan Support Vector Machine (SVM), yang selanjutnya akan dibandingkan dan dianalisa hasil performansi dari kedua metode tersebut untuk mencari mana yang lebih baik. Akurasi dari hasil penelitian ini menunjukkan 4 dari 5 data kanker mendapatkan akurasi sebesar 77-96% sedangkan 1 data lainnya yaitu data breast cancer mendapatkan akurasi terkecil yaitu 54.6%. Kata kunci : Kanker, Microarray, Reduksi Dimensi, Principal Component Analysis (PCA), Naïve Bayes, Support Vector Machine (SVM).