Claim Missing Document
Check
Articles

Found 38 Documents
Search

Implementasi Algoritma Ct-Pro Dan Data Warehouse Skema Galaxy Untuk Sistem Informasi Evaluasi Diri(Studi Kasus : Fakultas Informatika It Telkom) Raden Mochamad Rizky; Shaufiah Shaufiah; Hetti Hidayati
Indonesia Symposium on Computing Indonesian Symposium on Computing 2014/Seminar Nasional Ilmu Komputasi Teknik Informatika (SNIKTI)
Publisher : Indonesia Symposium on Computing

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Evaluasi diri merupakan proses evaluasi internal pada suatu program studi di suatu perguruan tinggi yang bertujuan untuk meningkatkan jaminan mutu pendidikannya, perencanaan,  perbaikan suatu program studi dan untuk mempersiapkan evaluasi eksternal atau akreditasi. Sistem yang dinamakan Sistem Informasi Evaluasi Diri ditujukan untuk pimpinan program studi dan pihak-pihak terkait untuk membantu melakukan proses evaluasi diri di fakultas Informatika IT Telkom berdasarkan tiga komponen evaluasi diri yang dipilih, yaitu Mahasiswa dan Lulusan, Sumber Daya Manusia, dan Penelitian, Pelayanan/Pengabdian Masyarakat, dan Kerjasama. Sistem Informasi Evaluasi Diri dibangun menggunakan DATA WAREHOUSE yang dirancang dengan skema GALAXY dan Data mining dengan algoritma CT-Pro. DATA WAREHOUSE skema GALAXY merupakan salah satu metode perancangan skema DATA WAREHOUSE dimana suatu tabel dimensi dapat terhubung dengan dua atau lebih tabel fakta. Data mining dengan algoritma CT-PRO merupakan modifikasi dari algoritma association rule lainnya yaitu fp-growth. Perbedaan algoritma CT-PROdengan algoritma FP-growth terletak pada proses pembuatan tree nya. Tree pada CT-PRO(CFP-Tree) lebih sedikit node nya daripada Tree pada FP-growth (FP-Tree). Tujuan menggunakan algoritma Data mining CT-PROadalah untuk menemukan pola-pola rules dari data-data komponen evaluasi diri yang ada agar dapat menjadi knowledge untuk evaluasi diri dan juga akreditasi. Pencarian pola-pola rules tersebut bergantung pada minimum support dan minimum confidence. Pengujian pada DATA WAREHOUSE menunjukkan bahwa DATA WAREHOUSE yang dibangun pada sistem telah memenuhi keempat karakteristik DATA WAREHOUSE, yaitu subject oriented, integrated, time variant,dan non-volatile. Pengujian pada Data mining CT-PRO menunjukkan bahwa association rule pada data mahasiswa kurang dapat diambil knowledge nya karena atribut yang ada pada data mahasiswa kurang lengkap.
Analisis Dan Implementasi Data Mining Dengan Continuous Association Rule Mining Algorithm (Carma) Untuk Rekomendasi Mata Kuliah Pada Perwalian Dwiaji Nuraryudha; Shaufiah Shaufiah; Hetti Hidayati
Indonesia Symposium on Computing Indonesian Symposium on Computing 2014/Seminar Nasional Ilmu Komputasi Teknik Informatika (SNIKTI)
Publisher : Indonesia Symposium on Computing

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Perwalian adalah tahapan yang harus dilalui oleh setiap mahasiswa pada masa registrasi semester baru.  Saat perwalian, mahasiswa mengajukan mata kuliah yang akan diambil kepada dosen wali, kemudian dosen wali akan membantu dengan memberikan rekomendasi mata kuliah untuk mahasiswa walinya terutama dalam pengambilan mata kuliah pilihan. Untuk itu dibuatlah sebuah sistem rekomendasi guna membantu proses perwalian. Sistem rekomendasi ini dibuat dengan teknik Data mining menggunakan algoritma CARMA (Continuous Association rule Mining Algorithm).  Hasil implementasi yang dilakukan membuktikan bahwa algoritma CARMA dapat digunakan untuk menyelesaikan proses rekomendasi mata kuliah pilihan. Rekomendasi ini berdasarkan aturan asosiasi yang terbentuk. Nilai yang didapat adalah minimum confidence=50%, dan support sequence = 0.4.
Penggunaan Rstudio Untuk Ekstraksi Dan Reduksi Fitur Fairuz Ahmad Hirzani; Fatiya Arifah; Shaufiah Shaufiah
Indonesia Symposium on Computing Indonesian Symposium on Computing 2014/Seminar Nasional Ilmu Komputasi Teknik Informatika (SNIKTI)
Publisher : Indonesia Symposium on Computing

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Ekstraksi dan reduksi fitur merupakan hal yang sangat penting dalam proses persiapan data sebelum dilakukan penambangan data. Tantangan dalam proses ekstraksi data diantaranya adalah menentukan proses dan nilai apa saja yang akan digunakan. Reduksi data juga merupakan isu penting karena tidak semua fitur relevan untuk digunakan. Proses ekstraksi dan reduksi fitur akan lebih efektif jika menggunakan tools. Oleh karenanya paper ini membahas pemanfaatan tools Rstudio untuk membantu proses ekstraksi dan reduksi data pada kasus data berdimensi besar yaitu Daily and Sports Activities Dataset . Pada percobaan menunjukan bahwa Rstudio mampu melakukan ekstraksi fitur dengan cepat dan reduksi fiturnya dapat mengurangi waktu eksekusi tanpa merubah secara drastis akurasi yang dihasilkan.
Analisis Algoritma RP-GD dalam Kualitas Peringkasan Graf dari Basis Data Graf Defrianda Rizky Pranata; Kemas Rahmat Saleh Wiharja; Shaufiah Abdullah
Indonesia Symposium on Computing Indonesia Symposium on Computing 2015
Publisher : Indonesia Symposium on Computing

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Basisdata graf merupakan representasi dari pemodelan suatu koleksi data yang terdiri dari Edges, Nodes, dan Properties untuk merepresentasikan dan menyimpan data. Bersifat index-free adjacency yang berarti bahwa setiap elemen berisi pointer langsung ke elemen yang berdekatan dan tidak memerlukan pencarian sederhana menggunakan indeks. Penulis menggunakan model database ini karena dapat merepresentasikan banyak data sehingga dapat dianalisis dan diambil kesimpulannya. Basisdata yang digunakan yaitu molekuler ikatan kimia dengan format penulisan SMILES (Simplified Molecular Input Line Entry System). Metode peringkasan yang penulis ambil adalah algoritma RP-GD yang efisien serta mampu meningkatkan kualitas peringkasan dan bisa merepresentasikan molekuler ikatan kimia dari dataset tersebut. Dari hasil pengujian dan analisis, terbukti algoritma RP-GD dapat digunakan dalam peringkasan basisdata graf, menghasilkan kualitas yang baik hasilnya. Parameter yang menunjukkan hasil tersebut adalah jumlah nodes dan edges hasil peringkasan lalu cakupan informasi serta rasio peringkasan. Variasi hasil peringkasan juga dapat dilakukan sesuai dengan minimum support yang diinginkan. Nilai cakupan informasi dari sebuah ringkasan basisdata graf berbanding lurus dengan nilai minimum support yang diberikan, sedangkan rasio peringkasan berbanding terbalik dengan nilai minimum support yang diberikan.  
IMPLEMENTASI DAN ANALISA GRANULAR SUPPORT VECTOR MACHINE DENGAN DATA CLEANING (GSVM-DC) UNTUK E-MAIL SPAM FILTERING Moh. Mahsus; ZK. Abdurahman Baizal; Shaufiah .
Seminar Nasional Aplikasi Teknologi Informasi (SNATI) 2012
Publisher : Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Islam Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

E-mail spam adalah pembanjiran internet dengan banyak salinan pesan yang sama, dan memaksa pengguna internet untuk menerimanya walupun itu tidak dinginkan. Pengguna e-mail membutuhkan waktu yang lebih lama untuk membaca dan memutuskan apakah e-mail yang diterima tersebut adalah spam atau bukan. Berdasarkan motivasi tersebut e-mail spam filtering banyak dikembangkan. Banyak teknik yang digunakan untuk pembangunan sebuah e-mail spam filtering, dan salah satunya dengan menggunakan metode Support Vector Machines karena terbukti memiliki kemampuan generalisasi yang baik. Untuk meningkatkan akurasi dan efisiensi pemrosesan, SVM dimodifikasi dengan paradigma granular computing dengan memecah data menjadi bagian-bagian kecil informasi serta metode data cleaning yang digunakan untuk mengurangi jumlah data yang akan dilatih. Dengan modifikasi yang disebut Granular Support Vector Machines with Data Cleaning ini diperoleh hasil akurasi sebesar 97,2%, lebih baik daripada menggunakan SVM biasa dengan hasil akurasi sebesar 96,6%.
Pengembangan Rules-Driven Workflow Management System (RDWfMS) dengan Menggunakan Teknik Data Mining untuk Sistem Informasi Research Center Shaufiah Shaufiah
Indonesia Journal on Computing (Indo-JC) Vol. 2 No. 1 (2017): Maret, 2017
Publisher : School of Computing, Telkom University

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.21108/INDOJC.2017.2.1.93

Abstract

The tight competition of business and technology today makes the organisation must be able to adapt to changes. The changes could affect not only business process model of the organisation but also their information system, which lead to high cost and time-consuming. Therefore, the design and implementation of an information system should handle with care. Furthermore, the organisation also needs to process data into information and knowledge to support their business. Hence, this research is developed to undertake those problems by developing the information system using hybrid approach of the workflow system and data mining technique with research centre organisation as a case study. The system named as SIMPLER which applying rules-driven workflow and data mining to process data into information and knowledge from research data. SIMPLER tested by measuring its ability as a workflow management system as well as measuring the quality based on end-user satisfaction and perception by using WebQual. Based on the test results indicate that the SIMPLER been able to satisfy the need for business process execution XYZ research centre, able to adapt to changes without reconstructing the source code and gained end users satisfaction of 81.81% and 85% of accuracy.
Implementasi Word Sense Disambiguation Dengan Metode Maximal Marginal Relevance Pada Peringkasan Teks Bening Suryani Pratiwi; Shaufiah Shaufiah; Moch. Arif Bijaksana
eProceedings of Engineering Vol 4, No 1 (2017): April, 2017
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Dalam meringkas sebuah teks terdapat permasalahan yang muncul dan mempengaruhi hasil dari peringkasan teks tersebut. Permasalahan yang muncul seperti ambiguitas kata dan redundansi. Untuk meningkatkan kualitas dari peringkasan teks tersebut maka, permasalahan ambiguitas dan redundansi harus diatasi. Sehingga pada tugas akhir ini dilakukan peringkasan teks pada single dokumen yang mengimplementasi Word Sense Disambiguation dengan metode Maximal Marginal Relevance. Tahapan yang dilakukan terdiri dari Preprocessing, Word Sense Disambiguation, perhitungan Cosine Similarity, perhitungan Maximal Marginal Relevance, dan evaluasi. Pada tahapan preprocessing dilakukan cleaning pada data seperti stopwords removal, tokenization, remove tag, lemmatization dan stemming. Proses Word Sense Disambiguation dipilih untuk mengatasi masalah ambigu pada term dan diganti dengan synset term pada peringkasan teks tersebut. Pada peringkasan ini akan menggunakan cosine similarity untuk mengukur kemiripan setiap kalimat dengan kalimat pada keseluruhan isi dokumen. Sedangkan metode Maximal Marginal Relevance digunakan untuk merangking ulang hasil dari perhitungan cosine similarity dan memilih kalimat dengan nilai MMR paling tinggi yang akan dijadikan summary dengan nilai compresion rate yang ditentukan. Metode MMR termasuk metode yang sederhana namun efisien untuk mengurangi redundansi. Hasil peringkasan teks otomatis ini selanjutnya dievalusi dan dianalisis dengan pengukuran precision, recall, dan F-Measure dan dilihat dari hasil survey pembaca terhadap summary yang dihasilkan. Dengan nilai Recall 35%, Precision 21%, dan F-Measure 25%. Kata kunci : Word Sense Disambiguation, Maximal Marginal Relevance, Cosine Similarity.
Analisis Penggunaan Association Rule Learning Pada Real-time Business Intelligence Dengan Data Stream Mining Faizal Hendyansyah Khrisdian; Shaufiah Shaufiah; Shinta Yulia Puspitasari
eProceedings of Engineering Vol 2, No 3 (2015): Desember, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Dengan semakin berkembangnya teknologi, kebutuhan pemrosesan data menjadi semakin cepat. Semakin banyaknya data yang mengalir, menuntut proses analisis data yang cepat sehingga dapat menghasilkan keputusan dengan tingkat keterlambatan minimum. Tidak hanya pada level managerial atau strategis saja sebuah sistem business intelligence dibutuhkan, bahkan pada level operasional pun sudah mulai membutuhkan sistem business intelligence untuk meningkatkan efektifitas dan efisiensi kerja. Oleh sebab itu, dibangunlah sebuah sistem real-time business intelligence yang dituntut bekerja cepat untuk membantu kinerja pada level operasional. Dalam tugas akhir ini, dilakukan penelitian tentang sebuah sistem real-time business intelligence untuk memprediksi delay pada penerbangan pesawat pada PT Garuda Indonesia menggunakan metode association rule learning dengan algoritma apriori. Data penerbangan akan dilakukan preprocessing sebelumnya dengan cara menghilangkan data yang memiliki missing value dan melakukan perubahan data untuk merubah data yang berbentuk string menjadi integer agar dapat dihitung. Data tersebut nantinya akan diolah dan digali agar membentuk informasi atau pengetahuan yang dapat digunakan sebagai dasar pengambilan keputusan. Hasil dari proses real-time analytic akan dimasukkan ke dalam beberapa skenario pengujian dengan jumlah minimum support dan minimum confident yang berbeda, dan juga dengan proses penggunaan apriori yang berbeda. Kata Kunci : Real-time Business Intelligence, Delay, Association Rule Learning, Apriori.
Stemming Words Dengan N-Gram Dan Lexeme Based Untuk Teks Berbahasa Korea Nadya Eka Putri Permadi; Shaufiah Shaufiah; Mira Kania Sabariah
eProceedings of Engineering Vol 2, No 1 (2015): April, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Bahasa Korea termasuk ke dalam bahasa aglutinatif yang termasuk unik dan memiliki berbagai jenis pelekatan morfem, dengan kondisi ini, pengaplikasian teknik stemming words dianggap sedikit sulit untuk dilakukan. Beberapa penelitian sudah dilakukan, namun masih ditemui beberapa kesalahan dikarenakan adanya keunikan dari karakter kata dalam Bahasa Korea. Dalam penelitian kali ini akan dibahas teknik baru untuk melakukan stemming words atau pencarian kata dasar disertai dengan deteksi imbuhannya. Penelitian ini bertujuan untuk membentuk kata dasar dari kata kerja berimbuhan pada bahasa Korea dan mencari jenis dan arti dari imbuhan yang melekat pada kata tersebut. Penelitian ini dilakukan dengan menggabungkan metode N-gram dan Lexeme Based. Dalam pencarian kata dasar ini sejumlah kata kerja yang mendapat imbuhan dalam tata bahasa tertentu dipecah untuk menghasilkan kata dasar dan imbuhan yang sesuai. Pemecahan kata berimbuhan dilakukan dengan metode N- gram dan dilanjutkan dengan pengaplikasian metode Lexeme Based untuk pencarian kata dasar serta jenis dan arti imbuhan. Hasil yang didapatkan pada penelitian ini adalah pembentukan kata dasar dan imbuhan yang disertai dengan jenis imbuhan serta arti dari imbuhan tersebut. Kata kunci : stemming words, Bahasa Korea, N-gram, Lexeme Based, aglutinatif.
Analisis Dan Implementasi Pencocokan String Berdasarkan Kemiripan Pengucapan (phonetic String Matching) Menggunakan Algoritma Metaphone Dalam Pencarian Ayat Al-qur’an Tegar Graha Adiwiguna; Moch. Arif Bijaksana; Shaufiah Shaufiah
eProceedings of Engineering Vol 2, No 2 (2015): Agustus, 2015
Publisher : eProceedings of Engineering

Show Abstract | Download Original | Original Source | Check in Google Scholar

Abstract

Abstrak Telah ditemukan penelitian baru yang membuat Al-Qur’an dalam versi digital. Akan tetapi, pada umumnya perangkat lunak yang telah ada hanya menggunakan teknik Exact String Matching untuk melakukan pencarian informasi (ayat). Dan jika pengguna perangkat lunak ini salah dalam penulisan inputan maka perangkat lunak tidak akan memberikan solusi dari apa yang diinginkan oleh pengguna. Oleh karena itu, tujuan penelitian ini adalah membangun sistem pencarian dengan teknik fonetik atau pencocokan kata berdasarkan pengucapan (Phonetic String Matching) yang dapat digunakan untuk mengatasi permasalah tersebut. Dengan menggunakan Algoritma Metaphone dan Dice Similarity, sistem pencarian ayat Al-Qur’an ini akan melakukan pencocokan string berdasarkan pengucapan dengan nilai precision sebesar 54% dan nilai recall sebesar 100%. Juga korelasi yang didapatkan sebesar 82%.