Claim Missing Document
Check
Articles

Found 26 Documents
Search

Performance of speech enhancement models in video conferences: DeepFilterNet3 and RNNoise Maulana, Muhammad Iqbal; Raisul Akbar, Muhammad Fadhlillah; Iklima, Zendi
SINERGI Vol 29, No 2 (2025)
Publisher : Universitas Mercu Buana

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22441/sinergi.2025.2.001

Abstract

As remote work and online education continue to gain prominence, the importance of clear audio communication becomes crucial. Deep Learning-based Speech Enhancement has emerged as a promising solution for processing data in noisy environments. In this study, we conducted an in-depth analysis of two speech enhancement models, RNNoise and DeepFilterNet3, selected for their respective strengths. DeepFilterNet3 leverages time-frequency masking with a Complex Mask filter, while RNNoise employs Recurrent Neural Networks with lower complexity. The performance evaluation in training revealed that RNNoise demonstrated impressive denoising capabilities, achieving low loss values, while DeepFilterNet3 showed superior generalization. Specifically, "DeepFilterNet3 (Pre-Trained)" exhibited the best overall performance, excelling in intelligibility and speech quality. RNNoise also performed well in subjective quality measures. Furthermore, we assessed the real-time processing efficiency of both models. Both RNNoise variants processed speech signals almost in real-time, whereas DeepFilterNet3, though slightly slower, remained efficient. The findings demonstrate significant improvements in speech quality, with "DeepFilterNet3 (Pre-Trained)" emerging as the top-performing model. The implications of this study have the potential to enhance video conference experiences and contribute to the improvement of remote work and online education.
Real-time dental caries segmentation with an efficient Deformable U-Net (DU-Net) for teledentistry system Iklima, Zendi; Kadarina, Trie Maya; Salamah, Ketty Siti; Sentosa, Arrival Dwi
SINERGI Vol 29, No 2 (2025)
Publisher : Universitas Mercu Buana

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22441/sinergi.2025.2.015

Abstract

Digital technology has greatly improved teledentistry by facilitating telediagnostics and teleconsultations, particularly benefiting those in remote areas. Additionally, AI advancements enhance diagnostic accuracy and streamline clinical decision-making, reducing costs and resource disparities in dental care. This study presents an improved U-Net architecture, Deformable U-Net (DU-Net), for semantic dental caries segmentation, leveraging deformable convolutions to dynamically adjust sampling points for improved feature extraction and reduced computational redundancy. By connecting encoder-decoder blocks via skip-connections, the DU-Net architecture enables efficient real-time segmentation and balance accuracy while reducing computational demands. The deformable block in DU-Net and DDR U-Net shows a balanced performance and efficiency while maintaining accuracy despite reduced FLOPs. The proposed architecture was implemented in real-time dental caries segmentation on a Dual Core Cortex A72 system and web server. It shows a significant improvement in Dice score, reducing CPU and memory usage compared to conventional U-Net models. Moreover, the DU-Net and its half variants achieved competitive performance with much lower computational demands makes suitable for web servers and embedded applications. The result highlights the DU-Net capability to optimize both computational efficiency and segmentation accuracy, offering a promising solution for real-world applications where speed and resource management are critical, particularly in the medical imaging field.
Analisis Citra Pada Potret Botol Minuman Bekas Menggunakan Algoritma Convolutional Neural Network Ramadhani, Nandiko; Iklima, Zendi
Jurnal Teknologi Elektro Vol 15, No 3 (2024)
Publisher : Electrical Engineering, Universitas Mercu Buana

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22441/jte.2024.v15i3.003

Abstract

Hadirnya kehidupan manusia yang menggunakan berbagai jenis produk berpotensi menghasilkan beraneka ragam sampah. Dalam situs resmi Sistem Informasi Pengelolaan Sampah Nasional (SIPSN), urutan kedua pada produksi sampah nasional tahun 2021 adalah sampah plastik. Sampah botol minuman bekas berbahan dasar plastik membutuhkan waktu yang lama agar dapat terurai. Di antara solusinya ialah dengan melakukan daur ulang sampah. Sebagian pengelola daur ulang masih menggunakan teknik penyortiran sampah secara manual, sehingga dibutuhkan sistem klasifikasi agar mempermudah penyortiran sampah botol minuman bekas. Pada penelitian ini, dilakukan perancangan sistem dengan algoritma Convolutional Neural Network (CNN), di mana terdapat beberapa model CNN tunggal dengan base model dari MobileNetV2 dan dimodifikasi pada bagian head model atau fully-connected layer, sehingga menghasilkan arsitektur MobileNetV2 dengan tiga macam head model, yaitu Head Model 1, Head Model 2, dan Head Model 3. Selain itu, diusulkan metode ensemble yang diterapkan pada seluruh model CNN tunggal dengan mengambil nilai bobot (weight) yang diperoleh setelah pelatihan, kemudian dilakukan proses bobot rata-rata (average weights) untuk meningkatkan performa pengklasifikasian gambar. Bentuk model baru ini dikenal dengan Ensemble Convolutional Neural Network (E-CNN). Berdasarkan hasil pengujian yang dilakukan, model CNN mampu mengklasifikasikan citra pada potret botol minuman bekas secara akurat dan efektif. Hal ini ditunjukkan pada nilai classification report pengujian, yaitu penggunaan model CNN tunggal berupa arsitektur MobileNetV2 dengan Head Model 1, Head Model 2, dan Head Model 3 memiliki nilai accuracy berturut-turut sebesar 91%, 89%, dan 91%. Selain itu, setelah diterapkan metode ensemble dan menjadi model E-CNN, maka didapatkan nilai accuracy pengujian sebesar 98%, di mana terjadi peningkatan nilai accuracy sebesar 7% hingga 9%.
Klasifikasi Hasil Potret pada Cacat Produk Spring Washer menggunakan Metode Transfer Learning Convolutional Neural Network Iklima, Zendi; Ningrum, Dinar Sakti Candra
Jurnal Ilmu Teknik dan Komputer Vol 9, No 1 (2025)
Publisher : Universitas Mercu Buana

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22441/jitkom.v9i1.003

Abstract

Spring Washer merupakan komponen yang dapat digunakan untuk pengencang berulir. Spring Washer terbuat dari bahan logam lalu dibentuk ring bulat. Dalam Quality Prosedur Perusahaan produk yang diproduksi harus dicek kualitasnya agar tidak ada kecacatan produk terkirim ke pelanggan. Kecacatan pada produk berbahan logam diantaranya adalah korosi pada produk. Pengecekan Spring Washer biasanya dilakukan secara visual manual oleh karyawan, hal ini memerlukan waktu yang tidak sebentar jika yang dicek memiliki kuantitas yang banyak. Dengan adanya Convolutional Neural Network (CNN) dilakukanya perancangan untuk mengklasifikasikan Spring Washer berkualitas baik dan korosi. Dalam penelitian ini dilakukan pembentukan sistem dengan Tiga model transfer learning CNN yaitu VGG16, MobileNet dan Xception. Pembentukan algoritma sistem menggunakan Google Colaboration dengan Bahasa pemrograman Phyton. Dataset diambil dari gambar produk Spring Washer sebanyak 1048 foto dengan keadaan yang berbeda, yaitu Spring Washer Bagus atau Korosi.
Sistem Pembelajaran Mandiri untuk Deteksi Anomali pada Proses Radius Shaping Menggunakan Deep Neural Network Berbasis Bidirectional Protocol Iklima, Zendi; Kadarina, Trie Maya
Jurnal Teknologi Elektro Vol 16, No 2 (2025)
Publisher : Electrical Engineering, Universitas Mercu Buana

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.22441/jte.2025.v16i2.006

Abstract

Proses shaping merupakan langkah dalam proses curing atau pemasakan ban setengah jadi (green tire), di mana ban tersebut ditempatkan pada bladder dan diberi tekanan yang sesuai. Dalam proses shaping, nilai tekanan dan dimensi (radius) bladder menjadi parameter utama yang memengaruhi hasil produk. Mesin curing yang digunakan saat ini masih mengadopsi sistem konvensional, memerlukan pemantauan konstan oleh operator untuk mencapai hasil shaping yang optimal dan mengurangi kegagalan dalam proses curing ban. Pantauan mesin curing yang dilakukan secara manual menyebabkan analisis cacat produk tidak optimal, dan penentuan nilai radius yang optimal sulit dilakukan. Oleh karena itu, diperlukan suatu metode agar sistem pemantauan nilai radius shaping dapat mendeteksi dan memberikan rekomendasi untuk parameter shaping yang tepat, seperti nilai radius dan tekanan. Dengan perkembangan teknologi kecerdasan buatan yang pesat di berbagai sektor, termasuk medis, militer, pendidikan, ekonomi, politik, industri, dan lainnya, teknologi ini dapat mengatasi tugas-tugas berbahaya dan berulang. Sejumlah metode AI telah berhasil diimplementasikan dalam industri untuk memastikan produksi yang memenuhi standar kualitas. Dalam konteks ini, penulis mengusulkan penerapan metode AI untuk melakukan analisis terhadap proses radius shaping pada pemasakan ban, dengan tujuan mengurangi kegagalan produksi yang sering disebabkan oleh berbagai faktor, salah satunya adalah kesalahan manusia. Penelitian ini mencakup pengidentifikasian pola atau perubahan yang tidak sesuai dengan kondisi normal yang diharapkan. Merujuk pada metode komunikasi yang memungkinkan aliran informasi dua arah, memungkinkan respons yang lebih cepat dan interaksi yang dinamis antara system deteksi anomali dengan system pembelajaran mandiri.
Realistic image synthesis of COVID-19 chest X-rays using depthwise boundary equilibrium generative adversarial networks Iklima, Zendi; Kadarina, Trie Maya; Ihsanto, Eko
International Journal of Electrical and Computer Engineering (IJECE) Vol 12, No 5: October 2022
Publisher : Institute of Advanced Engineering and Science

Show Abstract | Download Original | Original Source | Check in Google Scholar | DOI: 10.11591/ijece.v12i5.pp5444-5454

Abstract

Researchers in various related fields research preventing and controlling the spread of the coronavirus disease (COVID-19) virus. The spread of the COVID-19 is increasing exponentially and infecting humans massively. Preliminary detection can be observed by looking at abnormal conditions in the airways, thus allowing the entry of the virus into the patient's respiratory tract, which can be represented using computer tomography (CT) scan and chest X-ray (CXR) imaging. Particular deep learning approaches have been developed to classify COVID-19 CT or CXR images such as convolutional neural network (CNN), and deep convolutional neural network (DCNN). However, COVID-19 CXR dataset was measly opened and accessed. Particular deep learning method performance can be improved by augmenting the dataset amount. Therefore, the COVID-19 CXR dataset was possibly augmented by generating the synthetic image. This study discusses a fast and real-like image synthesis approach, namely depthwise boundary equilibrium generative adversarial network (DepthwiseBEGAN). DepthwiseBEGAN was reduced memory load 70.11% in training processes compared to the conventional BEGAN. DepthwiseBEGAN synthetic images were inspected by measuring the Fréchet inception distance (FID) score with the real-to-real score equal to 4.3866 and real-to-fake score equal to 4.4674. Moreover, generated DepthwiseBEGAN synthetic images improve 22.59% accuracy of conventional CNN models.