Penyakit paru masih menjadi permasalahan kesehatan global dengan angka kasus dan kematian yang terus meningkat, sementara metode diagnosis konvensional seperti auskultasi manual masih bersifat subjektif terhadap keahlian tenaga medis. Penelitian terdahulu menunjukkan hasil yang tidak konsisten dalam menentukan arsitektur deep learning terbaik untuk klasifikasi suara pernapasan, disertai keterbatasan dataset yang tidak seimbang dan belum adanya validasi statistik. Samanta dan Mandala melaporkan keunggulan CNN, sedangkan Zhang, P. dkk menemukan LSTM lebih unggul. Hal ini menunjukkan perlunya evaluasi yang lebih komprehensif. Sebagai tindak lanjut, penelitian ini bertujuan mengkaji performa CNN dan LSTM dengan mempertimbangkan keseimbangan kelas melalui stratified sampling dan class weighting, serta menilai signifikansi perbedaan performa menggunakan paired-sample t-test. Hasil menunjukkan bahwa CNN secara signifikan lebih unggul dengan akurasi rata-rata 88,20% dibandingkan LSTM sebesar 71,23% (p < 0,05). Selain itu, model CNN mencapai akurasi 86% pada independent test set, sedangkan LSTM mencapai akurasi 66%. Kontribusi utama penelitian ini adalah penerapan pendekatan evaluasi model yang lebih komprehensif melalui uji statistik dan mengembangkan sistem deteksi dini penyakit paru non-invasif yang efisien dan aplikatif melalui implementasi berbasis Streamlit. Kata Kunci – CNN, Klasisikasi, LSTM, Penyakit Paru, Suara Pernapasan.
Copyrights © 2025