Kecerdasan Buatan (AI) merupakan bidang ilmu komputer yang dikhususkan untuk memecahkan masalah kognitif yang umumnya terkait dengan kecerdasan manusia. Chat Generative Pre-Trained Transformer (Chat GPT) adalah model pemrosesan bahasa alami produk kecerdasan buatan yang dikembangkan oleh OpenAI. Chat GPT berpotensi membantu menjawab pertanyaan medis dengan tingkat kesesuaian yang akurat. Penelitian ini bertujuan untuk mengetahui perbandingan akurasi kecerdasan buatan Chat GPT-4 dan Chat GPT-3 dalam menjawab pertanyaan medis. Penelitian ini merupakan penelitian metaanalisis dan telaah sistematis dengan menggunakan diagram PRISMA. Pencarian studi primer melalui beberapa indexing database diantaranya: PubMed, Google Scholar dan BASE. Kata kunci yang digunakan untuk mempermudah pencarian artikel yaitu; “Chat GPT AND Medical Question”, atau “Chat GPT AND Accuracy”, atau “Chat GPT AND Medical Question AND Accuracy”. Kriteria inklusi penelitian ini adalah artikel yang terpublikasi menggunakan desain studi cross-sectional dari bulan Januari 2023-Agustus 2024. Analisis statistik yang digunakan pada penelitian ini menggunakan program metaanalisis RevMan 5.4.1 dengan pendekatan fixed effect dan Random effect serta menyajikan data funnel plot dan forest plot. Hasil penelitian menunjukan bahwa Chat GPT-4 memiliki tingkat akurasi yang lebih tinggi dalam menjawab pertanyaan medis. Tingkat akurasi Chat GPT-4 dalam menjawab pertanyaan medis menunjukan 3.07 kali lebih tinggi dibandingkan dengan Chat GPT-3 (OR: 3.07; 95%CI: 2.20-4.30; p<0.0001) dan signifikan secara statistik. Forest plot tersebut juga menunjukkan heterogenitas estimasi efek antar studi yang tinggi (I = 81%). Funnel plot menunjukkan terdapat bias publikasi yang cenderung melebih-lebihkan efek yang sesungguhnya (overestimate). Metaanalisis dari 9 studi menunjukan bahwa Chat GPT-4 lebih akurat dibandingkan Chat GPT-3 dalam menjawab pertanyaan medis.
Copyrights © 2025