Pertumbuhan pesat ekosistem blockchain telah melahirkan ribuan token pada jaringan ERC-20. Fenomena ini mendorong inovasi finansial, namun sekaligus meningkatkan risiko penipuan melalui smart contract yang menyembunyikan mekanisme berbahaya seperti backdoor, blacklist bot, dan manipulasi fee. Penelitian ini mengusulkan pendekatan klasifikasi berbasis Transformer secara end-to-end untuk mendeteksi token scam ERC-20 menggunakan kode sumber Solidity sebagai satu-satunya fitur masukan. Tiga model dievaluasi: CodeBERT (microsoft/codebert-base), RoBERTa (roberta-base), dan GraphCodeBERT (microsoft/graphcodebert-base). Dataset terdiri dari 60.000 kontrak ERC-20 yang diambil dari repositori ASSERT-KTH/DISL, dengan 30.000 kontrak dilabeli secara semi-otomatis menggunakan analisis kode statis berbasis aturan (rule-based) untuk tujuh jenis scam: Honeypot, High Tax, Balance Manipulation, Blacklist, Hidden Owner, Rug Pull, dan Unlimited Mint. Pada klasifikasi biner, GraphCodeBERT mencapai performa terbaik dengan F1-Score 0,9295 dan AUC 0,9808. Pada klasifikasi multilabel, RoBERTa unggul pada F1-Score (0,8681) sementara GraphCodeBERT unggul pada AUC (0,9672). Label Blacklist menjadi tantangan tersendiri dengan F1-Score hanya 0,61–0,64 akibat ketidakseimbangan kelas yang ekstrem. Hasil penelitian membuktikan bahwa representasi kode sumber Solidity melalui model Transformer sudah cukup informatif untuk membedakan kontrak scam dari kontrak legitim secara otomatis.
Copyrights © 2026