INTECOMS: Journal of Information Technology and Computer Science
Vol. 9 No. 2 (2026): INTECOMS: Journal of Information Technology and Computer Science

DAPATKAH MODEL TRANSFORMER MENDETEKSI TOKEN SCAM? SEBUAH STUDI PADA SMART CONTRACT ERC-20

Andhi Saputro (Universitas Pamulang)
Makhsun Makhsun (Universitas Pamulang)
Ahmad Musyafa (Universitas Pamulang)



Article Info

Publish Date
23 May 2026

Abstract

Pertumbuhan pesat ekosistem blockchain telah melahirkan ribuan token pada jaringan ERC-20. Fenomena ini mendorong inovasi finansial, namun sekaligus meningkatkan risiko penipuan melalui smart contract yang menyembunyikan mekanisme berbahaya seperti backdoor, blacklist bot, dan manipulasi fee. Penelitian ini mengusulkan pendekatan klasifikasi berbasis Transformer secara end-to-end untuk mendeteksi token scam ERC-20 menggunakan kode sumber Solidity sebagai satu-satunya fitur masukan. Tiga model dievaluasi: CodeBERT (microsoft/codebert-base), RoBERTa (roberta-base), dan GraphCodeBERT (microsoft/graphcodebert-base). Dataset terdiri dari 60.000 kontrak ERC-20 yang diambil dari repositori ASSERT-KTH/DISL, dengan 30.000 kontrak dilabeli secara semi-otomatis menggunakan analisis kode statis berbasis aturan (rule-based) untuk tujuh jenis scam: Honeypot, High Tax, Balance Manipulation, Blacklist, Hidden Owner, Rug Pull, dan Unlimited Mint. Pada klasifikasi biner, GraphCodeBERT mencapai performa terbaik dengan F1-Score 0,9295 dan AUC 0,9808. Pada klasifikasi multilabel, RoBERTa unggul pada F1-Score (0,8681) sementara GraphCodeBERT unggul pada AUC (0,9672). Label Blacklist menjadi tantangan tersendiri dengan F1-Score hanya 0,61–0,64 akibat ketidakseimbangan kelas yang ekstrem. Hasil penelitian membuktikan bahwa representasi kode sumber Solidity melalui model Transformer sudah cukup informatif untuk membedakan kontrak scam dari kontrak legitim secara otomatis.

Copyrights © 2026