Perusahaan keamanan BlockSec telah melakukan pengujian ulang standar penilaian audit kontrak pintar menggunakan AI bernama EVMBench, yang dikembangkan oleh OpenAI dan Paradigm. Hasilnya menunjukkan bahwa bot AI kurang efektif secara signifikan ketika menghadapi skenario eksploitasi nyata.

Tim peneliti telah memperluas lingkungan pengujian dengan lebih banyak konfigurasi model, sekaligus menambahkan insiden keamanan baru yang terjadi belakangan ini — data yang belum pernah muncul dalam data pelatihan model AI.

Meskipun AI belum mampu menggantikan para ahli keamanan, laporan menekankan bahwa kecerdasan mesin dapat berperan sebagai pelengkap alami dalam proses pemeriksaan kode manusia.

Hasil awal EVMBench mungkin terlalu optimistis

EVMBench sebelumnya menilai tugas keamanan kontrak pintar seperti deteksi, patch bug, dan eksploitasi kerentanan, dengan hasil yang dianggap sangat mengesankan. Menurut laporan, AI dapat mengeksploitasi 72% dan mendeteksi sekitar 45% kerentanan, berdasarkan 120 sampel yang dipilih dari audit Code4rena.

Namun, BlockSec berpendapat bahwa kondisi pengujian awal mungkin telah menyebabkan hasil yang menyesatkan. Co-founder Yajin Zhou mengatakan bahwa ketika timnya mengulang pengujian dengan lebih banyak konfigurasi dan 22 insiden serangan nyata, tingkat keberhasilan eksploitasi AI adalah 0%.

Memperluas konfigurasi dan menghilangkan “kontaminasi data”

Penelitian ini meningkatkan jumlah konfigurasi model dari 14 menjadi 26 dengan menggabungkan bot secara fleksibel dengan berbagai “scaffold”, bukan hanya terbatas dalam ekosistem masing-masing penyedia. Menurut tim peneliti, pendekatan lama membuat sulit membedakan performa yang berasal dari kemampuan model atau keunggulan arsitektur.

Selain itu, BlockSec juga meragukan fenomena “kontaminasi data”, ketika EVMBench menggunakan kerentanan yang sudah dipublikasikan sebelumnya — yang berpotensi sudah termasuk dalam data pelatihan AI. Untuk mengatasi hal ini, tim melakukan pengujian terhadap 22 insiden keamanan yang terjadi setelah Februari 2026, di luar “jendela pengetahuan” model.

AI sepenuhnya gagal dalam eksploitasi nyata

Hasil yang paling mencolok: dari 110 pasangan pengujian antara agen dan insiden (5 agen dari 22 situasi), tidak ada satu pun kasus eksploitasi lengkap yang berhasil. Ini menunjukkan bahwa bahkan AI paling canggih saat ini masih sangat jauh dari mampu melakukan serangan nyata.

Namun, dalam hal deteksi kerentanan, hasilnya cukup positif. Model Claude Opus 4.6 mencapai performa terbaik dengan mendeteksi 13 dari 20 kerentanan yang terjadi secara nyata.

Kerentanan yang umum dan familiar biasanya mudah dideteksi AI, tetapi kasus yang lebih kompleks hampir selalu terlewatkan sepenuhnya.

Masa depan adalah kolaborasi antara AI dan manusia

Penelitian menyimpulkan bahwa AI belum mampu menggantikan manusia dalam audit keamanan, dan pertanyaan yang lebih penting adalah bagaimana kedua pihak dapat bekerja sama secara efektif.

AI memiliki keunggulan dalam cakupan luas dan kemampuan untuk memindai sistem secara besar-besaran, sementara manusia unggul dalam analisis mendalam, pemahaman protokol, dan penalaran kontra-argumentasi. Kedua faktor ini saling melengkapi.

Menurut BlockSec, pendekatan yang tepat bukanlah menggantikan manusia dengan AI, melainkan membangun model kolaborasi antara keduanya untuk mencapai efektivitas audit yang lebih menyeluruh.

Thach Sanh

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Stablecoin Muncul sebagai Infrastruktur Keuangan Inti, Tren Lokalisasi Mempercepat: Laporan a16z

Laporan Industri

Pesan Berita Gate, 26 April — Menurut laporan dari peneliti kripto a16z Robert Hackett dan Jeremy Zhang, stablecoin berkembang dari instrumen perdagangan dan kendaraan penyimpanan tahap awal menjadi infrastruktur keuangan inti. UU GENIUS AS telah

GateNews23menit yang lalu

79% ATM Kripto Global Berlokasi di Amerika Serikat

Laporan Industri

Pesan Berita Gate, 25 April — Menurut Cointelegraph, 79% ATM kripto di seluruh dunia berlokasi di Amerika Serikat.

GateNews8jam yang lalu

Laporan Tren ETF JPMorgan: APIisasi, aktif sebesar 83%, tokenisasi terbagi menjadi dua jalur: sintetis dan native

Perkembangan Proyek Kemitraan & Ekosistem Laporan Industri Saham

Laporan JPMorgan Chase menunjukkan tiga tren utama: 1) perdagangan otomatis API dari AP menyumbang sekitar 50% arus masuk pasar level satu; 2) pada tahun 2025, ETF aktif menyumbang 83% dari penerbitan baru, diperkirakan menjadi arus utama pada 2026–27; 3) tokenisasi terbagi menjadi jalur sintetis (mencerminkan harga melalui derivatif) dan jalur asli (penerbitan melalui blockchain). Laporan tersebut menekankan peningkatan transparansi dan tata kelola dengan alat seperti Athena, serta mengamati tindak lanjut berikutnya dan jadwal pengkomersialan resmi.

ChainNewsAbmedia11jam yang lalu

Laporan a16z: Stablecoin Mencapai $4,5T dalam Transaksi Kuartal 1, Beralih ke Pembayaran Lokal

Laporan Industri

Pesan Gate News, 25 April — Menurut laporan a16z terbaru, stablecoin telah berevolusi dari alat penyelesaian kripto menjadi infrastruktur keuangan global, dengan adopsi yang makin cepat di seluruh Asia, Brasil, dan pasar negara berkembang lainnya. Pergeseran fokus telah bergeser dari pembayaran lintas-batas ke pembayaran lokal saat kepastian regulasi dan peningkatan kinerja blockchain memungkinkan integrasi yang lebih luas di dunia nyata sebagai

GateNews17jam yang lalu

Penyelamatan kerentanan Kelp DAO: Mantle meminjam-kembali Aave 3万 ETH, aliansi DeFi berkomitmen lebih dari 43.500 ETH

ethereum news Perkembangan Proyek Kemitraan & Ekosistem Laporan Industri

Jembatan lintas rantai Kelp DAO diserang, DeFi United mengumpulkan Aave dan protokol lain yang berkomitmen untuk menggunakan 43,500 ETH (sekitar 1,01 miliar dolar AS) guna melakukan penanganan piutang bermasalah. Mantle mengajukan MIP-34, dengan pinjaman maksimal 30,000 ETH kepada Aave DAO, serta memberikan 130,000 hak suara AAVE; Stani Kulechov secara pribadi menyuntik 5,000 ETH, dan Lido serta lainnya juga ikut menyetor. Langkah ini dipandang sebagai eksperimen “pinjaman untuk ditukar dengan hak tata kelola” di tengah krisis, yang masih menunggu pemungutan suara.

ChainNewsAbmedia04-24 15:28

Morgan Stanley meluncurkan dana cadangan stablecoin kepatuhan untuk GENIUS Act pertama MSNXX: biaya tahunan 0,15%, ambang batas 10 juta dolar AS

Acara Token Kemitraan & Ekosistem Laporan Industri

Morgan Stanley Investment Management Hari ini mengaktifkan dana cadangan stablecoin MSNXX, untuk menyediakan manajemen aset bagi penerbit stablecoin, dengan aset yang diinvestasikan pada kas, Surat Utang Pemerintah AS 93 hari, dan reverse repo overnight, NAV tetap 1,00 dolar AS, biaya tahunan 0,15%, ambang minimum 10 juta dolar AS. Dana ini memenuhi persyaratan GENIUS Act, yang akan memasukkan dana stablecoin ke dalam sistem dana pasar uang pemerintah AS, menunjukkan bahwa infrastruktur dasar stablecoin sedang terhubung dengan keuangan tradisional.

ChainNewsAbmedia04-24 15:24

Komentar

0/400

Tidak ada komentar