Menurut pemantauan 1M AI News, seorang pengembang telah melakukan reverse engineering terhadap file biner mandiri Claude Code berukuran 228MB melalui Ghidra, proxy MITM, dan radare2, dan menemukan dua bug cache yang terpisah yang dapat meningkatkan biaya API hingga 10-20 kali tanpa sepengetahuan pengguna. Analisis terkait telah diajukan ke GitHub (issue #40524), ditandai oleh Anthropic sebagai bug regresi dan ditugaskan untuk penanganan.
Bug pertama terdapat pada runtime Bun kustom yang digunakan oleh versi mandiri. Setiap kali ada permintaan API, runtime akan mencari pengenal penagihan di dalam body permintaan dan melakukan penggantian, tetapi logika pengganti yang terpicu adalah entri pertama yang cocok di dalam body permintaan. Jika riwayat percakapan secara kebetulan berisi string tersebut (misalnya membahas mekanisme penagihan internal Claude Code), penggantian akan mengenai konten pesan, bukan prompt sistem, sehingga setiap permintaan memicu rekonstruksi cache secara penuh. Metode mitigasi sementara adalah menggunakan npx @anthropic-ai/claude-code untuk menjalankan; versi paket npm tidak menyertakan logika penggantian ini.
Bug kedua memengaruhi semua pengguna yang menggunakan --resume atau --continue untuk memulihkan sesi, dan diperkenalkan sejak v2.1.69. Saat memulihkan sesi, posisi penyisipan informasi tambahan sistem berbeda dengan sesi yang baru dibuat, sehingga prefix cache sama sekali tidak cocok; seluruh riwayat percakapan yang panjang berubah dari dibaca dari cache menjadi ditulis ulang secara penuh. Ronde berikutnya pemulihan berjalan normal, tetapi operasi pemulihan itu sendiri telah menimbulkan banyak biaya tambahan; saat ini belum ada skema mitigasi dari pihak eksternal.
Pengembang tersebut memperkirakan bahwa, untuk percakapan panjang sekitar 500.000 token, Bug 1 menghabiskan biaya tambahan sekitar 0.04 dolar AS setiap permintaan, dan Bug 2 menghabiskan biaya tambahan sekitar 0.15 dolar AS setiap pemulihan; jika keduanya digabung, biaya per permintaan bisa melebihi 0.20 dolar AS. Sebelumnya, insinyur Anthropic Lydia Hallie telah mengonfirmasi bahwa kecepatan pemicu batas pemakaian pengguna «jauh lebih cepat dari yang diharapkan», dan di kolom komentar Reddit, beberapa pengguna berpendapat bahwa dua bug cache ini kemungkinan besar merupakan salah satu penyebab mendasar dari konsumsi yang tidak normal.