За моніторингом 1M AI News, один розробник за допомогою Ghidra, MITM-проксі та radare2 здійснив реверсний інжиніринг 228MB бінарного файлу автономної інсталяції Claude Code і виявив два незалежні кеш-помилки (Bug), які можуть підвищувати API-вартість у 10–20 разів без відома користувача. Відповідний аналіз подано на GitHub (issue #40524); Anthropic позначила це як regression Bug та призначила для опрацювання.
Перший Bug існує в кастомному середовищі виконання Bun, яке використовується в автономній інсталяції. Кожного разу під час запиту до API середовище виконання шукає в тілі запиту ідентифікатор для виставлення рахунків і замінює його, але логіка заміни спрацьовує на першій знайденій відповідності в тілі запиту. Якщо історія розмови містить цей рядок (наприклад, під час обговорення внутрішнього механізму виставлення рахунків Claude Code), заміна буде здійснена не в системному підказі (system prompt), а в тексті повідомлення, що призводить до того, що під час кожного запиту запускається повне відновлення кешу. Тимчасовий обхідний шлях — перейти на запуск npx @anthropic-ai/claude-code; версія npm-пакета не містить цієї логіки заміни.
Другий Bug впливає на всіх користувачів, які відновлюють сесії за допомогою --resume або --continue, і був представлений починаючи з v2.1.69. Під час відновлення сесії позиція ін’єкції додаткової системної інформації відрізняється від тієї, що використовується під час створення нової сесії, через що префікс кешу повністю не збігається: весь історичний контекст розмови зчитується з кешу замість того, щоб знову бути переписаним повністю. Наступні раунди відновлення працюють нормально, але сама операція відновлення вже спричинила значні додаткові витрати, і наразі зовнішнього обхідного рішення немає.
Цей розробник оцінив, що для довгої розмови приблизно на 500000 token Bug 1 додатково споживає близько $0.04 за кожен запит, а Bug 2 — приблизно $0.15 за кожне відновлення; у поєднанні вартість одного запиту може перевищувати $0.20. Раніше інженер Anthropic Lydia Hallie підтвердила, що швидкість дотикання до ліміту використання користувачами «значно швидша, ніж очікувалося», а в коментарях на Reddit кілька користувачів вважають, що ці два кеш-Bug можуть бути однією з першопричин аномальних витрат через використання.