Berdasarkan pemantauan 1M AI News, metode penagihan untuk paket Arrow Coding Plan dari Volcano Engine ditemukan oleh pengguna memiliki mekanisme tersembunyi yang tidak diungkapkan secara memadai. Seorang pengembang melaporkan di V2EX bahwa kecepatan konsumsi kuota jauh lebih cepat dibanding paket sejenis di platform lain; setelah menghubungi layanan pelanggan, ia mendapat balasan: “Jika Tokens yang dikonsumsi oleh satu kali pemanggilan model jauh lebih tinggi daripada konsumsi rata-rata pemanggilan, maka perkiraan jumlah pemanggilan yang dapat dilakukan dalam periode tersebut juga akan jauh lebih kecil dari 6.000 kali.”
Sebagai contoh paket Pro (200 yuan/bulan), kuota yang diklaim adalah 6.000 permintaan per 5 jam, 45.000 permintaan per minggu, dan 90.000 permintaan per bulan. Namun, pemotongan biaya nyatanya bukan setiap panggilan mengurangi sekali, melainkan dihitung berdasarkan token yang dikonsumsi dalam satu kali sehingga menjadi pengurangan untuk beberapa kali. Rumus konversi yang dihitung pengguna adalah usage = max(round(use_token/token_limit), 1). Pengali tersembunyi untuk model yang berbeda pun berbeda: DeepSeek-V3.2 sekitar 2 kali, Doubao-Seed-2.0-Code sekitar 4 kali, dan Doubao-Seed-2.0-Pro sekitar 6 kali. Artinya, satu kali pemanggilan menggunakan Doubao-Seed-2.0-Pro bisa dihitung sebagai konsumsi kuota sebanyak 6 kali.
Pengguna tersebut memberi contoh bahwa satu kali pemanggilan menghabiskan 510 ribu token; di platform lain seperti Alibaba Bailian hanya dihitung sekali, sementara di Volcano Engine bisa dikonversi menjadi sekitar 20 kali. Dalam AI programming Agent yang menjalankan tugas kompleks, konsumsi token puluhan atau bahkan ratusan ribu dalam satu kali pemanggilan adalah hal yang umum; skema penagihan seperti ini akan menyebabkan kuota paket cepat terkuras.
Paket Coding Plan di dalam negeri umumnya saat ini dihitung berdasarkan jumlah panggilan, sementara platform seperti Alibaba Bailian dan Xiaomi MiMo membebankan sekali untuk setiap panggilan dan tidak melakukan konversi berdasarkan token. Penagihan berlapis seperti “mengklaim berdasarkan jumlah, mengonversi berdasarkan token” dari Volcano Engine relatif jarang di industri ini, dan tidak dijelaskan secara mencolok di posisi utama halaman paket; pengguna baru mengetahui mekanisme tersebut setelah konsumsi yang tidak wajar terjadi dan kemudian menghubungi layanan pelanggan. Alat pemrograman AI Trae milik ByteDance baru-baru ini juga mendapat laporan dari pengguna bahwa mereka beralih dari penagihan murni berbasis per panggilan menjadi skema perhitungan jumlah berdasarkan konversi token yang serupa.