最近有没有发现,这半年のAI業界の画風がちょっと速すぎませんか?去年のこの時期、みんなは計算資源の値下げをめぐって狂喜していました。アリババクラウドが先頭を切って「最大下落幅60%」と叫び、テンセントクラウド、ファーウェイクラウド、百度クラウドも一斉に後に続きました。あの勢いは、まるで“双11(11.11)の大セール”そのもの。起業コミュニティでは毎日だれかが請求書を晒していました。「見て、私のこの100万Tokenでほんの数十銭しかかかってない!」当時は誰もが、AI起業の春が来た、計算資源が白菜みたいに安いのだから、誰でも大規模モデルのアプリが作れないはずがないと思っていたんです。でも、結果は?手ひどい“裏切り”が来るのが早すぎました。先月です。風向きが180度も一気に変わりました。Google、Amazon、Tencent、Alibaba、Baidu――10日以内に全員が値上げの告知を出しました。どれくらい値上げしたのか?一般的には30%から50%。いちばんきついのはテンセントクラウドで、あるコア製品が直接400%上がったんです。「ドサクサ大放出(投げ売り)」から「ロケット式の値上げ」へ――前後1年もかかっていません。いったい何が起きたのか?誰が裏で価格を押し上げているのか?そして、もっと重要なのは、この値上げラッシュの中で誰が一番つらくて、誰が内心ほくそ笑んでいるのか?去年は「大割引」をやっていたのに、今年なぜみんな一斉に値上げするのか?--------------------まずは、この“反転劇”を簡単に振り返りましょう。2025年4月、アリババクラウドが最初に大きな爆弾を投下しました。コア製品の最大値下げが60%。これは小手先の話ではなく、ガチの「半減してから割引」でした。続けて、JDクラウドが「どんどん下げていいよ、俺もやる」と言い、テンセントクラウド、ファーウェイクラウド、百度クラウドもすべて追随。一時期、計算資源市場では煙と塵が舞い、価格戦が“めちゃくちゃ”盛り上がったんです。当時のスローガンは何でしたか?「AIを使えるように」「計算資源の普及」。多くの起業会社は本当に信じて、Tokenを大々的に燃やし、モデルを回し始めました。しかし、無料の昼食は長くは続きません。2026年1月、Amazon AWSがこっそりとやったこと――発表会もなく、予告もなく、EC2サーバーの価格を直接15%前後引き上げました。下げ幅は大きくないように見えても、意味は重大です。クラウドサービス業界が近20年で初めて値上げしたことになるからです。そもそも過去20年で、AWSの値下げ回数は100回を超え、上がったことはなく、下がる一方だったのに。これで、まるでドミノ倒しを押し倒したように連鎖しました。3月11日、テンセントクラウドが追随。傘下のTencent HY2.0 Instructモデルの入力価格が、0.0008元/千tokensから0.004505元/千tokensへ――上昇幅463%、4倍以上。3月18日、アリババクラウドが計算資源カード製品の値上げを5%から34%と発表し、百度スマートクラウドもそれに続いて5%から30%引き上げました。以前は無料の公開テストだった大規模モデル――例えばGLM 5、MiniMax 2.5、Kimi 2.5――はすべて「無料で使える期間」を終え、正式な課金へ移行。「値下げで取り合う」から「値上げで取り合う」へ。なぜこれほど急に変わったのか?表面上は、クラウド事業者が耐えられなくなったからです。GPUチップはますます高くなり、データセンターの電力代は運営コストの40%から60%を占めます。さらに2025年後半にはストレージ用チップも値上げが始まり、コスト面の圧力が現実にじわじわ効いてきています。ただし、値上げを「やらざるを得ない」状態に変えたのは、別の、もっと根本的な理由――計算資源が、本当に足りなくなったことです。誰が狂ったようにTokenを“食べて”いるのか?140万億の真相---------------------前に計算資源は余っていると言っていませんでしたか?どうして突然足りなくなったんですか?答えはシンプルです。Tokenがあまりにも速く“食われて”いるからです。国家データ局局長の劉烈宏が今年3月に明かしたデータによれば、2026年3月時点で、中国の1日あたりのToken呼び出し量はすでに140万億を超えています。この数字はどれくらい突飛なのか?2つの基準を示します。・2024年初め、この数字は1000億。2年で1000倍以上に増えました。・2025年末、この数字は100万億。つまり、たった過去3か月でさらに40%増――この3か月で増えた量(40万億)だけで、2024年初めの年間全体の400倍です。これは直線的な成長ではなく、津波です。では問題です。誰が狂ったようにTokenを消費しているのか?答えは1つの言葉:スマートエージェント(Agent)。去年から、オープンソースのスマートエージェントOpenClaw(業界では「ロブスター」みたいな呼ばれ方)を代表にしたプロダクトが大ヒットしました。AIは「チャットだけ」のロボットから、「仕事をする」アシスタントへと変わりました――航空券の予約、コード作成、PPT作成、データ分析……かっこいいですよね?でも代償があるんです。エージェントが“単純な一仕事”をするだけで消費するToken量は、普通の会話の10倍から100倍。例を挙げます。AIにクローラースクリプトを書かせるとします。普通の対話なら、コードの一部を渡して終わり。あなたがコピペして使い、数百Tokenで済みます。ですが、エージェントなら、コードを自分で動かし、エラーを出し、デバッグし、また動かす――を行ったり来たり何度も繰り返します。往復十数回、Token消費は一気に数万へ跳ね上がります。さらに、動画生成のような“グルメ(トークン食い)モンスター”は別格です。分析によると、1分の動画生成には約10万億Tokenが必要だとか。しかも今の動画モデルは、5秒の動画を作るのに数十銭から数元しか請求しません。これは儲けるためではなく、明らかに赤字で宣伝しているようなものです。でも、使う人が多いので止まりません。動画、音楽、コード、データ分析……どの方向でも、みんなが狂ったようにTokenを“食べて”いる。供給が需要についていけず、計算資源の価格が上がるのは当然のこと。陰謀ではありません。むき出しの需給バランスの不均衡です。計算資源の実力別ランキング:大企業は肉を食い、小プレイヤーはスープすら飲めない--------------------この値上げは、立場によって意味がまったく違います。クラウド事業者にとっては、値上げは実は良いことです。証券会社が計算したところによると、アリババクラウドが1%値上げするごとに利益率が1ポイント上がります。だから、見えているデータでは、アリババクラウドのシェアは下がるどころか上がっていて、中国のAIクラウド市場の36%を占めています。そしてAIの呼び出し量という、もっと細かい競争軸では、火山エンジン(ByteDance傘下)がなんと約50%。つまり中国のToken呼び出しの半分が火山エンジンの配管を通っている、ということです。一方で、ファーウェイクラウドとテンセントクラウドのシェアは小幅に下落しています。トップ効果がますますはっきりしてきました。大企業ほど強くなり、資源はより一極集中していく。じゃあ一番つらいのは誰?中小のAI起業会社、そして参入したばかりの小さなプレイヤーたちです。理由は簡単です。値上げが、彼らの運営コストを直撃するから。Tokenが安いころは、気軽に実験でき、気軽にモデルを調整しても、数えるほどのお金で済みました。今は価格が数倍、場合によっては十数倍。トレーニングのたび、推論のたびに、金額を計算して慎重に扱わざるを得ません。さらに厄介なのは、小プレイヤーに値引き交渉の力がないことです。大口顧客はクラウド事業者と長期契約を結び、相対的に有利な価格をロックできます。あなたは新興企業で、年間の計算資源費が数万元程度。誰があなたと割引交渉をしてくれるでしょう?結局、値上げ後の価格を大人しく払うしかない。元々AIアプリを作ろうと思っていたプロジェクトも、採算を計算したあと、黙って棚上げしたものがあります。すでに動かしているものの中には、規模を縮小するか、赤字を抱えたまま自力で踏ん張るしかないものもあります。しかし、終端市場の競争は熾烈です。ユーザーに簡単に値上げできません。隣の会社は無料だというのに、課金を始めたらユーザーは一斉に逃げていきます。結局、コスト圓の圧力はすべて自分で飲み込むしかない。ある業界関係者が私に愚痴っていました。「以前は計算資源が安くて、起業のハードルが低いと思っていた。今わかったのは、ハードルが低くなったんじゃない。先に入れさせてから、ドアを閉めるだけだってことだよ。」これは実は、残酷なランキング戦です。過去20年、クラウド事業者は「低価格で量を取り、先に囲い込み、あとで儲ける」という戦い方でかなり上手く生きてきました。でもその時代は終わりました。計算資源は補助金の時期を正式に卒業し、商業的な価格設定のフェーズに入りました。今後は、誰がより安いかではなく、誰のサービスがより安定しているか、誰のエコシステムがより整っているか、誰が企業が持つ“すべての計算資源”を本当に使いこなせるよう手助けできるかで勝負します。そして、このランキング戦では、小プレイヤーが脱落する可能性が高い。この1年あまりのジェットコースターを振り返ると、胸に刺さる真実が見えてきます。計算資源は「白菜価格」から「ロケット価格」へ。根本的には、AI業界が野放図に育っていく段階から成熟へ向かう、一つの縮図です。無料の時代が終わり、価値競争が始まりました。補助金で生きていたビジネスモデルは死にます。技術があり、シーンがあり、ユーザーがいるプロダクトは、計算コストが上がる環境の中でも生き残り、場合によってはもっと良く生きられます。AI起業のコア競争力は、そもそも計算資源がどれだけ安いかではありません。あなたが計算資源を使って何をするのかです。計算資源の時代では、Tokenは確かに高くなりました。ですがTokenより高いのは、「Tokenをうまく使う方法を知っている」頭です。
トークンが「金を飲み込む獣」になり、大手企業の計算能力が狂ったように増加している
最近有没有发现,这半年のAI業界の画風がちょっと速すぎませんか?
去年のこの時期、みんなは計算資源の値下げをめぐって狂喜していました。アリババクラウドが先頭を切って「最大下落幅60%」と叫び、テンセントクラウド、ファーウェイクラウド、百度クラウドも一斉に後に続きました。あの勢いは、まるで“双11(11.11)の大セール”そのもの。起業コミュニティでは毎日だれかが請求書を晒していました。「見て、私のこの100万Tokenでほんの数十銭しかかかってない!」当時は誰もが、AI起業の春が来た、計算資源が白菜みたいに安いのだから、誰でも大規模モデルのアプリが作れないはずがないと思っていたんです。
でも、結果は?手ひどい“裏切り”が来るのが早すぎました。
先月です。風向きが180度も一気に変わりました。Google、Amazon、Tencent、Alibaba、Baidu――10日以内に全員が値上げの告知を出しました。どれくらい値上げしたのか?一般的には30%から50%。いちばんきついのはテンセントクラウドで、あるコア製品が直接400%上がったんです。
「ドサクサ大放出(投げ売り)」から「ロケット式の値上げ」へ――前後1年もかかっていません。いったい何が起きたのか?誰が裏で価格を押し上げているのか?そして、もっと重要なのは、この値上げラッシュの中で誰が一番つらくて、誰が内心ほくそ笑んでいるのか?
去年は「大割引」をやっていたのに、今年なぜみんな一斉に値上げするのか?
まずは、この“反転劇”を簡単に振り返りましょう。
2025年4月、アリババクラウドが最初に大きな爆弾を投下しました。コア製品の最大値下げが60%。これは小手先の話ではなく、ガチの「半減してから割引」でした。続けて、JDクラウドが「どんどん下げていいよ、俺もやる」と言い、テンセントクラウド、ファーウェイクラウド、百度クラウドもすべて追随。一時期、計算資源市場では煙と塵が舞い、価格戦が“めちゃくちゃ”盛り上がったんです。
当時のスローガンは何でしたか?「AIを使えるように」「計算資源の普及」。多くの起業会社は本当に信じて、Tokenを大々的に燃やし、モデルを回し始めました。
しかし、無料の昼食は長くは続きません。
2026年1月、Amazon AWSがこっそりとやったこと――発表会もなく、予告もなく、EC2サーバーの価格を直接15%前後引き上げました。下げ幅は大きくないように見えても、意味は重大です。クラウドサービス業界が近20年で初めて値上げしたことになるからです。そもそも過去20年で、AWSの値下げ回数は100回を超え、上がったことはなく、下がる一方だったのに。
これで、まるでドミノ倒しを押し倒したように連鎖しました。
3月11日、テンセントクラウドが追随。傘下のTencent HY2.0 Instructモデルの入力価格が、0.0008元/千tokensから0.004505元/千tokensへ――上昇幅463%、4倍以上。3月18日、アリババクラウドが計算資源カード製品の値上げを5%から34%と発表し、百度スマートクラウドもそれに続いて5%から30%引き上げました。以前は無料の公開テストだった大規模モデル――例えばGLM 5、MiniMax 2.5、Kimi 2.5――はすべて「無料で使える期間」を終え、正式な課金へ移行。
「値下げで取り合う」から「値上げで取り合う」へ。なぜこれほど急に変わったのか?
表面上は、クラウド事業者が耐えられなくなったからです。GPUチップはますます高くなり、データセンターの電力代は運営コストの40%から60%を占めます。さらに2025年後半にはストレージ用チップも値上げが始まり、コスト面の圧力が現実にじわじわ効いてきています。ただし、値上げを「やらざるを得ない」状態に変えたのは、別の、もっと根本的な理由――計算資源が、本当に足りなくなったことです。
誰が狂ったようにTokenを“食べて”いるのか?140万億の真相
前に計算資源は余っていると言っていませんでしたか?どうして突然足りなくなったんですか?
答えはシンプルです。Tokenがあまりにも速く“食われて”いるからです。
国家データ局局長の劉烈宏が今年3月に明かしたデータによれば、2026年3月時点で、中国の1日あたりのToken呼び出し量はすでに140万億を超えています。
この数字はどれくらい突飛なのか?2つの基準を示します。
・2024年初め、この数字は1000億。2年で1000倍以上に増えました。
・2025年末、この数字は100万億。つまり、たった過去3か月でさらに40%増――この3か月で増えた量(40万億)だけで、2024年初めの年間全体の400倍です。
これは直線的な成長ではなく、津波です。
では問題です。誰が狂ったようにTokenを消費しているのか?
答えは1つの言葉:スマートエージェント(Agent)。
去年から、オープンソースのスマートエージェントOpenClaw(業界では「ロブスター」みたいな呼ばれ方)を代表にしたプロダクトが大ヒットしました。AIは「チャットだけ」のロボットから、「仕事をする」アシスタントへと変わりました――航空券の予約、コード作成、PPT作成、データ分析……かっこいいですよね?でも代償があるんです。エージェントが“単純な一仕事”をするだけで消費するToken量は、普通の会話の10倍から100倍。
例を挙げます。AIにクローラースクリプトを書かせるとします。普通の対話なら、コードの一部を渡して終わり。あなたがコピペして使い、数百Tokenで済みます。ですが、エージェントなら、コードを自分で動かし、エラーを出し、デバッグし、また動かす――を行ったり来たり何度も繰り返します。往復十数回、Token消費は一気に数万へ跳ね上がります。
さらに、動画生成のような“グルメ(トークン食い)モンスター”は別格です。分析によると、1分の動画生成には約10万億Tokenが必要だとか。しかも今の動画モデルは、5秒の動画を作るのに数十銭から数元しか請求しません。これは儲けるためではなく、明らかに赤字で宣伝しているようなものです。でも、使う人が多いので止まりません。動画、音楽、コード、データ分析……どの方向でも、みんなが狂ったようにTokenを“食べて”いる。
供給が需要についていけず、計算資源の価格が上がるのは当然のこと。陰謀ではありません。むき出しの需給バランスの不均衡です。
計算資源の実力別ランキング:大企業は肉を食い、小プレイヤーはスープすら飲めない
この値上げは、立場によって意味がまったく違います。
クラウド事業者にとっては、値上げは実は良いことです。証券会社が計算したところによると、アリババクラウドが1%値上げするごとに利益率が1ポイント上がります。だから、見えているデータでは、アリババクラウドのシェアは下がるどころか上がっていて、中国のAIクラウド市場の36%を占めています。そしてAIの呼び出し量という、もっと細かい競争軸では、火山エンジン(ByteDance傘下)がなんと約50%。つまり中国のToken呼び出しの半分が火山エンジンの配管を通っている、ということです。
一方で、ファーウェイクラウドとテンセントクラウドのシェアは小幅に下落しています。トップ効果がますますはっきりしてきました。大企業ほど強くなり、資源はより一極集中していく。
じゃあ一番つらいのは誰?
中小のAI起業会社、そして参入したばかりの小さなプレイヤーたちです。
理由は簡単です。値上げが、彼らの運営コストを直撃するから。Tokenが安いころは、気軽に実験でき、気軽にモデルを調整しても、数えるほどのお金で済みました。今は価格が数倍、場合によっては十数倍。トレーニングのたび、推論のたびに、金額を計算して慎重に扱わざるを得ません。
さらに厄介なのは、小プレイヤーに値引き交渉の力がないことです。大口顧客はクラウド事業者と長期契約を結び、相対的に有利な価格をロックできます。あなたは新興企業で、年間の計算資源費が数万元程度。誰があなたと割引交渉をしてくれるでしょう?結局、値上げ後の価格を大人しく払うしかない。
元々AIアプリを作ろうと思っていたプロジェクトも、採算を計算したあと、黙って棚上げしたものがあります。すでに動かしているものの中には、規模を縮小するか、赤字を抱えたまま自力で踏ん張るしかないものもあります。しかし、終端市場の競争は熾烈です。ユーザーに簡単に値上げできません。隣の会社は無料だというのに、課金を始めたらユーザーは一斉に逃げていきます。結局、コスト圓の圧力はすべて自分で飲み込むしかない。
ある業界関係者が私に愚痴っていました。「以前は計算資源が安くて、起業のハードルが低いと思っていた。今わかったのは、ハードルが低くなったんじゃない。先に入れさせてから、ドアを閉めるだけだってことだよ。」
これは実は、残酷なランキング戦です。過去20年、クラウド事業者は「低価格で量を取り、先に囲い込み、あとで儲ける」という戦い方でかなり上手く生きてきました。でもその時代は終わりました。計算資源は補助金の時期を正式に卒業し、商業的な価格設定のフェーズに入りました。今後は、誰がより安いかではなく、誰のサービスがより安定しているか、誰のエコシステムがより整っているか、誰が企業が持つ“すべての計算資源”を本当に使いこなせるよう手助けできるかで勝負します。
そして、このランキング戦では、小プレイヤーが脱落する可能性が高い。
この1年あまりのジェットコースターを振り返ると、胸に刺さる真実が見えてきます。
計算資源は「白菜価格」から「ロケット価格」へ。根本的には、AI業界が野放図に育っていく段階から成熟へ向かう、一つの縮図です。無料の時代が終わり、価値競争が始まりました。補助金で生きていたビジネスモデルは死にます。技術があり、シーンがあり、ユーザーがいるプロダクトは、計算コストが上がる環境の中でも生き残り、場合によってはもっと良く生きられます。
AI起業のコア競争力は、そもそも計算資源がどれだけ安いかではありません。あなたが計算資源を使って何をするのかです。
計算資源の時代では、Tokenは確かに高くなりました。ですがTokenより高いのは、「Tokenをうまく使う方法を知っている」頭です。