魔法の箱を開けるのが怖い?Anthropicの史上最強モデルは完全に公開できずにいる

BlockBeatNews

OpenBSD のコードベースには、27 年も隠れていた脆弱性があります。FFmpeg には 16 年も隠れていた脆弱性があり、そのコードは見つかるまでに 500 万回以上呼び出されていました。これらを掘り起こしたのは、どの脆弱性賞金プラットフォームのトップ研究者でもなく、Google Project Zero でもありません。Anthropic の、まだ外部に公開されていないモデルで、コードネームは Claude Mythos Preview です。

4 月 7 日、Anthropic は Project Glasswing を発表しました。やること自体はとても単純で、Mythos Preview をホワイトリストに送るだけです。リストには AWS、Apple、Google、Microsoft、NVIDIA、ブロードコム、Cisco、CrowdStrike、JPMorgan Chase、Linux 基金会、Palo Alto Networks が含まれ、さらに重要な基盤を担う約 40 の機関が加わります。リスト外の人には渡せません。Anthropic は、このモデルを短期的に公開リリースする計画はないと明確に述べています。

これは最前線の実験室が初めて、自分の最強のものを主導的にロックしたことです。

過去 2 年、公開のペースはほぼ条件反射でした。GPT、Gemini、Claude の世代をまたぐたびに、「リリース、観察、パッチ当て」。Anthropic 自身の「責任ある拡張ポリシー」(RSP)も、本質的には約束の枠組みです。能力のある閾値に達したら、それに応じたレベルの緩和策を講じ、そのうえで出し続ける。Glasswing は、この枠組みの次のステップではなく、最初の例外です。すでに Anthropic 自身が「本来の手順どおりには公開に適さない」と判断したモデルが、単独で切り出され、守る側にだけ提供されます。

Mythos Preview は何を達成したのでしょうか。公式の説明は「数千のゼロデイ脆弱性で、すべての主流のオペレーティングシステムと、すべての主流のブラウザをカバー」です。数字以上に問題を示すのは、能力の幅です。Claude 4.6 Opus は、自律的な脆弱性開発のようなタスクでの成功率がほぼゼロです。つまり、6 か月前に Anthropic 自身が最強の公開モデルとして出していたものでも、まだこのことは完全にはできなかったということです。Mythos は、互いに無関係な複数の脆弱性を 1 本の完全な攻撃チェーンにつなげられます。4 段階のブラウザ活用(エクスプロイト)についても、すでに証明済みの例があります。「ほぼゼロ」から「4 脆弱性チェーン」へは、単なる世代更新による前進ではなく、跳躍です。

防衛側も、すでにその感触をつかんでいます。Linux カーネルの Greg Kroah-Hartman と curl の作者 Daniel Stenberg は最近、同じことを公に語っています。過去 1 年で、AI が生成したセキュリティレポートは「迷惑メール級」から「本物で、高品質で、見ないわけにいかなくなった」ものへと変わりました。オープンソースのプロジェクトが受け取るレポート数は増えており、品質も上がっているのに、メンテナーの人的リソースは増えていません。これは、防御側がずっと耐えてきた苦しみです。Anthropic の動きは、このことを曖昧な不安から表舞台に引き上げただけだと言えます。

白リストそのものを一度見ておく価値があります。三大クラウド(AWS、Google、Microsoft)、三社のハードウェア(Apple、NVIDIA、ブロードコム)、二つのネットワーク機器ベンダー(Cisco、Palo Alto Networks)、一つのエンドポイントセキュリティ企業(CrowdStrike)、一つのオープンソースのインフラ(Linux 基金会)、そして一つの銀行。リストに銀行は 1 社だけで、それが JPMorgan Chase です。

これは偶然の名目配分ではありません。Anthropic が描いているのは「守れなければ天が落ちる」ような地図です。世界の大半のコードはこれらの会社のスタック上で動き、世界の大半の資金はそのうちの一社の口座を通って回っています。ホワイトリストのロジックは「誰が最も必要か」ではなく、「誰が倒れたときに最初にみんなを巻き込むか」です。リスト外の Anthropic は、さらにオープンソースのセキュリティ組織に 400 万ドルを別途拠出しています。お金は人力で、モデルは能力。合わせると一言で「メンテナーに数か月分」です。

Anthropic 自身の言い回しは、リストよりもさらに直接的です。同社は声明の中で「AI の発展速度を考えると、この種の能力は、長期的に安全なデプロイに取り組む参加者たちの手の中に留まることはない」と書いています。直後の一文は「グローバルなネットワーク基盤を防御するには、数年かかる可能性がある」です。

この 2 つの言葉を並べて見ましょう。Anthropic は、モデルが流出したり複製されたりする時間枠は短い一方で、守る側が脆弱性をきれいにパッチし切る時間枠は長いと判断しています。Glasswing の意味のすべては、この 2 つの時間差の間にあります。統制された先手を、数か月から 1 年のパッチ猶予と交換するのです。

この件には、ワシントン(米政府)という側面もあります。Anthropic は、Mythos Preview の能力についてアメリカ政府と継続的に協議している一方で、それと並行して米国防総省とは、軍用 AI の使用範囲をめぐる未解決の争いがあります。ある会社は一方で、特定の軍事用途へのモデル利用を拒否しながら、他方で自らこのモデルを Linux 基金会と Apple のセキュリティチームに送っています。これら 2 つは矛盾しません。同じ判断の表裏です。Anthropic は「このモデルで何ができるか」を定義し、定義権をユーザーに委ねるのではありません。

Glasswing でいちばん異例なのは、それが何をしたかではなく、いつそれをやったかです。これまで、AI 企業が自分の力を示す方法は「公開」でした。今、Anthropic は「不公開」をもって証明することを選びました。最前線の実験室が自分の最強の製品を主導的にロックし、さらにそれが商業上の理由でも、アラインメントが未完了だからでも、規制要件だからでもないと言うのです。理由はそれ自体で計算した結果、公開のタイムテーブルでは修復のタイムテーブルに追いつけないからだ、と。

これから数か月に見るべきなのは、Mythos Preview 自体ではありません。ホワイトリストに載っている 50 ほどの機関で、それが動いた結果として出てきた脆弱性がどれだけ埋められるかです。さらにその次に見るのは、他の最前線の実験室がそれに続くかどうかです。もし続くなら、「公開、反復、公開」をリズムにする業界で、初めて「ロックしてから考える」という動きが出てくるでしょう。もし続かないなら、Anthropic が門の前に立つ側になります。手には鍵を握り、時計を見つめているのです。

律動 BlockBeats の募集職種をクリックして確認

律動 BlockBeats 公式コミュニティに参加を歓迎します:

Telegram 登録グループ:https://t.me/theblockbeats

Telegram 交流グループ:https://t.me/BlockBeats_App

Twitter 公式アカウント:https://twitter.com/BlockBeatsAsia

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし