Peureux d'ouvrir la boîte à secrets ? Le modèle le plus puissant d'Anthropic n'ose même pas être rendu public

BlockBeatNews

Un exploit caché depuis 27 ans existe dans la base de code d’OpenBSD. Un autre, caché depuis 16 ans, existe dans FFmpeg ; cette portion de code a été appelée plus de 5M de fois avant d’être découverte. Extraire ces deux éléments — ce n’est ni un chercheur de premier plan d’une quelconque plateforme de primes aux vulnérabilités, ni Google Project Zero. C’est un modèle encore non publié d’Anthropic, codé Claude Mythos Preview.

Le 7 avril, Anthropic a annoncé Project Glasswing. La démarche elle-même est très simple : envoyer Mythos Preview à une liste blanche. Sur la liste figurent AWS, Apple, Google, Microsoft, Nvidia, Broadcom, Cisco, CrowdStrike, JPMorgan Chase, la Linux Foundation, Palo Alto Networks, ainsi qu’environ 40 autres organisations responsables d’infrastructures critiques. Les personnes en dehors de la liste n’y ont pas accès. Anthropic a dit clairement qu’à court terme, elle ne prévoit pas de publier ce modèle au public.

C’est la première fois qu’un laboratoire d’avant-garde verrouille volontairement ce qu’il a de plus puissant.

Au cours des deux dernières années, le rythme de publication a été presque un réflexe conditionné. Chaque changement de génération de GPT, Gemini et Claude, c’est « publier, observer, corriger ». La propre « politique d’extension responsable » (RSP) d’Anthropic est, dans l’essence, aussi un cadre d’engagement : atteindre un certain seuil de capacités, puis appliquer les mesures d’atténuation du niveau correspondant, et continuer à publier. Glasswing n’est pas l’étape suivante de ce cadre ; c’est la première exception à ce cadre. Un modèle qu’Anthropic a déjà jugé « ne pas convenir à une publication selon le processus initial » a été extrait à part et n’a été donné qu’aux défenseurs.

Que fait Mythos Preview. La version officielle affirme « des milliers de vulnérabilités zero-day, couvrant chaque système d’exploitation grand public et chaque navigateur grand public ». Ce qui explique davantage que les chiffres, c’est l’ampleur des capacités. Le taux de réussite de Claude 4.6 Opus sur des tâches comme le développement autonome de vulnérabilités est proche de zéro ; autrement dit, il y a six mois, le modèle public le plus fort d’Anthropic ne pouvait pas encore faire cette chose-là. Mythos peut chaîner plusieurs vulnérabilités sans lien les unes avec les autres pour former une chaîne d’attaque complète ; l’exploitation en quatre étapes du navigateur est déjà un exemple éprouvé. De « presque zéro » à « chaîne de quatre vulnérabilités », ce n’est pas une progression par génération, c’est un saut.

Côté maintenance, on l’a déjà ressenti. Greg Kroah-Hartman du noyau Linux et Daniel Stenberg, l’auteur de curl, ont tous deux dit publiquement la même chose récemment : au cours de la dernière année, les rapports de sécurité générés par l’IA sont passés du « niveau spam » à du « réel, de haute qualité, qu’on ne peut pas ignorer ». Le nombre de rapports reçus par les projets open source augmente, et la qualité augmente aussi, tandis que les effectifs des mainteneurs ne changent pas. C’est la souffrance que la défense a déjà endurée depuis longtemps. L’action d’Anthropic ne fait que transformer cette réalité de l’inquiétude diffuse en quelque chose de visible.

Cela vaut la peine de regarder la liste blanche elle-même. Trois grands clouds (AWS, Google, Microsoft), trois fabricants de matériel (Apple, Nvidia, Broadcom), deux fabricants d’équipements réseau (Cisco, Palo Alto Networks), une société de sécurité pour endpoints (CrowdStrike), une infrastructure open source (Linux Foundation), et une banque. Sur la liste, il n’y a qu’une seule banque : JPMorgan Chase.

Ce n’est pas un partage aléatoire des places. Anthropic trace une carte du type « s’ils ne tiennent pas, tout s’effondre ». La majeure partie du code mondial s’exécute sur la pile de ces entreprises, et la majeure partie de l’argent mondial transite par les comptes d’une seule d’entre elles. La logique de la liste blanche n’est pas « qui en a le plus besoin », c’est « qui, en tombant le premier, fera basculer tout le monde ». En dehors de la liste, Anthropic alloue aussi 4 millions de dollars à des organisations de sécurité open source. L’argent finance des ressources humaines, le modèle finance des capacités ; réunis, cela se résume à une phrase : donner aux mainteneurs quelques mois.

Les mots d’Anthropic sont encore plus directs que la liste. Dans son communiqué, l’entreprise écrit : « Compte tenu de la vitesse du développement de l’IA, ces capacités ne resteront pas longtemps entre les mains des participants qui œuvrent à déployer la sécurité ». Juste après : « Pour défendre les infrastructures réseau mondiales, il pourrait falloir plusieurs années ».

Mettez ces deux phrases ensemble. Anthropic estime que la fenêtre de temps durant laquelle le modèle peut s’écouler ou être recopié est courte, tandis que la fenêtre de temps dont dispose la partie défensive pour corriger les vulnérabilités est longue. Toute la signification de Glasswing se trouve entre ces deux écarts de temps. Avec une prise d’avance contrôlée, on obtient une fenêtre de correctifs de quelques mois à un an.

Il y a aussi une dimension « Washington ». Anthropic mène en parallèle une communication continue avec le gouvernement américain au sujet des capacités de Mythos Preview, et, en même temps, elle a un différend non résolu avec le ministère américain de la Défense au sujet du champ d’utilisation de l’IA militaire. D’un côté, une entreprise refuse d’utiliser le modèle à certains usages militaires ; de l’autre, elle envoie volontairement ce modèle aux équipes de sécurité de la Linux Foundation et d’Apple. Ces deux éléments ne sont pas contradictoires : ce sont deux faces du même jugement. Anthropic définit « à quoi ce modèle peut servir », plutôt que de laisser ce pouvoir de définition aux utilisateurs.

Le plus anormal avec Glasswing, ce n’est pas ce qu’elle fait, c’est le moment où elle le fait. Par le passé, la manière dont les entreprises d’IA prouvaient leur valeur, c’était en publiant. Maintenant, Anthropic choisit d’utiliser « ne pas publier » pour prouver. Un laboratoire d’avant-garde verrouille volontairement son produit le plus puissant, et affirme que ce n’est pas pour des raisons commerciales, pas parce que l’alignement n’est pas terminé, pas à cause d’exigences réglementaires, mais parce qu’elle a elle-même calculé : le calendrier d’ouverture ne rattrape pas le calendrier de correction.

Dans les prochains mois, ce qu’il faut regarder, ce n’est pas Mythos Preview lui-même, mais combien des vulnérabilités qui auront été découvertes en le faisant tourner sur les quelque 50 institutions de la liste blanche seront corrigées. Ensuite, ce qu’il faudra regarder, c’est si d’autres laboratoires d’avant-garde feront de même. S’ils le font, une industrie régie par « ouvrir, itérer, ouvrir » verra apparaître pour la première fois un geste « verrouiller d’abord ». Sinon, Anthropic sera la personne qui reste debout à la porte. Clé en main, à regarder l’horloge.

Cliquez pour découvrir LiDun BlockBeats recrute des postes

Bienvenue dans la communauté officielle de LiDun BlockBeats :

Groupe d’abonnement Telegram : https://t.me/theblockbeats

Groupe Telegram de discussion : https://t.me/BlockBeats_App

Compte officiel Twitter : https://twitter.com/BlockBeatsAsia

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire