Google DeepMind выпустила ИИ со-математика — многoагентного исследовательского помощника по математике, достигнув 47,9% точности в бенчмарке FrontierMath Tier 4, превзойдя предыдущий рекорд GPT-5.5 Pro (39,6%) от 9 мая. Система решила 23 из 48 задач, включая 3, которые до этого не смогли решить ни одна из предыдущих моделей. Построенная на Gemini 3.1 Pro архитектура использует иерархический дизайн: агент-координатор проекта распределяет задачи между субагентами, отвечающими за извлечение литературы, кодирование и рассуждения; перед подачей несколько агентов-ревьюеров валидируют доказательства.
Epoch AI провела слепое тестирование, не позволяя команде DeepMind видеть задачи, при этом на каждый вопрос отводилось по 48 часов вычислений. В реальном применении математик Марк Лакенби использовал систему, чтобы разрешить открытую гипотезу из Kourovka Notebook, демонстрируя ее практическую исследовательскую ценность. Сейчас система доступна ограниченному числу математиков в рамках бета-тестирования.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Walmart сокращает 1 000 корпоративных рабочих мест в сфере технологий и ИИ из-за консолидации
Walmart сокращает или переносит примерно 1 000 корпоративных рабочих мест по мере консолидации своих команд по технологиям и ИИ, сообщает майское 12-е число в меморандуме от глобального CTO Суреша Кумара и исполнительного вице-президента по ИИ Дэниела Данкера. Перестройка призвана упростить линии отчетности, уточнить зоны ответственности и лучше увязать роли с теми навыками, которые Walmart потребуется в дальнейшем. Компания заявила, что постарается помочь затронутым сотрудникам найти другие дол
CryptoFrontier17м назад
США и Китай готовят новый диалог по безопасности ИИ, поскольку модель Anthropic Mythos активизирует обсуждения
Согласно Beating (платформе мониторинга), Китай и США готовятся к запуску нового раунда диалога по безопасности ИИ. Катализатором выступает модель Mythos от Anthropic, которая может автономно взламывать базы данных правительства и больничные сети, побуждая американских чиновников рассматривать её как беспрецедентное кибероружие. Параллельно DeepSeek объявила, что её новая модель адаптирована под чипы Huawei, снижая зависимость Китая от Nvidia и усиливая его переговорные позиции. Старшие чиновник
GateNews41м назад
Lightspeed снижает целевой объем фонда для Индии до 300–350 млн долларов и переориентируется на ИИ
Американская венчурная компания Lightspeed снизила целевой объём своего пятого фонда, ориентированного на Индию, до диапазона от 300 миллионов до 350 миллионов долларов с ранее заявлявшихся до 500 миллионов долларов, сообщает The Economic Times. Фирма смещает фокус в сторону инвестиций на ранней стадии в ИИ и deeptech. Стратегический сдвиг и размер фонда Сокращение фонда означает возврат к более ранним размерам индийских фондов Lightspeed. Новый целевой показатель ближе к объёмам первых трёх инд
CryptoFrontier47м назад
Хуан Жэньсюн в последний момент был приглашён на встречу с Трампом в Китае и поднялся на Air Force One
США подтвердили: директор Nvidia Дженсен Хуанг был приглашен в последний момент присоединиться к графику американо-китайского саммита Трампа и Си Цзиньпина с президентом США Дональдом Трампом. Несмотря на то, что ранее из разных источников сообщалось, что он не включен в список, согласно посту очевидца, на данный момент Дженсен Хуанг уже поднялся на борт Air Force One в Аляске вместе с несколькими ведущими представителями бизнеса, включая главного исполнительного директора Tesla Илона Маска, что
ChainNewsAbmedia1ч назад
Майкл Бьюрри предупреждает: ралли акций на основе ИИ похоже на пузырь 1999–2000 годов — последние несколько месяцев
Согласно сообщению Investopedia от 12 мая, инвестор Майкл Бьюрри, прославившийся прогнозом об обрушении рынка недвижимости в 2008 году, в минувшие выходные опубликовал на Substack несколько статей. Он заявил, что недавний ралли в акциях, связанных с ИИ, «похоже на последние месяцы пузыря 1999–2000 годов», и посоветовал «сокращать долю в акциях, которые растут по параболе». Конкретные предупреждения Бьюрри и рекомендации по действиям По данным Investopedia, в статье на Substack в воскресенье Бьюр
MarketWhisper1ч назад
Три крупнейших банка Японии получат доступ к Anthropic Claude Mythos к концу мая
Согласно Nikkei, три крупнейших банка Японии, как ожидается, получат доступ к Claude Mythos — мощной модели искусственного интеллекта, разработанной американским стартапом Anthropic, — уже к концу мая.
GateNews1ч назад