Google DeepMind AI співматематик досяг 47,9% у FrontierMath Tier 4, обійшов GPT-5.5 Pro та розв’язав 3 раніше нерозв’язні задачі

Google DeepMind випустила AI співматематика — багатoагентного помічника з математичних досліджень, який досяг 47,9% точності на бенчмарку FrontierMath Tier 4, перевершивши попередній рекорд GPT-5.5 Pro: 39,6% (станом на 9 травня). Система розв’язала 23 із 48 задач, зокрема 3, які не змогли розв’язати всі попередні моделі. Побудована на Gemini 3.1 Pro, архітектура використовує ієрархічну конструкцію: агент-координатор проєкту розподіляє завдання між підагентами, що займаються пошуком літератури, кодуванням і міркуванням, а кілька агентів-рецензентів перевіряють докази перед поданням.

Epoch AI провела сліпе тестування, не даючи команді DeepMind бачити задачі, при цьому на кожне питання відводилося 48 годин обчислень. У реальному застосуванні математик Марк Лакенбі використав систему, щоб розв’язати відкриту гіпотезу з Kourovka Notebook, продемонструвавши її практичну цінність для досліджень. Наразі система доступна обмеженій кількості математиків у бета-тестуванні.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Walmart скорочує 1 000 корпоративних посад у сфері технологій та штучного інтелекту під час консолідації

Walmart скорочує або переводить приблизно 1 000 корпоративних робочих місць, оскільки консолідує свої команди з технологій і ШІ, повідомляє меморандум від 12 травня від глобального CTO Суреша Кумара та виконавчого віцепрезидента з напрямку AI Даніеля Данкерса. Перебудова покликана спростити лінії звітності, чіткіше визначити відповідальних і краще узгодити ролі з навичками, які Walmart потрібні в майбутньому. Компанія заявила, що за можливості допоможе працівникам, яких це торкнеться, знайти інш

CryptoFrontier17хв. тому

США і Китай готують новий діалог з безпеки ШІ, оскільки модель Mythos від Anthropic активізує обговорення

Згідно з Beating (моніторингова платформа), Китай і США готуються запустити новий раунд діалогу щодо безпеки ШІ. Спусковим гачком став модель Mythos від Anthropic, яка здатна автономно обходити урядові бази даних і проникати в мережі лікарень, через що американські посадовці сприймають її як безпрецедентну кіберзброю. Паралельно DeepSeek оголосила, що її нову модель адаптували під чипи Huawei, що зменшує залежність Китаю від Nvidia та посилює його позиції на переговорах. Під час підтвердження ст

GateNews41хв. тому

Lightspeed скорочує цільовий обсяг фонду для Індії до $300 млн–$350 млн і переорієнтовується на AI

Венчурна компанія Lightspeed зі США знизила цільову суму свого п’ятого індійського фонду, орієнтуючись на діапазон від 300 мільйонів до 350 мільйонів доларів замість до 500 мільйонів доларів, повідомляє The Economic Times. Компанія зміщує фокус на інвестиції на ранніх стадіях у AI та deeptech. Стратегічний зсув і розмір фонду Зменшення фонду означає повернення Lightspeed до раніших розмірів її індійських фондів. Нова ціль ближча до перших трьох індійських фондів компанії, які були оцінені в 135

CryptoFrontier47хв. тому

Хуан Ренцюн у найостаннішу мить отримав запрошення приєднатися до Трампа візитом до Китаю, піднявшись на Air Force One

Білий дім підтвердив, що генерального директора Nvidia Хуана Женьсуна запросили приєднатися до поїздки саміту Трамп—Сі Цзіньпін у США в останню мить. Хоча раніше різні повідомлення вказували, що його немає в списку, за даними допису очевидця наразі Женьсунь уже піднявся на борт Air Force One в Алясці разом із кількома провідними представниками бізнесу, зокрема з керівником Tesla Ілоном Маском, і прямує до Китаю. Чому до переліку представників для візиту на саміт Трамп—Сі Цзіньпін у Пекіні потрап

ChainNewsAbmedia1год тому

Майкл Беррі попереджає: ралі акцій AI схоже на бульбашку 1999-2000 — останні кілька місяців

За повідомленням Investopedia від 12 травня, інвестор Майкл Беррі, який прославився завдяки прогнозу обвалу ринку нерухомості у 2008 році, упродовж вихідних опублікував у Substack кілька статей, де заявив, що нинішнє зростання акцій, пов’язаних з AI, «схоже на останні кілька місяців бульбашки 1999-2000 років», і закликав «зменшувати позиції в акціях, які зростають за параболічною траєкторією». Конкретні застереження Беррі та рекомендації щодо дій За даними повідомлення Investopedia, Беррі у свої

MarketWhisper1год тому

Три найбільші банки Японії отримають доступ до Anthropic Claude Mythos до кінця травня

Як повідомляє Nikkei, три найбільші банки Японії мають отримати доступ до Claude Mythos — потужної моделі штучного інтелекту, розробленої американським стартапом Anthropic, — уже наприкінці травня.

GateNews1год тому
Прокоментувати
0/400
Немає коментарів