PANews сообщил 27 февраля, что, согласно Cointelegraph, открытая лаборатория ИИ Sentient объявила о запуске Arena — тестовой среды производственного уровня для оценки эффективности AI-агентов в корпоративных рабочих процессах. Подразделения цифровых активов Pantera Capital и Franklin Templeton присоединились к первому тестовому набору Arena.
Sentient отметил, что Arena — это не статический тест, а тестирует агента ИИ на стандартизированной задаче, моделируя корпоративные условия с помощью длинных документов, неполной информации и противоречивых источников. Платформа отслеживает категории отказов, такие как галлюцинации, отсутствующие доказательства, ошибки цитирования и уязвимости рассуждения, чтобы помочь разработчикам диагностировать проблемы. Arena планирует публиковать сравнительные показатели производительности через публичные таблицы лидеров и публиковать отчёты по тестам, обобщающие распространённые паттерны отказов и исправления.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Генеральный директор Tether объявил о прорыве в ИИ-исследованиях, который выйдет на этой неделе
Как сообщает Cointelegraph, генеральный директор Tether Паоло Ардойно объявил 6 мая, что команда компании по исследованиям ИИ выпустит еще одно прорывное решение в области локального ИИ на этой неделе.
GateNews2м назад
Запуск в продакшн валидационного клиента Firedancer 1.0 на Solana
Согласно Foresight News, команда Firedancer объявила на Solana Accelerate USA, что валидационный клиент Firedancer 1.0 начал производственное развертывание. Обновление делает акцент на разнообразии клиентов, снижая зависимость Solana от одной реализации валидатора и уменьшая риски, связанные с программным обеспечением
GateNews4м назад
DAO Uniswap проголосовало за возврат 12,5 млн токенов UNI на сумму $42 млн; голосование завершится 8 мая
По данным DL News, Uniswap DAO голосует по предложению о возврате примерно 12,5 миллиона UNI-токенов (на сумму около $42 миллиона), выданных в кредит Фонду Uniswap и ключевым представителям. Голосование завершится 8 мая: на данный момент за предложение выступают 53%, 46% воздержались.
DAO
GateNews10м назад
Pi Network сооснователь объявил об активации Protocol 23, впервые добавив функциональность смарт-контрактов
Основатели Pi Network Др. Чэньдяо Фань (Dr. Chengdiao Fan) и Никос Коккалис (Nicolas Kokkalis) объявили на конференции Consensus 2026 в Майами 6 и 7 мая, что Protocol 23 будет активирован 11 мая — это крупное обновление впервые добавляет для блокчейна Pi полноценные функции смарт-контрактов.
MarketWhisper28м назад
K Wave Media перенаправляет план $485M Bitcoin на инфраструктуру ИИ
K Wave Media — корейская медиакомпания и компания в сфере развлечений, котирующаяся на Nasdaq, — объявила, что перенаправит до 485 млн долларов США из запланированной стратегии биткоин-казначейства в AI-инфраструктуру, включая дата-центры, вычисления на GPU и приобретения, как сообщает CoinDesk. Этот шаг вносит поправки в стратегию на 500 млн долларов
CryptoFrontier44м назад
Solana сооснователь Толли: Alpenglow — крупное обновление, самый быстрый запуск в следующем квартале
Согласно сообщению о конференции Consensus Miami 2026, прошедшей 6 мая, сооснователь Solana Anatoly Yakovenko (Toly) заявил в беседе у камина, что масштабное обновление сети Solana «Alpenglow» планируется выпустить в этом году, а самое раннее — в следующем квартале.
MarketWhisper52м назад