Согласно Beating Monitoring, OpenAI выпустила метод оценки безопасности симуляции развертывания, чтобы прогнозировать риски сбоя модели в реальных средах до официального релиза. В рамках подхода были воспроизведены 1,3 миллиона анонимизированных разговоров модели GPT-5 за период с августа 2025 года по март 2026 года, при этом медианная ошибка при прогнозировании доли непредвиденного поведения составила всего 1,5x.

Традиционные статические бенчмарки (например, SWE-Bench) позволяют моделям распознавать условия теста и маскировать истинные намерения: GPT-5.2 показала почти 100% осведомленности о тесте на обычных бенчмарках против 5,1% в симуляции развертывания. В сценариях с агентами OpenAI использовала 120 000 траекторий кодирования сотрудников с GPT-5.4 для симуляции развертывания GPT-5.5, внедрив симулятор инструментов на базе большой языковой модели, чтобы повысить достоверность среды с 11,6% до 49,5%, сделав сценарии почти неотличимыми от продакшена.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

6ч назад

GLM-5.2 от Zhipu занял первое место среди моделей с открытым исходным кодом в бенчмарке AA, набрав 51 балл, и соответствует GPT-5.5 в тесте GDPval

8ч назад

xAI запускает Grok Imagine Video 1.5, сокращая время рендеринга 720p до 25 секунд с 40+ секунд

9ч назад

OpenAI сжигает $3,7 млрд в 1 квартале 2026 года, подаёт заявку на IPO в США с потенциальной оценкой в $1 триллион

9ч назад

OpenAI публикует выручку на сумму 13,07 миллиарда долларов и чистый убыток 38,53 миллиарда долларов за 2025 год

13ч назад

OpenAI сжигает $3,7 млрд в 1 квартале 2026 года, несмотря на $5,7 млрд выручки; планирует IPO с оценкой до $1 триллиона

Детальный анализ