Первый в истории AI, создающий AI! GPT-5.3 участвует в разработке самого себя, научная фантастика становится реальностью

OpenAI выпустила GPT-5.3-Codex — первую модель, которая «участвует в создании себя» для отладки собственного кода, управления развертыванием и диагностики тестирования. Карпати назвал эту редакцию «ближе всего к сцене взлёта ИИ».

ИИ начал создавать технологические сингулярности и прорывы в области ИИ

Официальный аккаунт OpenAI: GPT-5.3-Codex официально запущен, который «первым участвует в создании собственной модели». Что это значит? Другими словами, в процессе разработки этот ИИ помогал отладить собственный обучающий код, управлять процессом развертывания и диагностировать результаты тестов. В человеческом смысле ИИ начал создавать ИИ.

Андрей Карпати, бывший исследователь OpenAI и директор Tesla AI, сразу после прочтения написал в Твиттере: «Это самое близкое к сцене взлёта ИИ, что я когда-либо видел в научной фантастике.» Эта оценка ведущих исследователей ИИ весома, поскольку Карпати лично прошёл через несколько ключевых этапов развития ИИ, и его суждение основано на глубоком техническом понимании.

ИИ повторяет сам себя, это не маркетинговая риторика. Согласно внутреннему раскрытию информации OpenAI, GPT-5.3-Codex выполнял следующие задачи в процессе разработки: анализировал тесты, которые не отмечали обучающие журналы, предлагал исправления для обучающих скриптов и профилей, генерировал рецепты развертывания и суммировал и оценивал аномалии для человеческой проверки. Что это значит? ИИ больше не просто инструмент, он начинает становиться частью команды разработчиков, и это тот тип, который может сам себя улучшать.

Эта способность участвовать в разработке продвигается через традиционное позиционирование ИИ. Раньше модели ИИ разрабатывались, обучались и внедрялись исключительно людьми, и ИИ был пассивным продуктом. Теперь GPT-5.3 сыграл активную роль в собственном рождении, и хотя он всё ещё находится под человеческим контролем, этот сдвиг роли имеет далеко идущие последствия. Это намекает на возможность: будущие модели ИИ могут в значительной степени разрабатываться и оптимизироваться самим ИИ, при этом люди будут давать только указания и окончательный обзор.

Самоучастие GPT-5.3 в разработке

Анализ обучающих журналов: Автоматически отмечает непроваленные тесты для выявления аномалий во время обучения

Рекомендуемый план ремонта: Предложить улучшения обучающих скриптов и профилей

Сгенерировать рецепт развертывания: Автоматизация процесса развертывания и сокращение ручных операций

Аномалия сводной оценки: Организовывать сложные результаты оценки в отчеты, понятные человеку

Недавняя статья SEAL, опубликованная MIT (arXiv:2506.10943), описывает архитектуру ИИ, которая непрерывно обучается после развертывания, развиваясь без переобучения. В частности, некоторые исследователи SEAL теперь присоединились к OpenAI. Это означает, что ИИ превратился из «статического инструмента» в «динамическую систему», обучение больше не останавливается на этапе внедрения, а границы выводов и обучения тают. GPT-5.3 может стать первым коммерческим применением этой новой архитектуры.

77,3% превзошёл эталонную резню Claude

5 февраля OpenAI и Anthropic выпустили новое поколение моделей с интервалом всего в 20 минут. Сначала Anthropic выпустила Claude Opus 4.6, а затем OpenAI выпустила GPT-5.3-Codex. Поскольку OpenAI хочет использовать GPT-5.3-Codex для снайпинга новых моделей других, у него должны быть какие-то возможности. Данные не лгут: GPT-5.3-Codex установил новые рекорды на множестве отраслевых бенчмарков сразу после запуска.

Terminal-Bench 2.0 проверяет операционные возможности ИИ в реальной терминальной среде, компилируя код, обучая модели и настраивая серверы. GPT-5.3-Codex набрал 77,3%, тогда как GPT-5.2-Codex — всего 64,0%, а Claude Opus 4.6 — 65,4%. Это рост на 13 процентных пунктов между поколениями, что уже является огромным шагом вперёд в области ИИ. Сравнение 77,3% против 65,4% показывает, что GPT-5.3 обеспечивает значительное преимущество в реальных инженерных задачах.

SWE-Bench Pro — это тест, специально разработанный для проверки реальных возможностей программной инженерии, охватывающий четыре языка программирования: Python, JavaScript, Go и Ruby. GPT-5.3-Codex набрал 56,8%, превзойдя 56,4% своего предшественника, GPT-5.2-Codex, и продолжал сохранять первое место в отрасли. Что ещё важнее, OpenAI показал, что GPT-5.3-Codex использует наименьшее количество выходных токенов среди всех моделей, когда достигает этого результата, что делает его не только точным, но и эффективным.

OSWorld-Verified проверяет способность ИИ выполнять задачи по продуктивности в визуальном рабочем столе, редактировать таблицы, создавать презентации, работать с документами и многое другое. GPT-5.3-Codex набрал 64,7%, по сравнению со средним показателем для человека в 72%. Это означает, что она приблизилась к производительности обычных людей в задачах работы с компьютерами, почти вдвое превысив производительность своего предшественника. Эта почти человеческая работа делает ИИ впервые по-настоящему способным работать в офисе, а не просто вспомогательным инструментом.

Клод сражается с командами жетонов и агентов по 100 тысяч

Что ещё более примечательно, что Claude Opus 4.6 впервые поддерживает контекстное окно с токенами (бета-версия) на уровне Opus, которое может одновременно обрабатывать всю кодовую базу или сотни страниц документов, а также запустил функцию Agent Teams, где несколько ИИ-агентов могут одновременно работать над программированием, тестированием и написанием документов.

Когда OpenAI и Anthropic выпускают свои флагманские модели в один день и в один момент, этот конкурс перестаёт быть просто техническим соревнованием, а борьбой за будущую форму ИИ: путь «самоэволюции» OpenAI или путь «мультиагентного сотрудничества» Anthropic? Стратегия OpenAI — сделать один ИИ мощнее и даже улучшить его. Стратегия Anthropic заключается в том, чтобы позволить нескольким ИИ сотрудничать над сложными задачами через разделение труда и сотрудничество.

Контекст токенов на 100 тысяч — это технологический прорыв. Это эквивалентно примерно 75 миллионам английских слов или 300 китайских иероглифов, что достаточно, чтобы вместить весь код среднего по размеру программного проекта или толстую техническую документацию. Эта способность позволяет Клоду «видеть» весь проект, а не фрагментарно понимать. Для анализа архитектуры и рефакторинга крупномасштабных проектов этот глобальный взгляд имеет решающее значение.

Agent Teams приносит концепцию сотрудничества в ИИ. Один агент пишет код, другой тестирует, третий пишет документацию, и они могут общаться и координироваться друг с другом. Этот паттерн имитирует работу команд человеческого программного обеспечения и может лучше подходить для определённых сценариев, чем один супер-ИИ. Однако многоагентное сотрудничество также вводит новые сложности: как координировать, как избегать конфликтов и как обеспечить последовательность.

Оба пути имеют свои плюсы и недостатки. Путь саморазвития OpenAI более агрессивный, и если он будет успешным, может привести к экспоненциальному росту возможностей, но также может выйти из-под контроля. Многоагентный путь Anthropic более консервативный, снижая одну точку риска за счёт распределения возможностей, но затраты на координацию могут ограничивать эффективность. По мере того как ИИ начинает развиваться в реальной природе, вопросы управления будут смещаться с «насколько он умный» на «как управлять системой, которая постоянно меняется?» А когда две ведущие компании в области искусственного интеллекта выпускают прорывные модели подряд в течение 20 минут, оставшееся окно времени для человеческого мышления и подготовки сокращается с видимой невооружённой скоростью.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Том Ли: Рынок уже переварил более 90% давления продаж, и обычно он достигает дна на этапе, предшествующем началу войны, в пределах первых 10%.

Том Ли в интервью CNBC заявил, что рынок уже переварил большую часть давления со стороны продавцов, или что он уже достиг дна. Он отметил, что исторически фондовый рынок в начале войн часто демонстрирует признаки того, что дно сформировано; если текущая ситуация соответствует этому правилу, рынок может получить V-образный отскок. Кроме того, он считает, что экономика США может выдержать цены на нефть до 120 долларов.

GateNews9м назад

Empery Digital на прошлой неделе сократила свои запасы на 79 BTC, в результате объем ее holdings снизился до 3 359 BTC

Gate News Сообщение, 1 апреля, компания Empery Digital, листингованная на Nasdaq, раскрыла, что на прошлой неделе продала 79 биткоинов со средним курсом 71 031 долларов США за единицу, общая выручка составила около 5,6 млн долларов США, а общее количество её биткоинов снизилось до 3 359. Кроме того, компания сообщила, что по состоянию на данный момент потратила около 137 млн долларов США на обратный выкуп 23 630 147 акций обыкновенного типа; в дальнейшем, при необходимости, она продолжит продавать биткоины для финансирования будущих выкупов акций и возможного погашения части непогашенных долгов.

GateNews31м назад

ETH 15 минут роста на 0,62%: рост в краткосрочной перспективе поддержан синхронным эффектом — чистые притоки в ETF и стягивание ликвидности

2026-04-01 03:00 до 03:15 (UTC) цена ETH показала всплеск волатильности; доходность в диапазоне составила +0.62%. Минимальная точка свечи — 2088.43 USDT, максимальная — 2106.93 USDT, амплитуда достигла 0.89%. На фоне усиления общей волатильности на рынке криптоактивов ETH в краткосрочной перспективе демонстрирует активизацию торгового оборота, рост ончейн-живости и заметное повышение внимания со стороны рынка. Основным драйвером данного всплеска стало продолжающееся наращивание чистого притока средств в американские спотовые ETF: чистые притоки ETF в начале апреля сохранили сильную динамику, начавшуюся в конце марта, что заметно стимулировало спрос на спотовый ETH.

GateNews47м назад

Вчера спотовый ETF на Ethereum в США получил чистый приток 31,16 млн долларов, при этом лидирует iShares ETHA от BlackRock

Согласно сообщению Gate News, 31 марта общий чистый приток в американские спотовые ETF на Ethereum составил 31,16 млн долларов, при этом чистый приток от BlackRock ETHA оказался самым высоким и достиг 24,69 млн долларов. Другие фонды, такие как 21Shares TETH и Fidelity FETH, также показали чистый приток в разной степени.

GateNews1ч назад

Вчера американные спотовые ETF на биткоин получили чистый приток в размере 117 миллионов долларов, что на 68% больше по сравнению с предыдущим периодом

Согласно Gate News, 31 марта американские спотовые ETF на биткоин зафиксировали чистый приток в размере 117 миллионов долларов США, что выросло примерно на 68%. Среди них самый высокий чистый приток у BlackRock IBIT — 98,10 миллиона долларов США. Другие фонды, такие как Fidelity FBTC, также показали рост, но объем чистого притока был меньше.

GateNews1ч назад

12 европейских крупнейших банков объединяются, чтобы поддержать евро-стаблкоин и противостоять угрозе цифровой долларизации

Генеральный директор Qivalis заявил, что доля евро в on-chain-торговле составляет всего 0,2%, что подвергает Европу риску долларизации. Запущенный при поддержке 12 банков проект Qivalis выпускает евро-стаблкоин, чтобы решить проблему фрагментации рынка стейблкоинов, а также дополняет цифровой евро Европейского центрального банка. Цель — обеспечить сохранение роли евро в мировой финансовой системе.

MarketWhisper1ч назад
комментарий
0/400
Нет комментариев