Борясь с трудностями, Microsoft недавно открыла исходный код семейств модели Phi-Ground, предназначенных для решения проблемы того, где именно ИИ должен кликать по экрану компьютера. Версия на 4 миллиарда параметров в паре с более крупными языковыми моделями для планирования инструкций превзошла по точности кликов OpenAI Operator и Claude Computer Use в бенчмарке Showdown и заняла первое место среди всех моделей с менее чем 100 миллиардами параметров по пяти оценкам, включая ScreenSpot-Pro.
Команда обучалась на более чем 40 миллионов наборах данных и выяснила, что три распространённые техники обучения из научных работ перестали работать эффективно при масштабировании. Ключевой подход оказался простым: выводить координаты как обычные числа, например «523, 417». Ранее исследования предлагали специализированные словари позиций для координат, но они не масштабировались. Также команда обнаружила, что размещение текстовых инструкций перед изображениями повышает качество, поскольку модели могли распознавать цели, обрабатывая пиксели. Кроме того, методы обучения с подкреплением, такие как DPO, улучшали точность даже после дообучения.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Геополитический риск возглавляет опрос Федеральной резервной системы за весну 2026 года, а ИИ выходит на третье место
Согласно опросу Федеральной резервной системы, проведённому весной 2026 года, респонденты поставили геополитические риски на первое место среди главных опасений, поднявшись на одну позицию по сравнению с опросом осени 2025 года. Искусственный интеллект переместился на третье место с пятого, а частный кредит поднялся на четвертое с девятого. Инфляция и ужесточение денежно-кредитной политики опустились на пятое место с третьего, что отражает сдвиг в оценке экономических рисков среди участников опр
GateNews56м назад
Google запускает протокол платежей с ИИ-агентами, заручившись поддержкой 120+ партнёров, включая PayPal
По данным CoinDesk, руководители Google Cloud и PayPal обсудили, как криптовалютные платежи будут поддерживать коммерцию, управляемую ИИ-агентами. Руководитель Web3-стратегии Google Cloud Ричард Видманн объявил, что Google запустила Agentic Payments Protocol (AP2), сделала пожертвование в FIDO Foundation и привлекла более 120 партнёров, включая PayPal, которые теперь участвуют. Видманн отметил, что ИИ-агенты не могут открывать традиционные банковские счета из‑за технических и регуляторных ограни
GateNews6ч назад
Apple урегулировала спор на 250 млн долларов по делу о недостоверной рекламе iPhone с ИИ-маркетингом: до 95 долларов компенсации за каждое устройство
Apple согласилась выплатить 250 млн долларов в рамках мирового соглашения, уладив коллективный иск по обвинению компании в преувеличении функций ИИ «Apple Intelligence» на iPhone. Top Class Actions сообщила следующее: истцы утверждают, что Apple в маркетинговых кампаниях для iPhone 16 и некоторых моделей iPhone 15 намекала, что функции ИИ (включая существенно обновлённый Siri) будут доступны сразу при выходе устройств на рынок, однако фактический запуск функций задержали. Пользователи, подпадающ
ChainNewsAbmedia6ч назад
Alphabet за год вырос на 160%, а его капитализация после торговой сессии превысила Nvidia: капитализация «воплотила ценность» всего «AI-стека»
Акции Alphabet(GOOGL)за последний год выросли примерно на 160%. После публикации финансовой отчетности за Q1 2026 аналитики связывают этот рост с конкурентной позицией Google в гонке за «полный AI-стек» (full stack). CNBC собрал ключевые итоги: выручка Alphabet за Q1 в консолидированном выражении выросла на 22% год к году до 109,9 млрд долларов, а чистая прибыль резко увеличилась на 81% до 62,6 млрд долларов; выручка Google Cloud выросла на 63% год к году до 20 млрд долларов и впервые превысила
ChainNewsAbmedia6ч назад
Капиталовложения Nvidia превышают 400 миллиардов долларов в 2026 году, расширяя AI-экосистему
Согласно Gelonghui, долевые инвестиции Nvidia превысили $400 миллиардов в 2026 году по состоянию на 9 мая. Инвестиции охватывают предприятия на уровне upstream и downstream в секторе ИИ, формируя интегрированную экосистему — от производства чипов до разработки моделей ИИ. Наблюдатели отрасли отмечают, что такая инвестиционная стратегия позволяет Nvidia привлекать клиентов в downstream, одновременно укрепляя конвейер спроса на свое оборудование.
GateNews7ч назад
Quantra и FishWar объявляют о стратегическом партнёрстве для интеграции AI-игр с инфраструктурой RWA 9 мая
9 мая Quantra и FishWar объявили о стратегическом партнёрстве, чтобы объединить игровые впечатления с ИИ и инфраструктуру блокчейна для реальных активов. О сотрудничестве, которое было опубликовано в официальных соцсетях обеих компаний, говорится в целях интеграции решений Quantra по токенизации RWA с платформой FishWar GameFi в сети Sei. Партнёрство нацелено на повышение масштабируемости блокчейн-игр, взаимодействия в ончейне и интеграции цифровых активов, одновременно решая технические проблем
GateNews7ч назад