微软开源 Phi-Ground 4B 模型,在屏幕点击准确率方面优于 OpenAI Operator 和 Claude

据 Beating 称,微软最近开源了 Phi-Ground 模型家族,旨在解决“AI 应该在计算机屏幕上点击哪里”的问题。该 40 亿参数版本,并结合用于指令规划的更大语言模型,在 Showdown 基准测试中超过了 OpenAI Operator 和 Claude Computer Use 的点击准确率,并在包括 ScreenSpot-Pro 在内的五项评估中位列所有 100 亿以下参数模型的第一名。

团队在超过 4000 万个数据样本上进行了训练,并发现学术论文中使用的三种常见训练技术在规模化时变得无效。关键思路证明很简单:以常规数字输出坐标,例如“523, 417.” 先前的研究为坐标发明了专门的位置词汇,但这些方法无法规模化。团队还发现,将文本指令放在图像之前可以提升性能,因为模型在处理像素时能够识别目标。此外,诸如 DPO 之类的强化学习方法在微调之后仍能提高准确率。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Anthropic 从 Elon Musk 手中获得 220,000 台 Nvidia GPU,披露于 5 月 6 日

据 The Prompt 报道,5 月 6 日,Anthropic 从 Elon Musk 获得了 220,000 张 Nvidia GPU 的使用权限。该交易为这家 AI 公司带来了显著的算力激增,使其能够几乎将 Claude Code 的速率限制翻倍。该披露发生在 Musk 同时在法庭上起诉他共同创立的 OpenAI 之际。

GateNews59 分钟前

黄仁勋于卡内基梅隆大学致意毕业生:「我心在运行」你的职业生涯始于 AI 革命的开端

輝达创办人暨执行长黄仁勋受邀出席卡内基梅隆大学第 128 届毕业典礼时发表主题演讲,他向台下的毕业生献上毕业祝福时致意表示,当前正处于人工智能革命的开端,为全球工业转型的关键转捩点,现在毕业的学生拥有最佳的时机,让“智慧”普及到世界上的每个人。 黄仁勋:现在毕业拥有最广阔的机遇 在卡内基梅隆大学第 2026 届毕业典礼上,辉达创办人黄仁勋向毕业生致意,他表示现在是毕业生开启职涯的最佳时机,现在毕业正步入一个非凡的年代,黄仁勋向学生勉励祝福道:“我们都站在同条起跑线上,没有哪一代人比你们拥有更强大的工具,现在就是你们重塑未来的开始。” 黄仁勋的美国梦起始于爱上某大姐、在 250 名竞争者中脱颖而出 演讲开头时,黄仁勋一如以往用幽默的口吻表示,他相信美国梦,老婆年纪比他大,跟他开始约会时已 19 岁,而他当年只有 17 岁,却能从同校当中 250 名竞争者当中胜出娶回老婆,生下两个孩子,而他从一个丹尼餐厅的洗碗工到结识辉达的另外两名共同创办人 Chris Malachowsky 和 Curtis Priem 一起创立辉达,为初代移民实现美国梦的最佳范例。 “智慧”将真正惠及每个人 即将到来

鏈新聞abmedia1小时前

Jim Cramer:AI 数据中心类股“还不算太迟”、清单涵盖芯片到电力4大类

CNBC 主持人 Jim Cramer 5 月 10 日对 AI 资料中心類股表態:即使股价已大漲、现在进场「还不算太遲」、因为超大規模雲端业者(hyperscaler)的资本支出規模与明年起的營收预期、让资料中心類股难以下跌。CNBC 报導整理:Cramer 认为 AI 已从「窄技術故事」變为「廣基经濟转變」、从公用事业、工业到科技业、都被「一场资金洪流擊中」。 Cramer 推薦的 AI 资料中心相关類股:橫跨晶片、基礎建设、电力、雲端 Cramer 点名的 AI 受惠類股、分四大類: 晶片:Western Digital、Micron(記憶體与儲存);ASML、Applied Materials(晶圓设備) 基礎建设与網路:Dell(伺服器)、Vertiv(冷卻)、Eaton(电力设備)、Cisco、Arista(網路)、Corning(光纖) 电力与能源:Vistra、GE Vernova、Constellation Energy 雲端平台:Amazon Web Services、Microsoft Azure、Google Cloud 这份名單橫跨「资料中心建置」全棧—从晶片

鏈新聞abmedia1小时前

OpenAI 允许员工在最近一轮融资中出售最多 $30M 股份

据《华尔街日报》报道,OpenAI 允许员工在最近一轮融资中每人出售最多 3000 万美元的股份。去年 10 月,600 多名在职和离职员工集体出售其持股,融资额达到 66 亿美元;约有 75 名员工触及 3000 万美元的上限。员工等待了大约两年才等到出售股份的机会。

GateNews1小时前

中信:AI 需求接近 1998-1999,市场定价为 1997-1998

中国国际金融股份有限公司(CITIC)使用一个历史框架来评估当前人工智能市场所处阶段,并将其与20世纪90年代的互联网繁荣周期进行对比。根据CITIC的分析,需求端正接近1998–1999年的水平,投资强度与产能接近2000年的水平,二级市场定价类似于1997–1998年的状况。 CITIC的泡沫评估框架 在一份于2023年11月下旬发布的报告《AI Bubble: How Far Along Are We?》中,CITIC概述了其用于评估泡沫风险的方法论。该框架摒弃了三种常见误解:持续的价格上涨意味着泡沫,高估值与市场集中本身就必然存在问题,或 dominant firms(占主导地位的公司)之间高度集中的领导力表明过度投机。相反,CITIC认为,真正的泡沫发生在定价与基本面价值脱节之时。 据CITIC称,关键区别不在于投资是否在加速——加速本身是正常的——而在于投资规模是否超过了实际需求以及市场吸收这些规模的能力。该公司强调,判断泡沫所处阶段需要同时审视多个维度:需求水平、投资产能,以及二级市场定价相对于基本面的情况。 2023年11月评估 当CITIC在2023年11月下旬发布其

Crypto Frontier2小时前

英伟达 CEO 黄仁勋向毕业生发出警告:AI 不会取代你,但更善于使用它的人会取代你

据《Business Insider》报道,英伟达创始人兼首席执行官黄仁勋在 5 月 11 日卡内基梅隆大学 2026 届毕业典礼上发言,鼓励毕业生把握以 AI 为契机的最佳时机开启职业生涯。黄仁勋表示,AI 正在缩小技术差距,使普通人能够构建有价值的产品,并将在未来几年为年轻人创造大量机会。他提醒称,尽管 AI 不太可能取代毕业生,但更擅长使用 AI 的人更可能取代不那么擅长的人。

GateNews2小时前
评论
0/400
暂无评论