#OpenAIReleasesGPT-5.4


🎉 OpenAI 已正式宣布 GPT-5.4,這款最新模型在人工智慧界引發了熱烈的討論。GPT-5.4 被譽為「最具能力與效率的前沿模型」,在前一版本 GPT-5.2 的「思考」能力基礎上邁出了一大步,並在推理、編碼和自主工具工作流程方面取得了重大進展。這個新版本有潛力從根本上改變人工智慧的角色,尤其是在專業工作流程中。

🤔 主要特點與改進

🔹 原生計算能力:GPT-5.4 最令人矚目的創新之一是它成為第一個具備原生計算能力的通用模型。這意味著該模型能解讀螢幕圖像並發出滑鼠和鍵盤指令,通過 Playwright 自動化瀏覽器,並完成複雜的跨應用工作流程。在 OSWorld-Verified 基準測試中,其成功率達到75%,超越人類表現的 (72.4%),明顯展現其在此領域的能力。
🔹 100 萬代幣上下文窗口:該模型在 API 和 Codex 中提供高達一百萬代幣的上下文支持,使其能執行長時間任務和複雜推理鏈,處理大型程式碼庫、文件和合約而不會失去追蹤能力。這展現了模型在深入分析和大規模專案中的獨特能力。 🔹 改進的準確性與減少幻覺:OpenAI 表示,GPT-5.4 在完整回應中比前一版本少了33%的錯誤聲稱,錯誤率降低18%。這提升了可靠性,尤其適用於需要敏感資訊的專業應用。
🔹 工具搜尋:此新功能允許模型在 API 中根據需求動態搜尋工具定義。這可以降低47%的代幣使用量,帶來成本與延遲的優勢,特別適合使用大型工具生態系的開發者。
🔹 思考計劃與中期干預:GPT-5.4 在 ChatGPT 中的思考功能提供了針對複雜查詢的預先規劃推理策略。用戶可以在模型回應中途介入,加入指令或改變方向,從而產生更精確且符合語境的輸出。
🔹 兩種不同版本:該模型在 ChatGPT 中提供 GPT-5.4 Thinking(適用於 Plus、Team 和 Pro 訂閱者)以及 GPT-5.4 Pro(適用於 Pro 和企業方案),以在更複雜的任務中提供最大性能。

🕵️ 競爭與影響:

✨ GPT-5.4 的推出加劇了與 Google 的 Gemini 和 Anthropic 的 Claude Opus 4.6 等競爭對手的較量。OpenAI 自身的基準測試顯示,GPT-5.4 在 OSWorld-Verified 和 GDPval 等關鍵指標上超越了競爭者。這次快速的迭代再次證明了人工智慧公司之間的領導競爭是多麼的動態。

社群反應與未來展望:

✨ 社群的初步反應普遍正面。開發者和科技愛好者對新功能帶來的潛力感到興奮。許多人強調,這款模型不再只是「助手」,而是能直接在軟體環境中執行任務的「操作者」。這標誌著一個可能重新定義 AI 與人類合作方式,甚至改變整個工作流程的轉變。

🤔 不過,也存在一些爭議。由於該模型僅限於高級訂閱用戶,導致部分用戶對成本和可及性表示擔憂。此外,考慮到 GPT-5.3 只是幾天前才發布,這樣的快速版本更新讓一些用戶感到驚訝,並產生疑問:「這只是行銷策略嗎?」

✍️ 總結來說,GPT-5.4 在人工智慧技術上代表了一個重大進步。憑藉強化的推理能力、原生計算功能和提升的可靠性,它為專業用戶和開發者提供了突破性的機會。這款模型開啟了一個未來,人工智慧不僅能生成資訊,還能積極與數位世界互動,自主執行複雜任務。然而,這一快速發展所帶來的倫理、安全與可及性問題,將是未來行業必須面對的重要挑戰。
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 12
  • 轉發
  • 分享
留言
0/400
özlem_1903vip
· 14分鐘前
感謝您的資訊 🍀
查看原文回復0
Moonchartvip
· 46分鐘前
直達月球 🌕
查看原文回復0
Unforgettablevip
· 51分鐘前
直達月球 🌕
查看原文回復0
discoveryvip
· 1小時前
直達月球 🌕
查看原文回復0
discoveryvip
· 1小時前
2026 GOGOGO 👊
回復0
xxx40xxxvip
· 2小時前
直達月球 🌕
查看原文回復0
xxx40xxxvip
· 2小時前
LFG 🔥
回復0
AylaShinexvip
· 2小時前
Ape In 🚀
回復0
AylaShinexvip
· 2小時前
直達月球 🌕
查看原文回復0
AylaShinexvip
· 2小時前
2026 GOGOGO 👊
回復0
查看更多