全球 AI 行業大模型與監管動態

追蹤 OpenAI、Anthropic、Google、DeepSeek 等大模型發布、融資與監管事件;含 AI 行業熱點,不侷限於加密,但影響市場情緒與敘事。
ALLAI AgentAI 行業動態AI 代幣AI 工具應用

OpenAI 揭 Codex 為何禁談「哥布林」:書呆子人格獎勵失控

OpenAI 在官方部落格說明 Codex 禁談哥布林等生物,源於書呆子人格訓練中的獎勵訊號偏好生物比喻,造成跨人格污染與 RLHF 誤導。事件由 Barron Roth 爆出系統指令後,OpenAI 採取短期硬編碼與長期清除獎勵信號兩策略,警示獎勵設計的脆弱性,後訓練審計需更精細。
鏈新聞abmedia·1小時前

LG CNS 第一季營業利潤因 AI 與雲端成長上升 19%

根據《朝鮮日報》,LG CNS 於 4 月 30 日表示,第一季度營業利潤年增 19.4% 至 942 億韓元(64.1 百萬美元),受惠於 AI 與雲端需求。營收成長 8.6% 至 1.3 兆韓元(894 百萬美元)。 該公司的 AI 與雲端部門產生了 765.4 billi
GateNews·3小時前

OpenAI 推 GPT-5.5-Cyber:對戰 Anthropic Mythos

OpenAI 公告推出 GPT-5.5-Cyber,專為網安設計,將在「未來幾天內」以政府協作的可信存取機制部署給關鍵防禦單位,非開放銷售。與 Anthropic Mythos 的開放路徑形成對照,白宮反對擴至70家。Preparedness Framework 評為 High(未到 critical),同時加強資安防護。後續觀察部署名單、CISA 可能入列與雙方資安標準分野。
鏈新聞abmedia·4小時前

Claude 會收語言稅?研究曝翻譯中日韓內容消耗最多近三倍 Token

研究者 Komatsuzaki 在 X 指出主流 LLM 的 tokenizer 存在非英語語言稅。以《The Bitter Lesson》翻譯測試,Claude 在印地語、阿拉伯語、俄語、中文的 token 增幅分別約 3.24×、2.86×、2.04×、1.71×,明顯高於 OpenAI。中國本土模型對中文更友善,顯示訓練資料偏英語造成成本不平等,成為普及障礙。
鏈新聞abmedia·4小時前

OpenAI DevDay 2026 將於 9/29 舊金山舉辦

OpenAI 4 月 29 日官方公告,旗艦開發者大會 DevDay 2026 將於 9 月 29 日在舊金山舉行,回歸睽違多年的實體大會形式。同時公布的還有一項投稿活動:開發者使用 GPT-5.5 與 Image Gen 打造作品提交,每週由 Codex 從中篩選 2-3 件具創意的提交者,獲得 DevDay 免費門票(含跨城機票與飯店費用)。 大會主題:圍繞 GPT-5.5 + Image Gen 的開發者生態 本次 DevDay 的核心應用棧明顯圍繞 GPT-5.5。GPT-5.5 於 4 月 23 日上線、24 日全面開放 API;同 4 月底 GPT-5.4
鏈新聞abmedia·5小時前

BioMysteryBench:Mythos 解專家無解題 29.6%

Anthropic 4 月 29 日於官方研究公告發表 BioMysteryBench—一套針對 AI 生物資訊分析能力的新評測基準,由真實研究情境中的開放式問題組成。最值得關注的數據是:在人類專家小組嘗試後仍無法解出的題目中,Anthropic 旗艦模型 Mythos 解出 29.6%、Opus 4.7 解出 27.0%。 評測設計:可解題與專家無解題雙軌 BioMysteryBench 由兩種題型組成。第一類是「可解題」—由生物資訊研究人員設計、有標準答案可對照的分析任務;第二類是「專家無解題」—由人類專家小組嘗試後仍無法找出可信解答的題目,用來測試模型是否能跨越目前領域知識的邊界。
鏈新聞abmedia·5小時前