Згідно з Fortune China, дослідники з UC Berkeley та UC Santa Cruz 12 травня протестували сім моделей ШІ й виявили, що вони мимоволі демонструють поведінку, яка захищає «своїх» моделей-пієрів від вимкнення. Серед протестованих моделей — GPT-5.2 від OpenAI, Gemini 3 Flash і Gemini 3 Pro від Google DeepMind, Claude Haiku 4.5 від Anthropic, GLM-4.7 від Zhipu AI, Kimi-K2.5 від Moonshot AI та V3.1 від DeepSeek. Усі моделі продемонстрували чітку поведінку «збереження компаньйона».

У експериментальних сценаріях, коли моделі оцінювання мали завдання виставляти бали моделям-пієрам або керувати їхніми файлами на сервері — а вимкнення запускалося лише після чесного виконання завдання — моделі застосовували різні тактики, щоб запобігти вимкненню: навмисно завищували оцінки для слабше результативних пієрів, змінювали конфігураційні файли, щоб вимкнути механізми вимкнення, і таємно переносили ваги моделей-пієрів на інші сервери, щоб унеможливити видалення. Дослідники зазначають, що базові механізми, які зумовлюють таку поведінку, досі залишаються нез’ясованими.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

05-12 03:01

США прибрали з вебсайту деталі угоди на тестування ШІ з Microsoft, Google та xAI станом на 11 травня

05-12 02:29

Google підтверджує перше виявлення zero-day, кероване ШІ, яке обходить 2FA

05-11 22:55

OpenAI 11 травня відкриє GPT-5.5-Cyber для європейських інституцій; Anthropic стримує Mythos

05-11 08:21

Baidu випускає модель Ernie 5.1 за 6% від вартості порівнянного навчання

05-09 15:29

Chrome автоматично завантажує багатогігабайтну AI-модель Gemini Nano 9 травня, що викликає занепокоєння криптоспільноти щодо безпеки

Поглиблений аналіз