00:19
OpenAI випустила оцінку GDPval для оцінки виконання завдань економічної вартості ШІ
PANews 26 вересня повідомляє, що OpenAI запустила новий інструмент оцінки GDPval, який зосереджений на вимірюванні продуктивності AI у завданнях, що мають економічну цінність у реальному світі. GDPval охоплює 44 професії дев'яти найбільших галузей, що вносять найбільший внесок у ВВП США, завдання були розроблені експертами галузі з середнім досвідом роботи 14 років. Результати оцінювання показують, що модель Claude Opus 4.1 демонструє близько половини своїх виходів на рівні експертів або навіть краще. OpenAI повідомила, що в майбутньому буде продовжувати розширювати обсяг і деталі оцінки GDPval.

