00:19
OpenAI, AI ekonomik değer görevinin GDPval değerlendirmesini yayınladı.
PANews 26 Eylül'de, OpenAI yeni değerlendirme aracı GDPval'ı tanıttı; bu araç, AI'nın gerçek dünya ekonomik değer görevlerindeki performansını ölçmeye odaklanıyor. GDPval, ABD'nin GSYİH katkısının en büyük olduğu dokuz sektördeki 44 mesleği kapsıyor ve görevler, ortalama 14 yıllık deneyime sahip sektör uzmanları tarafından tasarlandı. Değerlendirme sonuçları, Claude Opus 4.1 modelinin neredeyse yarı çıktısının uzman seviyesine denk veya daha iyi olduğunu gösteriyor. OpenAI, gelecekte GDPval değerlendirme kapsamını ve detaylarını sürekli olarak genişleteceğini belirtti.

