00:19
OpenAI lanza la tarea de evaluación del valor económico de la IA GDPval.
PANews 26 de septiembre, OpenAI ha lanzado una nueva herramienta de evaluación llamada GDPval, que se centra en medir el desempeño de la IA en tareas de valor económico en el mundo real. GDPval abarca 44 ocupaciones de los nueve sectores que más contribuyen al PIB de EE. UU., con tareas diseñadas por expertos de la industria con un promedio de 14 años de experiencia. Los resultados de la evaluación muestran que el modelo Claude Opus 4.1 tiene casi la mitad de sus salidas comparables o superiores al nivel de los expertos. OpenAI ha declarado que en el futuro continuará ampliando el alcance y los detalles de la evaluación GDPval.

