Estudo da USC: modelos de IA violam diretrizes de segurança social em mais de 27% do tempo
Pesquisadores da University of Southern California divulgaram um estudo que constatou que todo modelo de IA de fronteira testado violou diretrizes de segurança para interações sociais em mais de 27% das vezes. O estudo apresentou o EUDAIMONIA, um benchmark criado para medir dinâmicas indesejadas em conversas entre humanos e IA, avaliando 969 entradas de usuários e mais de 3.100 verificações de violações em modelos da OpenAI, Anthropic, Google, xAI, DeepSeek e Alibaba. Os pesquisadores identifica
2h atrás