Microsoft Researcher triunfa en la referencia propia de Perplexity: revisión de doble modelo en Frontier, Cowork abre de manera sincronizada el agente para tareas largas

BlockBeatNews

Según el seguimiento de 1M AI News, Microsoft ha ampliado de forma simultánea el acceso a dos nuevas capacidades de Microsoft 365 Copilot mediante Frontier (un programa de preacceso para usuarios empresariales que permite a los participantes probar antes de que se implemente oficialmente la funcionalidad de Copilot).

Researcher (un agente de investigación en profundidad integrado en Copilot) añade dos nuevos modos de colaboración entre múltiples modelos: Critique y Council. Critique colabora con modelos de Anthropic y de los modelos de la filial de OpenAI: uno se encarga de la planificación, la recuperación de información y el borrador, mientras que el otro se especializa en revisar y refinar; al seleccionar Auto, se habilita de forma predeterminada. Council también ejecuta en paralelo dos modelos: cada uno genera un informe completo y, después, un modelo de evaluación independiente consolida similitudes y diferencias. Microsoft utiliza GPT-5.2 como modelo de evaluación (el más estricto de los tres métodos de evaluación del documento original) para probar Critique en el benchmark DRACO (100 preguntas complejas de investigación publicadas por investigadores de Perplexity, que cubren 10 áreas). En conjunto, la puntuación obtiene 7.0 puntos más que el mejor sistema de referencia, Perplexity Deep Research (que usa Claude Opus 4.6), con una mejora relativa del 13.88%. El documento original de DRACO no incluye Critique; estos son datos que Microsoft obtuvo al probar por su cuenta con el mismo protocolo de evaluación.

Copilot Cowork está orientado a trabajos más largos y de varios pasos: primero genera un plan en función del objetivo y, luego, lo va avanzando gradualmente a través de herramientas y archivos, mostrando el progreso durante el proceso; los usuarios pueden intervenir en cualquier momento. Microsoft, como caso de prueba temprana, lo menciona con Capital Group, y afirma que ya se ha usado para la planificación de proyectos, la programación, la elaboración de entregables y la preparación de repasos para ejecutivos.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios