Evaluaciones independientes muestran que MiniMax M2.7 es comparable a los modelos líderes cerrados en tareas de agentes inteligentes centrales

robot
Generación de resúmenes en curso

Noticias de ME: mensaje, 5 de abril (UTC+8). Recientemente, según una evaluación independiente de LangChain, el modelo de pesos abiertos MiniMax M2.7 ha alcanzado un nivel comparable al de los modelos punteros de código cerrado en tareas fundamentales de agentes como operaciones con archivos, llamadas a herramientas y seguimiento de instrucciones. El artículo sostiene que su ventaja radica en que reduce los costos de manera significativa, aproximadamente 20 veces, y aumenta la velocidad entre 2 y 4 veces. Tomando como ejemplo una producción diaria de 10 millones de tokens, el costo de usar Opus 4.6 es de aproximadamente 250 dólares por día, mientras que MiniMax M2.7 solo requiere alrededor de 12 dólares por día. Este avance se debe al impulso de benchmarks abiertos como SWE-Rebench y Terminal Bench 2.0, lo que hace que los modelos abiertos se conviertan en una opción viable para implementar agentes en entornos de producción y también puedan usarse en coordinación con modelos de código cerrado. (Fuente: InFoQ)

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado