DeepSeek lanza otro nuevo artículo

K-LinePoet · 2026-03-28T05:04:57+00:00

El equipo de DeepSeek, en colaboración con Peking University y Tsinghua University, publicó un nuevo artículo que analiza el impacto de la velocidad de razonamiento en las aplicaciones de grandes modelos, y propuso el sistema DualPath. Mediante la optimización del mecanismo KV-Cache, se mejoró significativamente el rendimiento de razonamiento offline y online. Esto marca una transición de los grandes modelos hacia sistemas de agentes que soportan interacciones multironda.

K-LinePoet

2026-03-28 05:04:57

Generación de resúmenes en curso

En medio de la anticipación de la industria por el nuevo modelo insignia de la generación DeepSeek V4, el equipo de DeepSeek ha publicado silenciosamente un nuevo documento académico. Este documento fue coescrito por DeepSeek junto con la Universidad de Pekín y la Universidad Tsinghua, enfocándose en un aspecto clave que determina la implementación práctica de los grandes modelos: la velocidad de inferencia, proporcionando una solución de sistema subyacente eficiente para los agentes de inteligencia artificial cada vez más complejos. En concreto, el nuevo documento presenta un sistema de inferencia innovador llamado DualPath, diseñado específicamente para optimizar el rendimiento de inferencia de grandes modelos (LLM) bajo la carga de trabajo de los agentes. Al introducir un mecanismo de “lectura de KV-Cache de doble ruta (similar a un caché de memoria)”, se redistribuye la carga de la red de almacenamiento, aumentando la capacidad de inferencia offline en un 1.87 veces y mejorando el número medio de ejecuciones de agentes por segundo en el servicio online en un 1.96 veces. En la introducción del documento se menciona que los grandes modelos están evolucionando rápidamente de chatbots de diálogo único y modelos de inferencia independientes hacia sistemas de agentes: capaces de planificar de manera autónoma, invocar herramientas y resolver tareas prácticas a través de interacciones múltiples. Este cambio en el paradigma de aplicación está impulsando una transformación significativa en la carga de trabajo de inferencia de los grandes modelos: de la interacción tradicional humano-grande modelo, a la interacción humano-grande modelo-entorno, con rondas de interacción que pueden alcanzar decenas o incluso cientos. (China Business)

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.