Le site Web de Coinjie a annoncé que l'équipe PAI d'Alibaba a publié et open-sourcé un petit modèle de langage intelligent conçu spécifiquement pour l'appel d'outils industriels, nommé AgenticQwen (comprenant deux versions, 8B et 30B-a3b).


Cette série de modèles est entraînée via un cadre d'apprentissage par renforcement innovant appelé « double volant d'inertie de données », qui réduit considérablement le coût de l'inférence tout en réalisant des capacités d'agent proches de celles des modèles de grande taille de près de mille milliards de paramètres.
Les évaluations montrent que AgenticQwen-8B obtient une moyenne de 47,4 points dans des benchmarks d'environnement d'outils réels (tels que tau-2 et bfcl-v4), dépassant largement la version de base Qwen3-8B (23,8), et se rapprochant de Qwen3-235B (52,0).
Actuellement, ce modèle a été déployé dans des systèmes de production internes similaires à manus, réduisant considérablement l'écart avec le grand modèle de 235B.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler