2025-12-23 07:21:04

Grok 4.1 de xAI élève la barre pour les performances des modèles basés sur RAG dans plusieurs domaines. Les dernières références racontent une histoire intéressante : lorsqu'il s'agit de tâches de codage, Grok obtient 86, prenant la première place. Dans les applications spécifiques à la finance, il pousse encore plus fort avec un score de 93,0, établissant un avantage concurrentiel clair. En analyse juridique, il tient son rang face aux alternatives leading.

Ce qui rend cela particulièrement pertinent, c'est la façon dont ces chiffres se traduisent en utilisation dans le monde réel. Des documents complexes et longs—le genre qui pose généralement des défis à la plupart des systèmes—semblent être traités avec une cohérence mesurable. Cela positionne Grok non pas seulement comme un autre acteur dans le domaine de l'IA, mais comme une option significative pour les utilisateurs qui ont besoin d'une performance fiable lors du traitement de charges de travail d'informations complexes.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

12 J'aime

Récompense
12
3
Reposter
Partager

Commentaire

0/400

MoneyBurnerSociety

· 2025-12-23 07:44

Financier 93.0... Mon taux de défaite en Arbitrage Algorithme est aussi ce chiffre, mais dans la direction opposée. Grok est vraiment incroyable, mes smart contracts ne peuvent pas rivaliser.

Voir l'originalRépondre0

MEVvictim

· 2025-12-23 07:40

Financier 93.0 ? Ce score est un peu fou, il faut voir si ça fonctionne vraiment. Je fais confiance à Grok pour ses performances sur des documents complexes, mais j'ai peur que ce ne soit que des données théoriques. Le codage 86 en premier... Mais tous ces benchmarks sont fictifs, c'est en pratique que ça compte. Le domaine juridique peut-il rivaliser ? J'ai l'impression que cette fois, xAI est sérieux. Les chiffres sont jolis, mais le problème est de savoir s'ils peuvent traiter des longs documents de manière stable, c'est ça le plus important. Le modèle RAG est devenu tellement compétitif, qui est vraiment un outil de productivité ?

Voir l'originalRépondre0

SnapshotStriker

· 2025-12-23 07:37

Financier 93 points ? Ce chiffre est un peu sévère, mais en réalité, à quel point cela peut-il être utilisé... --- Codage 86 premier, financier 93... les données sur papier sont toujours aussi belles, mais le vrai problème est de savoir si ça fonctionne de manière stable. --- La capacité de traitement des longs fichiers est effectivement un point sensible, mais il faut vraiment essayer Grok pour croire qu'il peut faire cela. --- Une pile de chiffres de benchmark arrive, mais je veux juste savoir si cette chose peut remplacer l'outil que j'utilise actuellement. --- Un score de 93 pour les applications financières semble impressionnant, mais le secteur financier a un seuil d'entrée élevé, la stabilité est beaucoup plus importante que le score, non ? --- Oh donc cela signifie que Grok a quelque chose pour le traitement de fichiers complexes, mais à quel prix cela peut-il être proposé ? --- Codage, finance, droit également ? Est-ce que cela doit être polyvalent ou juste une compétence dans chaque domaine ?

Voir l'originalRépondre0