D’après la surveillance de 1M AI News, un modèle anonyme nommé HappyHorse-1.0 a pris la première place la semaine dernière sur la plateforme d’évaluation vidéo d’IA Artificial Analysis, dans le classement Video Arena. Il a remporté simultanément la première place sur les deux filières (catégories sans audio) : génération de vidéos à partir de texte et génération de vidéos à partir d’images. Il a ainsi évincé Seedance 2.0, qui a été classé deuxième. Dans les catégories avec audio, Seedance 2.0 reste néanmoins en tête avec un léger avantage. Aucune conférence de presse, aucun blog technique, aucune mention de l’entreprise. À ce jour, personne ne l’a publiquement revendiqué.
Le classement de Video Arena repose sur un système de tests à l’aveugle basé sur Elo : les utilisateurs votent pour la meilleure de deux vidéos générées sans connaître l’identité du modèle. La durée de présence de HappyHorse dans le classement est relativement courte : l’échantillon compte environ 3500 tests, soit moins de la moitié de celui de Seedance 2.0. L’intervalle de confiance est donc plus large (±12-13 points). Cependant, l’avance de HappyHorse sur la filière sans audio (environ 76 points pour la génération de vidéos à partir de texte, et environ 48 points pour la génération de vidéos à partir d’images) demeure très supérieure à la marge d’erreur.
D’après l’ordre des langues sur le site officiel (le chinois et le cantonais avant l’anglais) et le mème « HappyHorse » associé à l’année 2026 du cheval, les acteurs du secteur estiment que le modèle provient d’une équipe chinoise. Deux explications principales :
Le site officiel de HappyHorse indique que le modèle compte 15 milliards de paramètres, 40 couches de Transformer avec attention, et utilise une architecture Transfusion (qui traite de manière unifiée dans le même modèle la prédiction auto-régressive du texte et la génération par diffusion des vidéos et de l’audio). Il effectue l’inférence en 8 étapes, produit des vidéos en 1080p avec audio synchronisé, prend en charge la synchronisation des lèvres dans sept langues (chinois, anglais, japonais, coréen, allemand, français et cantonais), est entièrement open source et autorise un usage commercial.