Wenxiu AI, modèle LLM open source 'Kimi-K2.6' publié… Comparaison directe avec GPT-5.4

robot
Création du résumé en cours

La startup chinoise d’intelligence artificielle Moonshot AI a dévoilé son dernier modèle de langage open source de grande taille (LLM) « Kimi-K2.6 ». La société indique que ce modèle dépasse ou est légèrement en retard par rapport à GPT-5.4 et Claude Opus 4.6 dans les principaux benchmarks d’intelligence artificielle.

Kimi-K2.6 est la dernière création de la série « Kimi » de Moonshot AI. Ce modèle est conçu pour traiter non seulement du texte, mais aussi des entrées multimédia telles que des images. Moonshot AI précise qu’il se concentre particulièrement sur l’efficacité et la capacité à exécuter des tâches pratiques. Cela signifie non seulement une amélioration de la qualité des réponses, mais aussi une optimisation de la structure pour permettre d’utiliser les mêmes ressources de calcul pour réaliser des tâches plus complexes.

Une architecture permettant d’améliorer la performance avec moins de ressources est essentielle

Kimi-K2.6 utilise une fonction d’activation appelée « Swiglu ». Il s’agit d’une structure qui, par rapport aux méthodes traditionnelles, améliore l’efficacité de l’utilisation du matériel et simplifie partiellement le processus d’entraînement du modèle. Cette méthode a également été appliquée à plusieurs modèles open source, notamment la série Llama de Meta Platforms.

Le modèle déploie 384 « experts » réseau. Mais tous ces réseaux ne sont pas activés à chaque question posée par l’utilisateur. Lors de la génération de la réponse, seuls 8 experts sont sélectionnés de manière conditionnelle. Cette approche de « mélange d’experts » n’active que la partie nécessaire, ce qui contribue à réduire la charge de calcul et l’infrastructure requise.

De plus, il intègre la technologie de « l’attention potentielle multi-tête ». Il s’agit d’un mécanisme d’attention qui permet de filtrer plus efficacement les informations importantes à partir des prompts. En compressant les données en une forme mathématique plus légère, cette méthode nécessite moins de ressources matérielles comparée à une structure d’attention classique.

Fonctionnalités améliorées pour la compréhension d’images et la collaboration avec des agents intelligents

Kimi-K2.6 est également équipé d’un encodeur visuel de 4 milliards de paramètres. Cet appareil convertit les images en une « embedding » compréhensible par le modèle. Grâce à cela, Kimi-K2.6 peut non seulement traiter des entrées textuelles, mais aussi travailler avec des croquis ou des données visuelles.

Selon Moonshot AI, ce modèle peut générer un site web complet à partir d’instructions simples de l’utilisateur et d’esquisses d’interface. Pour des tâches plus complexes et chronophages, jusqu’à 300 agents intelligents peuvent travailler simultanément. Cette méthode consiste à décomposer la tâche en sous-étapes et à les traiter en parallèle, ce qui accélère le processus par rapport à une exécution séquentielle.

De plus, grâce à la fonction de « collaboration en groupe », il est possible de concevoir des flux de travail où humains et agents intelligents travaillent ensemble. Moonshot AI explique que cela permet d’attribuer des tâches à la fois à des travailleurs humains et à des intelligences artificielles dans un même projet. La société ajoute qu’en comparaison avec ses versions précédentes, ses performances dans des tâches de programmation difficiles comme le développement en Rust ont également été améliorées.

Affirmation de la supériorité sur le benchmark difficile HLE-Full face à GPT-5.4

Moonshot AI indique avoir comparé Kimi-K2.6 à GPT-5.4 et Claude Opus 4.6 dans plus de 20 benchmarks principaux. Selon la société, le nouveau modèle dépasse ces deux modèles de pointe dans plusieurs tests, ou voit la différence de score se réduire à quelques points de pourcentage.

Particulièrement dans l’un des évaluations les plus strictes, « HLE-Full », Kimi-K2.6 a obtenu 54 points. Ce benchmark comprend plus de 2 500 questions de niveau doctorat couvrant plus de 100 disciplines académiques. Moonshot AI affirme que, dans le même test, Claude Opus 4.6 a obtenu 53 points, et GPT-5.4 52,1 points.

Cette annonce montre que la compétition dans le domaine de l’intelligence artificielle open source devient de plus en plus intense. Bien que les modèles de haut niveau en mode fermé dominent encore le marché, l’augmentation de modèles open source comme Kimi-K2.6, qui mettent l’accent à la fois sur l’efficacité et l’automatisation des tâches, élargit les choix pour les entreprises et les développeurs.

Remarques TP AI : Cet article est un résumé généré par le modèle linguistique TokenPost.ai. Le contenu principal peut être omis ou comporter des inexactitudes.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler