Analyse du rapport de recherche sur les 100 000 milliards de tokens d’OpenRouter : À quoi les humains utilisent-ils réellement l’IA, l’essor des modèles chinois et les secrets de la rétention des utilisateurs

robot
Création du résumé en cours

Le rapport d’OpenRouter révèle que l’IA est entrée dans l’ère du raisonnement par agents, que les modèles open source chinois s’imposent sur le marché mondial grâce à leur capacité de jeu de rôle et de programmation, et partage des cas d’utilisation réels des utilisateurs.

(Contexte préalable : Cathie Wood affirme que « l’IA n’est pas une bulle » : elle est en train de répliquer l’explosion de richesse d’Internet) (Complément d’information : Google lance officiellement « Gemini 3 » ! Le modèle d’IA le plus intelligent du monde, quelles sont ses particularités ?)

La plateforme d’agrégation de modèles d’IA OpenRouter a publié cette semaine son rapport annuel de référence « État de l’IA 2025 ». Ce rapport ne repose pas sur des enquêtes ou le battage médiatique, mais sur une analyse empirique des données de 100 000 milliards (100 Trillion) de tokens générés sur la plateforme OpenRouter.

Ces données couvrent plus de 300 grands modèles de langage (LLM) issus de plus de 60 fournisseurs, offrant une perspective nouvelle pour comprendre « comment l’IA est réellement utilisée dans le monde réel ».

Changement de paradigme : du « mot suivant » au « raisonnement par agents »

Si la compétition IA avant 2024 portait sur la capacité à générer du texte de manière fluide, le thème de 2025 est désormais la « réflexion ». Le rapport indique que l’année écoulée marque un tournant décisif dans l’évolution des LLM.

o1 : L’avènement de l’ère du modèle de raisonnement

Le rapport définit le 5 décembre 2024 comme une date charnière pour l’industrie, marquée par le lancement par OpenAI du premier modèle de raisonnement largement adopté : o1. Avant cela, même les modèles les plus puissants (comme Claude 3.5 Sonnet ou GPT-4) restaient fondamentalement des prédicteurs probabilistes à passage unique, imitant le raisonnement à partir de schémas présents dans les données d’entraînement, sans véritable calcul interne.

L’apparition de o1 a tout changé. Ce modèle introduit un processus de calcul lors de l’inférence : avant de donner une réponse finale, il engage une délibération interne en plusieurs étapes, une planification latente et une auto-correction.

Preuves chiffrées : Selon les statistiques d’OpenRouter, depuis début 2025, la part des tokens utilisés par des « modèles optimisés pour le raisonnement » croît de façon exponentielle. Fin 2025, plus de 50 % de l’utilisation totale de tokens concerne ces modèles capables de réflexion. Cela signifie que les utilisateurs ne considèrent plus l’IA comme un simple chatbot, mais comme un « cerveau » capable de résoudre des problèmes logiques complexes.

L’essor des workflows par agents

Avec l’amélioration des capacités de raisonnement, le terme « workflow agent » devient un autre mot-clé essentiel. Les utilisateurs commencent à construire des systèmes d’automatisation complexes, dans lesquels les modèles ne se contentent plus de répondre, mais « agissent ».

Le rapport analyse spécifiquement les données d’« appels d’outils », c’est-à-dire la capacité des modèles d’IA à utiliser des outils externes (recherche web, exécution de code, requête de base de données…).

Tendance : L’utilisation des appels d’outils a augmenté de manière stable et significative tout au long de l’année 2025.

Paysage des modèles : Au départ, ce segment était dominé par le gpt-4o-mini d’OpenAI et la série Claude 3.5 d’Anthropic. Mais au second semestre, la concurrence s’intensifie : Gemini Flash de Google, Grok Code Fast de xAI et GLM 4.5 de Chine rattrapent rapidement leur retard dans l’utilisation d’outils, accélérant ainsi l’adoption de l’automatisation en entreprise.

Guerre open source vs propriétaire : l’ascension des modèles chinois

Concernant l’écosystème des modèles, le rapport montre un monde à deux vitesses : les modèles propriétaires dominent les revenus, mais les modèles open source (OSS) occupent des positions clés en innovation et dans certains domaines.

Les modèles propriétaires restent majoritaires, mais l’open source progresse

Bien que les modèles propriétaires (comme GPT-5, Claude 4.5) représentent encore environ 70 % de la consommation totale de tokens, la part de marché des modèles open source a connu une croissance fulgurante l’année passée, atteignant près de 30 %.

Cela indique que développeurs et entreprises cherchent de plus en plus un équilibre entre contrôle, confidentialité et coût, et que les modèles open source de haute qualité offrent cette option.

La domination des modèles open source chinois

Le rapport met en évidence une découverte marquante : les modèles open source développés en Chine sont devenus le pilier de l’écosystème open source mondial.

Acteurs clés : Les séries Qwen d’Alibaba, DeepSeek et Kimi de Moonshot AI occupent une part très importante du volume d’appels mondiaux sur OpenRouter.

Avantage compétitif : Selon le rapport, la montée en puissance des modèles chinois s’explique principalement par leurs « cycles d’itération très courts » et leur « qualité de modèle extrêmement compétitive ». Par exemple, Qwen 2.5 Coder rivalise avec de nombreux modèles propriétaires dans le domaine de la programmation.

Positionnement unique : Les données montrent que les modèles open source chinois appliquent moins de filtres de contenu (comparé à la rigueur des garde-fous occidentaux), ce qui les rend très populaires à l’échelle mondiale pour l’écriture créative, le jeu de rôle et la génération de récits.

Évolution « en M » de la taille des modèles

Le marché open source connaît également des évolutions structurelles intéressantes :

Déclin des petits modèles : Malgré le lancement par Google de petits modèles comme Gemma, leur utilisation globale diminue. Les utilisateurs constatent que la capacité intellectuelle des petits modèles limite leur utilisation pour les tâches complexes.

L’âge d’or des modèles intermédiaires : Les modèles d’environ 32B de paramètres sont devenus le « sweet spot ». Représentés par Qwen 2.5 Coder 32B, ils offrent un équilibre parfait entre performance et coût de raisonnement, atteignant une véritable « adéquation modèle-marché ».

Diversification des grands modèles : Dans la gamme 70B à 200B+ de paramètres, le marché n’est pas monopolisé par un seul modèle, mais reste très concurrentiel (avec par exemple la série Llama 3, Qwen 72B, etc.), les utilisateurs choisissant le modèle adapté à chaque tâche.

Cas d’usage réels : que font réellement les humains avec l’IA ?

C’est sans doute la partie la plus éclairante du rapport. Grâce au système de classification GoogleTagClassifier d’OpenRouter, l’équipe a analysé des milliards de requêtes. Les résultats battent en brèche de nombreux stéréotypes sur l’IA principalement dédiée à la productivité professionnelle.

Jeu de rôle

Les données montrent que les jeux de rôle constituent la catégorie la plus importante d’utilisation des modèles open source, avec plus de 60 %.

Phénomène : De nombreux utilisateurs emploient l’IA pour des dialogues avec des personnages virtuels, la création de romans interactifs et des expériences de jeu immersives. Il ne s’agit pas d’une niche, mais d’un marché de masse à forte demande.

Facteurs moteurs : Les utilisateurs préfèrent les modèles open source pour le jeu de rôle principalement parce qu’ils sont soumis à moins de restrictions de modération (notamment pour les modèles non américains), offrant des interactions plus riches et moins contraintes.

Valeur commerciale : Ces utilisateurs font preuve d’une fidélité remarquable, bâtissant des liens émotionnels solides et des habitudes d’utilisation autour de modèles spécifiques.

Programmation

Vient ensuite la catégorie programmation, également l’une des plus dynamiques en croissance. …

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)