Alpamayo de Nvidia : Le modèle d'IA qui dote les véhicules autonomes de capacités de raisonnement logique

L’évolution du raisonnement autonome dans les machines intelligentes

Nvidia a introduit une avancée significative en intelligence artificielle avec Alpamayo, un ensemble complet de modèles open source, plateformes d’émulation et bases de données spécialisées. L’objectif principal est de renforcer les systèmes de conduite autonome avec des capacités d’analyse et de prise de décision similaires au raisonnement humain, permettant aux véhicules de naviguer dans des situations inattendues avec plus de sécurité et d’autonomie.

Selon Jensen Huang, PDG de Nvidia : « Nous sommes à un point de bascule pour l’IA physique : les systèmes intelligents commencent à traiter, évaluer et interagir de manière plus sophistiquée avec leur environnement. » La capacité d’interpréter des événements atypiques, d’opérer dans des contextes complexes et de justifier des décisions représente une avancée qualitative dans la technologie des véhicules autonomes.

Alpamayo 1 : Le moteur de raisonnement avec 10 milliards de paramètres

Le cœur de cette initiative est Alpamayo 1, un modèle d’action visuelle et linguistique (VLA) qui intègre dix milliards de paramètres dans son architecture. Ce système est optimisé pour traiter les problèmes étape par étape, en évaluant plusieurs scénarios possibles et en sélectionnant la trajectoire la plus sûre, même dans des intersections de ensembles complexes où convergent plusieurs conditions de risque.

Ali Kani, dirigeant de la division automobile de Nvidia, souligne que le modèle gère des situations sans précédent dans son expérience d’entraînement, comme faire fonctionner un véhicule face à des feux de signalisation défectueux dans des croisements congestionnés. L’architecture permet à la machine de raisonner sur des scénarios anormaux via un processus d’analyse séquentielle similaire à la pensée humaine.

Infrastructure ouverte pour les développeurs et la personnalisation

Le code source d’Alpamayo 1 est disponible publiquement sur la plateforme Hugging Face, permettant aux développeurs d’adapter le modèle à des besoins spécifiques. Cette ouverture facilite la création de versions optimisées pour des applications automobiles particulières, des simplifications pour des systèmes moins complexes, et des outils auxiliaires comme l’annotation automatique de vidéos et des systèmes d’évaluation des décisions.

La synergie avec Cosmos, les modèles génératifs de mondes de Nvidia, multiplie les capacités de développement. En fusionnant des données synthétiques produites par Cosmos avec des enregistrements du monde réel, les équipes techniques peuvent entraîner et valider des systèmes autonomes de manière plus robuste et efficace. Cosmos génère des simulations numériques d’espaces physiques, permettant aux algorithmes de prévoir des conséquences et d’exécuter des actions anticipées.

Ressources massives pour la validation et le test des systèmes

En complément d’Alpamayo, Nvidia distribue un ensemble de données open source contenant plus de 1 700 heures de matériel de conduite enregistré dans plusieurs localisations et conditions météorologiques adverses. Ces données incluent des événements réels exceptionnels et des scénarios de haute complexité.

Parallèlement, la plateforme AlpaSim, une plateforme de simulation open source hébergée sur GitHub, est lancée. AlpaSim reproduit fidèlement des environnements de conduite réels, depuis les signaux des capteurs jusqu’aux dynamiques de flux de véhicules, permettant des validations exhaustives de systèmes autonomes dans des environnements contrôlés et évolutifs. Cet outil comble le fossé entre le développement en laboratoire et la mise en œuvre sur les routes.

L’impact sur la chaîne de valeur de la mobilité autonome

La combinaison d’Alpamayo 1, Cosmos et AlpaSim forme un écosystème technique qui accélère la maturation des véhicules autonomes commerciaux. Les développeurs disposent d’une infrastructure professionnelle, de données de qualité et de modèles de raisonnement avancés, éléments cruciaux pour surmonter les défis de sécurité et d’opérabilité qui persistent dans l’industrie. L’ouverture du code et des données publiques démocratise l’accès à une technologie de pointe, stimulant l’innovation décentralisée et réduisant les barrières à l’entrée pour les équipes de recherche en conduite autonome.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)