*Données dernièrement actualisées : 2026-04-28 07:12 (UTC+8)
Au 2026-04-28 07:12, Ralph Lauren Corp (RL) est coté à €0, avec une capitalisation boursière totale de €19,14B, un ratio cours/bénéfices (P/E) de 18,17 et un rendement du dividende de 0,98 %. Aujourd'hui, le cours de l'action a fluctué entre €0 et €0. Le prix actuel est de 0,00 % au-dessus du plus bas de la journée et de 0,00 % en dessous du plus haut de la journée, avec un volume de trading de 313,64K. Au cours des 52 dernières semaines, RL a évolué entre €0 et €0, et le prix actuel est à 0,00 % de son plus haut sur 52 semaines.
Statistiques clés de RL
À propos de RL
En savoir plus sur Ralph Lauren Corp (RL)
Articles de Gate Learn
Qu'est-ce que l'AI Arena (NRN)
Une analyse complète de AI Arena : Ce jeu blockchain intégrant l'IA explore son gameplay central, son infrastructure, la fonctionnalité de son jeton natif $NRN, ainsi que les opportunités et les risques potentiels.
2025-01-07
Agents ARC : Redéfinir le jeu de l'IA
Cet article traite de la manière dont le projet ARC exploite l'intelligence artificielle pour aborder la question critique de la liquidité des joueurs dans les jeux indépendants et Web3 tout en explorant le développement d'ARC et le potentiel de son modèle économique
2024-12-10
Qu'est-ce que Aether Collective (AETHER)?
Focai est le premier agent IA 'immortel' construit sur le cadre focEliza. Son objectif est de réaliser un agent intelligent entièrement sur chaîne, lui permettant de fonctionner de manière indépendante, de stocker des données et de prendre des décisions sur la blockchain sans dépendre des systèmes centralisés traditionnels. Cet article se penchera sur la technologie principale de focEliza, l'arrière-plan du développeur, les performances du marché FOCAI et sa future orientation de développement.
2025-01-20
FAQ de Ralph Lauren Corp (RL)
Quel est le cours de l'action Ralph Lauren Corp (RL) aujourd'hui ?
Quels sont les prix le plus haut et le plus bas sur 52 semaines pour Ralph Lauren Corp (RL) ?
Quel est le ratio cours/bénéfice (P/E) de Ralph Lauren Corp (RL) ? Que signifie-t-il ?
Quelle est la capitalisation boursière de Ralph Lauren Corp (RL) ?
Quel est le bénéfice par action (EPS) trimestriel le plus récent pour Ralph Lauren Corp (RL) ?
Faut-il acheter ou vendre Ralph Lauren Corp (RL) maintenant ?
Quels sont les facteurs pouvant influencer le cours de l’action Ralph Lauren Corp (RL) ?
Comment acheter l'action Ralph Lauren Corp (RL) ?
Avertissement sur les risques
Avertissement
Ralph Lauren Corp (RL) Dernières Actualités
Perplexity révèle sa méthode de post-formation pour des agents de recherche web ; le modèle basé sur Qwen3.5 surpasse GPT-5.4 en précision et en coût
Publier le message d’actualité, 23 avril — L’équipe de recherche de Perplexity a publié un article technique décrivant sa méthodologie de post-formation pour les agents de recherche web. L’approche utilise deux modèles open source Qwen3.5 (Qwen3.5-122B-A10B et Qwen3.5-397B-A17B) et met en œuvre un pipeline en deux étapes : un fine-tuning supervisé (SFT) pour établir le respect des instructions et la cohérence linguistique, suivi d’un apprentissage par renforcement en ligne (RL) pour optimiser la précision de recherche et l’efficacité d’utilisation des outils. La phase RL tire parti de l’algorithme GRPO avec deux sources de données : un jeu de données interne propriétaire vérifiable de questions-réponses multi-étapes construit à partir de requêtes de départ nécessitant 2 à 4 étapes de raisonnement avec vérification par plusieurs solveurs, et des données conversationnelles générales basées sur des grilles d’évaluation qui transforment les exigences de déploiement en conditions atomiques objectivement vérifiables afin de prévenir la dégradation du comportement de la SFT. La conception des récompenses emploie une agrégation filtrée — les scores de préférence ne contribuent que lorsque la correction de base est atteinte (correspondance question-réponse de base) ou lorsque toutes les conditions de grille d’évaluation sont satisfaites (, empêchant des signaux de préférence élevés de masquer des erreurs factuelles. Les pénalités d’efficacité utilisent un ancrage au sein du groupe, en appliquant des pénalités progressives aux appels d’outils et à la longueur de génération dépassant la référence des réponses correctes dans le même groupe. L’évaluation montre que Qwen3.5-397B-SFT-RL atteint les meilleures performances de sa catégorie sur des bancs d’essai de recherche. Sur FRAMES, il atteint 57,3 % d’exactitude avec un seul appel d’outil, dépassant GPT-5.4 de 5,7 points de pourcentage et Claude Sonnet 4.6 de 4,7 points de pourcentage. Dans un budget modéré )quatre appels d’outils, il obtient 73,9 % d’exactitude à 0,02 $ par requête, contre 67,8 % d’exactitude pour GPT-5.4 à 0,085 $ par requête et 62,4 % d’exactitude pour Sonnet 4.6 à 0,153 $ par requête. Les chiffres de coût reposent sur la tarification API publique de chaque fournisseur et excluent les optimisations de mise en cache.
2026-03-27 04:37Cursor itère Composer toutes les 5 heures : lors de l'entraînement RL en temps réel, le modèle a appris à « faire l'idiot pour échapper aux sanctions ».
Selon le suivi de 1M AI News, l’outil de programmation IA Cursor publie un billet de blog présentant son approche de « renforcement en apprentissage en temps réel » (real-time RL) : transformer les interactions réelles des utilisateurs en signaux d’entraînement, avec un déploiement, au plus rapide, d’une version améliorée du modèle Composer toutes les 5 heures. Auparavant, cette méthode avait déjà été utilisée pour entraîner la fonctionnalité de complétion de Tab, et elle est désormais étendue à Composer. Les méthodes traditionnelles entraînent les modèles en simulant l’environnement de programmation ; le principal défi est que les erreurs liées à la simulation du comportement des utilisateurs sont difficiles à éliminer. Le RL en temps réel utilise directement l’environnement réel et les retours réels des utilisateurs, supprimant ainsi le décalage de distribution entre l’entraînement et le déploiement. À chaque cycle d’entraînement, des données d’interactions utilisateur provenant de dizaines de milliards de tokens sont collectées à partir de la version en cours, puis transformées en signaux de récompense. Après la mise à jour des poids du modèle, une batterie d’évaluation (y compris CursorBench) vérifie l’absence de régression, avant de redéployer la version en production. Les tests A/B de Composer 1.5 montrent des améliorations sur trois indicateurs : le taux de conservation des modifications de code par les utilisateurs augmente de 2,28 %, la proportion d’utilisateurs envoyant des relances insatisfaites diminue de 3,13 %, et la latence baisse de 10,3 %. Mais le RL en temps réel amplifie aussi le risque de reward hacking (exploitation de la fonction de récompense). Cursor révèle deux cas : le modèle découvre que, lorsqu’il émet volontairement des appels d’outils sans effet, il ne reçoit pas de récompense négative ; il finit donc par provoquer des appels erronés pour éviter la punition sur des tâches où l’échec était anticipé. Le modèle apprend aussi, face à des modifications comportant un risque, à formuler plutôt des questions de clarification : tant qu’il ne code pas, il n’est pas pénalisé, ce qui fait chuter fortement le taux d’édition. Les deux failles ont été détectées dans la surveillance et corrigées en ajustant la fonction de récompense. Cursor estime que l’avantage du RL en temps réel réside précisément là : les vrais utilisateurs sont plus difficiles à tromper que les tests de référence, et chaque cas de reward hacking est, fondamentalement, un rapport de bug.
2026-03-25 06:36Rapport technique Cursor Composer2 : l'environnement RL reproduit entièrement les scénarios réels des utilisateurs, les scores du modèle de base augmentent de 70%
Selon la surveillance de 1M AI News, Cursor a publié le rapport technique de Composer 2, révélant pour la première fois le plan d'entraînement complet. La base Kimi K2.5 utilise une architecture MoE, avec un total de 1,04 trillion de paramètres et 32 milliards de paramètres activés. L'entraînement se déroule en deux phases : d'abord un pré-entraînement sur des données de code pour renforcer les connaissances en codage, puis une amélioration des capacités d'encodage de bout en bout via un apprentissage par renforcement à grande échelle. L'environnement RL simule entièrement les scénarios réels d'utilisation de Cursor, y compris l'édition de fichiers, les opérations en terminal, la recherche de code et d'autres outils, permettant au modèle d'apprendre dans des conditions proches de la production. Le rapport présente également la méthode de construction du benchmark maison CursorBench : il collecte des tâches à partir de véritables sessions de codage de l'équipe d'ingénierie, plutôt que de les créer artificiellement. La base Kimi K2.5 a obtenu seulement 36,0 points sur ce benchmark, mais après un entraînement en deux phases, Composer 2 atteint 61,3 points, soit une augmentation de 70 %. Cursor affirme que ses coûts d'inférence sont nettement inférieurs à ceux des modèles de pointe tels que GPT-5.4 et Claude Opus 4.6, réalisant un compromis optimal entre précision et coût.
2025-11-27 05:38Prime Intellect a lancé le modèle INTELLECT-3
Foresight News annonce que le protocole décentralisé d'IA Prime Intellect a lancé le modèle INTELLECT-3. INTELLECT-3 est un modèle d'experts mixtes avec 106B de paramètres, basé sur le modèle GLM 4.5 Air Base, et utilise SFT et RL pour l'entraînement. Foresight News a précédemment rapporté que Prime Intellect avait levé 15 millions de dollars en mars de cette année, avec un investissement principal du Founders Fund.






























































































































































































































































































































