Résumé : Selon le rapport du “Kechuangban Daily” du 11 juillet, Jiang Guangzhi, secrétaire du groupe du parti et directeur du Bureau économique et d’information de Pékin, a déclaré dans une interview avec des journalistes que le Bureau économique et d’information de Pékin augmentera l’offre de puissance de calcul à moyen et long terme. Accélérer la construction de projets clés tels que la puissance de calcul public de l’intelligence artificielle de Pékin dans le district de Haidian, le centre de puissance de calcul de l’économie numérique de Pékin dans le district de Chaoyang, former une alimentation électrique dès que possible et améliorer le système d’alimentation électrique de Pékin. Jiang Guangzhi a également souligné que Pékin prendra des scénarios comme traction et application comme orientation, ouvrira des scénarios plus typiques, promouvra l’application industrielle de modèles à grande échelle, lancera de manière itérative des résultats d’application de modèles à grande échelle sur une base trimestrielle et formera un ensemble de modèles typiques d’intégration profonde de l’intelligence artificielle et du développement économique et social.
Source de l’image : générée par l’outil d’IA illimitée
Selon le rapport de 36 Krypton du 11 juillet, Baichuan Intelligence a officiellement publié un grand modèle de langage à usage général Baichuan-13B-Base avec un volume de paramètres de 13 milliards, un modèle de dialogue Baichuan-13B-Chat et deux versions quantifiées de INT4/INT8. Selon les rapports, le modèle à grande échelle chinois et anglais Baichuan-13B intègre des performances élevées, une source ouverte complète et une utilisation commerciale gratuite.
Selon un rapport d’IT House du 11 juillet, Microsoft a récemment lancé le Composable Diffusion Model (CoDi), un modèle d’IA unique basé sur Composable Diffusion, conçu pour interagir et générer du contenu multimodal.
Microsoft a conçu CoDi dans le but de répondre aux limites des modèles d’IA unimodaux traditionnels. En prenant la vidéo et l’audio synchronisés comme exemple, il peut y avoir des incohérences et des problèmes d’alignement lors de la fusion de flux d’informations générés indépendamment. CoDi utilise une stratégie de génération composable unique pour aligner les multimodalités pendant la diffusion afin de générer des modalités entrelacées, et CoDi est capable de traiter des modalités d’entrée arbitraires et de générer du contenu de modalités arbitraires. Il est rapporté que CoDi a été développé par l’équipe de recherche sur les services cognitifs Microsoft Azure en coopération avec l’Université de Caroline du Nord à Chapel Hill, et fait également partie du projet i-Code de Microsoft, qui utilise l’intelligence artificielle pour améliorer l’interaction homme-ordinateur.
Selon un rapport du 11 juillet du Science and Technology Innovation Board Daily, Jiang Guangzhi, secrétaire du groupe du parti et directeur du Bureau de l’économie et des technologies de l’information de Pékin, a déclaré dans une interview avec des journalistes que le Bureau de l’économie et de l’information de Pékin améliorera sa capacité d’alimentation de calcul à moyen et long terme au niveau de l’alimentation de calcul. Accélérer la construction de projets clés tels que la puissance de calcul public de l’intelligence artificielle de Pékin dans le district de Haidian, le centre de puissance de calcul de l’économie numérique de Pékin dans le district de Chaoyang, former une alimentation électrique dès que possible et améliorer le système d’alimentation électrique de Pékin. Jiang Guangzhi a également souligné que Pékin prendra des scénarios comme traction et application comme orientation, ouvrira des scénarios plus typiques, promouvra l’application industrielle de modèles à grande échelle, lancera de manière itérative des résultats d’application de modèles à grande échelle sur une base trimestrielle et formera un ensemble de modèles typiques d’intégration profonde de l’intelligence artificielle et du développement économique et social.
Selon le rapport de Jinshi du 11 juillet, l’équipe dirigée par le scientifique en intelligence artificielle Li Feifei a récemment publié la dernière réalisation de l’intelligence incarnée : un grand modèle est connecté au robot et des instructions complexes sont converties en plans d’action spécifiques. Les humains peuvent utiliser librement le langage naturel. pour donner des instructions aux robots Instructions, le robot n’a pas besoin de données et de formation supplémentaires. L’équipe de Li Feifei a nommé le système VoxPoser. Par rapport à la méthode traditionnelle, une pré-formation supplémentaire est nécessaire. Cette méthode utilise un grand modèle pour guider le robot sur la manière d’interagir avec l’environnement, ce qui résout directement le problème de la rareté des données d’entraînement du robot. .
Selon un rapport de The Decoder du 11 juillet, le géant allemand des médias Axel Springer a annoncé la création d’une équipe mondiale d’intelligence artificielle générative, qui accélérera le développement de son travail sur l’intelligence artificielle. Il est rapporté que l’équipe, dirigée par Niddal Salah-Eldin et Samir Fadlallah, se concentrera sur les études de produits et de marché, et développera des partenariats stratégiques avec des entreprises technologiques et des start-ups axées sur l’intelligence artificielle.
L’équipe de recherche Microsoft Azure et les chercheurs de l’Université de Caroline du Nord ont publié un article intitulé « Génération arbitraire par diffusion composable », présentant un nouveau modèle de génération multimodale - CoDi (Composable Diffusion). CoDi est capable de générer n’importe quelle combinaison de modalités de sortie à partir de n’importe quelle combinaison de modalités d’entrée, telles que la langue, l’image, la vidéo ou l’audio. Contrairement aux systèmes d’IA générative existants, CoDi peut générer plusieurs modalités en parallèle, et sa contribution n’est pas limitée à des sous-ensembles de modalités telles que du texte ou des images. CoDi est libre de conditionner n’importe quelle combinaison d’entrées et de générer n’importe quel ensemble de modalités, même si elles ne sont pas présentes dans les données d’apprentissage.
Par rapport au modèle OpenAI + Microsoft + Nvidia aux États-Unis, les grandes entreprises chinoises qui réussiront à terme seront très différentes en termes d’alliances, de modèles commerciaux et de contributions aux revenus côté C / B. Le développement futur prendra du temps. Il faut bien distinguer quel étage est la tuyère et quel étage est la valeur. Dans l’ensemble, nous pensons qu’il s’agit d’une route à long terme. Si l’on compare la décennie dorée de l’Internet mobile (2010-2020), les meilleures entreprises ont en fait été créées dans les 3-4 ans après 2010, et maintenant l’IA vient de commencer. .
Lorsque la vague technologique arrive, les entreprises géantes ont plus de ressources pour y faire face, et ont également plus de coûts d’essais et d’erreurs. Mais les start-up sont complètement différentes : elles sont faibles, et elles ne peuvent ni lâcher prise et rater l’occasion, ni suivre aveuglément le vent, qui les fait marcher sur de la glace fine.