Resumo: De acordo com a reportagem do “Kechuangban Daily” em 11 de julho, Jiang Guangzhi, secretário do grupo do partido e diretor do Departamento Econômico e de Informação de Pequim, disse em entrevista a repórteres que o Departamento Econômico e de Informação de Pequim aumentará a oferta de poder computacional a médio e longo prazo. Acelerar a construção de projetos importantes, como o Poder de Computação Pública de Inteligência Artificial de Pequim no distrito de Haidian, o Centro de Energia de Computação de Economia Digital de Pequim no distrito de Chaoyang, formar uma fonte de alimentação de computação o mais rápido possível e melhorar o sistema de fornecimento de energia de computação de Pequim. Jiang Guangzhi também apontou que Pequim adotará cenários como tração e aplicação como orientação, abrirá cenários mais típicos, promoverá a aplicação industrial de modelos de grande escala, lançará iterativamente os resultados da aplicação de modelos de grande escala trimestralmente e formará um grupo de modelos típicos para integração profunda de inteligência artificial e desenvolvimento econômico e social.
Fonte da imagem: Gerada pela ferramenta Unbounded AI
De acordo com o relatório de 36 Krypton em 11 de julho, a Baichuan Intelligence lançou oficialmente um modelo de linguagem grande de propósito geral Baichuan-13B-Base com um volume de parâmetro de 13 bilhões, um modelo de diálogo Baichuan-13B-Chat e duas versões quantizadas de INT4/INT8. Segundo relatos, o modelo de grande escala chinês e inglês Baichuan-13B integra alto desempenho, código aberto completo e uso comercial gratuito.
De acordo com um relatório da IT House em 11 de julho, a Microsoft lançou recentemente o Composable Diffusion Model (CoDi), um modelo de IA exclusivo baseado no Composable Diffusion, projetado para interagir e gerar conteúdo multimodal.
A Microsoft projetou o CoDi com o objetivo de abordar as limitações dos modelos tradicionais de IA unimodal. Tomando como exemplo o vídeo e o áudio sincronizados, pode haver inconsistências e problemas de alinhamento ao unir fluxos de informações gerados independentemente. CoDi emprega uma estratégia única de geração composable para alinhar multimodalidades durante a difusão para gerar modalidades entrelaçadas, e CoDi é capaz de processar modalidades de entrada arbitrárias e gerar conteúdo de modalidades arbitrárias. É relatado que o CoDi foi desenvolvido pela Equipe de Pesquisa de Serviços Cognitivos do Microsoft Azure em cooperação com a Universidade da Carolina do Norte em Chapel Hill, e também faz parte do projeto i-Code da Microsoft, que usa inteligência artificial para aprimorar a interação humano-computador.
De acordo com um relatório de 11 de julho do Science and Technology Innovation Board Daily, Jiang Guangzhi, secretário do grupo do partido e diretor do Bureau de Economia e Tecnologia da Informação de Pequim, disse em entrevista a repórteres que o Bureau Econômico e de Informação de Pequim melhorará sua capacidade de fornecimento de energia de computação de médio e longo prazo no nível da fonte de alimentação de computação. Acelerar a construção de projetos importantes, como o Poder de Computação Pública de Inteligência Artificial de Pequim no distrito de Haidian, o Centro de Energia de Computação de Economia Digital de Pequim no distrito de Chaoyang, formar uma fonte de alimentação de computação o mais rápido possível e melhorar o sistema de fornecimento de energia de computação de Pequim. Jiang Guangzhi também apontou que Pequim adotará cenários como tração e aplicação como orientação, abrirá cenários mais típicos, promoverá a aplicação industrial de modelos de grande escala, lançará iterativamente os resultados da aplicação de modelos de grande escala trimestralmente e formará um grupo de modelos típicos para integração profunda de inteligência artificial e desenvolvimento econômico e social.
De acordo com o relatório de Jinshi em 11 de julho, a equipe liderada pelo cientista de IA Li Feifei divulgou recentemente a mais recente conquista da inteligência incorporada: um grande modelo é conectado ao robô e instruções complexas são convertidas em planos de ação específicos. Os humanos podem usar livremente a linguagem natural para dar instruções aos robôs. Instruções, o robô não precisa de dados e treinamento adicionais. A equipe de Li Feifei nomeou o sistema VoxPoser. Em comparação com o método tradicional, é necessário um pré-treinamento adicional. Este método usa um modelo grande para orientar o robô como interagir com o ambiente, resolvendo diretamente o problema de escassez de dados de treinamento do robô .
De acordo com um relatório do The Decoder em 11 de julho, a gigante da mídia alemã Axel Springer anunciou o estabelecimento de uma equipe global de inteligência artificial generativa, que acelerará o desenvolvimento de seu trabalho de inteligência artificial. É relatado que a equipe, liderada por Niddal Salah-Eldin e Samir Fadlallah, se concentrará em pesquisa de produtos e mercado e desenvolverá parcerias estratégicas com empresas e start-ups de tecnologia baseadas em inteligência artificial.
A equipe de pesquisa do Microsoft Azure e os pesquisadores da Universidade da Carolina do Norte publicaram um artigo “Arbitrary Generation Through Composable Diffusion”, apresentando um novo modelo de geração multimodal - CoDi (Composable Diffusion). O CoDi é capaz de gerar qualquer combinação de modalidades de saída a partir de qualquer combinação de modalidades de entrada, como linguagem, imagem, vídeo ou áudio. Ao contrário dos sistemas de IA generativos existentes, o CoDi pode gerar várias modalidades em paralelo e sua entrada não se limita a subconjuntos de modalidades, como texto ou imagens. O CoDi é livre para condicionar qualquer combinação de entradas e gerar qualquer conjunto de modalidades, mesmo que não estejam presentes nos dados de treinamento.
Em comparação com o modelo de OpenAI+Microsoft+Nvidia nos Estados Unidos, as empresas de grande escala eventualmente bem-sucedidas da China serão muito diferentes em termos de alianças, modelos de negócios e contribuições de receita do lado C/B. O desenvolvimento futuro levará tempo. É necessário distinguir claramente qual estágio é a ventaneira e qual estágio é o valor. No geral, pensamos que este é um caminho de longo prazo. Se compararmos a década de ouro da Internet móvel (2010-2020), as melhores empresas foram estabelecidas dentro de 3-4 anos após 2010, e agora a IA apenas começou .
Quando chega a onda tecnológica, as empresas gigantes têm mais recursos para lidar com ela, e também têm mais custos de tentativa e erro. Mas as empresas iniciantes são completamente diferentes, são fracas e não podem deixar passar a oportunidade, nem seguir cegamente o vento, que as faz caminhar sobre o gelo fino.