De acordo com um relatório aprofundado da CNBC, nas duas reuniões fechadas que decorreram esta semana no Vale do Silício, vários CEO de novas empresas de IA e engenheiros afirmaram que a implementação em escala de agentes de IA enfrenta dois grandes problemas estruturais: “enorme desperdício de tokens” e “extrema confusão entre sistemas”. Este registo presencial contrasta fortemente com a expectativa optimista do CEO da Nvidia, Jensen Huang, em março, quando disse que os agentes de IA são o “próximo ChatGPT”, sugerindo que o verdadeiro gargalo nesta via não está no poder de computação, mas sim no desenho da tomada de decisão, na eficiência dos tokens e na integração de múltiplos sistemas.
O maior problema é entregar tudo ao LLM
O CEO da nova empresa de IA Meibel, Kevin McGrath, assinalou na reunião: “O maior problema que estamos a enfrentar agora é pensarmos erradamente que tudo precisa de ser processado por modelos de linguagem grandes — colocar todos os tokens e todo o dinheiro num único bot de IA, e ele vai queimar alguns milhões de tokens.” Ele sublinhou que, ao conceber fluxos de trabalho de agentes, as empresas precisam de avaliar com mais clareza quais tarefas realmente exigem LLM e quais podem ser concluídas com lógica mais barata baseada em regras ou com aprendizagem automática tradicional.
Esta observação acompanha a reacção do mercado após a viragem da versão empresarial da Anthropic Claude para faturação por quantidade — quando o consumo de tokens se traduz diretamente em custos, o modelo de desenvolvimento de “entregar cegamente ao agente” evidencia imediatamente a pressão financeira. A perspectiva da Meibel representa um grupo de profissionais de engenharia menos dadas ao hype: a arte da arquitectura de agentes está em impor limites, e não em dar rédea solta.
Confusão gerada pela dependência mútua de sistemas de multi-agentes
Uma outra palavra-chave que surge repetidamente na reportagem da CNBC é “caótico”. Quando as empresas executam vários agentes de IA em simultâneo — por exemplo, um para lidar com apoio ao cliente, outro para gerir agendamentos e outro para tratar de finanças — a transmissão de mensagens entre agentes, a consistência do estado e a resposta a erros acabam por influenciar-se mutuamente, e qualquer comportamento anómalo de um agente pode propagar-se em cadeia. O Karpathy também mencionou esta semana que, pessoalmente, executa fluxos de trabalho com 10–20 agentes ao mesmo tempo, mas admitiu que o code review e o processo de PR se tornaram o novo gargalo.
A confusão destes sistemas de multi-agentes é, no fundo, a repetição dos antigos problemas dos sistemas distribuídos na era do LLM: não há um SLA claro, não existem limites transaccionais e não existe semântica de tentativas de falha e re-tentativas. Embora a Anthropic e a OpenAI tenham lançado camadas de protocolo como MCP e Agent SDK, na prática de adopção empresarial a normalização ainda fica muito atrás do crescimento do número de agentes.
A proposta salarial em tokens de 250 mil dólares de Jensen Huang cai em desuso
Em março, o CEO da Nvidia, Jensen Huang, promoveu fortemente o conceito de “salário em tokens” em GTC e em entrevistas subsequentes, afirmando: “Se um engenheiro com um salário anual de 500 mil dólares não consumir pelo menos 250 mil dólares em tokens, eu ficaria profundamente inquieto.” A lógica dele é a seguinte: os engenheiros devem usar agentes de IA para substituir as suas acções mais básicas, e a quantidade absoluta de tokens consumidos é um indicador delegado de produtividade. Esta argumentação pode ser consultada na entrevista mais recente de Jensen Huang (parte superior), com uma exposição completa sobre a procura de capacidade informática de IA.
Mas as opiniões presenciais na reportagem da CNBC mostram que o grupo de engenheiros do Vale do Silício está cada vez mais reticente: a quantidade de tokens consumidos não equivale a produtividade e, até, pode ser um sinal de que o desenho do agente é inadequado. O verdadeiro valor do engenheiro continua a residir em “decidir quais tarefas valem a pena ser chamadas de agente, como decompor tarefas e como desenhar o tratamento de erros” — e esse trabalho, por si só, não pode ser medido pela quantidade de tokens consumidos.
Crypto e agentes de IA ainda exigem tempo
Para a indústria cripto, a tendência desta semana de a IA estar a absorver 80% do capital de risco global e de projectos DeFi integrarem activamente agentes autónomos baseia-se no pressuposto de que a tecnologia de agentes atingiu um nível já deployável. Mas esta reportagem da CNBC lembra: mesmo em ambientes empresariais puramente web2, a eficiência dos tokens dos agentes e a integração de múltiplos sistemas ainda não estão estabilizadas. Colocar agentes em ambientes on-line 7×24, onde os activos podem ser roubados em tempo real, ampliará tanto o risco técnico como o risco financeiro. O verdadeiro ponto de partida para Crypto × IA poderá ainda esperar pela maturidade da normalização na camada de frameworks de agentes (como MCP, LangGraph, Cloudflare Agents).
Este artigo “Realidade dos Agentes de IA no Vale do Silício: enorme desperdício de tokens, integração de sistemas ‘extremamente caótica’, previsão de Jensen Huang sobre ‘o próximo ChatGPT’ aguarda validação” foi publicado pela primeira vez em 鏈新聞 ABMedia.
Related Articles
Fere AI conclui ronda de financiamento de $1,3M liderada pela Ethereal Ventures
Grande carteira de CEX lança Agentic Wallet para agentes de IA com taxas zero durante o período promocional
Infraestrutura Web3 para IA: AIW3 angaria $2M em financiamento semente liderado pela Buffalo Capital
O Governo dos Emirados Árabes Unidos anunciou a introdução de agentes de IA, com a conclusão mais rápida em 2028 de metade das operações automatizadas
OristaPay Lança Sistema de Pagamentos Impulsionado por IA no Telegram, Permite Liquidações Instantâneas de USDT na TON