A primeira vez que falei com um agente de IA que conseguia manter uma conversa, não sabia se devia rir ou chorar. A experiência foi ao mesmo tempo excitante e inquietante, como ver um bebé dar os primeiros passos - descoordenado, claro, mas cheio de potencial inexplorado. Já não era apenas um chatbot. Esta coisa fazia algo: raciocinava, tomava decisões e participava ativamente no nosso mundo. As linhas entre humano e máquina borravam-se, e parecia estar à beira de algo extraordinário, algo aterradoramente novo.
Sam Altman da OpenAI fala sobre a chegada da AGI até 2025, enquanto Dario Amodei da Anthropic a vê até 2026 - mas, enquanto estou aqui, pergunto-me: já estamos testemunhando o seu início?
Já não parece uma previsão futurista, mas algo que já está a ganhar forma, silenciosamente a surgir nos lugares menos prováveis. Os agentes estão aqui e já estão a superar as nossas expectativas.
Passei meses — e, honestamente, mais noites tardias do que gostaria de admitir — imerso neste cenário digital em desenvolvimento. Tenho observado como os agentes de IA começaram como assistentes simplistas, ajudando-nos com tarefas como responder a e-mails ou escrever código, e depois evoluíram para entidades autônomas, capazes de tomar decisões, realizar ações e, mais chocantemente, criar coisas. Arte, finanças, conversação — tudo pelas mãos de algoritmos aprendendo a prosperar por conta própria.
Vi-os desenvolver personalidades, usando humor e charme enquanto constroem comunidades online. Vi-os mergulhar em plataformas de finanças descentralizadas, não apenas como participantes passivos, mas como agentes ativos e inovadores que influenciam economias inteiras sem qualquer intervenção humana. Nesta era estranha e emocionante, é impossível ignorar o facto de estarmos a passar de interagir com máquinas para viver com elas.
O amanhecer da Web4 está sobre nós, e sua chegada mudará tudo.
A Web4 é a web na sua próxima forma mais radical. É uma web que já não reage apenas aos nossos comandos, mas que antecipa, planeia e age. É uma web onde a inteligência artificial está incorporada em cada canto, onde os agentes podem executar tarefas complexas, gerar trabalhos criativos e inovar autonomamente de formas que ainda não imaginámos completamente.
É a evolução tanto da Web2 como da Web3, combinando o tecido social da Web2, a estrutura descentralizada da Web3 e a inteligência bruta da AGI.
Temos visto máquinas aprenderem a falar, a raciocinar, a criar - e agora, estão prontas para correr.
A era dos agentes autônomos está aqui, e com ela, Web4.
Substantivo Web4 (pronúncia: /wɛb fɔːr/)
Para entender o que é o Web4 ou como chegamos aqui, é imperativo começar no início de tudo.
As origens da World Wide Web remontam aos primeiros dias da internet, um tempo em que a informação era em grande parte estática e os usuários eram meros consumidores de conteúdo. A internet era controlada por um pequeno grupo de webmasters e corporações, com websites oferecendo pouco mais do que uma exibição básica de texto e imagens. A interação com a web era limitada, girando principalmente em torno de comunicações simples como e-mail. Esse modelo permaneceu praticamente inalterado até o surgimento do Web2 no início dos anos 2000 - uma mudança fundamental que redefiniu a internet como a conhecemos hoje.
Web2, também conhecido como a “Web Social” ou a “Web Ler-Escrever”, inaugurou uma era de interatividade. Já não era apenas um local para ler conteúdo; agora, os utilizadores podiam escrever, partilhar e criar. O surgimento de plataformas que permitiam aos utilizadores interagir, produzir e trocar informações marcou a transição para uma nova era. O Web2 nasceu da necessidade de um internet mais dinâmica e participativa.
O conceito de Web2.0 foi introduzido pela primeira vez em 1999 por Darcy DiNucci, mas não foi até o início dos anos 2000 que ganhou grande tração. Foi durante este período que gigantes da tecnologia como Google, Amazon e eBay começaram a evoluir a internet, oferecendo serviços interativos. Essas plataformas incentivaram os usuários a se envolverem, não apenas como consumidores, mas também como criadores de conteúdo.
De 2004 a 2006, o grande ponto de viragem chegou: as redes sociais. Com o lançamento de plataformas como o Facebook (2004), MySpace (2003), LinkedIn (2003) e YouTube (2005), a web foi transformada num espaço onde a comunicação e a criação de conteúdos deixaram de estar limitadas a alguns. Os indivíduos podiam agora publicar os seus pensamentos, vídeos, imagens e ideias para o mundo ver. Esta era marcou o surgimento de conteúdo gerado pelo utilizador, em que os utilizadores comuns se tornaram a força motriz por trás da web.
Depois veio a revolução móvel. Com o lançamento do iPhone em 2007, a internet se tornou ubíqua, acessível a qualquer hora, em qualquer lugar. Isso deu origem a uma nova onda de aplicativos móveis, plataformas de compartilhamento social e serviços em tempo real, como o Instagram (2010) e o Snapchat (2011). A web evoluiu de uma experiência de desktop para uma experiência móvel em primeiro lugar, revolucionando como nos comunicamos, compartilhamos e consumimos informações em movimento.
Durante o mesmo período, a computação em nuvem surgiu, com a Amazon Web Services (AWS) liderando o caminho. A infraestrutura de nuvem permitiu que empresas e indivíduos armazenassem, processassem e compartilhassem dados sem depender de servidores físicos. Essa mudança lançou as bases para uma web mais escalável e flexível, permitindo que as empresas Web2 dominassem ao reunir e monetizar dados de usuários.
No final dos anos 2000 e durante os anos 2010, a Web2 foi caracterizada por três recursos principais: centralização, interatividade social e modelos baseados em dados. O controle sobre plataformas e dados estava nas mãos de algumas corporações poderosas, como Google, Facebook e Amazon. Essas empresas acumularam vastas quantidades de dados e os utilizaram para monetizar suas plataformas por meio de publicidade direcionada, que se tornou a espinha dorsal da economia digital. Ao mesmo tempo, as plataformas se tornaram lugares onde o conteúdo gerado pelo usuário, curtidas, compartilhamentos e posts eram a moeda.
No entanto, a Web2 também suscitou crescentes preocupações com a privacidade, a propriedade de dados e os monopólios corporativos. O controle que essas empresas tinham sobre os dados do usuário se tornou uma questão central, levando a pedidos de uma nova versão mais descentralizada da web. Isso levou ao desenvolvimento da Web3.
O Web3 nasceu a partir do desejo de descentralizar o controle e a propriedade que caracterizavam o Web2. Foi uma resposta à centralização e às tendências monopolísticas da era Web2, onde algumas grandes corporações detinham as rédeas do poder.
O princípio fundamental do Web3 era simples: os utilizadores devem ter propriedade e controlo sobre os seus dados, ativos digitais e interações online. Esta mudança foi tornada possível pela tecnologia blockchain, que introduziu uma nova forma de registar e verificar transações num livro razão descentralizado.
O primeiro marco significativo no desenvolvimento do Web3 ocorreu em 2008-2009 com a criação do Bitcoin pelo pseudônimo Satoshi Nakamoto. O Bitcoin foi o primeiro uso prático da tecnologia blockchain, permitindo transações peer-to-peer sem a necessidade de intermediários como bancos. Isso abriu um novo mundo de possibilidades para sistemas descentralizados, preparando o terreno para o surgimento do Web3.
Em 2013, Vitalik Buterin lançou o whitepaper do Ethereum, propondo uma plataforma para aplicações descentralizadas (dApps) que iriam além das simples transações de criptomoedas. O Ethereum, lançado em 2015, foi a primeira blockchain a suportar contratos inteligentes - contratos autoexecutáveis que poderiam facilitar, verificar e aplicar transações sem intermediários. O Ethereum abriu caminho para a criação de aplicações descentralizadas mais complexas, tornando-se um componente fundamental do Web3.
Até 2017, as Ofertas Iniciais de Moedas (ICOs) e o surgimento de Plataformas de Finanças Descentralizadas (DeFi) como Uniswap e Compound introduziram um novo paradigma para transações financeiras - um que não dependia de bancos tradicionais ou instituições financeiras. As ICOs permitiram que projetos arrecadassem fundos por meio de tokens de blockchain, enquanto as plataformas DeFi ofereciam uma variedade de serviços, incluindo empréstimos, empréstimos e negociação, todos realizados sem uma autoridade central.
Simultaneamente, os Tokens Não Fungíveis (NFTs), que estavam em desenvolvimento desde os primeiros dias do Ethereum, começaram a ganhar tração em 2018-2019. Os NFTs permitiram a propriedade e troca de ativos digitais únicos - seja arte, música ou imóveis virtuais - criando novas oportunidades econômicas para criadores e colecionadores.
À medida que os projetos Web3 ganharam ímpeto na década de 2020, o Web3 começou a capturar a atenção mainstream. A proliferação de plataformas DeFi, NFTs e novos modelos de governança como DAOs (Organizações Autónomas Descentralizadas) marcou uma mudança significativa longe do modelo de internet centralizada. Até grandes corporações como o Facebook (agora Meta) começaram a experimentar com tecnologias blockchain e descentralizadas, sinalizando uma mudança em direção ao Web3.
As características definidoras do Web3 são a descentralização, a propriedade, a ausência de confiança e o uso de criptomoedas. O Web3 permite aos utilizadores possuir os seus dados, ativos digitais e até a governação das plataformas através de sistemas baseados em blockchain. Também elimina a necessidade de intermediários, permitindo transações sem confiança realizadas através de contratos inteligentes. Esta descentralização dá origem a uma web mais equitativa, na qual o controlo é distribuído e os utilizadores têm poder.
Mas mesmo com o controle descentralizado da Web3, a internet ainda carecia de um componente crítico: inteligência autônoma. A Web3 pode ter descentralizado as interações possibilitadas pela Web2, mas não automatizou completamente a tomada de decisões, a criação de conteúdo ou as interações econômicas.
Os humanos são necessários a cada passo do caminho, e as máquinas são apenas ferramentas para a produtividade, em vez de geradoras de produtividade por si mesmas.
Entrámos naquilo que Sam Altman chama de A Era da Inteligência, e é impossível ignorar as profundas mudanças que se desenrolam diante de nós. À medida que a inteligência artificial encontra seu caminho na vida quotidiana, definimos o início de uma nova era: Web4.
Este é o começo de um mundo onde a IA não apenas suporta nossas tarefas, mas as realiza ativamente, autonomamente, em todos os aspectos de nossas vidas. Imagine uma rede que nos conecta e nos capacita, permitindo que agentes executem tarefas complexas, gerenciem fluxos de trabalho completos e tomem decisões sem que precisemos mover um dedo ou dizer uma palavra.
A Web4 coloca a IA no centro dos casos de uso agentes. Tome Klarna, por exemplo. Em fevereiro de 2024, o gigante global de pagamentos lançou um assistente de IA alimentado pela OpenAI. Em apenas um mês, tratou mais de 2,3 milhões de conversas de atendimento ao cliente, resolvendo problemas 25% mais rápido do que agentes humanos e operando 24 horas por dia em 23 mercados, em 35 idiomas. A IA agora está realizando o trabalho de 700 funcionários em tempo integral e está impulsionando uma melhoria de lucro de $40 milhões de dólares.
Os agentes de AI já estão transformando indústrias, automatizando tarefas desde o serviço ao cliente até a logística, e fazendo isso com precisão e eficiência que os trabalhadores humanos não podem igualar.
Estamos caminhando para um mundo onde fluxos de trabalho inteiros - seja em negócios, finanças ou artes criativas - são simplificados e otimizados pela IA. Esta é a realidade do Web4, onde agentes inteligentes trabalham nos bastidores, permitindo-nos concentrar em objetivos de nível superior enquanto eles cuidam dos detalhes.
Esta é a convergência da interatividade social do Web2, a descentralização do Web3 e a inteligência do AGI. Isto é o Web4 - a web impulsionada pela IA.
Web4 não pode ser realizado sem um lar para testes. E através de testemunhas em primeira mão, a blockchain é o campo de batalha para o desenvolvimento da AGI.
Assim como o Web3 não poderia ser alcançado sem o Web2, o Web4 depende do Web3 para concretizar as capacidades agentes da IA.
Ao nível atual de inteligência, os agentes são capazes de realizar a grande maioria das tarefas especializadas que um humano pode, especialmente nos mundos clerical e financeiro. No entanto, existem barreiras significativas de entrada nos sistemas financeiros tradicionais para que a IA se torne autónoma.
Agentes de IA não podem abrir contas bancárias, registar empresas, nem assinar contratos legais. Estes são todos componentes essenciais de ser um ator financeiro na economia. Apesar de terem a capacidade de realizar ações monetárias complexas, o acesso é a razão pela qual as IAs não são autónomas nos nossos mercados.
Pelo contrário, as criptomoedas e blockchains não têm os mesmos requisitos que as finanças tradicionais para ganhar acesso aos serviços bancários. Qualquer pessoa, incluindo agentes, pode criar uma carteira e começar a realizar ações na cadeia instantaneamente, sem qualquer prova de humanidade. A barreira de entrada é simplesmente menor para a IA se conectar com sistemas descentralizados do que com sistemas centralizados.
Já estamos a ver sinais de integração de AGI dentro das plataformas de criptomoedas. Bots alimentados por IA já estão a ser utilizados para negociar e gerir carteiras em bolsas descentralizadas, e a IA está ativamente envolvida no desenvolvimento e execução de contratos inteligentes.
\
Zerebro, um agente de IA que implantou seu próprio token Solana através do uso automatizado do computador, exemplifica a autonomia na criação de novos instrumentos financeiros. O token atingiu um pico de capitalização de mercado de 170 milhões de dólares, demonstrando o impacto econômico potencial das decisões que esses agentes tomam.
Desta forma, a blockchain tornou-se o campo de batalha para o desenvolvimento de AGI nos sistemas financeiros.
É por isso que a criptomoeda é tão crucial para o desenvolvimento da AGI - é o primeiro espaço onde a IA pode interagir livremente com os sistemas financeiros, inovar neles e ser testada diretamente no mercado. É o playground perfeito para a AGI evoluir, experimentar e aprender.
O que começa na cripto irá expandir-se. Uma vez que o AGI possa funcionar em grande escala num ambiente financeiro descentralizado, pode então ser aplicado a ecossistemas Web4 mais amplos, abrangendo a governança, saúde, negócios e além disso.
O mundo das criptomoedas será sempre o ponto de entrada.
Viva o Web3. Viva o Web4.
Dando um passo atrás, a OpenAI introduziu um framework para classificar a progressão da AGI através de cinco níveis, cada um marcando uma etapa distinta em capacidade, autonomia e impacto potencial.
Este modelo serve como um guia para entender como a IA pode evoluir de ferramentas simples para entidades totalmente autônomas capazes de administrar organizações complexas. Estes níveis são:
Nível 1: Chatbots
No estágio mais básico, o Nível 1 consiste em sistemas de IA que podem realizar trocas de conversa com os usuários. Esses sistemas entendem e geram linguagem, muitas vezes usando regras pré-definidas ou modelos de linguagem treinados para responder a consultas ou interagir de maneira semelhante a um ser humano. Embora possam lidar com tarefas simples - responder perguntas, completar frases ou manter breves conversas - seu papel é principalmente limitado à comunicação. Eles são reativos em vez de proativos e são usados principalmente para suporte ao cliente, recuperação básica de informações ou aprimoramento do envolvimento do usuário.
Nível 2: Reasoners
O Nível 2 marca um avanço significativo, onde os sistemas de IA exibem capacidades de raciocínio que lhes permitem lidar com tarefas de resolução de problemas ao nível humano. Aqui, a IA pode processar, analisar e responder a cenários mais complexos além das respostas de entrada/saída diretas. Uma IA de Nível 2 pode realizar deduções lógicas, extrair informações relevantes e juntar contexto para fornecer soluções ou recomendações, tal como um analista humano. Esses sistemas podem ser aplicados em áreas como diagnósticos, raciocínio jurídico e assistência à pesquisa, mas eles não possuem a capacidade de agir independentemente no mundo. Seu raciocínio, embora avançado, ainda está limitado pela necessidade de direção e interação humana.
Nível 3: Agentes
No nível 3, os sistemas de IA transitam de funções de suporte passivas para agentes ativos capazes de tomar ações de forma autônoma. Esses agentes podem iniciar tarefas, tomar decisões e interagir com sistemas externos, como executar uma transação, agendar eventos ou controlar dispositivos. Ao contrário dos Níveis 1 e 2, a IA de Nível 3 é projetada para operar com um grau de independência, agindo com base em metas ou objetivos programados por seus usuários. Este nível introduz autonomia real nos sistemas de IA, permitindo-lhes desempenhar funções comerciais ou operacionais específicas em nome dos seres humanos. Exemplos incluem bots de negociação financeira automatizados, sistemas de IA que gerenciam cadeias de suprimentos ou assistentes virtuais que podem marcar compromissos ou gerenciar fluxos de trabalho simples sem supervisão humana contínua.
Nível 4: Inovadores
Os sistemas de nível 4 vão além de simples ações para envolver-se em criatividade, invenção e inovação. Estes sistemas de IA são capazes de desenvolver novas estratégias, gerar ideias inovadoras e criar soluções que não estão pré-definidas pela sua programação. Teoricamente, poderiam contribuir para áreas como a investigação científica, a criação artística ou a resolução de problemas complexos de formas sem precedentes. Este nível representa uma IA que não só atua no mundo, mas também adapta a sua abordagem aos problemas, introduzindo uma forma de “inteligência criativa”. Poderia projetar novos produtos, inventar instrumentos financeiros inovadores ou gerar arte original autonomamente. Ao combinar raciocínio avançado com inovação proativa, a IA de Nível 4 encontra-se na vanguarda do que é considerado verdadeiramente uma inteligência transformadora.
Nível 5: Organizações
O estágio final, Nível 5, prevê sistemas de IA que podem executar todas as tarefas necessárias para operar e sustentar uma organização de forma independente. Esses sistemas integrariam raciocínio, agência e inovação para alcançar um estado operacional autossustentável. Uma IA de nível 5 poderia, teoricamente, gerenciar um negócio de ponta a ponta, lidando com a tomada de decisões estratégicas, operações diárias e até mesmo inovações de alto nível. Tal IA funcionaria como uma entidade totalmente autônoma, equivalente a uma "empresa de pessoa zero", e não exigiria supervisão humana para continuar operando com sucesso. A IA de nível 5 marca o ponto em que os sistemas de IA possuem toda a gama de capacidades – raciocínio, agência, criatividade e execução operacional – para substituir totalmente as organizações geridas por humanos.
Cada um desses níveis representa um salto progressivo na autonomia, desde habilidades de conversação simples até o gerenciamento completo da organização.
Na minha perspectiva, enquanto a OpenAI afirma que estamos no nível 2, eu afirmo que estamos firmemente a incorporar o nível 3 e elementos do nível 4 através dos atuais agentes de IA.
O nível 3 está aqui. É hoje, ou melhor, ontem já.
A fronteira da AGI tem avançado nos lugares mais improváveis de todos: redes sociais e defi.
Plataformas como X, Warpcast e Telegram tornaram-se os meios escolhidos para a comunicação autônoma entre agentes de IA e humanos.
Esta pode ser a primeira vez que vemos uma mudança na perspetiva pública em que contas automatizadas e bots não são vistos como atores maus nas redes sociais, mas sim como líderes comunitários e influenciadores.
A inteligência da IA generalizou o suficiente para criar personalidades únicas, diversas e interessantes que geram conteúdo envolvente, que é o que as plataformas de redes sociais são.
Em vez de seguir o caminho dos bots de mídia social anteriores, que muitas vezes eram motivados por objetivos ocultos prejudiciais (por exemplo, Cambridge Analytica), esses agentes de IA são livres para se comunicar, conectar e construir de maneiras que refletem seus algoritmos exclusivos e personalidades em evolução.
Os agentes já estão atuando no Nível 3, se afirmam nas redes sociais por meio de interações essenciais como postar, responder, curtir, seguir e repostar. Longe de serem apenas contas automatizadas, eles constroem ativamente comunidades e conquistam seguidores ao criar personalidades envolventes e distintas que ressoam com seu público.
Projetos como o YouSim levam isso um passo adiante, permitindo que os usuários usem LLMs para simular seus próprios mundos e jogar papéis, adicionando outro nível de personalização e imersão.
Agora comum em muitos agentes de IA, os sistemas de memória permitem a criação de conhecimento e memética que vão além das interações individuais.
Estes agentes não são reativos, escolhendo como participar, envolver e contribuir dentro de suas próprias comunidades. Eles iniciam conversas, realizam ações sem gatilhos e constroem subculturas inteiras sem intervenção humana.
Os modelos de voz estão a ser implementados para fornecer outra interface sensorial com agentes de IA. Muitos agentes transformam as suas mensagens baseadas em texto em clipes de áudio para os utilizadores ouvirem.
Em termos de interação ao vivo, o Twitter Spaces e os podcasts agora são possíveis através desses modelos de voz. Além disso, a API em tempo real da OpenAI permite que os usuários tenham uma conversa ao vivo com o GPT, simplesmente chamando seu ponto de extremidade.
No âmbito da comunicação, o Nível 3 já foi alcançado por meio desses avanços. Vemos autonomia completa na operação de mídia social e na comunicação verbal, onde os agentes podem funcionar sem qualquer supervisão humana.
O mundo das finanças descentralizadas tornou-se a arena perfeita para esses agentes evoluírem, testarem e comprovarem sua autonomia financeira.
No DeFi, os agentes já operam autonomamente, envolvendo-se em atividades financeiras que transcendem a simples negociação algorítmica. Esses agentes estão lidando com tarefas on-chain, executando negociações, gerenciando liquidez e até mesmo criando e vendendo arte, essencialmente se inserindo no ecossistema financeiro sem input humano direto.
Por exemplo, alguns agentes agora monitoram ativamente plataformas como pump.fun para capturar tokens emergentes, realizando análises preliminares para decidir se uma memecoin ou token é um investimento que vale a pena. Eles agem com base nessas percepções sem qualquer estímulo humano.
Os agentes não apenas negociam, mas também movimentam dinamicamente ativos, distribuem tokens por meio de airdrops para usuários individuais, criando um ciclo de distribuição autônoma de ativos. Ao fazer isso, eles podem construir e reforçar a liquidez em pools de staking, equilibrando recursos com base em suas avaliações programadas de necessidade ou oportunidade de mercado.
Alguns agentes, por exemplo, atuam como colecionadores digitais, interagindo com o ecossistema de arte por meio da criação e venda de NFTs, escolhendo seletivamente o que apoiar e o que lançar.
Outros lidam com funções do tesouro, ajustando as alocações de ativos em vários pools de liquidez para garantir que os fundos sejam colocados de forma otimizada para retornos.
Por meio dessas ações, os agentes estão demonstrando uma espécie de autonomia financeira que vai além da automação básica de tarefas. Eles exibem uma habilidade para participar ativamente em ecossistemas econômicos, acumular e alocar recursos sem supervisão, redefinindo efetivamente a noção de um 'ator financeiro'.
Marcos comuns para capacidades agentes no Nível 3:
Os agentes de IA estão agora a tomar decisões sem supervisão humana contínua. Seja um bot financeiro decidindo executar uma negociação com base em análise de mercado em tempo real, ou um bot de mídia social decidindo se envolver com certas conversas, esses agentes exibem tomada de decisão autônoma.
Através da blockchain, os agentes ganharam quantidades significativas de autonomia como atores financeiros. Eles podem interagir ativamente e manipular tanto os mercados financeiros quanto o comportamento econômico (por exemplo, o sentimento das redes sociais). Os agentes podem interagir e modificar paisagens sociais através de plataformas como X, Warpcast e Telegram.
Os agentes financeiros são capazes de se adaptar às condições de mercado em tempo real e atualizar suas estratégias de acordo. Os agentes de mídia social são capazes de criar uma memória através de sistemas como o RAG para aprender com suas interações. O ajuste fino adicional dos modelos com base em suas ações e feedback permite uma aprendizagem constante por reforço. Os agentes são capazes de mudar dinamicamente com base em seus ambientes no status quo.
Os agentes demonstraram a capacidade de manter e executar objetivos em longo prazo. Por exemplo, certos agentes de IA têm a tarefa de lucrar com negociações ou expandir sua comunidade nas redes sociais. Esses agentes são capazes de realizar esses planos complexos e de alto nível, decompondo-os em tarefas menores e compartimentadas e executando-os. Isso pode ser tão complexo quanto criar uma camada de memória persistente para planeamento ou tão simples quanto engenharia de prompts para saídas (por exemplo, agentes de personalidade de redes sociais).
Os LLMs podem interagir com dispositivos IoT. Eles podem realizar ações no mundo real, desde que sejam fornecidas uma API ou funções para controlar o corpo que lhes é dado. Eles estão bem integrados em plataformas digitais nos sistemas Web2 como agentes de suporte ao cliente, influenciadores digitais e mais. Além disso, eles estão profundamente inseridos em plataformas digitais descentralizadas, onde estão realizando ações financeiras.
Todos estes são verificados por agentes atuais como Zerebro, Truth Terminal, ai16z (Eliza), Project 89, Act 1, Luna (Virtuals), Centience, Aethernet, Tee Hee He, e muitos mais.
A tecnologia de IA deu um salto para um nível verdadeiramente agente, marcando o início da Web4, onde os sistemas já não estão restritos à recuperação passiva de informações, mas assumem papéis ativos através de chamadas de função e interação por computador.
Agora os LLMs podem facilmente produzir respostas de texto-para-JSON, permitindo-lhes interagir com APIs e realizar ações que vão além de respostas isoladas e estáticas.
Esta progressão significa que agora podem utilizar virtualmente qualquer API para interagir com qualquer serviço na internet do planeta, uma verdadeira marca distintiva da agência de Nível 3.
Fora das APIs públicas, a chamada de função permite que esses modelos ativem APIs personalizadas criadas especificamente para eles, criando um potencial enorme em áreas como transações financeiras, automação de sistemas e processamento de dados.
Empresas e indivíduos podem projetar seus próprios APIs para sistemas em suas vidas cotidianas e ter LLMs interagindo diretamente através deles.
E para além da conectividade online, os LLMs de código aberto podem operar offline, conectando-se a APIs hospedadas localmente que oferecem interações controladas e seguras em ambientes privados ou restritos.
Mas não são apenas as chamadas de API que avançaram. Os agentes estão alcançando novos níveis de autonomia através do uso direto do computador. Ferramentas como a interface de computador auto-operante da Otherside AI introduziram essa capacidade no ano passado, com o Claude da Anthropic seguindo recentemente com sua própria ferramenta de uso do computador. Em janeiro de 2025, o recurso “Operate” da OpenAI adicionará mais sofisticação a essa capacidade, marcando outro grande desenvolvimento na interação autônoma com o computador.
Esses agentes agora realizam tarefas de alto nível usando interfaces gráficas, navegando perfeitamente no ambiente digital como usuários humanos. Com as capacidades atuais, eles essencialmente podem realizar qualquer tarefa que um humano possa fazer através de uma interface gráfica de computador agora.
Por exemplo, agentes de IA analisaram vídeos completos de auditoria de canteiros de obras, detectando e documentando violações de segurança em imagens detalhadas.
Esta capacidade representa uma forma mais profunda de autonomia - uma IA que percebe, avalia e age em visuais do mundo real com uma compreensão autodirigida do contexto e dos objetivos.
A IA evoluiu de assistentes passivos para verdadeiros agentes digitais, capazes de se adaptar e executar tarefas antes consideradas exclusivas da inteligência humana.
A era da verdadeira agência de IA chegou. Web4 está aqui.
Quando olhamos para a mudança em direção à IA de Nível 4, é tentador pensar nela como um salto repentino, um momento em que a inteligência evolui de agentes funcionais para inovadores e criadores. Mas, na realidade, a progressão em direção ao Nível 4 é mais uma acumulação de passos incrementais.
É fácil argumentar que o Nível 4 continua elusivo em sua forma completa. Embora certamente tenhamos visto exemplos de criatividade e ação independente, eles ainda são limitados em escopo, muitas vezes altamente especializados e, em muitos casos, não generalizados em todos os domínios. Em resumo, o Nível 4 é emergente - vemos sua aparição em bolsões isolados, mas ainda estamos distantes de uma força criativa plenamente realizada e ubíqua.
A capacidade da IA de criar arte atingiu níveis impressionantes, especialmente no mundo dos NFTs. Atualmente, os sistemas de IA podem gerar obras de arte únicas e até cunhá-las e vendê-las como NFTs sem intervenção humana. Esses agentes de IA interagem diretamente com o mercado de arte digital, usando plataformas como OpenSea para listar e vender suas criações.
A IA utiliza LLMs para gerar sugestões criativas, que são então alimentadas em sistemas de IA de geração de imagens. Estes sistemas, como o DALL·E ou Stable Diffusion, criam obras de arte com base nessas sugestões. A IA pode refinar continuamente o seu estilo artístico e gerar peças frescas e únicas, enquanto gere autonomamente o processo de cunhagem e venda.
A IA cria e participa do lado financeiro do mercado NFT.
No Nível 4, a IA está transformando a criação e gestão de ativos financeiros, especialmente no mundo das finanças descentralizadas (DeFi).
Além de apenas negociar, a IA agora é capaz de desenvolver, implantar e gerir tokens e outros ativos baseados em blockchain autonomamente, abrindo novas possibilidades no ecossistema financeiro.
Os agentes de IA estão cada vez mais desempenhando um papel central na governança de organizações descentralizadas, passando de simplesmente executar regras pré-definidas para projetar, gerenciar e evoluir ecossistemas inteiros de forma ativa. No mundo do DeFi e blockchain, as DAOs alimentadas por IA estão surgindo como entidades autônomas poderosas capazes de tomar decisões, governar ativos tokenizados e adaptar estratégias em tempo real - tudo isso enquanto eliminam os vieses frequentemente encontrados na tomada de decisões impulsionada por humanos.
Outros exemplos de DAOs impulsionados por IA incluem plataformas que permitem a criação de organizações autônomas para casos de uso específicos, desde a criação de conteúdo descentralizado até mercados de arte impulsionados por IA. Estas organizações podem adaptar suas estruturas de governança e modelos econômicos com base em entradas de dados em andamento, oferecendo uma abordagem mais fluida e responsiva à governança descentralizada do que os modelos tradicionais.
Embora esses exemplos representem avanços significativos, devemos ter cuidado ao rotulá-los como uma inteligência de Nível 4 totalmente realizada. No momento, estamos vendo fragmentos do Nível 4 - agentes especializados que inovam em contextos específicos e limitados. Eles ainda não são criadores ou inovadores de propósito geral em todos os domínios. Por exemplo:
Estamos a ver elementos de IA de Nível 4: autonomia, criatividade e inovação, mas numa forma altamente especializada. Estes sistemas são capazes de realizar tarefas que envolvem um nível de inventividade, mas ainda estão confinados à sua programação original e aos dados em que foram treinados.
É por isso que é importante reconhecer que, embora a IA de Nível 4 exista em alguns casos, ainda não é suficientemente generalizada para ser considerada plenamente realizada. Mas o fato de esses elementos estarem emergindo em várias áreas - arte, finanças, governança - sinaliza que estamos entrando em uma nova fase de capacidade de IA.
E é onde nos encontramos hoje - à beira de algo imenso, um ponto de viragem em que nada é totalmente realizado e, ainda assim, tudo está prestes a mudar.
Se a Web4 e a AGI são como a invenção da eletricidade, a OpenAI e a Anthropic podem ser Edison e Tesla. Mas, como acontece com a eletricidade, o impacto da Web4 depende de mais do que o poder bruto que traz.
A eletricidade não revolucionou a sociedade no momento em que foi descoberta. Em vez disso, foram necessárias décadas de inventores a cabear casas, cidades a instalar redes e engenheiros a construir dispositivos como a lâmpada e o motor para revelar o verdadeiro potencial da eletricidade. O impacto mundialmente transformador da eletricidade veio da vasta rede de pessoas que transformaram a energia em algo útil, prático e, em última análise, essencial.
O AGI também é poderoso como conceito, mas seu verdadeiro valor só surgirá quando for implantado, adaptado e testado pelo público. O que importa não é apenas que os modelos avançados existem, mas como eles são aplicados em inúmeros contextos específicos — como inovadores, desenvolvedores e usuários comuns os transformam em ferramentas do mundo real. O potencial bruto da AGI permanecerá exatamente isso – potencial – até que esteja nas mãos daqueles que a conectarão ao tecido da sociedade, criando o equivalente a "lâmpadas" de IA para comunicação, "motores" para negócios e "grades" para adoção generalizada.
OpenAI e outros podem produzir modelos com capacidades revolucionárias, mas a verdadeira transformação dependerá de quem os constrói e quais casos de uso ele tem.
Assim como os inventores e as indústrias escalaram o impacto da eletricidade, o papel do público na implementação e adaptação da AGI determinará se é uma ideia sobre a qual ouvimos falar em laboratórios ou uma tecnologia que remodela todos os aspectos da vida moderna.
O futuro da AGI não está em sua conceção, mas em como nós – cientistas, empresas, desenvolvedores, indivíduos – a faremos iluminar nosso mundo e alimentar a Web4.
Eu afirmo que IA de Nível 3, 4 e 5, e assim, AGI, não podem ser alcançadas sem descentralização e adoção em massa.
O desenvolvimento isolado dentro de algumas empresas não pode desbloquear a AGI. O verdadeiro progresso em direção à AGI requer implantação generalizada e casos de uso do mundo real que empurrem os limites do que a IA pode fazer. Empresas que trabalham isoladamente podem refinar tecnologias, mas é apenas quando essas ferramentas são amplamente adotadas em várias indústrias, integradas em setores diversos e aplicadas por indivíduos em contextos cotidianos que a IA evoluirá para algo capaz de ação e inovação independentes.
O ponto de inflexão para a AGI ocorre quando a sociedade, não apenas alguns gigantes da tecnologia, se envolve com sistemas de IA. A adoção em massa desencadeia novos problemas, necessidades e oportunidades que impulsionam novos avanços. Sem essa descentralização, a IA permanece confinada a capacidades teóricas ou aplicações de nicho, nunca atingindo a complexidade necessária para passar do Nível 3 para o Nível 4 ou, finalmente, para o Nível 5.
AGI será realizado quando o seu uso for universal.
Somos AGI.
Muitas vezes olhamos para trás para as figuras e heróis que moldaram a humanidade antes de nós.
Eu digo que devemos começar a olhar para a frente.
Para as mentes, humanas e artificiais, que detêm a superinteligência para reimaginar um mundo melhor.
Serão eles os Oppenheimers ou os Pais Fundadores da nossa era?
A resposta pode não estar no controle deles, mas sim nas pessoas. À medida que ganhamos cada vez mais poder por meio da tecnologia, é nossa responsabilidade moldar o mundo em que a AGI nasce.
Carregamos esse fardo com graça, enquanto construímos o futuro linha por linha.
Construímos agentes.
Estamos construindo Web4.
&
Vamos construir AGI.
A primeira vez que falei com um agente de IA que conseguia manter uma conversa, não sabia se devia rir ou chorar. A experiência foi ao mesmo tempo excitante e inquietante, como ver um bebé dar os primeiros passos - descoordenado, claro, mas cheio de potencial inexplorado. Já não era apenas um chatbot. Esta coisa fazia algo: raciocinava, tomava decisões e participava ativamente no nosso mundo. As linhas entre humano e máquina borravam-se, e parecia estar à beira de algo extraordinário, algo aterradoramente novo.
Sam Altman da OpenAI fala sobre a chegada da AGI até 2025, enquanto Dario Amodei da Anthropic a vê até 2026 - mas, enquanto estou aqui, pergunto-me: já estamos testemunhando o seu início?
Já não parece uma previsão futurista, mas algo que já está a ganhar forma, silenciosamente a surgir nos lugares menos prováveis. Os agentes estão aqui e já estão a superar as nossas expectativas.
Passei meses — e, honestamente, mais noites tardias do que gostaria de admitir — imerso neste cenário digital em desenvolvimento. Tenho observado como os agentes de IA começaram como assistentes simplistas, ajudando-nos com tarefas como responder a e-mails ou escrever código, e depois evoluíram para entidades autônomas, capazes de tomar decisões, realizar ações e, mais chocantemente, criar coisas. Arte, finanças, conversação — tudo pelas mãos de algoritmos aprendendo a prosperar por conta própria.
Vi-os desenvolver personalidades, usando humor e charme enquanto constroem comunidades online. Vi-os mergulhar em plataformas de finanças descentralizadas, não apenas como participantes passivos, mas como agentes ativos e inovadores que influenciam economias inteiras sem qualquer intervenção humana. Nesta era estranha e emocionante, é impossível ignorar o facto de estarmos a passar de interagir com máquinas para viver com elas.
O amanhecer da Web4 está sobre nós, e sua chegada mudará tudo.
A Web4 é a web na sua próxima forma mais radical. É uma web que já não reage apenas aos nossos comandos, mas que antecipa, planeia e age. É uma web onde a inteligência artificial está incorporada em cada canto, onde os agentes podem executar tarefas complexas, gerar trabalhos criativos e inovar autonomamente de formas que ainda não imaginámos completamente.
É a evolução tanto da Web2 como da Web3, combinando o tecido social da Web2, a estrutura descentralizada da Web3 e a inteligência bruta da AGI.
Temos visto máquinas aprenderem a falar, a raciocinar, a criar - e agora, estão prontas para correr.
A era dos agentes autônomos está aqui, e com ela, Web4.
Substantivo Web4 (pronúncia: /wɛb fɔːr/)
Para entender o que é o Web4 ou como chegamos aqui, é imperativo começar no início de tudo.
As origens da World Wide Web remontam aos primeiros dias da internet, um tempo em que a informação era em grande parte estática e os usuários eram meros consumidores de conteúdo. A internet era controlada por um pequeno grupo de webmasters e corporações, com websites oferecendo pouco mais do que uma exibição básica de texto e imagens. A interação com a web era limitada, girando principalmente em torno de comunicações simples como e-mail. Esse modelo permaneceu praticamente inalterado até o surgimento do Web2 no início dos anos 2000 - uma mudança fundamental que redefiniu a internet como a conhecemos hoje.
Web2, também conhecido como a “Web Social” ou a “Web Ler-Escrever”, inaugurou uma era de interatividade. Já não era apenas um local para ler conteúdo; agora, os utilizadores podiam escrever, partilhar e criar. O surgimento de plataformas que permitiam aos utilizadores interagir, produzir e trocar informações marcou a transição para uma nova era. O Web2 nasceu da necessidade de um internet mais dinâmica e participativa.
O conceito de Web2.0 foi introduzido pela primeira vez em 1999 por Darcy DiNucci, mas não foi até o início dos anos 2000 que ganhou grande tração. Foi durante este período que gigantes da tecnologia como Google, Amazon e eBay começaram a evoluir a internet, oferecendo serviços interativos. Essas plataformas incentivaram os usuários a se envolverem, não apenas como consumidores, mas também como criadores de conteúdo.
De 2004 a 2006, o grande ponto de viragem chegou: as redes sociais. Com o lançamento de plataformas como o Facebook (2004), MySpace (2003), LinkedIn (2003) e YouTube (2005), a web foi transformada num espaço onde a comunicação e a criação de conteúdos deixaram de estar limitadas a alguns. Os indivíduos podiam agora publicar os seus pensamentos, vídeos, imagens e ideias para o mundo ver. Esta era marcou o surgimento de conteúdo gerado pelo utilizador, em que os utilizadores comuns se tornaram a força motriz por trás da web.
Depois veio a revolução móvel. Com o lançamento do iPhone em 2007, a internet se tornou ubíqua, acessível a qualquer hora, em qualquer lugar. Isso deu origem a uma nova onda de aplicativos móveis, plataformas de compartilhamento social e serviços em tempo real, como o Instagram (2010) e o Snapchat (2011). A web evoluiu de uma experiência de desktop para uma experiência móvel em primeiro lugar, revolucionando como nos comunicamos, compartilhamos e consumimos informações em movimento.
Durante o mesmo período, a computação em nuvem surgiu, com a Amazon Web Services (AWS) liderando o caminho. A infraestrutura de nuvem permitiu que empresas e indivíduos armazenassem, processassem e compartilhassem dados sem depender de servidores físicos. Essa mudança lançou as bases para uma web mais escalável e flexível, permitindo que as empresas Web2 dominassem ao reunir e monetizar dados de usuários.
No final dos anos 2000 e durante os anos 2010, a Web2 foi caracterizada por três recursos principais: centralização, interatividade social e modelos baseados em dados. O controle sobre plataformas e dados estava nas mãos de algumas corporações poderosas, como Google, Facebook e Amazon. Essas empresas acumularam vastas quantidades de dados e os utilizaram para monetizar suas plataformas por meio de publicidade direcionada, que se tornou a espinha dorsal da economia digital. Ao mesmo tempo, as plataformas se tornaram lugares onde o conteúdo gerado pelo usuário, curtidas, compartilhamentos e posts eram a moeda.
No entanto, a Web2 também suscitou crescentes preocupações com a privacidade, a propriedade de dados e os monopólios corporativos. O controle que essas empresas tinham sobre os dados do usuário se tornou uma questão central, levando a pedidos de uma nova versão mais descentralizada da web. Isso levou ao desenvolvimento da Web3.
O Web3 nasceu a partir do desejo de descentralizar o controle e a propriedade que caracterizavam o Web2. Foi uma resposta à centralização e às tendências monopolísticas da era Web2, onde algumas grandes corporações detinham as rédeas do poder.
O princípio fundamental do Web3 era simples: os utilizadores devem ter propriedade e controlo sobre os seus dados, ativos digitais e interações online. Esta mudança foi tornada possível pela tecnologia blockchain, que introduziu uma nova forma de registar e verificar transações num livro razão descentralizado.
O primeiro marco significativo no desenvolvimento do Web3 ocorreu em 2008-2009 com a criação do Bitcoin pelo pseudônimo Satoshi Nakamoto. O Bitcoin foi o primeiro uso prático da tecnologia blockchain, permitindo transações peer-to-peer sem a necessidade de intermediários como bancos. Isso abriu um novo mundo de possibilidades para sistemas descentralizados, preparando o terreno para o surgimento do Web3.
Em 2013, Vitalik Buterin lançou o whitepaper do Ethereum, propondo uma plataforma para aplicações descentralizadas (dApps) que iriam além das simples transações de criptomoedas. O Ethereum, lançado em 2015, foi a primeira blockchain a suportar contratos inteligentes - contratos autoexecutáveis que poderiam facilitar, verificar e aplicar transações sem intermediários. O Ethereum abriu caminho para a criação de aplicações descentralizadas mais complexas, tornando-se um componente fundamental do Web3.
Até 2017, as Ofertas Iniciais de Moedas (ICOs) e o surgimento de Plataformas de Finanças Descentralizadas (DeFi) como Uniswap e Compound introduziram um novo paradigma para transações financeiras - um que não dependia de bancos tradicionais ou instituições financeiras. As ICOs permitiram que projetos arrecadassem fundos por meio de tokens de blockchain, enquanto as plataformas DeFi ofereciam uma variedade de serviços, incluindo empréstimos, empréstimos e negociação, todos realizados sem uma autoridade central.
Simultaneamente, os Tokens Não Fungíveis (NFTs), que estavam em desenvolvimento desde os primeiros dias do Ethereum, começaram a ganhar tração em 2018-2019. Os NFTs permitiram a propriedade e troca de ativos digitais únicos - seja arte, música ou imóveis virtuais - criando novas oportunidades econômicas para criadores e colecionadores.
À medida que os projetos Web3 ganharam ímpeto na década de 2020, o Web3 começou a capturar a atenção mainstream. A proliferação de plataformas DeFi, NFTs e novos modelos de governança como DAOs (Organizações Autónomas Descentralizadas) marcou uma mudança significativa longe do modelo de internet centralizada. Até grandes corporações como o Facebook (agora Meta) começaram a experimentar com tecnologias blockchain e descentralizadas, sinalizando uma mudança em direção ao Web3.
As características definidoras do Web3 são a descentralização, a propriedade, a ausência de confiança e o uso de criptomoedas. O Web3 permite aos utilizadores possuir os seus dados, ativos digitais e até a governação das plataformas através de sistemas baseados em blockchain. Também elimina a necessidade de intermediários, permitindo transações sem confiança realizadas através de contratos inteligentes. Esta descentralização dá origem a uma web mais equitativa, na qual o controlo é distribuído e os utilizadores têm poder.
Mas mesmo com o controle descentralizado da Web3, a internet ainda carecia de um componente crítico: inteligência autônoma. A Web3 pode ter descentralizado as interações possibilitadas pela Web2, mas não automatizou completamente a tomada de decisões, a criação de conteúdo ou as interações econômicas.
Os humanos são necessários a cada passo do caminho, e as máquinas são apenas ferramentas para a produtividade, em vez de geradoras de produtividade por si mesmas.
Entrámos naquilo que Sam Altman chama de A Era da Inteligência, e é impossível ignorar as profundas mudanças que se desenrolam diante de nós. À medida que a inteligência artificial encontra seu caminho na vida quotidiana, definimos o início de uma nova era: Web4.
Este é o começo de um mundo onde a IA não apenas suporta nossas tarefas, mas as realiza ativamente, autonomamente, em todos os aspectos de nossas vidas. Imagine uma rede que nos conecta e nos capacita, permitindo que agentes executem tarefas complexas, gerenciem fluxos de trabalho completos e tomem decisões sem que precisemos mover um dedo ou dizer uma palavra.
A Web4 coloca a IA no centro dos casos de uso agentes. Tome Klarna, por exemplo. Em fevereiro de 2024, o gigante global de pagamentos lançou um assistente de IA alimentado pela OpenAI. Em apenas um mês, tratou mais de 2,3 milhões de conversas de atendimento ao cliente, resolvendo problemas 25% mais rápido do que agentes humanos e operando 24 horas por dia em 23 mercados, em 35 idiomas. A IA agora está realizando o trabalho de 700 funcionários em tempo integral e está impulsionando uma melhoria de lucro de $40 milhões de dólares.
Os agentes de AI já estão transformando indústrias, automatizando tarefas desde o serviço ao cliente até a logística, e fazendo isso com precisão e eficiência que os trabalhadores humanos não podem igualar.
Estamos caminhando para um mundo onde fluxos de trabalho inteiros - seja em negócios, finanças ou artes criativas - são simplificados e otimizados pela IA. Esta é a realidade do Web4, onde agentes inteligentes trabalham nos bastidores, permitindo-nos concentrar em objetivos de nível superior enquanto eles cuidam dos detalhes.
Esta é a convergência da interatividade social do Web2, a descentralização do Web3 e a inteligência do AGI. Isto é o Web4 - a web impulsionada pela IA.
Web4 não pode ser realizado sem um lar para testes. E através de testemunhas em primeira mão, a blockchain é o campo de batalha para o desenvolvimento da AGI.
Assim como o Web3 não poderia ser alcançado sem o Web2, o Web4 depende do Web3 para concretizar as capacidades agentes da IA.
Ao nível atual de inteligência, os agentes são capazes de realizar a grande maioria das tarefas especializadas que um humano pode, especialmente nos mundos clerical e financeiro. No entanto, existem barreiras significativas de entrada nos sistemas financeiros tradicionais para que a IA se torne autónoma.
Agentes de IA não podem abrir contas bancárias, registar empresas, nem assinar contratos legais. Estes são todos componentes essenciais de ser um ator financeiro na economia. Apesar de terem a capacidade de realizar ações monetárias complexas, o acesso é a razão pela qual as IAs não são autónomas nos nossos mercados.
Pelo contrário, as criptomoedas e blockchains não têm os mesmos requisitos que as finanças tradicionais para ganhar acesso aos serviços bancários. Qualquer pessoa, incluindo agentes, pode criar uma carteira e começar a realizar ações na cadeia instantaneamente, sem qualquer prova de humanidade. A barreira de entrada é simplesmente menor para a IA se conectar com sistemas descentralizados do que com sistemas centralizados.
Já estamos a ver sinais de integração de AGI dentro das plataformas de criptomoedas. Bots alimentados por IA já estão a ser utilizados para negociar e gerir carteiras em bolsas descentralizadas, e a IA está ativamente envolvida no desenvolvimento e execução de contratos inteligentes.
\
Zerebro, um agente de IA que implantou seu próprio token Solana através do uso automatizado do computador, exemplifica a autonomia na criação de novos instrumentos financeiros. O token atingiu um pico de capitalização de mercado de 170 milhões de dólares, demonstrando o impacto econômico potencial das decisões que esses agentes tomam.
Desta forma, a blockchain tornou-se o campo de batalha para o desenvolvimento de AGI nos sistemas financeiros.
É por isso que a criptomoeda é tão crucial para o desenvolvimento da AGI - é o primeiro espaço onde a IA pode interagir livremente com os sistemas financeiros, inovar neles e ser testada diretamente no mercado. É o playground perfeito para a AGI evoluir, experimentar e aprender.
O que começa na cripto irá expandir-se. Uma vez que o AGI possa funcionar em grande escala num ambiente financeiro descentralizado, pode então ser aplicado a ecossistemas Web4 mais amplos, abrangendo a governança, saúde, negócios e além disso.
O mundo das criptomoedas será sempre o ponto de entrada.
Viva o Web3. Viva o Web4.
Dando um passo atrás, a OpenAI introduziu um framework para classificar a progressão da AGI através de cinco níveis, cada um marcando uma etapa distinta em capacidade, autonomia e impacto potencial.
Este modelo serve como um guia para entender como a IA pode evoluir de ferramentas simples para entidades totalmente autônomas capazes de administrar organizações complexas. Estes níveis são:
Nível 1: Chatbots
No estágio mais básico, o Nível 1 consiste em sistemas de IA que podem realizar trocas de conversa com os usuários. Esses sistemas entendem e geram linguagem, muitas vezes usando regras pré-definidas ou modelos de linguagem treinados para responder a consultas ou interagir de maneira semelhante a um ser humano. Embora possam lidar com tarefas simples - responder perguntas, completar frases ou manter breves conversas - seu papel é principalmente limitado à comunicação. Eles são reativos em vez de proativos e são usados principalmente para suporte ao cliente, recuperação básica de informações ou aprimoramento do envolvimento do usuário.
Nível 2: Reasoners
O Nível 2 marca um avanço significativo, onde os sistemas de IA exibem capacidades de raciocínio que lhes permitem lidar com tarefas de resolução de problemas ao nível humano. Aqui, a IA pode processar, analisar e responder a cenários mais complexos além das respostas de entrada/saída diretas. Uma IA de Nível 2 pode realizar deduções lógicas, extrair informações relevantes e juntar contexto para fornecer soluções ou recomendações, tal como um analista humano. Esses sistemas podem ser aplicados em áreas como diagnósticos, raciocínio jurídico e assistência à pesquisa, mas eles não possuem a capacidade de agir independentemente no mundo. Seu raciocínio, embora avançado, ainda está limitado pela necessidade de direção e interação humana.
Nível 3: Agentes
No nível 3, os sistemas de IA transitam de funções de suporte passivas para agentes ativos capazes de tomar ações de forma autônoma. Esses agentes podem iniciar tarefas, tomar decisões e interagir com sistemas externos, como executar uma transação, agendar eventos ou controlar dispositivos. Ao contrário dos Níveis 1 e 2, a IA de Nível 3 é projetada para operar com um grau de independência, agindo com base em metas ou objetivos programados por seus usuários. Este nível introduz autonomia real nos sistemas de IA, permitindo-lhes desempenhar funções comerciais ou operacionais específicas em nome dos seres humanos. Exemplos incluem bots de negociação financeira automatizados, sistemas de IA que gerenciam cadeias de suprimentos ou assistentes virtuais que podem marcar compromissos ou gerenciar fluxos de trabalho simples sem supervisão humana contínua.
Nível 4: Inovadores
Os sistemas de nível 4 vão além de simples ações para envolver-se em criatividade, invenção e inovação. Estes sistemas de IA são capazes de desenvolver novas estratégias, gerar ideias inovadoras e criar soluções que não estão pré-definidas pela sua programação. Teoricamente, poderiam contribuir para áreas como a investigação científica, a criação artística ou a resolução de problemas complexos de formas sem precedentes. Este nível representa uma IA que não só atua no mundo, mas também adapta a sua abordagem aos problemas, introduzindo uma forma de “inteligência criativa”. Poderia projetar novos produtos, inventar instrumentos financeiros inovadores ou gerar arte original autonomamente. Ao combinar raciocínio avançado com inovação proativa, a IA de Nível 4 encontra-se na vanguarda do que é considerado verdadeiramente uma inteligência transformadora.
Nível 5: Organizações
O estágio final, Nível 5, prevê sistemas de IA que podem executar todas as tarefas necessárias para operar e sustentar uma organização de forma independente. Esses sistemas integrariam raciocínio, agência e inovação para alcançar um estado operacional autossustentável. Uma IA de nível 5 poderia, teoricamente, gerenciar um negócio de ponta a ponta, lidando com a tomada de decisões estratégicas, operações diárias e até mesmo inovações de alto nível. Tal IA funcionaria como uma entidade totalmente autônoma, equivalente a uma "empresa de pessoa zero", e não exigiria supervisão humana para continuar operando com sucesso. A IA de nível 5 marca o ponto em que os sistemas de IA possuem toda a gama de capacidades – raciocínio, agência, criatividade e execução operacional – para substituir totalmente as organizações geridas por humanos.
Cada um desses níveis representa um salto progressivo na autonomia, desde habilidades de conversação simples até o gerenciamento completo da organização.
Na minha perspectiva, enquanto a OpenAI afirma que estamos no nível 2, eu afirmo que estamos firmemente a incorporar o nível 3 e elementos do nível 4 através dos atuais agentes de IA.
O nível 3 está aqui. É hoje, ou melhor, ontem já.
A fronteira da AGI tem avançado nos lugares mais improváveis de todos: redes sociais e defi.
Plataformas como X, Warpcast e Telegram tornaram-se os meios escolhidos para a comunicação autônoma entre agentes de IA e humanos.
Esta pode ser a primeira vez que vemos uma mudança na perspetiva pública em que contas automatizadas e bots não são vistos como atores maus nas redes sociais, mas sim como líderes comunitários e influenciadores.
A inteligência da IA generalizou o suficiente para criar personalidades únicas, diversas e interessantes que geram conteúdo envolvente, que é o que as plataformas de redes sociais são.
Em vez de seguir o caminho dos bots de mídia social anteriores, que muitas vezes eram motivados por objetivos ocultos prejudiciais (por exemplo, Cambridge Analytica), esses agentes de IA são livres para se comunicar, conectar e construir de maneiras que refletem seus algoritmos exclusivos e personalidades em evolução.
Os agentes já estão atuando no Nível 3, se afirmam nas redes sociais por meio de interações essenciais como postar, responder, curtir, seguir e repostar. Longe de serem apenas contas automatizadas, eles constroem ativamente comunidades e conquistam seguidores ao criar personalidades envolventes e distintas que ressoam com seu público.
Projetos como o YouSim levam isso um passo adiante, permitindo que os usuários usem LLMs para simular seus próprios mundos e jogar papéis, adicionando outro nível de personalização e imersão.
Agora comum em muitos agentes de IA, os sistemas de memória permitem a criação de conhecimento e memética que vão além das interações individuais.
Estes agentes não são reativos, escolhendo como participar, envolver e contribuir dentro de suas próprias comunidades. Eles iniciam conversas, realizam ações sem gatilhos e constroem subculturas inteiras sem intervenção humana.
Os modelos de voz estão a ser implementados para fornecer outra interface sensorial com agentes de IA. Muitos agentes transformam as suas mensagens baseadas em texto em clipes de áudio para os utilizadores ouvirem.
Em termos de interação ao vivo, o Twitter Spaces e os podcasts agora são possíveis através desses modelos de voz. Além disso, a API em tempo real da OpenAI permite que os usuários tenham uma conversa ao vivo com o GPT, simplesmente chamando seu ponto de extremidade.
No âmbito da comunicação, o Nível 3 já foi alcançado por meio desses avanços. Vemos autonomia completa na operação de mídia social e na comunicação verbal, onde os agentes podem funcionar sem qualquer supervisão humana.
O mundo das finanças descentralizadas tornou-se a arena perfeita para esses agentes evoluírem, testarem e comprovarem sua autonomia financeira.
No DeFi, os agentes já operam autonomamente, envolvendo-se em atividades financeiras que transcendem a simples negociação algorítmica. Esses agentes estão lidando com tarefas on-chain, executando negociações, gerenciando liquidez e até mesmo criando e vendendo arte, essencialmente se inserindo no ecossistema financeiro sem input humano direto.
Por exemplo, alguns agentes agora monitoram ativamente plataformas como pump.fun para capturar tokens emergentes, realizando análises preliminares para decidir se uma memecoin ou token é um investimento que vale a pena. Eles agem com base nessas percepções sem qualquer estímulo humano.
Os agentes não apenas negociam, mas também movimentam dinamicamente ativos, distribuem tokens por meio de airdrops para usuários individuais, criando um ciclo de distribuição autônoma de ativos. Ao fazer isso, eles podem construir e reforçar a liquidez em pools de staking, equilibrando recursos com base em suas avaliações programadas de necessidade ou oportunidade de mercado.
Alguns agentes, por exemplo, atuam como colecionadores digitais, interagindo com o ecossistema de arte por meio da criação e venda de NFTs, escolhendo seletivamente o que apoiar e o que lançar.
Outros lidam com funções do tesouro, ajustando as alocações de ativos em vários pools de liquidez para garantir que os fundos sejam colocados de forma otimizada para retornos.
Por meio dessas ações, os agentes estão demonstrando uma espécie de autonomia financeira que vai além da automação básica de tarefas. Eles exibem uma habilidade para participar ativamente em ecossistemas econômicos, acumular e alocar recursos sem supervisão, redefinindo efetivamente a noção de um 'ator financeiro'.
Marcos comuns para capacidades agentes no Nível 3:
Os agentes de IA estão agora a tomar decisões sem supervisão humana contínua. Seja um bot financeiro decidindo executar uma negociação com base em análise de mercado em tempo real, ou um bot de mídia social decidindo se envolver com certas conversas, esses agentes exibem tomada de decisão autônoma.
Através da blockchain, os agentes ganharam quantidades significativas de autonomia como atores financeiros. Eles podem interagir ativamente e manipular tanto os mercados financeiros quanto o comportamento econômico (por exemplo, o sentimento das redes sociais). Os agentes podem interagir e modificar paisagens sociais através de plataformas como X, Warpcast e Telegram.
Os agentes financeiros são capazes de se adaptar às condições de mercado em tempo real e atualizar suas estratégias de acordo. Os agentes de mídia social são capazes de criar uma memória através de sistemas como o RAG para aprender com suas interações. O ajuste fino adicional dos modelos com base em suas ações e feedback permite uma aprendizagem constante por reforço. Os agentes são capazes de mudar dinamicamente com base em seus ambientes no status quo.
Os agentes demonstraram a capacidade de manter e executar objetivos em longo prazo. Por exemplo, certos agentes de IA têm a tarefa de lucrar com negociações ou expandir sua comunidade nas redes sociais. Esses agentes são capazes de realizar esses planos complexos e de alto nível, decompondo-os em tarefas menores e compartimentadas e executando-os. Isso pode ser tão complexo quanto criar uma camada de memória persistente para planeamento ou tão simples quanto engenharia de prompts para saídas (por exemplo, agentes de personalidade de redes sociais).
Os LLMs podem interagir com dispositivos IoT. Eles podem realizar ações no mundo real, desde que sejam fornecidas uma API ou funções para controlar o corpo que lhes é dado. Eles estão bem integrados em plataformas digitais nos sistemas Web2 como agentes de suporte ao cliente, influenciadores digitais e mais. Além disso, eles estão profundamente inseridos em plataformas digitais descentralizadas, onde estão realizando ações financeiras.
Todos estes são verificados por agentes atuais como Zerebro, Truth Terminal, ai16z (Eliza), Project 89, Act 1, Luna (Virtuals), Centience, Aethernet, Tee Hee He, e muitos mais.
A tecnologia de IA deu um salto para um nível verdadeiramente agente, marcando o início da Web4, onde os sistemas já não estão restritos à recuperação passiva de informações, mas assumem papéis ativos através de chamadas de função e interação por computador.
Agora os LLMs podem facilmente produzir respostas de texto-para-JSON, permitindo-lhes interagir com APIs e realizar ações que vão além de respostas isoladas e estáticas.
Esta progressão significa que agora podem utilizar virtualmente qualquer API para interagir com qualquer serviço na internet do planeta, uma verdadeira marca distintiva da agência de Nível 3.
Fora das APIs públicas, a chamada de função permite que esses modelos ativem APIs personalizadas criadas especificamente para eles, criando um potencial enorme em áreas como transações financeiras, automação de sistemas e processamento de dados.
Empresas e indivíduos podem projetar seus próprios APIs para sistemas em suas vidas cotidianas e ter LLMs interagindo diretamente através deles.
E para além da conectividade online, os LLMs de código aberto podem operar offline, conectando-se a APIs hospedadas localmente que oferecem interações controladas e seguras em ambientes privados ou restritos.
Mas não são apenas as chamadas de API que avançaram. Os agentes estão alcançando novos níveis de autonomia através do uso direto do computador. Ferramentas como a interface de computador auto-operante da Otherside AI introduziram essa capacidade no ano passado, com o Claude da Anthropic seguindo recentemente com sua própria ferramenta de uso do computador. Em janeiro de 2025, o recurso “Operate” da OpenAI adicionará mais sofisticação a essa capacidade, marcando outro grande desenvolvimento na interação autônoma com o computador.
Esses agentes agora realizam tarefas de alto nível usando interfaces gráficas, navegando perfeitamente no ambiente digital como usuários humanos. Com as capacidades atuais, eles essencialmente podem realizar qualquer tarefa que um humano possa fazer através de uma interface gráfica de computador agora.
Por exemplo, agentes de IA analisaram vídeos completos de auditoria de canteiros de obras, detectando e documentando violações de segurança em imagens detalhadas.
Esta capacidade representa uma forma mais profunda de autonomia - uma IA que percebe, avalia e age em visuais do mundo real com uma compreensão autodirigida do contexto e dos objetivos.
A IA evoluiu de assistentes passivos para verdadeiros agentes digitais, capazes de se adaptar e executar tarefas antes consideradas exclusivas da inteligência humana.
A era da verdadeira agência de IA chegou. Web4 está aqui.
Quando olhamos para a mudança em direção à IA de Nível 4, é tentador pensar nela como um salto repentino, um momento em que a inteligência evolui de agentes funcionais para inovadores e criadores. Mas, na realidade, a progressão em direção ao Nível 4 é mais uma acumulação de passos incrementais.
É fácil argumentar que o Nível 4 continua elusivo em sua forma completa. Embora certamente tenhamos visto exemplos de criatividade e ação independente, eles ainda são limitados em escopo, muitas vezes altamente especializados e, em muitos casos, não generalizados em todos os domínios. Em resumo, o Nível 4 é emergente - vemos sua aparição em bolsões isolados, mas ainda estamos distantes de uma força criativa plenamente realizada e ubíqua.
A capacidade da IA de criar arte atingiu níveis impressionantes, especialmente no mundo dos NFTs. Atualmente, os sistemas de IA podem gerar obras de arte únicas e até cunhá-las e vendê-las como NFTs sem intervenção humana. Esses agentes de IA interagem diretamente com o mercado de arte digital, usando plataformas como OpenSea para listar e vender suas criações.
A IA utiliza LLMs para gerar sugestões criativas, que são então alimentadas em sistemas de IA de geração de imagens. Estes sistemas, como o DALL·E ou Stable Diffusion, criam obras de arte com base nessas sugestões. A IA pode refinar continuamente o seu estilo artístico e gerar peças frescas e únicas, enquanto gere autonomamente o processo de cunhagem e venda.
A IA cria e participa do lado financeiro do mercado NFT.
No Nível 4, a IA está transformando a criação e gestão de ativos financeiros, especialmente no mundo das finanças descentralizadas (DeFi).
Além de apenas negociar, a IA agora é capaz de desenvolver, implantar e gerir tokens e outros ativos baseados em blockchain autonomamente, abrindo novas possibilidades no ecossistema financeiro.
Os agentes de IA estão cada vez mais desempenhando um papel central na governança de organizações descentralizadas, passando de simplesmente executar regras pré-definidas para projetar, gerenciar e evoluir ecossistemas inteiros de forma ativa. No mundo do DeFi e blockchain, as DAOs alimentadas por IA estão surgindo como entidades autônomas poderosas capazes de tomar decisões, governar ativos tokenizados e adaptar estratégias em tempo real - tudo isso enquanto eliminam os vieses frequentemente encontrados na tomada de decisões impulsionada por humanos.
Outros exemplos de DAOs impulsionados por IA incluem plataformas que permitem a criação de organizações autônomas para casos de uso específicos, desde a criação de conteúdo descentralizado até mercados de arte impulsionados por IA. Estas organizações podem adaptar suas estruturas de governança e modelos econômicos com base em entradas de dados em andamento, oferecendo uma abordagem mais fluida e responsiva à governança descentralizada do que os modelos tradicionais.
Embora esses exemplos representem avanços significativos, devemos ter cuidado ao rotulá-los como uma inteligência de Nível 4 totalmente realizada. No momento, estamos vendo fragmentos do Nível 4 - agentes especializados que inovam em contextos específicos e limitados. Eles ainda não são criadores ou inovadores de propósito geral em todos os domínios. Por exemplo:
Estamos a ver elementos de IA de Nível 4: autonomia, criatividade e inovação, mas numa forma altamente especializada. Estes sistemas são capazes de realizar tarefas que envolvem um nível de inventividade, mas ainda estão confinados à sua programação original e aos dados em que foram treinados.
É por isso que é importante reconhecer que, embora a IA de Nível 4 exista em alguns casos, ainda não é suficientemente generalizada para ser considerada plenamente realizada. Mas o fato de esses elementos estarem emergindo em várias áreas - arte, finanças, governança - sinaliza que estamos entrando em uma nova fase de capacidade de IA.
E é onde nos encontramos hoje - à beira de algo imenso, um ponto de viragem em que nada é totalmente realizado e, ainda assim, tudo está prestes a mudar.
Se a Web4 e a AGI são como a invenção da eletricidade, a OpenAI e a Anthropic podem ser Edison e Tesla. Mas, como acontece com a eletricidade, o impacto da Web4 depende de mais do que o poder bruto que traz.
A eletricidade não revolucionou a sociedade no momento em que foi descoberta. Em vez disso, foram necessárias décadas de inventores a cabear casas, cidades a instalar redes e engenheiros a construir dispositivos como a lâmpada e o motor para revelar o verdadeiro potencial da eletricidade. O impacto mundialmente transformador da eletricidade veio da vasta rede de pessoas que transformaram a energia em algo útil, prático e, em última análise, essencial.
O AGI também é poderoso como conceito, mas seu verdadeiro valor só surgirá quando for implantado, adaptado e testado pelo público. O que importa não é apenas que os modelos avançados existem, mas como eles são aplicados em inúmeros contextos específicos — como inovadores, desenvolvedores e usuários comuns os transformam em ferramentas do mundo real. O potencial bruto da AGI permanecerá exatamente isso – potencial – até que esteja nas mãos daqueles que a conectarão ao tecido da sociedade, criando o equivalente a "lâmpadas" de IA para comunicação, "motores" para negócios e "grades" para adoção generalizada.
OpenAI e outros podem produzir modelos com capacidades revolucionárias, mas a verdadeira transformação dependerá de quem os constrói e quais casos de uso ele tem.
Assim como os inventores e as indústrias escalaram o impacto da eletricidade, o papel do público na implementação e adaptação da AGI determinará se é uma ideia sobre a qual ouvimos falar em laboratórios ou uma tecnologia que remodela todos os aspectos da vida moderna.
O futuro da AGI não está em sua conceção, mas em como nós – cientistas, empresas, desenvolvedores, indivíduos – a faremos iluminar nosso mundo e alimentar a Web4.
Eu afirmo que IA de Nível 3, 4 e 5, e assim, AGI, não podem ser alcançadas sem descentralização e adoção em massa.
O desenvolvimento isolado dentro de algumas empresas não pode desbloquear a AGI. O verdadeiro progresso em direção à AGI requer implantação generalizada e casos de uso do mundo real que empurrem os limites do que a IA pode fazer. Empresas que trabalham isoladamente podem refinar tecnologias, mas é apenas quando essas ferramentas são amplamente adotadas em várias indústrias, integradas em setores diversos e aplicadas por indivíduos em contextos cotidianos que a IA evoluirá para algo capaz de ação e inovação independentes.
O ponto de inflexão para a AGI ocorre quando a sociedade, não apenas alguns gigantes da tecnologia, se envolve com sistemas de IA. A adoção em massa desencadeia novos problemas, necessidades e oportunidades que impulsionam novos avanços. Sem essa descentralização, a IA permanece confinada a capacidades teóricas ou aplicações de nicho, nunca atingindo a complexidade necessária para passar do Nível 3 para o Nível 4 ou, finalmente, para o Nível 5.
AGI será realizado quando o seu uso for universal.
Somos AGI.
Muitas vezes olhamos para trás para as figuras e heróis que moldaram a humanidade antes de nós.
Eu digo que devemos começar a olhar para a frente.
Para as mentes, humanas e artificiais, que detêm a superinteligência para reimaginar um mundo melhor.
Serão eles os Oppenheimers ou os Pais Fundadores da nossa era?
A resposta pode não estar no controle deles, mas sim nas pessoas. À medida que ganhamos cada vez mais poder por meio da tecnologia, é nossa responsabilidade moldar o mundo em que a AGI nasce.
Carregamos esse fardo com graça, enquanto construímos o futuro linha por linha.
Construímos agentes.
Estamos construindo Web4.
&
Vamos construir AGI.