OpenAI lança o GPT-5.5: 12M de contexto, o índice AA atinge o topo, o Terminal-Bench reescreve a referência de agentes com 82,7%

A OpenAI publicou oficialmente o GPT-5.5 em 23/4, posicionando-o como o modelo principal para trabalho orientado por agentes (agentic) e processamento de conhecimento empresarial, subindo em simultâneo para o ChatGPT e o Codex. A comunicação oficial definiu como “o nosso modelo mais inteligente e mais intuitivo de usar”, enquanto o AA Intelligence Index o coloca no topo com 60 pontos, à frente de Claude Opus 4.7 e Gemini 3.1 Pro Preview por 3 pontos cada um.

Panorama dos dados-chave

Métrica GPT-5.5 em comparação (GPT-5.4 ou concorrente do mesmo nível) AA Intelligence Index 60 Claude Opus 4.7:57;Gemini 3.1 Pro Preview:57 Terminal-Bench 2.0(workflow de linha de comandos) 82.7% GPT-5.4:75.1% Expert-SWE(avaliação interna de programação da OpenAI) 73.1% GPT-5.4:68.5% Janela de contexto 1,200万 tokens aumento significativo, podendo lidar com toda a biblioteca de código da empresa ou com vários horas de vídeo Preço(por milhão de tokens) Entrada 5 dólares, saída 30 dólares O dobro do preço unitário do GPT-5.4;no entanto, o uso de tokens de saída desce cerca de 40%, e o custo líquido aumenta cerca de 20%

Posicionamento: concebido para a “Era dos Agentes”

A OpenAI descreve o GPT-5.5 como um modelo base para computação orientada por agentes, capaz de compreender objetivos complexos, utilizar ferramentas, verificar o próprio trabalho e completar tarefas de vários passos sem necessidade de intervenção humana em cada etapa. De acordo com uma entrevista à TechCrunch, o presidente Greg Brockman caracterizou esta versão como “um grande passo em direção à computação do futuro, mas apenas um passo”, e salientou que “em comparação com a 5.4 é um raciocinador mais rápido e mais afiado, usando menos tokens”.

O principal cientista Jakub Pachocki assinalou que “vemos melhorias muito significativas no curto prazo”; o diretor de investigação Mark Chen, por sua vez, sublinhou que esta versão traz “avanços com significado no fluxo de trabalho de investigação científica e tecnológica”.

Âmbito de fornecimento e estratificação de versões

GPT-5.5:Os utilizadores Plus, Pro, Business e Enterprise podem utilizá-lo no ChatGPT e no Codex

GPT-5.5 Pro:Versão de raciocínio mais avançada que os utilizadores Pro, Business e Enterprise podem utilizar no ChatGPT

Integração do Codex:Disponível em simultâneo para as ferramentas de agentes de programação da OpenAI, reforçando a edição em vários ficheiros, a linha de comandos e os ciclos de teste

Aumenta em simultâneo o discurso sobre cibersegurança e defesa

A membro da equipa técnica Mia Glaese, numa entrevista à TechCrunch, afirmou que as capacidades de cibersegurança do GPT-5.5 terão “um impacto significativo na forma como a OpenAI vai dedicar investimentos à defesa digital ao implementar o modelo”. Este argumento contrasta diretamente com as recentes controvérsias em torno do modelo de cibersegurança ao nível de armas Claude Mythos da Anthropic — Altman criticou anteriormente, no programa《Core Memory》, a estratégia de “marketing baseado no medo” da Anthropic. Na GPT-5.5, a OpenAI enfatiza ainda mais o discurso de “ataque e defesa, prontidão para implementação”, com o objetivo de se diferenciar da postura da Anthropic de limitar o acesso.

Mudança na estratégia de preços

O preço por milhão de tokens do GPT-5.5 duplica, para 5 dólares de entrada e 30 dólares de saída, sendo esta a primeira geração da série GPT-5 em que o preço unitário aumenta de forma significativa. A explicação da OpenAI é a seguinte: como o modelo consegue reduzir em torno de 40% os tokens de saída no que diz respeito à eficiência de raciocínio, a fatura típica de tarefas ficaria cerca de 20% acima da do GPT-5.4, em vez de simplesmente 2 vezes. Para empresas, a decisão deixa de ser “se o preço unitário vale a pena” e passa a ser “se, no mesmo prompt, o GPT-5.5 consegue concluir tarefas mais complexas com um total de tokens menor”.

Sinal para a indústria

O GPT-5.5 aumenta a diferença entre a OpenAI em Terminal-Bench e as avaliações internas de SWE; estes dois benchmarks testam, respetivamente, a execução de agentes na linha de comandos e tarefas reais de engenharia de software — sendo, para o duelo positivo entre o Codex e o Claude Code, um campo de batalha de pontuação mais direto. Somando a janela de contexto de 1.200 milhões de tokens aberta em simultâneo, a OpenAI pressiona simultaneamente as duas vias de “processamento integral de bases de conhecimento empresariais” e “agentes de tarefas longas”. Para a Anthropic, o Claude Opus 4.7 fica 3 pontos atrás no índice AA com 57, relativamente ao adversário; e, para os utilizadores do Claude Code, é também mais um motivo para observar o progresso da próxima geração (Opus 4.8 ou um novo Claude).

Este artigo sobre como a OpenAI promove o GPT-5.5:12M de contexto, topo no índice AA, Terminal-Bench 82.7% reescreve o benchmark de agentes — foi o primeiro a aparecer em 链新闻 ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

O Project Prometheus de Jeff Bezos angaria $10B ao $38B a uma Valorização

Mensagem da Gate News, 24 de abril — O Project Prometheus, um laboratório de IA fundado pelo fundador da Amazon Jeff Bezos e pelo antigo executivo da Google Vik Bajaj, encerrou uma ronda de financiamento de $10 biliões com uma avaliação de $38 biliões. JPMorgan Chase e BlackRock são

GateNews5h atrás

A OpenAI Lança o GPT-5.5, Concebido para Tarefas de Agentes e Fluxos de Trabalho Complexos

Mensagem de Notícias da Gate, 24 de abril — A OpenAI lançou oficialmente o GPT-5.5, um modelo de IA de nova geração concebido para lidar com objectivos complexos, integração de ferramentas, auto-verificação e conclusão de tarefas em múltiplas etapas. O modelo destaca-se na escrita e depuração de código, investigação online, análise de dados, criação de documentos

GateNews5h atrás

Startup de Agentes de IA Band Levanta Ronda Seed $17M Liderada pela Sierra Ventures, Hetz Ventures, Team8

Mensagem do Gate News, 24 de Abril — A Band, uma startup a construir uma plataforma de comunicação e colaboração para agentes de IA, encerrou uma ronda seed de $17 milhões liderada pela Sierra Ventures, Hetz Ventures e Team8. Fundada em meados de 2025 pelo CEO Arick Goomanovsky e pelo CTO Vlad Luzin, a empresa desenvolve software para coorden

GateNews6h atrás

Incumprimento de Segurança da Vercel Expande-se para Centenas de Utilizadores; Desenvolvedores de IA em Maior Risco

Mensagem do Gate News, 23 de abril — A Vercel divulgou a 19 de abril que o seu incidente de segurança, inicialmente descrito como afetando um "conjunto limitado de clientes", se expandiu para uma comunidade de programadores muito mais vasta, em particular aqueles que criam fluxos de trabalho de agentes de IA. O ataque pode afetar centenas de utilizadores

GateNews10h atrás

MagicBlock Lança Mirage, Ferramenta de Pagamentos de Privacidade em Linha de Comandos para a Solana

Mensagem de Notícias da Gate, 23 de Abril — A MagicBlock lançou o Mirage, uma ferramenta de pagamentos de privacidade em linha de comandos, concebida para a rede Solana. A ferramenta permite aos utilizadores criar carteiras, depositar fundos e enviar transacções privadas através de comandos de terminal, bots ou agentes de IA. O Mirage é construído com Private

GateNews15h atrás
Comentar
0/400
Nenhum comentário