Claude Haiku 3 foi oficialmente descontinuado em 19/4: a Anthropic força a migração para o Haiku 4.5, e os programadores têm de alterar o ID do modelo e as definições de parâmetros

De acordo com a documentação oficial da retirada de modelos da Anthropic, o Claude Haiku 3 (ID do modelo: claude-3-haiku-20240307) foi oficialmente descontinuado a 19 de abril de 2026. A partir desta data, todas as chamadas à API para este modelo vão reportar diretamente um erro; a Anthropic não vai encaminhar automaticamente o tráfego para uma nova versão, pelo que os programadores têm de atualizar ativamente o ID do modelo no código para o Haiku 4.5. Este é o primeiro grande evento de fim de ciclo de vida (lifecycle) de um modelo Claude deste ano.

Impacto centra-se sobretudo em aplicações ligeiras

Lançado em março de 2024, o Claude Haiku 3 foi, na altura, o modelo mais barato e mais rápido da Anthropic, sendo amplamente utilizado em tarefas frequentes e ligeiras como bots de atendimento ao cliente, sumarização, classificação e moderação de conteúdos. Passados dois anos, ainda há muitos SaaS de pequena/média dimensão e ferramentas internas que utilizam este modelo, porque o prompt e os custos foram profundamente ajustados; a substituição exige refazer QA. O aviso de retirada começou em fevereiro e, através de notificações oficiais, email e alertas no dashboard, a Anthropic enviou pelo menos 60 dias de antecedência a todos os clientes empresariais com contratos.

Duas alterações destrutivas ao migrar para o Haiku 4.5

A solução alternativa recomendada oficialmente é o Claude Haiku 4.5, mas a migração não é apenas uma questão de alterar uma string. Os programadores devem ter atenção a duas alterações destrutivas: primeiro, os parâmetros de amostragem temperature e top_p passam agora a permitir apenas a definição de um deles; se o código existente tiver valores explícitos para ambos, a API da Anthropic irá reportar um erro; segundo, o Haiku 4.5 adiciona um refusal stop reason, que é devolvido quando o modelo recusa responder, em vez de, como no Haiku 3, gerar diretamente um error ou devolver um placeholder — o código do produto tem de tratar a refusal como um caminho normal.

Além disso, a controvérsia da última semana sobre uma subida “silenciosa” da faturação causada pela alteração do tokenizer do Opus 4.7 pode igualmente aplicar-se ao Haiku 4.5 — mesmo que a rate card indique um preço por token mais baixo, o consumo real de tokens nas tarefas de negócio pode variar devido a diferenças no tokenizer. Recomenda-se que todos os planos de migração sejam testados empiricamente no dia da mudança para comparar custos.

A gestão do ciclo de vida dos modelos de IA torna-se uma disciplina obrigatória para as empresas

Este aviso de retirada evidencia uma mudança estrutural na infraestrutura de IA das empresas: os LLM passaram de uma fase de “aquisição pontual” para uma fase de “gestão contínua de versões”, tal como acontece com serviços cloud e sistemas operativos. A página oficial de deprecation da Anthropic antecipa, em simultâneo, que o Claude Opus 4 e o Sonnet 4 serão descontinuados a 15 de junho de 2026; o calendário está muito concentrado. As cláusulas de aquisição de IA das empresas devem incluir itens contratuais como “período mínimo de suporte”, “modelos alternativos automaticamente disponíveis” e “subsídio para testes de migração”; caso contrário, o serviço em produção pode ser interrompido devido à desativação dos modelos.

Recomendações de ações para programadores em Taiwan e equipas de SaaS

Três ações imediatas: primeiro, pesquisar todos os repositórios de código e ficheiros de configuração, e substituir claude-3-haiku-20240307 por claude-haiku-4-5; segundo, verificar se nas chamadas à API há definição simultânea de temperature e top_p, e conservar apenas um; terceiro, adicionar, no handler, uma ramificação de tratamento para refusal stop reason, para evitar erros inesperados voltados para o utilizador. Para organizações com contratos empresariais com cobrança por uso, monitorizar a variação do consumo de tokens na semana da troca também é uma ação necessária, para evitar gastos inesperados causados por diferenças no tokenizer.

Este artigo: retirada oficial do Claude Haiku 3 em 19/4 — a Anthropic força a migração para o Haiku 4.5, os programadores têm de alterar o ID do modelo e as definições de parâmetros. Aconteceu pela primeira vez em Cadeia de Notícias ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A capitalização de mercado da Nvidia recupera $5 triliões com o aumento da procura por IA, enquanto os preços do aluguer de GPUs sobem

Mensagem da Gate News, 25 de abril — As ações da Nvidia dispararam mais de 4% nas negociações nos EUA a 24 de abril, levando a capitalização de mercado da empresa acima de $5 triliões pela primeira vez em quase seis meses, impulsionada por um forte aumento da procura por IA. A Intel indicou que o tamanho potencial do mercado para a infra-estrutura de IA poderia aproximar-se de triliões, enquanto a TSMC reportou uma procura forte por computação de alto desempenho e chips de IA, juntamente com restrições persistentes de capacidade. Os preços de aluguer de GPUs H100 subiram quase 40% ao longo dos últimos seis meses, e os custos de aluguer dos chips Blackwell aumentaram aproximadamente 48% em apenas dois meses, com os fornecedores de cloud a iniciarem também aumentos de preços face à escassez de oferta de recursos informáticos premium. No entanto, a Nvidia enfrenta uma pressão competitiva emergente à medida que a DeepSeek e outras empresas introduzem novos modelos e aceleram a adoção de soluções de chips domésticas.

GateNews39m atrás

Nvidia Implementa o Agente de IA Codex da OpenAI em Toda a Força de Trabalho na Infraestrutura Blackwell

Mensagem da Gate News, 25 de Abril — A Nvidia lançou o Codex da OpenAI, um agente de IA alimentado por GPT-5.5, para toda a sua força de trabalho após um ensaio bem-sucedido com cerca de 10.000 empregados, segundo comunicações internas do CEO Jensen Huang e do CEO da OpenAI, Sam Altman. O Codex foi concebido para ajudar com tarefas de programação, planeamento e de fluxo de trabalho

GateNews1h atrás

O Departamento de Estado dos EUA alerta sobre a destilação do modelo de IA DeepSeek

O Departamento de Estado dos EUA emitiu um cabo em 24 de abril para as missões diplomáticas e consulares em todo o mundo, alertando os governos estrangeiros sobre os esforços da China para copiar sistemas de IA americanos através de destilação, segundo a Reuters. O cabo

CryptoFrontier1h atrás

Startup de IA para a Saúde do Professor de Stanford Procura $100M com $1B de Avaliação

Mensagem do Gate News, 25 de abril — O professor de Stanford James Zou está a angariar aproximadamente $100 milhões para a Human Intelligence, uma startup da Califórnia que desenvolve modelos de IA para a fisiologia humana, com uma avaliação de aproximadamente $1 mil milhões. A empresa baseia-se na investigação de Zou em fisiologia e IA. O algoritmo EchoNet do seu laboratório

GateNews1h atrás

Startup de Programação com IA Cognition em Conversas para uma Rodada de Financiamento com Avaliação $25B Valuation

Mensagem do Gate News, 25 de abril — A startup de programação com IA Cognition está em conversações iniciais para angariar centenas de milhões de dólares ou mais, a uma avaliação de aproximadamente um $25 billion, segundo pessoas familiarizadas com o assunto. O interesse aumentou após a aquisição pela SpaceX de uma startup rival de programação com IA. Co

GateNews1h atrás

Meta vai utilizar milhões de chips AWS Graviton para cargas de trabalho de IA

Mensagem do Gate News, 25 de abril — A Amazon anunciou a 24 de abril que a Meta vai utilizar milhões de chips AWS Graviton para cargas de trabalho de IA, assinalando uma vitória significativa junto dos clientes para os processadores ARM internos da AWS. Os chips serão usados para inferência de IA e para computação geral, em vez de

GateNews1h atrás
Comentar
0/400
Nenhum comentário