Os funcionários da OpenAI criticaram publicamente os resultados enganosos dos testes de Referência do novo modelo de IA Grok3 da xAI

robot
Geração de resumo em curso

A ChainCatcher reporta que um funcionário da OpenAI acusou publicamente a empresa xAI, pertencente a Musk, de lançar resultados enganosos nos testes de Referência do seu mais recente modelo de IA, Grok3. Igor Babushkin, co-fundador da xAI, insistiu que a empresa não agiu de forma inadequada. O gráfico da XAI mostra que as duas versões do Grok3 - Grok3 Reasoning Beta e Grok3 mini Reasoning - superaram o modelo atualmente mais poderoso da OpenAI, o o3-mini-high, na AIME 2025. No entanto, os funcionários da OpenAI logo apontaram na plataforma X que o gráfico da XAI não incluía a pontuação AIME 2025 do o3-mini-high sob a condição 'cons@64'. Bobushkin afirmou na plataforma X que a OpenAI também publicou gráficos de teste Referência enganosos no passado, embora esses gráficos fossem utilizados para comparar o desempenho dos seus próprios modelos.

Ver original
O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.
  • Recompensa
  • Comentar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Pino
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate.io
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)