O Agente de IA já consegue reproduzir autonomamente artigos académicos complexos: Mollick afirma que os erros se devem mais ao texto original humano do que à IA

教授 Ethan Mollick, da Wharton School da Universidade da Pensilvânia, publicou a 25/4 na plataforma X uma observação com um impacto forte na comunidade académica: os actuais agentes de IA já conseguem, sem as publicações originais e sem o código original, reproduzir de forma independente resultados complexos de investigação académica apenas com descrições de métodos e dados disponibilizados publicamente. Mollick acrescentou ainda que, quando as versões reproduzidas por IA divergem do artigo original, “os erros costumam estar no próprio texto humano, e não na IA”. Este é um ponto de viragem real para a crise de reprodutibilidade da investigação no tempo da IA generativa — a validação por pares que no passado exigia mão de obra cara está a ser concluída em larga escala e com custos baixos por IA.

Claude reproduz múltiplos artigos e, depois, verifica duas vezes com o GPT-5 Pro

Num post do seu blogue OneUsefulThing e nesta publicação, Mollick descreve os seus testes concretos ao Claude: pegar num artigo académico e entregá-lo ao Claude, para que este abra o arquivo, organize os ficheiros, converta automaticamente o código STATA usado para as estatísticas para Python e, em seguida, execute uma a uma todas as conclusões do artigo. Depois de o Claude concluir, ele faz uma segunda ronda de verificação com o GPT-5 Pro para os mesmos resultados de reprodução. Foram testados vários artigos do mesmo modo; os resultados foram, em geral, bem-sucedidos, sendo apenas bloqueados quando os ficheiros de dados são demasiado grandes ou quando há problemas no próprio replication data original.

Para a comunidade académica, este processo normalmente exigia, no passado, que assistentes de investigação gastassem semanas ou até meses. A escala de tempo descrita por Mollick é de uma tarde a um dia, e o custo de execução é apenas o custo de tokens da API LLM comercial.

Há mais erros no texto humano original do que na IA

Ainda mais controversa é a avaliação de Mollick sobre “quem errou”. No seu post, ele afirma explicitamente que, quando os resultados reproduzidos por IA não correspondem aos do artigo original, na maioria das vezes não é a IA que se engana, mas sim que o artigo original tem erros no tratamento de dados, houve uso incorrecto do modelo ou as conclusões vão além do âmbito que os dados suportam. Na psicologia, na economia comportamental, na gestão e noutras ciências sociais, têm surgido várias vezes, ao longo dos últimos dez anos, acontecimentos importantes de crise de reprodutibilidade; o mais conhecido é o grande estudo de reprodução de 2015 da Open Science Collaboration, em que apenas cerca de 36% dos resultados de artigos de psicologia puderam ser reproduzidos de forma independente. O agente de IA empurra este processo de validação para lá do limite de “necessitar de alocação de recursos humanos” e torna-o “executável de forma generalizada”.

Aprender ainda proíbe a IA de entrar na revisão por pares; a instituição está atrasada face à tecnologia

Noutro post de 4/25, Mollick apontou de forma concreta que a maior associação da sua área, a Academy of Management, ainda proíbe explicitamente a IA de entrar no processo de revisão por pares de artigos. Ele cita estudos existentes que indicam que a revisão por IA já é superior, no controlo de precisão, consistência e enviesamento, a alguns revisores humanos tradicionais; por isso, a posição de “proibir” pode, na prática, agravar de forma inversa a falha dos sistemas de revisão existentes. A distância entre esta instituição e a tecnologia — é uma questão de políticas públicas que as áreas da publicação académica, as associações e as entidades financiadoras terão de enfrentar nos próximos 1–2 anos.

Para os leitores, este debate não se limita ao meio académico. Quando um agente de IA consegue validar os resultados de investigação em tempo real, as citações da indústria, os relatórios de políticas públicas e os fundamentos académicos em decisões financeiras entrarão num novo patamar de verificação: “as conclusões suportam ou não uma reprodução independente por IA”. Em complemento a outro post de Mollick, ele considera que o governo é a única entidade capaz de fixar o “marco” para este processo de verificação quando a intensidade das ferramentas continua a aumentar — e que a complexidade do desenho das políticas públicas se tornará, em paralelo, um eixo relativamente ignorado nas discussões sobre governação de IA.

Este artigo: o Agente de IA já consegue reproduzir autonomamente artigos académicos complexos — Mollick afirma que os erros estão mais no texto humano original do que na IA, e foi publicado pela primeira vez em Cadeia Notícias ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

OpenAI recruta principais talentos de software empresarial à medida que agentes de fronteira perturbam a indústria

Mensagem do Gate News, 26 de abril — A OpenAI e a Anthropic têm estado a recrutar executivos seniores e engenheiros especializados de grandes empresas de software empresarial, incluindo Salesforce, Snowflake, Datadog e Palantir. Denise Dresser, antiga CEO da Slack sob a Salesforce, juntou-se à OpenAI como diretora de receitas, enquanto Jennifer Majlessi, também da Salesforce, se tornou recentemente a responsável de go-to-market da OpenAI.

GateNews1h atrás

Worxphere Rebrands JobKorea With AI-Powered Hiring Tools

Gate News message, April 26 — South Korean HR platform Worxphere has rebranded JobKorea as it transitions from traditional online job boards to AI-driven hiring solutions. The company is consolidating services including JobKorea and Albamon into a unified platform covering permanent employment,

GateNews11h atrás

Os EAU Anunciam uma Mudança Para um Modelo de Governo Baseado em IA nos Próximos Dois Anos

Sua Alteza o Sheikha Mohammed bin Rashid Al Maktoum afirmou que o objectivo era fazer com que 50% dos sectores do governo operassem através de IA agentic autónoma. A transição irá também incluir a formação dos funcionários federais para “dominar a IA” e será supervisionada por Sheikh Mansour bin Zayed. Principais Conclusões:

Coinpedia04-25 08:39

Plataforma de Negociação com IA Fere AI Angaria $1,3M em Financiamento Liderado pela Ethereal Ventures

Notícia da Gate, 25 de abril — Fere AI, uma plataforma de negociação de ativos digitais com base em IA, anunciou a conclusão de uma ronda de financiamento de $1,3 milhões liderada pela Ethereal Ventures, com participação da Galaxy Vision Hill e da Kosmos Ventures, de acordo com a Globenewswire. A plataforma suporta redes de interoperabilidade entre cadeias, incluindo Ethereum, Solana e Base, permitindo que os utilizadores descrevam os seus objetivos de negociação em linguagem natural enquanto os agentes de IA executam as operações.

GateNews04-25 07:46

Nvidia Implementa o Agente de IA Codex da OpenAI em Toda a Força de Trabalho na Infraestrutura Blackwell

Mensagem da Gate News, 25 de Abril — A Nvidia lançou o Codex da OpenAI, um agente de IA alimentado por GPT-5.5, para toda a sua força de trabalho após um ensaio bem-sucedido com cerca de 10.000 empregados, segundo comunicações internas do CEO Jensen Huang e do CEO da OpenAI, Sam Altman. O Codex foi concebido para ajudar com tarefas de programação, planeamento e de fluxo de trabalho

GateNews04-25 03:11

Startup de Programação com IA Cognition em Conversas para uma Rodada de Financiamento com Avaliação $25B Valuation

Mensagem do Gate News, 25 de abril — A startup de programação com IA Cognition está em conversações iniciais para angariar centenas de milhões de dólares ou mais, a uma avaliação de aproximadamente um $25 billion, segundo pessoas familiarizadas com o assunto. O interesse aumentou após a aquisição pela SpaceX de uma startup rival de programação com IA. Co

GateNews04-25 02:51
Comentar
0/400
Nenhum comentário