A Anthropic, empresa de inteligência artificial criadora do Claude, anunciou que seu mais novo modelo, chamado Claude Mythos, é capaz de superar humanos em tarefas de hacking e segurança cibernética. A revelação provocou alertas em reguladores, autoridades governamentais e instituições financeiras ao redor do mundo, que passaram a discutir os riscos concretos que uma ferramenta desse tipo pode representar para serviços digitais críticos.

O Mythos foi apresentado no início de abril sob o nome Mythos Preview como parte do sistema de IA mais amplo da Anthropic, que inclui o assistente Claude e sua família de modelos. A empresa, que compete diretamente com o ChatGPT da OpenAI e o Gemini do Google, afirmou que o modelo já encontrou milhares de vulnerabilidades de alta gravidade, incluindo falhas em todos os principais sistemas operacionais e navegadores web existentes no mercado.

Claude Mythos: modelo de IA da Anthropic supera humanos em hacking e assusta setor financeiro - Imagem complementar

Em vez de liberar o modelo para uso geral, a Anthropic optou por restringir o acesso inicial a 12 empresas de tecnologia por meio de uma iniciativa chamada Project Glasswing, descrita como um esforço para proteger sistemas essenciais de software. Entre os parceiros estão gigantes como Amazon Web Services, Apple, Microsoft, Google, NVIDIA e Broadcom. A Crowdstrike, empresa de segurança cibernética que em julho de 2024 causou uma interrupção global devido a uma atualização defeituosa de software, também integra o grupo. Ao todo, mais de 40 organizações responsáveis por softwares considerados críticos receberam acesso ao modelo.

PUBLICIDADE

Agora, a Anthropic anunciou que vai ampliar o acesso ao Mythos para outras 150 instituições em setores como energia, água, saúde, comunicações e equipamentos. Novos parceiros precisarão atender a requisitos rigorosos de segurança antes de obterem permissão para utilizar a ferramenta.

Os testes realizados por equipes especializadas em testes de penetração, conhecidas como red teams, mostraram que o Mythos é excepcionalmente capaz em tarefas de segurança de computadores. Segundo a Anthropic, o modelo conseguiu localizar falhas críticas escondidas em códigos antigos com pouca supervisão humana, incluindo uma vulnerabilidade que permaneceu em um sistema por 27 anos antes de ser identificada. A empresa também destacou que a ferramenta pode sugerir maneiras de explorar essas falhas.

A capacidade do modelo de identificar e explorar vulnerabilidades com rapidez e eficiência sem precedentes levantou preocupações imediatas no sistema financeiro global. O ministro das Finanças do Canadá, François-Philippe Champagne, confirmou à BBC que o Mythos foi discutido em uma reunião do Fundo Monetário Internacional realizada em Washington em abril. Ele afirmou que o assunto é sério o suficiente para merecer a atenção de todos os ministros das Finanças.

O diretor do Banco da Inglaterra, Andrew Bailey, também se pronunciou sobre o tema, dizendo que é necessário analisar com cuidado o que esse desenvolvimento recente da inteligência artificial pode significar para o risco de crime cibernético. A União Europeia, por sua vez, iniciou discussões com a Anthropic sobre suas preocupações relacionadas ao modelo e, em maio, recebeu acesso à ferramenta.

Ciaran Martin, ex-chefe do Centro Nacional de Segurança Cibernética do Reino Unido, disse que a capacidade do Mythos de descobrir vulnerabilidades críticas de forma muito mais rápida do que outros modelos de IA realmente abalou especialistas do setor. Ele explicou que, mesmo diante de vulnerabilidades já conhecidas, contra as quais as organizações podem não ter aplicado correções, o modelo se mostrou um agente ofensivo altamente eficaz.

Apesar do alarme, parte da comunidade de segurança cibernética mantém uma postura cética. Muitos analistas independentes ainda não tiveram a oportunidade de testar o Mythos por conta própria. O Instituto de Segurança em IA do Reino Unido concluiu recentemente que, embora o modelo seja de fato poderoso, sua maior ameaça se concentra em sistemas mal protegidos e vulneráveis. Os pesquisadores do instituto afirmaram que não é possível garantir que o Mythos consiga atacar sistemas bem protegidos e que, onde existem boas práticas de cibersegurança, o modelo teoricamente seria contido.

Valentina Palmiotti, hacker ética italiana conhecida como Chompie, que participa de torneios internacionais nos quais competidores ganham dinheiro encontrando vulnerabilidades antes de cibercriminosos, disse à BBC que seus dias de competição podem estar contados devido ao avanço de ferramentas como o Claude Mythos.

Em um vídeo divulgado junto com o lançamento do Project Glasswing, o chefe executivo da Anthropic, Dario Amodei, afirmou que a empresa se ofereceu para trabalhar com funcionários do governo dos Estados Unidos para ajudar a se defender contra os riscos que esses modelos podem representar. A Anthropic também declarou que, considerando a velocidade do progresso da inteligência artificial, não demorará muito para que capacidades como as do Mythos se disseminem, potencialmente caindo nas mãos de agentes comprometidos com usos maliciosos.

Alguns analistas, no entanto, apontam que é do interesse comercial da Anthropic construir uma narrativa de que possui uma ferramenta com capacidades sem precedentes. A discussão sobre até que ponto as habilidades do Mythos são reais ou fruto de exagero de marketing segue em aberto, especialmente porque a maioria dos especialistas independentes ainda não teve acesso ao modelo.

No final de abril, a Anthropic confirmou que estava investigando uma denúncia de acesso não autorizado ao Claude Mythos Preview por meio de um de seus ambientes de fornecedores terceirizados. A declaração foi uma resposta a uma reportagem da Bloomberg, que revelou que usuários em um fórum privado conseguiram acessar o modelo sem as permissões necessárias. O incidente reforçou as preocupações sobre a segurança do próprio modelo e a possibilidade de que suas capacidades caiam nas mãos erradas.

Para especialistas como Martin, a questão central não é entrar em pânico, mas sim reconhecer que a maioria dos ataques cibernéticos bem-sucedidos atualmente explora falhas básicas de segurança que não exigem ferramentas sofisticadas. Ele afirmou que, no médio prazo, há uma oportunidade concreta de usar justamente essas ferramentas para corrigir muitas das vulnerabilidades subjacentes da internet e construir um ambiente digital mais seguro para todos os setores, incluindo o financeiro.