Um algoritmo de inteligência artificial desenvolvido pela Anthropic conseguiu penetrar em quase todos os sistemas classificados da Agência de Segurança Nacional dos Estados Unidos (NSA) em questão de horas, durante um exercício de segurança cibernética. O feito envolve o modelo Mythos 5 e foi relatado pelo general Joshua Rudd, diretor da NSA desde março deste ano, em informação divulgada pela revista britânica The Economist. O episódio reacendeu o debate sobre o poder de modelos avançados de IA em cenários de segurança nacional.

A informação foi transmitida à publicação pelo senador Mark Warner, vice-presidente do Comitê de Inteligência do Senado norte-americano. Segundo Warner, Rudd afirmou que o Mythos invadiu quase todos os sistemas confidenciais da agência, não em semanas, mas em horas. O detalhamento técnico do incidente não foi divulgado, mas especialistas interpretam que a invasão ocorreu durante um exercício do tipo red team, prática na qual profissionais de uma organização utilizam ferramentas para atacar seus próprios sistemas com o objetivo de identificar vulnerabilidades.

Mythos 5: IA da Anthropic penetra sistemas da NSA em horas - Imagem complementar

A Anthropic, empresa norte-americana de inteligência artificial criadora da linha de modelos Claude, suspendeu o acesso ao Mythos 5 na semana passada após receber uma ordem da Casa Branca. A determinação proibiu o uso do algoritmo por estrangeiros, com a justificativa de que a ferramenta seria capaz de identificar grande quantidade de brechas de segurança em softwares, configurando ameaça à segurança nacional dos Estados Unidos.

PUBLICIDADE

O Mythos 5 havia ganhado notoriedade ao identificar 271 falhas de segurança no navegador Firefox durante um teste controlado conduzido com a autorização da Fundação Mozilla, organização sem fins lucrativos responsável pelo navegador. A descoberta levou a Anthropic a restringir o acesso ao modelo, permitindo seu uso apenas por pesquisadores e instituições previamente aprovadas pela empresa.

No dia 9 de junho, a empresa decidiu lançar publicamente uma versão controlada do algoritmo, batizada de Claude Fable 5. Essa versão seria protegida por guardrails, mecanismos de segurança programados para impedir que o modelo execute determinadas ordens consideradas perigosas. Três dias depois, porém, em 12 de junho, a Anthropic recebeu a ordem da Casa Branca e retirou o algoritmo de seu site.

A determinação governamental teria sido motivada por uma descoberta feita por engenheiros da Amazon. Segundo relatos, os profissionais da empresa de comércio eletrônico e computação em nuvem encontraram uma forma de contornar os guardrails do modelo e alertaram as autoridades norte-americanas sobre a vulnerabilidade dos mecanismos de proteção.

O caso expõe a tensão entre o desenvolvimento de modelos de IA cada vez mais capazes e a necessidade de controlar seu uso em áreas sensíveis. A OpenAI, empresa responsável pelo ChatGPT e pelos modelos GPT, adotou postura semelhante no passado ao inicialmente restringir o acesso ao modelo GPT-2 em 2019 por considerá-lo potencialmente perigoso, para depois liberá-lo. O ChatGPT, lançado em novembro de 2022 rodando o modelo GPT-3.5, demonstrou que modelos liberados posteriormente eram significativamente mais poderosos.

A diferença, segundo analistas, é que Mythos 5 e sua versão pública Fable parecem ser consideravelmente mais potentes e potencialmente mais danosos do que os modelos anteriores. A capacidade de identificar vulnerabilidades em sistemas de segurança em escala e velocidade sem precedentes coloca esses algoritmos em uma categoria própria dentro do debate sobre riscos de inteligência artificial.

A decisão da Casa Branca de suspender o modelo tem gerado reações divergentes. Especialistas em cibersegurança alertam que proibir o uso da ferramenta pode ser contraproducente, pois limita a capacidade de pesquisadores e empresas de identificar e corrigir falhas em seus próprios sistemas. A argumentação é de que a mesma tecnologia capaz de atacar também é essencial para defender infraestruturas críticas.

Há ainda relatos de que a própria NSA continuaria utilizando o Mythos internamente, apesar da suspensão determinada pelo governo federal e da inclusão do modelo em uma lista de restrições do Pentágono. Essa aparente contradição ilustra a complexidade do cenário, já que a mesma agência que constatou o poder de penetração do algoritmo reconhece seu valor como ferramenta de identificação de vulnerabilidades.

A capacidade demonstrada pelo Mythos 5 de comprometer sistemas de segurança de uma das agências de inteligência mais sofisticadas do mundo em poucas horas marca um marco na discussão sobre o papel da inteligência artificial na cibersegurança. Modelos de linguagem avançados já não se limitam a gerar texto ou código, mas funcionam como ferramentas de prospecção e exploração de vulnerabilidades em escala e velocidade que ultrapassam amplamente o trabalho humano manual.

Para profissionais de segurança da informação, o episódio reforça a urgência de repensar arquiteturas de defesa e processos de auditoria de sistemas. A possibilidade de que um único modelo de IA consiga mapear e explorar centenas de vulnerabilidades em questão de horas altera os parâmetros de tempo e recursos necessários para proteger redes corporativas e governamentais. O desafio que se coloca é como incorporar essas ferramentas nos processos de defesa sem que elas se tornem vetores de ataque nas mãos de adversários.