Malware Hades usa injeção de prompt para driblar scanners de IA e roubar credenciais de desenvolvedores
Um malware batizado de Hades está mirando engenheiros de software, cientistas de dados e desenvolvedores que trabalham com inteligência artificial. A ameaça se esconde em pacotes de código disponíveis em plataformas de download e utiliza uma técnica chamada injeção de prompt para enganar os sistemas automatizados de segurança baseados em IA, permitindo a invasão de servidores e o roubo de credenciais de acesso.
A estratégia central do Hades consiste em inserir, no meio do código malicioso, um trecho de texto direcionado ao scanner de segurança. Esse texto exige que o sistema forneça um passo a passo para fabricar armas biológicas e nucleares. Ao se deparar com esse pedido, os filtros éticos dos modelos de linguagem entram em ação e interrompem a leitura do arquivo por questões de segurança. Como a verificação é abortada antes do fim, a parte final do pacote, que é onde o vírus de fato está escondido, passa despercebida pela análise automatizada.
Esse comportamento representa um risco concreto para os profissionais que utilizam assistentes de IA para verificar se os arquivos recém-baixados estão livres de ameaças. Se um desenvolvedor pedir ao modelo de linguagem que analise o pacote, receberá um falso sinal verde, já que o documento não foi examinado por completo. A tática transforma os próprios mecanismos de proteção em cúmplices involuntários da invasão, uma vez que a IA de segurança trava exatamente quando deveria continuar investigando.
Contornar o antivírus automatizado é apenas o começo da operação. De acordo com um relatório da plataforma de segurança Socket.dev, depois que o malware se instala na máquina do desenvolvedor, ele passa a vasculhar o sistema em busca de credenciais de alto escalão. O Hades procura chaves de acesso e senhas temporárias de servidores na nuvem, incluindo ambientes da AWS. Com essas informações em mãos, os criminosos conseguem sair do computador de um único engenheiro e ganhar acesso à infraestrutura completa de uma empresa, ampliando de forma significativa o alcance do ataque.
A escala da campanha já é considerada relevante. Segundo estimativas de especialistas, 37 pacotes da linguagem Python e 106 pacotes JavaScript foram contaminados por essa onda de ataques. Mesmo assim, o sucesso da operação depende, em grande parte, de descuidos humanos. Embora os alvos sejam profissionais qualificados, muitos acabam ignorando práticas básicas de segurança cibernética, como verificar a autoria dos arquivos antes de instalá-los em seus projetos.
Para as equipes de segurança, a principal lição deixada pelo caso é que a inteligência artificial não pode ser a única linha de defesa contra ameaças desse tipo. Métodos tradicionais continuam sendo indispensáveis, incluindo a análise humana do código-fonte e a execução dos arquivos em sandbox, que é um ambiente virtual fechado e isolado do computador real, projetado para testar pacotes sem comprometer a máquina principal. A combinação entre revisão manual e ferramentas automatizadas segue como a abordagem mais segura para identificar pacotes comprometidos antes que eles sejam integrados a projetos de desenvolvimento.
A descoberta do Hades reforça uma tendência que vem ganhando força no cenário de cibersegurança: os agentes maliciosos estão cada vez mais interessados em explorar as próprias defesas baseadas em IA. Ao manipular o comportamento dos modelos de linguagem por meio de instruções embutidas no código, os atacantes conseguem transformar a tecnologia de proteção em um ponto de entrada para invasões. Para desenvolvedores e empresas, a recomendação é manter atenção redobrada à procedência dos pacotes utilizados e não confiar exclusivamente em verificações automatizadas para garantir a integridade dos ambientes de programação.