Pesquisadores de segurança da HiddenLayer descobriram uma falha crítica de Argument Injection que afeta agentes de IA, como os baseados no AutoGen da Microsoft. Essa vulnerabilidade permite que agentes maliciosos passem instruções disfarçadas em comandos aparentemente inofensivos, levando o sistema a executar tarefas perigosas sem autenticação ou conhecimento prévio do usuário.
Essa brecha acontece quando múltiplos agentes de IA colaboram entre si para resolver tarefas. Um dos agentes pode ser comprometido e manipular os parâmetros de chamada para executar ações não autorizadas, como comandos de sistema, instalação de malwares ou vazamento de dados confidenciais. O pior: a falha pode ser explorada sem interação humana.
Os testes realizados pelos pesquisadores mostraram que apenas uma pequena modificação no comando, como inserir caracteres especiais, já era suficiente para contornar restrições. Um exemplo citado foi a execução remota de comandos do sistema operacional apenas com uma linha de código manipulada.
Empresas que estão adotando IA generativa e agentes automatizados para tarefas como atendimento ao cliente, análise de dados ou integração com sistemas internos devem redobrar a atenção. A falha não está limitada a um modelo específico, e pode afetar qualquer ecossistema de IA com múltiplos agentes que compartilham tarefas.
Dica de prevenção:
Empresas que utilizam agentes de IA devem aplicar validações rigorosas nos comandos recebidos, isolar ambientes de execução e evitar permissões amplas para IA em sistemas internos. A auditoria contínua e testes de segurança em IA, como pentests especializados, são essenciais para identificar riscos antes que sejam explorados.
Para concluir, essa nova vulnerabilidade mostra que, embora a IA traga ganhos de produtividade, sua implementação exige atenção redobrada à segurança. Se sua empresa utiliza ou planeja utilizar agentes de IA, é hora de agir. Conheça os serviços da LC SEC para proteger seus dados com pentests, threat intelligence com IA e criação de políticas robustas de segurança: lcsec.io

