Blog

Nvidia orienta a ativar ECC em GPUs GDDR6 para evitar

Escrito por LC Sec | 14/07/2025 22:38:48
Segurança da Informação

Nvidia orienta a ativar ECC em GPUs GDDR6 para evitar ataques RowHammer

Pesquisadores descobriram um novo ataque chamado GPUHammer, que explora a vulnerabilidade RowHammer em GPUs Nvidia com memória GDDR6. Para proteger seu sistema, a Nvidia recomenda ativar o ECC no n...

Navegação

O que é o ataque GPUHammer Como funciona Sinais de alerta / Como identificar O que fazer agora / Como se proteger Prevenção / Boas práticas

Resumo rápido

Pesquisadores descobriram um novo ataque chamado GPUHammer, que explora a vulnerabilidade RowHammer em GPUs Nvidia com memória GDDR6. Para proteger seu sistema, a Nvidia recomenda ativar o ECC no nível de sistema (System‑Level ECC) em suas GPUs.

Neste artigo você vai aprender:

  • O que é o ataque GPUHammer e como ele funciona.
  • Os riscos associados à vulnerabilidade RowHammer em GPUs.
  • Como ativar ECC em GPUs para prevenir falhas.
  • Boas práticas de segurança para ambientes com GPUs.
  • O papel da LC Sec na auditoria de configurações de hardware.

O que é o ataque GPUHammer

Pesquisadores da University of Toronto demonstraram um ataque novo chamado GPUHammer, que explora a vulnerabilidade RowHammer em GPUs Nvidia com memória GDDR6. Esse tipo de ataque pode causar falhas silenciosas, degradando modelos de IA ou permitindo escalonamento de privilégio.

O ataque foi testado com sucesso em GPUs Nvidia A6000, causando bit flips em 8 células de memória após cerca de 12 mil acessos rápidos, degradando a precisão de machine learning de 80 % para menos de 1 %.

Batizado GPUHammer, ele representa o primeiro RowHammer confirmado em GPUs discretas da Nvidia. O ataque exige memória GDDR6 sem System‑Level ECC habilitado, acesso repetido a bancos adjacentes de memória e execução paralela para gerar alta taxa de acessos.

Como funciona

A Nvidia publicou um comunicado em 9 de julho de 2025 recomendando a ativação do ECC no nível de sistema (System‑Level ECC) em diversas linhas de GPUs, incluindo Ampere, Ada, Hopper, Blackwell, Turing, Volta e Jetson. GPUs mais recentes já possuem ECC interno ativado por padrão.

Sinais de alerta / Como identificar

O GPUHammer revela que ataques RowHammer agora atingem a memória de GPUs, não apenas a DRAM de CPU. Ativar ECC e usar GPUs com correção de erro é essencial para prevenir falhas silenciosas, perdas de precisão em IA e invasões em data centers.

O que fazer agora / Como se proteger

  1. Verifique se o System‑Level ECC está ativo utilizando ferramentas como 'nvidia‑smi' ou métodos out‑of‑band via BMC/Redfish.
  2. Habilite ECC em GPUs compatíveis; espere uma redução de até 10 % no desempenho de inferência e perda de ~6,5 % na capacidade de memória.
  3. Prefira GPUs com ECC ativado por padrão (on‑die), como Blackwell RTX 50‑series e GPUs da linha data center Hopper e Blackwell.
  4. Em ambientes multi‑tenant, revise a política de compartilhamento de GPUs e considere isolamento físico ou virtual seguro.

Prevenção / Boas práticas

Na LC SEC, ajudamos a auditar configurações de hardware, habilitar ECC corretamente e revisar políticas de infraestrutura para ambientes críticos. Fortaleça sua arquitetura: conheça nossos serviços em lcsec.io.

Perguntas frequentes

O que é a vulnerabilidade RowHammer?

A vulnerabilidade RowHammer permite que ataques físicos ou lógicos causem alterações indesejadas em células de memória, o que pode levar a falhas em sistemas e perda de dados.

Como o ataque GPUHammer afeta as GPUs?

O ataque GPUHammer explora a vulnerabilidade RowHammer em GPUs Nvidia, causando bit flips em células de memória, o que pode degradar a precisão de modelos de inteligência artificial.

Qual é a importância do ECC em GPUs?

O ECC (Error Correction Code) é importante porque ajuda a detectar e corrigir erros de memória, prevenindo falhas silenciosas e garantindo a integridade dos dados processados pelas GPUs.

Garanta a segurança da sua infraestrutura com a LC Sec

Estamos aqui para ajudar a auditar suas configurações de hardware e habilitar ECC corretamente para proteger seus dados e sistemas críticos.