NVIDIA e AWS Colaboram para Levar IA à Produção em Escala com GPUs Blackwell e Busca Vetorial Acelerada

NVIDIA e AWS acabam de anunciar uma colaboração que ataca diretamente os principais gargalos de quem coloca IA em produção: latência de inferência, busca vetorial lenta e infraestrutura que não escala sem explodir a complexidade operacional.

As novidades se dividem em três frentes complementares: novas instâncias EC2 G7 com GPUs NVIDIA RTX PRO 4500 Blackwell, aceleração de busca vetorial por GPU no Amazon OpenSearch Serverless e a certificação NVIDIA Exemplar Cloud para treinamento com GB300.

Instâncias EC2 G7: GPUs Blackwell chegam à AWS

As novas instâncias Amazon EC2 G7 trazem as GPUs NVIDIA RTX PRO 4500 Blackwell Server Edition para a AWS. O foco não é só inferência de IA — é uma plataforma multi-workload que atende gráficos, computação espacial e analytics acelerado por GPU.

Os números impressionam: até 4,6x mais desempenho em inferência de IA comparado às instâncias G6 anteriores, 2,1x em gráficos e aceleração significativa em analytics no Amazon EMR via biblioteca NVIDIA cuDF para Apache Spark.

As especificações técnicas entregam densidade de verdade: até 8 GPUs, 256 GB de memória total de GPU, 700 Gbps de rede com EFA e até 7,6 TB de armazenamento NVMe SSD local. As configurações vão de 1 a 8 GPUs, com bare metal chegando em breve — o que permite dimensionar exatamente para a carga de trabalho, sem superprovisionamento.

As instâncias G7 já estão disponíveis via AWS Deep Learning AMIs, Deep Learning Containers, Amazon EMR, EKS, ECS e gráficos AMIs, com suporte ao Amazon SageMaker AI previsto para breve.

NVIDIA cuVS: busca vetorial acelerada por GPU como padrão no OpenSearch

A segunda grande novidade é que o Amazon OpenSearch Serverless agora usa indexação vetorial acelerada por GPU, via biblioteca NVIDIA cuVS, como padrão para todas as coleções de vetores — sem configuração adicional.

Para times que trabalham com RAG (geração aumentada por recuperação), busca semântica, sistemas de recomendação e aplicações de IA agentiva, isso é uma virada de chave. A busca vetorial com GPU deixa de ser um projeto de otimização especializado e vira uma capacidade padrão da AWS.

O impacto para o cliente é direto: indexação vetorial até 10x mais rápida com um quarto do custo comparado a implementações apenas em CPU. Bancos de dados vetoriais em escala de bilhões se tornam viáveis de construir em menos de uma hora.

AWS conquista certificação NVIDIA Exemplar Cloud para GB300

A AWS alcançou o status NVIDIA Exemplar Cloud para cargas de treinamento com NVIDIA GB300. Essa certificação atesta que a AWS atende aos rigorosos limites de desempenho que a NVIDIA usa como referência para benchmarks de IA.

O selo é resultado de um esforço profundo de co-engenharia entre as equipes da AWS e NVIDIA. Para líderes de IA e desenvolvedores, isso significa confiança de que estão usando infraestrutura consistente e de alto desempenho para treinamento em larga escala, facilitando a comparação entre provedores de nuvem e acelerando projetos do planejamento à produção.

As três frentes reforçam cada camada da stack de infraestrutura de IA na AWS com o mesmo princípio: desempenho em escala de produção sem adicionar carga operacional para os times que rodam a infraestrutura.

Fonte: NVIDIA Blog

NVIDIA e AWS Colaboram para Levar IA à Produção em Escala com GPUs Blackwell e Busca Vetorial Acelerada

Instâncias EC2 G7: GPUs Blackwell chegam à AWS

NVIDIA cuVS: busca vetorial acelerada por GPU como padrão no OpenSearch

AWS conquista certificação NVIDIA Exemplar Cloud para GB300

Leia também

ASML e a Máquina de US$ 400 Milhões: O Futuro dos Chips e o Confronto da Anthropic com o Governo dos EUA

NVIDIA Domina 81% dos Supercomputadores Mais Rápidos do Mundo

A Máquina de US$ 400 Milhões que Impulsiona o Futuro dos Chips de IA

Nvidia promete resolver consumo de água em data centers, mas ignora o problema das usinas elétricas