AWS lança Capacity Blocks para ML e planos de treinamento SageMaker para garantir capacidade GPU de curto prazo com descontos

Novas soluções da AWS para garantir capacidade GPU de curto prazo para workloads de Machine Learning

A crescente demanda por GPUs para treinamentos, ajustes finos e inferência de modelos de Machine Learning tem superado a oferta disponível na indústria, dificultando o acesso confiável a esses recursos computacionais essenciais. Para enfrentar esse desafio, a AWS lançou duas soluções que permitem reservar capacidade GPU para períodos curtos, com descontos significativos e flexibilidade operacional: o Amazon EC2 Capacity Blocks for ML e os Amazon SageMaker training plans.

O que são Capacity Blocks for ML e SageMaker training plans?

Capacity Blocks for ML são reservas autogerenciadas de capacidade GPU no Amazon EC2, que garantem a disponibilidade das instâncias durante um período definido, com descontos de 40-50% em relação ao preço sob demanda. Já os SageMaker training plans permitem reservar capacidade GPU para workloads gerenciados no ambiente do Amazon SageMaker, incluindo jobs de treinamento, clusters HyperPod e workloads de inferência, com preços até 70-75% abaixo das tarifas sob demanda.

Quem pode se beneficiar dessas soluções?

Empresas e equipes que precisam de capacidade GPU garantida para cargas de trabalho de curto prazo, como testes de carga, validação de modelos, workshops com duração limitada ou preparação antecipada para picos de inferência.
Usuários que buscam reduzir custos em comparação ao uso de instâncias sob demanda, especialmente para workloads que exigem previsibilidade na disponibilidade do recurso.
Times que utilizam Amazon EC2 para gerenciar diretamente a infraestrutura ou que preferem a comodidade do ambiente gerenciado do Amazon SageMaker.

Detalhes do Amazon EC2 Capacity Blocks for ML

Este recurso permite reservar uma quantidade específica de instâncias GPU por um período entre 1 a 14 dias (em incrementos diários) ou 15 a 182 dias (incrementos semanais), com até 64 instâncias por bloco e 256 instâncias configuráveis em múltiplos blocos para organizações AWS. A reserva pode ser feita com até oito semanas de antecedência.

O Capacity Blocks é indicado para workloads que rodam diretamente no EC2, onde o usuário gerencia sistema operacional, rede e orquestração. Ele oferece um SLA com buffer para relançamento de instâncias em caso de falhas de hardware durante a reserva, garantindo maior confiabilidade.

Limitações importantes incluem suporte apenas para famílias selecionadas de instâncias EC2 (como P5, Trn1 e Trn2), impossibilidade de compartilhamento entre contas ou uso com instâncias gerenciadas pelo SageMaker, e restrições na movimentação ou divisão dos blocos.

Características dos Amazon SageMaker training plans

Os training plans do SageMaker são voltados para workloads gerenciados, onde a AWS cuida do provisionamento, escalonamento e ciclo de vida das instâncias. É possível reservar capacidade para treinamento, clusters HyperPod e inferência, com flexibilidade para escolher tipos de instância aceleradas, incluindo GPUs NVIDIA recentes e aceleradores AWS Trainium.

Esses planos não são intercambiáveis entre tipos de workload (por exemplo, um plano para inferência não pode ser usado para treinamento). A reserva é feita com pagamento antecipado e não pode ser cancelada, expirando automaticamente ao final do período contratado.

Como acessar e contratar essas soluções

Para contratar Capacity Blocks for ML, o usuário deve acessar a documentação oficial da AWS e realizar a reserva via AWS Management Console ou AWS CLI, configurando o período, tipo e quantidade de instâncias desejadas.

Já para SageMaker training plans, o processo é feito pelo console do Amazon SageMaker, na seção "Training plans". O usuário escolhe data, duração, tipo e número de instâncias para seu workload de treinamento ou inferência, visualiza o preço total e confirma a compra.

Exemplo de comando para verificar status de um training plan via AWS CLI:

aws sagemaker describe-training-plan \
  --training-plan-name seu-nome-do-plano \
  --region sua-regiao

Impacto prático para o usuário

Essas soluções facilitam o planejamento e a execução de workloads de ML que exigem acesso garantido a GPUs por curtos períodos, evitando a incerteza e os custos elevados do uso sob demanda. Com descontos expressivos e flexibilidade para diferentes cenários, Capacity Blocks e SageMaker training plans permitem maior controle orçamentário e operacional, especialmente para eventos pontuais, testes e preparações para lançamentos.

AWS lança Capacity Blocks para ML e planos de treinamento SageMaker para garantir capacidade GPU de curto prazo com descontos

Novas soluções da AWS para garantir capacidade GPU de curto prazo para workloads de Machine Learning

O que são Capacity Blocks for ML e SageMaker training plans?

Quem pode se beneficiar dessas soluções?

Detalhes do Amazon EC2 Capacity Blocks for ML

Características dos Amazon SageMaker training plans

Como acessar e contratar essas soluções

Impacto prático para o usuário

Links úteis para aprofundamento

Leia também

Hugging Face lança simulação econômica com cinco modelos de IA para entender mercados emergentes

Projeto Amazing Digital Dentures: os desafios de criar aventuras digitais com IA

Her: a detetive que analisa suas sessões de Claude Code com inteligência e segurança

Hugging Face lança Thousand Token Wood v2: drama financeiro multi-modelos para pequenos modelos de IA