Como executar inferência de IA generativa com Amazon Bedrock na região Ásia-Pacífico (Nova Zelândia)

Amazon Bedrock disponível na região Ásia-Pacífico (Nova Zelândia)
A Amazon Web Services (AWS) anunciou a disponibilidade do Amazon Bedrock na região Ásia-Pacífico (Nova Zelândia) – código ap-southeast-6. A partir de agora, clientes neozelandeses podem acessar modelos de linguagem base (foundation models, FMs) da Anthropic, como Claude Opus 4.5, Opus 4.6, Sonnet 4.5, Sonnet 4.6 e Haiku 4.5, além do modelo Amazon Nova 2 Lite, diretamente da região de Auckland com suporte a inferência cross-region.
Como funciona a inferência cross-region no Amazon Bedrock
A inferência cross-region é um recurso do Amazon Bedrock que distribui o processamento de inferência de IA generativa entre múltiplas regiões da AWS, permitindo maior capacidade e resiliência. Ao fazer uma chamada API em uma região de origem, a requisição é roteada para uma região de destino onde a inferência é executada.
- Todo o tráfego entre regiões ocorre exclusivamente na rede global da AWS, sem passar pela internet pública, e com criptografia ponta a ponta.
- As chamadas cross-region são registradas no AWS CloudTrail na região de origem, e logs podem ser configurados para o Amazon CloudWatch Logs ou Amazon S3.
Perfis de inferência cross-region
- Geográfico: restringe o roteamento dentro de uma área geográfica específica. No caso da região Ásia-Pacífico (Nova Zelândia), o perfil geográfico (AU) cobre Auckland, Sydney e Melbourne, mantendo os dados dentro da jurisdição da Austrália e Nova Zelândia.
- Global: permite roteamento para regiões comerciais AWS suportadas mundialmente, maximizando a capacidade e a resiliência para organizações sem restrições rígidas de residência de dados.
Configuração do perfil geográfico AU para a região de Auckland
Com a inclusão da região de Auckland como origem, o perfil geográfico AU cobre agora três regiões:
| Região Origem | Regiões Destino | Descrição |
|---|---|---|
| Auckland (ap-southeast-6) | ap-southeast-6, ap-southeast-2, ap-southeast-4 | Solicitações de Auckland podem ser roteadas para Auckland, Sydney ou Melbourne |
| Sydney (ap-southeast-2) | ap-southeast-2, ap-southeast-4 | Solicitações de Sydney podem ser roteadas para Sydney ou Melbourne |
| Melbourne (ap-southeast-4) | ap-southeast-2, ap-southeast-4 | Solicitações de Melbourne podem ser roteadas para Sydney ou Melbourne |
Importante: a adição de Auckland não altera o roteamento existente entre Sydney e Melbourne.
Modelos suportados e uso dos perfis de inferência
Na região de Auckland, a inferência cross-region suporta os modelos da Anthropic Claude e Amazon Nova 2 Lite, tanto no perfil geográfico AU quanto no perfil global:
- Perfil geográfico AU: Anthropic Claude Opus 4.6, Sonnet 4.6, Sonnet 4.5, Haiku 4.5.
- Perfil global: além dos modelos Anthropic Claude citados, permite acesso a um conjunto mais amplo de modelos em regiões globais.
Para utilizar um perfil, basta prefixar o ID do modelo com au. ou global.. Por exemplo, anthropic.claude-sonnet-4-6 vira au.anthropic.claude-sonnet-4-6 para o perfil geográfico.
As APIs compatíveis incluem InvokeModel, InvokeModelWithResponseStream, Converse e ConverseStream. A API Converse facilita a troca entre modelos com um formato de requisição e resposta unificado.
Configuração de permissões IAM para inferência cross-region
Para invocar modelos via perfil geográfico AU a partir de Auckland, a política IAM deve conter dois blocos:
- Permissão para acessar o perfil de inferência na região de origem (Auckland).
- Permissão para invocar o modelo em todas as regiões de destino (Sydney, Melbourne e Auckland), condicionada ao uso do perfil de inferência.
Exemplo de política JSON para acesso ao modelo Anthropic Claude Sonnet 4.6 (substitua <ACCOUNT_ID> pelo seu ID AWS):
{
"Version": "2012-10-17",
"Statement": [
{
"Sid": "AllowAuCrisInferenceProfile",
"Effect": "Allow",
"Action": [
"bedrock:InvokeModel",
"bedrock:InvokeModelWithResponseStream"
],
"Resource": "arn:aws:bedrock:ap-southeast-6:<ACCOUNT_ID>:inference-profile/au.anthropic.claude-sonnet-4-6"
},
{
"Sid": "AllowFoundationModelViaAuCris",
"Effect": "Allow",
"Action": [
"bedrock:InvokeModel",
"bedrock:InvokeModelWithResponseStream"
],
"Resource": [
"arn:aws:bedrock:ap-southeast-2::foundation-model/anthropic.claude-sonnet-4-6",
"arn:aws:bedrock:ap-southeast-4::foundation-model/anthropic.claude-sonnet-4-6",
"arn:aws:bedrock:ap-southeast-6::foundation-model/anthropic.claude-sonnet-4-6"
],
"Condition": {
"StringLike": {
"bedrock:InferenceProfileArn": "arn:aws:bedrock:ap-southeast-6:<ACCOUNT_ID>:inference-profile/au.anthropic.claude-sonnet-4-6"
}
}
}
]
}
Segurança, conformidade e políticas de controle
A inferência cross-region mantém a segurança com tráfego criptografado e restrito à rede AWS. Para clientes que usam Service Control Policies (SCPs), é importante liberar as ações em ap-southeast-2, ap-southeast-4 e ap-southeast-6 para o Bedrock, além de permitir valores regionais dinâmicos para o perfil global.
Um exemplo de SCP restringe serviços à região de Auckland, permitindo exceções para Bedrock e serviços globais, e exige que invocações nas regiões de Sydney e Melbourne passem por perfis cross-region, bloqueando chamadas diretas:
{
"Version": "2012-10-17",
"Statement": [
{
"Sid": "DenyNonBedrockServicesOutsideAuckland",
"Effect": "Deny",
"NotAction": ["bedrock:*", "iam:*", "organizations:*", "support:*"] ,
"Resource": "*",
"Condition": {
"StringNotEquals": {"aws:RequestedRegion": ["ap-southeast-6"]}
}
},
{
"Sid": "DenyBedrockOutsideANZRegions",
"Effect": "Deny",
"Action": "bedrock:*",
"Resource": "*",
"Condition": {
"StringNotEquals": {"aws:RequestedRegion": ["ap-southeast-2", "ap-southeast-4", "ap-southeast-6"]}
}
},
{
"Sid": "DenyDirectBedrockInDestinationRegions",
"Effect": "Deny",
"Action": "bedrock:*",
"Resource": "*",
"Condition": {
"StringEquals": {"aws:RequestedRegion": ["ap-southeast-2", "ap-southeast-4"]},
"Null": {"bedrock:InferenceProfileArn": "true"}
}
}
]
}
Monitoramento, auditoria e gerenciamento de cotas
O AWS CloudTrail registra todas as chamadas cross-region na região de origem, incluindo dados sobre a região onde a inferência foi processada. Para monitoramento em tempo real, o Amazon CloudWatch fornece métricas como número de invocações, latência, erros e consumo de tokens.
As cotas do Amazon Bedrock são gerenciadas por região de origem. No caso da região de Auckland, aumentos de cota devem ser solicitados localmente via console AWS Service Quotas. As cotas consideram tokens por minuto (TPM) e requisições por minuto (RPM), com uma fórmula que leva em conta a taxa de queima de tokens de saída (exemplo: 5:1 para alguns modelos Anthropic Claude).
Passos para iniciar a inferência cross-region em Auckland
- Faça login no console do Amazon Bedrock na região
ap-southeast-6(Auckland). - Configure as permissões IAM e SCP conforme os exemplos fornecidos.
- Realize sua primeira chamada API utilizando o ID do perfil de inferência com prefixo
au.. - Solicite aumentos de cota conforme a demanda prevista no console Service Quotas.