Amazon Bedrock lança atribuição granular de custos para rastreamento detalhado de uso de IA

Com o crescimento do uso de inferência de inteligência artificial na nuvem, entender quem e o que gera custos tornou-se fundamental para otimizar gastos, realizar cobranças internas e planejar financeiramente. Pensando nisso, a AWS anunciou uma novidade para o Amazon Bedrock: a atribuição granular de custos.
Como funciona a atribuição granular de custos no Amazon Bedrock
Agora, o Amazon Bedrock atribui automaticamente os custos de inferência ao principal IAM que fez a chamada. Um principal IAM pode ser um usuário IAM, uma função assumida por um aplicativo ou uma identidade federada de provedores como Okta ou Entra ID. Essa atribuição é integrada ao sistema de faturamento da AWS, cobre todos os modelos disponíveis e não exige gerenciamento adicional de recursos ou mudanças nos fluxos existentes.
Além disso, com o uso opcional de tags de alocação de custos, é possível agrupar gastos por equipe, projeto ou outras dimensões personalizadas usando o AWS Cost Explorer e o AWS Cost and Usage Reports (CUR 2.0).
Visualizando custos detalhados no CUR 2.0
Ao habilitar os dados do principal IAM na configuração de exportação do CUR 2.0, é possível identificar exatamente quem está consumindo quais recursos e quanto está gastando. Por exemplo:
line_item_iam_principal line_item_usage_type line_item_unblended_cost
arn:aws:iam::123456789012:user/alice USE1-Claude4.6Sonnet-input-tokens $0.069
arn:aws:iam::123456789012:user/alice USE1-Claude4.6Sonnet-output-tokens $0.214
arn:aws:iam::123456789012:user/bob USE1-Claude4.6Opus-input-tokens $0.198
arn:aws:iam::123456789012:user/bob USE1-Claude4.6Opus-output-tokens $0.990
Isso mostra que a usuária Alice consumiu tokens de entrada e saída do modelo Claude 4.6 Sonnet, enquanto Bob utilizou o Claude 4.6 Opus, com o respectivo custo detalhado.
Agregação de custos com tags para análise por equipe ou projeto
Para facilitar a análise e agrupamento de custos, é possível adicionar tags aos principais IAM. Existem duas formas principais:
- Tags permanentes: associadas diretamente a usuários ou funções IAM, aplicadas a todas as requisições daquele principal.
- Tags de sessão: passadas dinamicamente ao assumir uma função IAM temporária ou embutidas em assertivas de provedores de identidade federada.
Após ativar essas tags como tags de alocação de custos no console de faturamento da AWS, elas aparecem no CUR 2.0 com o prefixo iamPrincipal/, permitindo análises personalizadas.
Exemplos práticos de cenários de atribuição de custos
Cenário 1: Rastreamento por usuário com usuários IAM e chaves API
Ideal para equipes pequenas ou ambientes de desenvolvimento onde cada desenvolvedor usa credenciais IAM ou chaves API do Amazon Bedrock. Os custos são automaticamente atribuídos ao ARN do usuário IAM. Para agrupar por time ou centro de custo, basta adicionar tags aos usuários IAM, por exemplo:
# Tagueando usuários da equipe de ciência de dados
aws iam tag-user --user-name user-1 --tags Key=team,Value="BedrockDataScience" Key=cost-center,Value="12345"
aws iam tag-user --user-name user-2 --tags Key=team,Value="BedrockDataScience" Key=cost-center,Value="12345"
No CUR 2.0, serão exibidos o usuário, o tipo de uso, o custo e as tags associadas, facilitando análises por usuário, modelo ou equipe.
Cenário 2: Rastreamento por aplicação com funções IAM
Para workloads de produção, onde aplicações assumem funções IAM para chamar o Bedrock, o custo é atribuído à função assumida. É possível adicionar tags às funções para agrupar custos por projeto ou centro de custo. Exemplo:
# Tagueando funções de aplicação
aws iam tag-role --role-name Role-1 --tags Key=project,Value="DocFlow" Key=cost-center,Value="12345"
aws iam tag-role --role-name Role-2 --tags Key=project,Value="ChatBackend" Key=cost-center,Value="12345"
Assim, o CUR 2.0 mostrará custos detalhados por função e tags, permitindo análises por aplicação, sessão ou projeto.
Cenário 3: Rastreamento por usuário com autenticação federada
Em ambientes corporativos que utilizam provedores de identidade como Okta, Azure AD ou Amazon Cognito, usuários federados assumem uma função IAM compartilhada. A atribuição por usuário ocorre via nome de sessão no ARN e tags passadas pelo provedor. O CUR 2.0 exibirá informações detalhadas por usuário mesmo que todos compartilhem a mesma função IAM.
Cenário 4: Rastreamento por usuário em gateways de LLM
Organizações que utilizam gateways ou proxies para LLM (como LiteLLM ou API gateways customizados) enfrentam o desafio de que todas as chamadas aparecem com uma única identidade no CUR. A solução é implementar gerenciamento de sessões por usuário, onde o gateway assume uma função para cada usuário com o nome da sessão e tags, permitindo atribuição individualizada e análise detalhada.
Considerações finais e próximos passos
Essa funcionalidade traz controle e transparência inéditos para o uso do Amazon Bedrock, facilitando a gestão financeira e operacional de projetos de IA. Para ativar as tags de alocação de custos, acesse o console de faturamento AWS ou utilize a API UpdateCostAllocationTagsStatus. As informações estarão disponíveis no AWS Cost Explorer e no CUR 2.0 em até 48 horas.