Guia Prático para Migrar do Amazon Nova 1 para o Amazon Nova 2 no Amazon Bedrock

Por que migrar do Amazon Nova 1 para o Amazon Nova 2?
Se você utiliza modelos Amazon Nova 1 no Amazon Bedrock, a migração para o Amazon Nova 2 pode trazer ganhos significativos. O Nova 2 amplia a janela de contexto de 300 mil para 1 milhão de tokens, melhora o raciocínio, e integra ferramentas nativas como web grounding e um interpretador de código Python. Isso permite processar documentos maiores, executar workflows complexos e obter respostas mais precisas com menor latência.
Modelos e caminhos recomendados para migração
- Amazon Nova 1 Lite: migração direta para Nova 2 Lite, mantendo os mesmos tipos de entrada (texto, imagem, vídeo) e adicionando recursos avançados como extended thinking e ferramentas nativas.
- Amazon Nova 1 Pro: recomendado migrar para Nova 2 Lite, que oferece melhor desempenho em raciocínio e custo-benefício, graças ao aumento da janela de contexto e à capacidade de extended thinking.
- Amazon Nova Premier: também indicado migrar para Nova 2 Lite, especialmente para workloads que envolvem uso de agentes e ferramentas, com ganhos de até 7x em resolução de problemas complexos e inferência até 5x mais rápida.
Principais casos de uso do Amazon Nova 2 Lite
- Processamento de Linguagem Natural (NLP): desde predição simples de texto até recomendações baseadas em lógica. O modelo apresenta alta pontuação em benchmarks como MMLU Pro (80,9%) e IF-Bench (70,8%), com baixa latência ideal para aplicações que exigem respostas rápidas.
- Processamento Inteligente de Documentos (IDP): vai além da extração textual, interpretando o significado semântico, relacionando informações entre páginas, normalizando variações e possibilitando validação e detecção de anomalias automaticamente.
- Workflows multi-etapas com agentes: o Nova 2 Lite melhora a confiabilidade na chamada de múltiplas ferramentas, sendo indicado para automação de tarefas complexas, como triagem de alertas de segurança e modernização de código, com ganhos de até 60% em eficiência.
Novidades técnicas do Amazon Nova 2
- Extended thinking: permite ao modelo raciocinar antes de responder, com controle de esforço (baixo, médio, alto) para balancear precisão e custo.
- Ferramentas embutidas: suporte nativo para web grounding (busca em tempo real com citações) e interpretador de código Python, eliminando integrações externas.
- Janela de contexto expandida: até 1 milhão de tokens para entrada e até 65 mil tokens para saída, suportando documentos e fluxos mais complexos em uma única requisição.
Alterações na API e atualizações de código
Para migrar, atualize o modelId para a versão Nova 2 Lite disponível nos endpoints Global CRIS, US CRIS, EU CRIS e JP CRIS. Exemplo de uso da API Converse com Boto3:
import boto3
bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')
response = bedrock.converse(
modelId='us.amazon.nova-2-lite-v1:0',
system=[{'text': 'You are a helpful assistant'}],
messages=[{'role': 'user', 'content': [{'text': 'Explique computação em nuvem de forma simples.'}]}],
inferenceConfig={
'maxTokens': 1024,
'temperature': 0.7,
'topP': 0.9
}
)
print(response['output']['message']['content'][0]['text'])
Note que para usar o recurso de extended thinking é necessário incluir o parâmetro reasoningConfig dentro de additionalModelRequestFields, com níveis low, medium ou high. Exemplo com esforço médio:
response = bedrock.converse(
modelId='us.amazon.nova-2-lite-v1:0',
system=[{'text': 'You are a helpful assistant'}],
messages=[{'role': 'user', 'content': [{'text': 'Um bastão e uma bola custam $1,10 no total. O bastão custa $1,00 a mais que a bola. Quanto custa a bola?'}]}],
inferenceConfig={
'maxTokens': 10000,
'temperature': 0.7,
'topP': 0.9
},
additionalModelRequestFields={
'reasoningConfig': {
'type': 'enabled',
'maxReasoningEffort': 'medium'
}
}
)
Para o nível de esforço high, não inclua os parâmetros maxTokens, temperature, topP nem topK, sob pena de erro na requisição.
Checklist para migração
- Atualize o modelId para
us.amazon.nova-2-lite-v1:0ou equivalente regional. - Revise o uso de parâmetros de inferência, especialmente se utilizar
maxReasoningEffortem nível high. - Teste os níveis de esforço do reasoning para identificar o melhor equilíbrio entre custo e qualidade para seu caso.
- Explore as ferramentas nativas como web grounding e interpretador de código para enriquecer suas aplicações.
- Monitore o desempenho e custos usando as métricas do Amazon Bedrock e ajuste configurações conforme necessário.