IaFoco
Voltar para o blog
HuggingFace

Guia Prático para Migrar do Amazon Nova 1 para o Amazon Nova 2 no Amazon Bedrock

18 de março de 2026
12:19
Automaçãointeligência artificialmachine learningprocessamento de linguagem naturalAmazon BedrockAmazon NovaMigração de ModelosExtended ThinkingAPI AWSDocumentação AWS
Guia Prático para Migrar do Amazon Nova 1 para o Amazon Nova 2 no Amazon Bedrock

Por que migrar do Amazon Nova 1 para o Amazon Nova 2?

Se você utiliza modelos Amazon Nova 1 no Amazon Bedrock, a migração para o Amazon Nova 2 pode trazer ganhos significativos. O Nova 2 amplia a janela de contexto de 300 mil para 1 milhão de tokens, melhora o raciocínio, e integra ferramentas nativas como web grounding e um interpretador de código Python. Isso permite processar documentos maiores, executar workflows complexos e obter respostas mais precisas com menor latência.

Modelos e caminhos recomendados para migração

  • Amazon Nova 1 Lite: migração direta para Nova 2 Lite, mantendo os mesmos tipos de entrada (texto, imagem, vídeo) e adicionando recursos avançados como extended thinking e ferramentas nativas.
  • Amazon Nova 1 Pro: recomendado migrar para Nova 2 Lite, que oferece melhor desempenho em raciocínio e custo-benefício, graças ao aumento da janela de contexto e à capacidade de extended thinking.
  • Amazon Nova Premier: também indicado migrar para Nova 2 Lite, especialmente para workloads que envolvem uso de agentes e ferramentas, com ganhos de até 7x em resolução de problemas complexos e inferência até 5x mais rápida.

Principais casos de uso do Amazon Nova 2 Lite

  • Processamento de Linguagem Natural (NLP): desde predição simples de texto até recomendações baseadas em lógica. O modelo apresenta alta pontuação em benchmarks como MMLU Pro (80,9%) e IF-Bench (70,8%), com baixa latência ideal para aplicações que exigem respostas rápidas.
  • Processamento Inteligente de Documentos (IDP): vai além da extração textual, interpretando o significado semântico, relacionando informações entre páginas, normalizando variações e possibilitando validação e detecção de anomalias automaticamente.
  • Workflows multi-etapas com agentes: o Nova 2 Lite melhora a confiabilidade na chamada de múltiplas ferramentas, sendo indicado para automação de tarefas complexas, como triagem de alertas de segurança e modernização de código, com ganhos de até 60% em eficiência.

Novidades técnicas do Amazon Nova 2

  • Extended thinking: permite ao modelo raciocinar antes de responder, com controle de esforço (baixo, médio, alto) para balancear precisão e custo.
  • Ferramentas embutidas: suporte nativo para web grounding (busca em tempo real com citações) e interpretador de código Python, eliminando integrações externas.
  • Janela de contexto expandida: até 1 milhão de tokens para entrada e até 65 mil tokens para saída, suportando documentos e fluxos mais complexos em uma única requisição.

Alterações na API e atualizações de código

Para migrar, atualize o modelId para a versão Nova 2 Lite disponível nos endpoints Global CRIS, US CRIS, EU CRIS e JP CRIS. Exemplo de uso da API Converse com Boto3:

import boto3
bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')
response = bedrock.converse(
    modelId='us.amazon.nova-2-lite-v1:0',
    system=[{'text': 'You are a helpful assistant'}],
    messages=[{'role': 'user', 'content': [{'text': 'Explique computação em nuvem de forma simples.'}]}],
    inferenceConfig={
        'maxTokens': 1024,
        'temperature': 0.7,
        'topP': 0.9
    }
)
print(response['output']['message']['content'][0]['text'])

Note que para usar o recurso de extended thinking é necessário incluir o parâmetro reasoningConfig dentro de additionalModelRequestFields, com níveis low, medium ou high. Exemplo com esforço médio:

response = bedrock.converse(
    modelId='us.amazon.nova-2-lite-v1:0',
    system=[{'text': 'You are a helpful assistant'}],
    messages=[{'role': 'user', 'content': [{'text': 'Um bastão e uma bola custam $1,10 no total. O bastão custa $1,00 a mais que a bola. Quanto custa a bola?'}]}],
    inferenceConfig={
        'maxTokens': 10000,
        'temperature': 0.7,
        'topP': 0.9
    },
    additionalModelRequestFields={
        'reasoningConfig': {
            'type': 'enabled',
            'maxReasoningEffort': 'medium'
        }
    }
)

Para o nível de esforço high, não inclua os parâmetros maxTokens, temperature, topP nem topK, sob pena de erro na requisição.

Checklist para migração

  1. Atualize o modelId para us.amazon.nova-2-lite-v1:0 ou equivalente regional.
  2. Revise o uso de parâmetros de inferência, especialmente se utilizar maxReasoningEffort em nível high.
  3. Teste os níveis de esforço do reasoning para identificar o melhor equilíbrio entre custo e qualidade para seu caso.
  4. Explore as ferramentas nativas como web grounding e interpretador de código para enriquecer suas aplicações.
  5. Monitore o desempenho e custos usando as métricas do Amazon Bedrock e ajuste configurações conforme necessário.

Links úteis para aprofundamento