Amazon Nova 2 Lite: Detecção de Objetos Simplificada com Amazon Bedrock e AWS Lambda

Amazon lança Nova 2 Lite para detecção de objetos sem necessidade de treinamento
A Amazon anunciou o Amazon Nova 2 Lite, um modelo multimodal de base que permite a detecção de objetos em imagens por meio de prompts em linguagem natural, sem a necessidade de treinamento prévio. Disponível através do Amazon Bedrock, o Nova 2 Lite oferece uma alternativa acessível e escalável para equipes e empresas que precisam implementar visão computacional sem investimentos altos em infraestrutura e equipes especializadas.
Para quem é e como acessar
O Amazon Nova 2 Lite é ideal para pequenas e médias empresas, desenvolvedores e times que buscam implementar soluções de detecção de objetos em setores como manufatura, agricultura e logística. O serviço está disponível nas regiões onde o Amazon Bedrock é oferecido e pode ser acessado via API, eliminando a necessidade de gerenciar infraestrutura ou treinar modelos.
Para começar, é necessário ter uma conta AWS com permissões para acessar o Amazon Bedrock e o modelo Nova 2 Lite. O desenvolvimento pode ser feito com Python 3.8 ou superior, utilizando o AWS SDK (Boto3) e a biblioteca Pillow para manipulação de imagens.
Como funciona a detecção de objetos com Amazon Nova 2 Lite
O processo de detecção utiliza uma arquitetura serverless que combina Amazon Bedrock, AWS Lambda e Amazon API Gateway. O fluxo consiste em quatro etapas principais:
- Engenharia do prompt: elaboração de prompts detalhados em linguagem natural para especificar os objetos a serem detectados e o formato JSON esperado na resposta.
- Chamada ao Amazon Bedrock: invocação da API Converse do Bedrock para enviar a imagem e o prompt ao modelo Nova 2 Lite, que retorna coordenadas normalizadas dos objetos detectados.
- Processamento das coordenadas: conversão das coordenadas normalizadas (escala 0-1000) para posições em pixels conforme as dimensões da imagem.
- Visualização: renderização das caixas delimitadoras sobre a imagem original para validação dos resultados.
O modelo retorna os dados estruturados em JSON, contendo as coordenadas dos bounding boxes para cada objeto identificado, o que facilita a integração com sistemas existentes.
Exemplo prático: detecção em cenas urbanas
Em um exemplo aplicado, o Nova 2 Lite foi capaz de detectar veículos e placas de pare em uma imagem de rua sem qualquer treinamento adicional. A precisão foi alta mesmo para objetos pequenos, distantes ou parcialmente ocultos, demonstrando a eficácia do modelo em reconhecer categorias genéricas apenas a partir de seus nomes.
Arquitetura e implantação na nuvem
O modelo é acessado por meio do Amazon Bedrock Converse API, que pode ser integrado a diversos serviços AWS conforme a necessidade do cliente:
- AWS Lambda: para cargas de trabalho orientadas a eventos e endpoints API, com escalabilidade automática e custo por invocação.
- Amazon EC2: para maior controle do ambiente e processos de longa duração.
- Amazon ECS/EKS: para implantações baseadas em containers com escalabilidade automática.
Uma aplicação web serverless de exemplo foi desenvolvida, utilizando Amazon CloudFront para distribuição global, Amazon S3 para armazenamento, API Gateway para roteamento e Lambda para orquestração da chamada ao modelo e processamento dos resultados.
Custos estimados e modelo de pagamento
O Amazon Bedrock cobra por tokens de entrada e saída, com valores aproximados de $0,0003 por mil tokens de entrada e $0,0025 por mil tokens de saída. Uma imagem típica gera cerca de 230 tokens de entrada e 200 tokens de saída, resultando em um custo aproximado de $0,00057 por imagem processada. AWS Lambda e API Gateway são cobrados conforme uso, com valores mínimos para testes.
Aplicações práticas em diferentes setores
- Manufatura: inspeção automatizada para identificar defeitos como riscos, amassados e ferrugem em peças metálicas, reduzindo custos com retrabalho.
- Agricultura de precisão: monitoramento com drones para detectar folhas doentes, danos por pragas e fungos, otimizando o uso de defensivos agrícolas e prevenindo perdas.
- Logística e fulfillment: identificação automática de embalagens danificadas, itens fora do lugar e equipamentos de segurança, garantindo qualidade e conformidade operacional.
Como testar e implantar sua solução
O código-fonte completo da aplicação de exemplo está disponível no repositório GitHub da AWS. A implantação pode ser feita pelo AWS CLI e AWS CDK, bastando ter acesso ao Amazon Bedrock e permissões configuradas.
Após a implantação, a aplicação permite enviar imagens e especificar os objetos a serem detectados via interface web, retornando imagens anotadas com as caixas delimitadoras dos objetos identificados.