Sun Finance revoluciona verificação de identidade e detecção de fraudes com IA generativa na AWS

Sun Finance automatiza extração de documentos e combate fraudes com IA generativa da AWS

A fintech Sun Finance, sediada na Letônia e presente em nove países, desenvolveu uma avançada solução de verificação de identidade (IDV) e detecção de fraudes utilizando tecnologias de inteligência artificial generativa da AWS. A implementação, realizada em parceria com o AWS Generative AI Innovation Center, integra serviços como Amazon Bedrock, Amazon Textract e Amazon Rekognition, transformando processos que antes demandavam horas e custos elevados em operações rápidas, precisas e econômicas.

Desafios enfrentados pela Sun Finance

Desde sua fundação em 2017, a Sun Finance processa cerca de uma solicitação de empréstimo a cada 0,63 segundos, totalizando mais de 4 milhões de avaliações mensais. Em um dos setores com maior volume, que recebe 80 mil pedidos de microempréstimos por mês, cerca de 60% das aplicações precisavam de revisão manual devido a falhas na extração de dados dos documentos de identidade, principalmente causadas por limitações das tecnologias tradicionais de OCR e pela diversidade de documentos e idiomas locais.

Além disso, aproximadamente 10% das solicitações diárias eram fraudes, muitas vezes utilizando imagens similares e padrões que burlavam controles básicos, o que aumentava a carga de trabalho manual e dificultava a expansão para mercados com microempréstimos de menor valor.

Arquitetura da solução: combinação de OCR especializado e IA generativa

A solução construída utiliza uma arquitetura serverless que integra múltiplos serviços AWS para automatizar a extração de dados e a detecção de fraudes:

Amazon Textract: Realiza a extração primária de texto dos documentos de identidade.
Amazon Rekognition: Atua como fallback para OCR em imagens de baixa qualidade, além de realizar detecção e mascaramento facial.
Amazon Bedrock (Claude Sonnet 4 e Amazon Titan Multimodal Embeddings): Estrutura e padroniza os dados extraídos, além de gerar vetores para análise de similaridade visual na detecção de fraudes.
AWS Lambda e AWS Step Functions: Orquestram o processamento paralelo e serverless das tarefas.
Amazon API Gateway: Expõe APIs para os serviços de extração e detecção.
Amazon S3 Vectors: Armazena vetores para buscas de similaridade contra padrões conhecidos de fraude.

Pipeline de extração de identidade: evolução e resultados

O pipeline de extração passou por três iterações até atingir 90,8% de precisão, partindo de 61,8% na primeira abordagem que utilizava apenas o modelo Claude Sonnet 4 para extração direta. A principal dificuldade inicial foi a política interna do modelo para proteção de dados pessoais (PII), que restringia a extração de informações sensíveis.

Na segunda etapa, a equipe separou o OCR da estruturação: Amazon Textract ficou responsável pela extração do texto bruto, enquanto Claude Sonnet 4 estruturava os dados em campos padronizados (tipo de documento, nome, data de nascimento, número do documento, entre outros). Essa mudança elevou a precisão para 85%.

A versão final incorporou ainda o Amazon Rekognition como método de fallback para casos de baixa confiança no Textract, além de regras de validação para padronização de formatos, resultando em 90,8% de acurácia geral e redução do tempo médio de processamento para menos de 5 segundos por documento.

Detecção de fraudes baseada em análise visual e similaridade vetorial

O sistema de detecção de fraudes executa duas verificações em paralelo:

Detecção de padrões visuais: Claude Sonnet 4 analisa selfies enviadas para identificar sinais de manipulação digital, fotos de tela (com artefatos como linhas de varredura e reflexos) com alta precisão.
Análise de similaridade de fundo: Amazon Rekognition remove o rosto da selfie para focar no fundo, que é convertido em vetores pelo Amazon Titan Multimodal Embeddings. Esses vetores são comparados contra um banco de dados de padrões de fraude armazenados no Amazon S3 Vectors para identificar grupos de fraude organizados.

Os resultados das duas análises são combinados em uma função Lambda que gera uma pontuação final de risco, categorizando os casos em alto, médio ou baixo risco de fraude.

Impactos práticos: ganhos de custo, velocidade e precisão

Precisão da extração: aumento de 79,7% para 90,8%.
Redução de custos: diminuição de 91% no custo por documento processado.
Velocidade: redução do tempo de processamento de até 20 horas para menos de 5 segundos.
Detecção de fraudes: 81% de precisão geral, com 59% de recall, permitindo identificar cerca de 6 em cada 10 casos de fraude.

Essa eficiência possibilita à Sun Finance expandir sua atuação em mercados de microempréstimos com melhor controle, menor custo operacional e maior satisfação do cliente.

Disponibilidade e como acessar

As tecnologias utilizadas estão disponíveis na plataforma AWS e podem ser acessadas por desenvolvedores e empresas com conta ativa. É necessário habilitar o acesso aos modelos Amazon Bedrock, como Anthropic Claude Sonnet 4 e Amazon Titan Multimodal Embeddings, além de permissões para os serviços AWS Lambda, Step Functions, Textract, Rekognition e S3.

Para iniciar, é recomendada familiaridade com arquiteturas serverless, Python e ferramentas de infraestrutura como Terraform. Documentação oficial e guias estão disponíveis nos links abaixo.