Como a Vanguard Construiu um Analista Virtual com Dados Prontos para IA na AWS

Desafios na Análise de Dados Financeiros Complexos
A Vanguard, uma das maiores gestoras globais de investimentos, enfrentava um desafio comum a muitas organizações: seus analistas financeiros precisavam consultar bases de dados complexas, mas mesmo perguntas básicas exigiam consultas SQL elaboradas e longos tempos de espera por suporte das equipes de dados. Essa dificuldade impactava a agilidade na tomada de decisões estratégicas.
Para superar essa barreira, a Vanguard apostou no desenvolvimento de um Analista Virtual baseado em inteligência artificial conversacional. Porém, o projeto revelou que o maior obstáculo não estava nos modelos de IA em si, mas na arquitetura de dados que suportava essas soluções.
Construindo Dados Prontos para IA: A Mudança de Paradigma
O time da Vanguard percebeu que, para que a IA funcionasse de maneira confiável e escalável, era necessário criar uma infraestrutura de dados que eles chamaram de "AI-ready data" — dados prontos para IA. Isso envolveu oito princípios orientadores que vão além da simples integração de dados, incluindo governança, qualidade, semântica e colaboração entre equipes.
Colaboração Multidisciplinar para Quebrar Silos
O projeto reuniu engenheiros de dados, analistas de negócios, equipes de compliance, segurança e usuários finais. Essa colaboração foi crucial para definir modelos claros de propriedade dos dados, garantir conformidade regulatória e alinhar os dados às necessidades reais dos usuários. Sem esse alinhamento, o Analista Virtual não teria uma base sólida para entregar informações confiáveis.
Arquitetura Técnica do Analista Virtual
A Vanguard escolheu a AWS por sua ampla gama de serviços integrados que suportam dados e IA. A arquitetura do Analista Virtual inclui:
- Amazon Bedrock: para acesso a modelos de base que interpretam a linguagem natural.
- Amazon Bedrock Guardrails: para garantir a segurança dos dados financeiros sensíveis.
- Amazon ECS: para infraestrutura computacional escalável.
- Amazon DynamoDB: para armazenar o histórico das conversas com baixa latência.
- Amazon S3: para armazenamento de dados.
- Amazon SageMaker: para experimentação em machine learning.
- Amazon Redshift: para o data warehouse centralizado.
- AWS Glue: para catalogação e pipelines ETL automatizados.
Os Oito Princípios para Dados Prontos para IA
- Modelos claros de produto e operação de dados: definir proprietários técnicos e de negócio para cada ativo de dados, com acordos de níveis de serviço (SLAs) para garantir qualidade e atualização.
- Governança e segurança: implementar controles de acesso baseados em funções, autorização em nível de consulta e políticas de retenção para cumprir regulações.
- Catálogo unificado de metadados: integrar metadados técnicos e de negócio para garantir que o significado dos dados seja compreendido por todos e acessível via APIs.
- Camada semântica operacional: traduzir definições e regras de negócio em lógica executável que padroniza métricas e facilita a geração automática de consultas SQL a partir de linguagem natural.
- Exemplos de referência (ground truth): criar pares de perguntas e consultas SQL corretas para treinar, avaliar e testar o modelo de IA, garantindo precisão e evolução contínua.
- Verificações automatizadas de qualidade dos dados: monitorar anomalias, relacionamentos entre tabelas, consistência entre sistemas e atualização dos dados.
- Controle de mudanças: tratar definições semânticas, exemplos e configurações como código, com versionamento e processos de aprovação para garantir segurança e agilidade.
- Avaliação contínua: medir métricas de negócio como redução do tempo para insights, satisfação dos usuários, e impacto financeiro, mantendo ciclos de feedback e testes automatizados.
Resultados Concretos e Impactos para o Negócio
Com a implementação do Analista Virtual, a Vanguard conseguiu reduzir o tempo para obter insights financeiros complexos de dias para minutos, empoderando usuários de negócios a acessarem dados sem necessidade de conhecimento em SQL. A precisão das consultas geradas pela IA aumentou significativamente graças à camada semântica e ao catálogo de metadados, além de diminuir a carga da equipe de dados em solicitações rotineiras.
Além disso, a arquitetura e os processos desenvolvidos estão sendo adotados por outras unidades da Vanguard, ampliando o impacto da transformação digital.
Perspectivas Futuras: Graphs e RAG para Evolução do Analista Virtual
A Vanguard avalia incorporar tecnologias como knowledge graphs para melhorar o entendimento das relações entre entidades e contextos cruzados, aumentando a precisão e explicabilidade das consultas. Também explora Retrieval-Augmented Generation (RAG) com Amazon Bedrock Knowledge Bases para usar a biblioteca de exemplos e criar sistemas de feedback inteligente que aprimoram continuamente a qualidade dos modelos.
Considerações Finais: Transformação Além da IA
O caso da Vanguard mostra que o sucesso em IA corporativa depende menos dos algoritmos e mais da construção de fundamentos sólidos de dados. A combinação de serviços AWS integrados e práticas rigorosas de governança e qualidade permite converter capacidades técnicas em resultados de negócio confiáveis, acelerando a tomada de decisão e a inovação.