Voltar para o blog
Machine Learning

OncoAgent: Sistema de IA para Apoio Clínico Oncológico com Privacidade e Alta Precisão

10 de maio de 2026
00:23
privacidade de dadosmodelos de linguagemoncologiaOpen SourceInteligência ArtificialmultiagentesAMD MI300Xsuporte clínicorecuperação aumentadaQLoRA
OncoAgent: Sistema de IA para Apoio Clínico Oncológico com Privacidade e Alta Precisão

OncoAgent: inovação em suporte à decisão clínica oncológica

O OncoAgent é um sistema open-source desenvolvido para oferecer suporte à decisão clínica em oncologia, combinando inteligência artificial avançada com rigoroso respeito à privacidade dos dados dos pacientes. Publicado em maio de 2026 e disponível na plataforma Hugging Face, o projeto destaca-se pela arquitetura multiagente de dois níveis, que alia modelos de linguagem de diferentes capacidades para otimizar tanto a velocidade quanto a profundidade das análises.

Arquitetura e funcionamento do sistema

O OncoAgent utiliza uma topologia LangGraph composta por oito nós especializados, cada um com função delimitada e auditável. O sistema inicia com um roteador de complexidade que avalia as características clínicas do caso, como tipo e estágio do câncer, mutações genéticas e tratamentos prévios, para decidir entre dois modelos de linguagem:

  • Tier 1: modelo Qwen 3.5 com 9 bilhões de parâmetros, otimizado para triagem rápida.
  • Tier 2: modelo Qwen 3.6 com 27 bilhões de parâmetros, focado em raciocínio profundo para casos mais complexos.

Essa divisão permite balancear desempenho e precisão, garantindo respostas adequadas ao nível de complexidade do caso clínico.

Pipeline de recuperação e validação das informações

Para assegurar que as recomendações estejam fundamentadas em evidências clínicas atualizadas, o OncoAgent implementa um pipeline de Recuperação Aumentada por Geração Corretiva (Corrective RAG) em quatro etapas, que manipula mais de 70 diretrizes oncológicas de alta qualidade, incluindo as da NCCN e ESMO:

  1. Recuperação ampla com modelo bi-encoder PubMedBERT para identificar os documentos mais relevantes.
  2. Filtro rigoroso baseado na distância de similaridade para evitar falsos positivos.
  3. Reordenação dos documentos por relevância com cross-encoder.
  4. Ajuste do conteúdo para caber no limite do modelo de linguagem.

Além disso, cada documento recuperado é avaliado por um nó corretivo que elimina conteúdos irrelevantes, evitando alucinações comuns em sistemas de IA.

Mecanismos de segurança e privacidade

O sistema adota uma política Zero-PHI (Zero Protected Health Information), removendo e substituindo informações pessoais identificáveis antes de qualquer processamento por modelos de linguagem, em conformidade com normas como a HIPAA. A segurança é reforçada por múltiplas camadas, incluindo validação estrutural e semântica das respostas, loops de autorreflexão para correção automática e a integração obrigatória de um clínico no processo para casos complexos ou quando a confiança do sistema estiver baixa.

Treinamento e otimização com hardware AMD

O OncoAgent foi treinado com um corpus extenso de 266.854 casos oncológicos reais e sintéticos, usando a técnica QLoRA para fine-tuning eficiente em modelos de grande escala. O uso do processador gráfico AMD Instinct MI300X, aliado à biblioteca Unsloth, permitiu acelerar o treinamento em até 56 vezes comparado ao padrão API, concluindo todo o fine-tuning em cerca de 50 minutos.

Esse avanço tecnológico garante que o sistema possa ser executado localmente em hospitais, eliminando a dependência de APIs em nuvem e protegendo a soberania dos dados clínicos.

Benefícios práticos e disponibilidade

O OncoAgent oferece uma solução robusta para o desafio da rápida atualização e aplicação das diretrizes oncológicas na prática clínica. Sua arquitetura modular e auditável, combinada com rigorosas salvaguardas de segurança, torna-o adequado para ambientes hospitalares que exigem privacidade máxima e confiabilidade.

Por ser 100% open-source, o sistema pode ser implantado on-premises, permitindo que instituições de saúde mantenham total controle sobre seus dados. Essa característica é especialmente importante em oncologia, onde decisões erradas podem ter consequências graves.

Links úteis