Sakana AI Lança Marlin: Agente Empresarial Autônomo que Gera Relatórios de Até 100 Páginas

A Sakana AI, laboratório de IA baseado em Tóquio, acaba de comercializar sua tecnologia proprietária de busca em árvore com o lançamento do Sakana Marlin — um agente empresarial autônomo que funciona como um Chief Strategy Officer virtual, capaz de gerar relatórios de pesquisa de até 100 páginas com slides de apresentação incluídos.
O que o Marlin faz
Basta fornecer um único tópico ou pergunta de pesquisa e o Marlin trabalha de forma autônoma por até 8 horas, executando centenas ou milhares de consultas a LLMs para:
- Planejar hipóteses
- Navegar por fontes
- Verificar descobertas
- Comprimir semanas de trabalho estratégico em horas
O resultado é um relatório completo com dezenas a ~100 páginas (corpo principal, referências, apêndices) mais uma apresentação de slides gerada com IA de criação de imagens.
"O Marlin não responde em segundos como um chatbot. Ele funciona de forma autônoma por até cerca de oito horas."
A tecnologia por trás: AB-MCTS
O coração do Marlin é o AB-MCTS (Adaptive Branching Monte Carlo Tree Search), baseado em pesquisa publicada pela Sakana que recebeu destaque no NeurIPS 2025. A ideia é elegante: a cada passo de raciocínio, o sistema decide se deve:
- Alargar (gerar uma nova resposta candidata) ou
- Aprofundar (refinar uma resposta promissora existente)
Isso é diferente da amostragem repetida tradicional, que apenas explora a amplitude em paralelo. Uma variante multi-LLM pode inclusive rotear cada passo para um modelo diferente — combinando o4-mini, Gemini 2.5 Pro e DeepSeek-R1, por exemplo, alcançando 27,5% de taxa de resolução no benchmark ARC-AGI-2 (contra 23% do o4-mini sozinho).
O Marlin também herda automação de fluxo de trabalho do projeto AI Scientist da Sakana, publicado na revista Nature.
Casos de uso reais
- Entrada em mercado: "Avalie o mercado japonês de stablecoins e pagamentos tokenizados após mudança regulatória" → O Marlin mapeia drivers, riscos e opções estratégicas estruturadas.
- Análise de risco: "Modele cenários de resolução para um bloqueio no Estreito de Ormuz" → Compara hipóteses em vez de apenas resumir.
- Análise competitiva: "Perfile três rivais e classifique nossas lacunas de posicionamento" → Retorna slides prontos para uma reunião de estratégia.
Comparação com outras ferramentas
| Ferramenta | Tempo típico | Resultado | Público principal |
|---|---|---|---|
| Sakana Marlin | Até ~8 horas | Relatório (60-100 págs) + slides | Equipes de estratégia |
| OpenAI Deep Research | Minutos a dezenas de minutos | Relatório com citações | Usuários gerais e pro |
| Perplexity Deep Research | Alguns minutos | Resposta com citações | Usuários gerais |
| Gemini Deep Research | Minutos | Relatório com citações | Usuários gerais |
O Marlin troca velocidade por profundidade e um produto refinado, adequado para decisões de C-level.
Preços
- Pay-as-you-go: 100 créditos por execução, ¥98 por crédito
- Pro: ¥150.000/mês (2.000 créditos)
- Team: ¥400.000/mês (6.000 créditos)
- Enterprise: Preço personalizado
Código aberto: TreeQuest
A Sakana disponibilizou o algoritmo AB-MCTS como TreeQuest (licença Apache 2.0), instalável via pip install treequest. A biblioteca suporta busca com um ou múltiplos LLMs, checkpointing para execuções longas e é compatível com qualquer modelo que o usuário queira integrar.
Embora o Marlin em si seja código fechado, a publicação do algoritmo central permite que a comunidade de pesquisa estude e experimente com a tecnologia independentemente.