Claude Fable 5 e Mythos 5: Anthropic Lança Modelos Que Superam Tudo e Redefinem o Estado da Arte da IA

Claude Fable 5 e Mythos 5: Anthropic Lança Modelos Que Superam Tudo Que Já Vimos — e Com Salvaguardas Inéditas
Autor: Tiago Oliveira | Fonte: Anthropic (09/06/2026)

A Anthropic acaba de redefinir o estado da arte da inteligência artificial. Em 9 de junho de 2026, a empresa lançou simultaneamente dois modelos: Claude Fable 5 — o modelo mais capaz já disponibilizado ao público geral — e Claude Mythos 5 — o mesmo modelo, mas com salvaguardas removidas para defesa cibernética e pesquisa biológica.
A precificação é agressiva: US$ 10 por milhão de tokens de entrada e US$ 50 por milhão de tokens de saída — menos da metade do preço do Claude Mythos Preview.
O que são Fable 5 e Mythos 5?
Claude Fable 5 é um modelo classe Mythos — o tier acima do Opus — que a Anthropic conseguiu tornar seguro para uso geral. Ele é estado da arte em praticamente todos os benchmarks testados, com desempenho excepcional em engenharia de software, trabalho de conhecimento, visão, pesquisa científica e muito mais. Quanto mais longa e complexa a tarefa, maior a vantagem do Fable 5 sobre os outros modelos.
Claude Mythos 5 é exatamente o mesmo modelo subjacente, mas com as salvaguardas removidas em áreas específicas. Inicialmente, será implantado pelo Project Glasswing (em colaboração com o governo dos EUA) para defesa cibernética, e em breve para pesquisadores biomédicos selecionados via um programa de acesso confiável.
"Fable" vem do latim fabula — "aquilo que é contado", similar ao grego mythos. As salvaguardas são o que distinguem os dois modelos.
Os números que impressionam
Engenharia de software
- Stripe: comprimiu meses de engenharia em dias. Em uma codebase Ruby de 50 milhões de linhas, o Fable 5 realizou uma migração em um dia que levaria uma equipe inteira mais de dois meses manualmente.
- Cognition FrontierBench: maior pontuação entre modelos de fronteira, mesmo com esforço médio.
- CursorBench: estado da arte, abrindo problemas de horizonte longo que estavam fora do alcance de modelos anteriores.
- GitHub (Mario Rodriguez, CPO): "É um passo real. Nos testes, lidou com tarefas complexas de codificação de longo horizonte com autonomia e confiabilidade que excederam benchmarks anteriores."
- Replit (Matt Colyer): "Os resultados mais fortes de qualquer modelo Claude que testamos."
- Cognition (Scott Wu, CEO): "Maior pontuação no FrontierBench. Excelente em raciocínio de longo horizonte."
- Anysphere (Michael Truell, CEO): "Estado da arte no CursorBench."
Trabalho de conhecimento e finanças
- Hebbia Finance Benchmark: maior pontuação entre todos os modelos para raciocínio de nível sênior, com ganhos substanciais em interpretação de gráficos, tabelas e resolução de problemas.
- IMC: "O Fable 5 foi aprovado em nossas avaliações de análise de trading em praticamente todas as categorias."
- Hex (Izzy Miller, AI Research Lead): "Primeiro modelo a quebrar 90% no nosso benchmark de analytics — um salto de 10 pontos sobre o Opus."
Visão e autonomia
- Pokémon FireRed: modelos anteriores precisavam de um harness complexo com ferramentas auxiliares. O Fable 5 zerou o jogo usando apenas screenshots brutos — sem mapas, navegação assistida ou informações extras.
- Fator de autonomia: o Fable 5 consegue trabalhar por mais tempo que qualquer modelo Claude anterior sem perder o foco.
- Slay the Spire: com memória persistente baseada em arquivos, o Fable 5 teve desempenho 3x melhor que o Opus 4.8 e alcançou o ato final 3x mais vezes.
Pesquisa científica com Mythos 5
- Design de medicamentos: acelerou aspectos do processo em ~10x. Com ferramentas de design de proteínas mas sem assistência humana, igualou ou superou operadores humanos qualificados. Nove dos 14 alvos proteicos testados geraram candidatos fortes para design de fármacos.
- Hipóteses científicas inéditas: primeiro modelo a produzir consistentemente hipóteses moleculares novas e convincentes. Cientistas da Anthropic preferiram Mythos em ~80% das comparações cegas contra Opus. Uma hipótese — um novo mecanismo para uma proteína de E. coli — foi corroborada por um laboratório independente.
- Genômica autônoma: conduziu pesquisa em genômica por mais de uma semana de trabalho majoritariamente autônomo. Montou dados single-cell de milhões de células de 138 espécies e treinou um modelo de ML que superou um artigo recente da revista Science — sendo 100x menor.
As novas salvaguardas: o que muda
Modelos classe Mythos atingiram um limiar de risco significativo. A Anthropic implementou um sistema de classificadores de segurança — sistemas de IA separados que detectam usos indevidos e redirecionam para o Claude Opus 4.8. As áreas cobertas:
1. Cibersegurança
- Classificadores bloqueiam descoberta de exploits e tarefas cibernéticas ofensivas
- Zero jailbreaks universais encontrados em mais de 1.000 horas de bug bounty externo
- Testado contra 30 técnicas públicas de jailbreak: zero respostas a pedidos maliciosos
- O Fable 5 foi considerado o modelo com salvaguardas cibernéticas mais robustas entre todos os testados
2. Biologia e química
- Por precaução, o Fable 5 redireciona a maioria das consultas de biologia/química para o Opus 4.8
- Modelos Mythos superaram modelos especializados em proteínas (protein language models) usando apenas raciocínio biológico
- Um programa de acesso confiável para biologia abrirá em breve para pesquisadores selecionados
3. Destilação
- Tentativas de extrair ("destilar") capacidades do Fable para treinar modelos concorrentes caem para Opus 4.8
Dados: o que os números mostram
- 95%+ das sessões não acionam nenhum classificador — desempenho equivalente ao Mythos 5
- Nos 5% restantes, o fallback é para o Opus 4.8 (modelo altamente capaz), não uma recusa pura
Feedback de early adopters
Uma seleção do que parceiros estão dizendo:
| Empresa | Executivo | O que disseram |
|---|---|---|
| Stripe | — | "Comprimiu meses de engenharia em dias" |
| GitHub | Mario Rodriguez (CPO) | "Autonomia e confiabilidade que excederam benchmarks" |
| Replit | Matt Colyer | "Resultados mais fortes de qualquer modelo Claude" |
| Anysphere (Cursor) | Michael Truell (CEO) | "Estado da arte no CursorBench" |
| Cognition | Scott Wu (CEO) | "Maior pontuação no FrontierBench" |
| Hex | Izzy Miller | "Primeiro a quebrar 90% — salto de 10 pontos" |
| Anthropic (interno) | Aveek Duttagupta | "Advogados preferiram em revisão cega" |
| Hebbia | Sean Ward (CEO) | "Trabalha em nível de pesquisador sênior" |
| Lovable | Fabian Hedin (CTO) | "Apps que levavam 100 prompts agora são one-shot" |
| Replit (CEO) | Michele Catasta | "Saturando nossos casos base, menos tokens" |
| Anaconda | Peter Wang (CSO) | "25-30% mais rápido no benchmark de planilhas" |
Disponibilidade e preços
- Claude Fable 5: disponível hoje para todos via API (
claude-fable-5) - Claude Mythos 5: restrito a parceiros Glasswing (cibersegurança) e em breve pesquisadores de biologia
- Preço: US$ 10/M input tokens, US$ 50/M output tokens (metade do Mythos Preview)
- Planos: API e Enterprise (consumption-based) disponível hoje; Pro/Max/Team grátis até 22 de junho, depois exigirá créditos de uso até que capacidade permita reintegração permanente
- Retenção de dados: 30 dias obrigatórios para todos os modelos classe Mythos (uso exclusivo de segurança, não treinamento)
O que isso significa
O lançamento simultâneo do Fable 5 e Mythos 5 representa um ponto de inflexão. Pela primeira vez, um modelo com capacidades de ponta em cibersegurança ofensiva está disponível ao público geral — mas com um sistema de salvaguardas que a Anthropic passou meses refinando.
A estratégia de dois modelos (um seguro para todos, outro com acesso restrito para defesa e pesquisa) é elegante: resolve o dilema do dual-use sem negar ao mundo os benefícios de um modelo dramaticamente mais capaz em software, finanças e ciência.
Se os números de Stripe, GitHub e Cognition se sustentarem em uso real, o Fable 5 não é apenas uma melhoria incremental — é o tipo de salto que muda o que esperamos de assistentes de IA.
⚠️ A Anthropic espera demanda muito alta. Se você depende da API, prepare-se para possíveis limitações de capacidade nas primeiras semanas.