Governo dos EUA ordena suspensão dos modelos Fable 5 e Mythos 5 da Anthropic

Em um movimento sem precedentes que promete redefinir o cenário de regulação e governança de Inteligência Artificial, o governo dos Estados Unidos emitiu uma diretiva de controle de exportação ordenando a suspensão imediata de todo o acesso aos modelos Fable 5 e Mythos 5 da Anthropic. A ordem se aplica a qualquer cidadão estrangeiro, incluindo funcionários de nacionalidade estrangeira da própria Anthropic.

Para cumprir a determinação legal, a Anthropic foi forçada a desativar abruptamente os modelos Fable 5 e Mythos 5 para todos os seus clientes globais. O acesso a todos os outros modelos da empresa permanece inalterado. A Anthropic manifestou forte desacordo com a decisão, classificando o episódio como um "mal-entendido" técnico e de comunicação.

O "Jailbreak" em Questão e o Contexto Técnico

A diretiva governamental baseia-se em uma preocupação de segurança nacional relacionada a um suposto método de burla das salvaguardas (jailbreak) do modelo Fable 5. No entanto, segundo a Anthropic, as evidências fornecidas pelo governo foram apenas verbais e descreviam um método de "jailbreak estreito e não universal".

O teste em questão envolvia pedir ao modelo para ler uma base de código específica e corrigir falhas de software. A Anthropic analisou a demonstração e constatou que:
* A técnica apenas identificava um pequeno número de vulnerabilidades menores previamente conhecidas.
* Essas falhas são simples o suficiente para que outros modelos disponíveis publicamente — incluindo o GPT-5.5 da OpenAI — consigam descobri-las sem a necessidade de qualquer tipo de burlas ou contorno de segurança.
* As capacidades demonstradas são amplamente utilizadas no dia a dia por defensores de segurança cibernética para proteger sistemas contra ataques.
* Não foi apresentada nenhuma evidência ou relatório de um jailbreak não universal que tenha resultado em danos reais.

A Postura da Anthropic: "Defesa em Profundidade"

A Anthropic defendeu veementemente sua arquitetura de segurança para a linha Fable 5, destacando que os modelos passaram por milhares de horas de testes de segurança (red-teaming) antes do lançamento. Estes testes contaram com a participação do governo dos EUA, do Instituto de Segurança de IA do Reino Unido (AISI), equipes internas e organizações parceiras privadas de terceiros.

A empresa destacou pontos cruciais sobre a realidade atual da segurança em IA:
1. Resistência Perfeita é Impossível: Atualmente, não é tecnicamente viável para nenhum provedor criar um modelo totalmente imune a jailbreaks estreitos e específicos.
2. Abordagem de Defesa em Profundidade: Como a imunidade total é impossível, os modelos são projetados para tornar os jailbreaks altamente específicos ou proibitivamente caros para produzir, combinando isso com monitoramento rigoroso em tempo real.
3. Retenção de Dados por 30 Dias: Para rastrear e mitigar essas tentativas, a Anthropic mantém uma política rigorosa de retenção de dados de clientes por 30 dias para a linha Fable, apesar das fricções comerciais que isso gera.

"Discordamos que a descoberta de um jailbreak estreito e potencial deva ser motivo para recolher um modelo comercial implantado para centenas de milhões de pessoas. Se esse padrão fosse aplicado a todo o setor, acreditamos que ele interromperia essencialmente todas as novas implantações de modelos para todos os provedores de modelos de fronteira."

Próximos Passos e Impacto no Setor

A Anthropic está cumprindo integralmente a ordem legal enquanto trabalha ativamente junto aos órgãos governamentais para demonstrar a segurança de seus sistemas e restabelecer o acesso aos modelos Fable 5 e Mythos 5. A empresa se comprometeu a divulgar mais detalhes técnicos sobre o caso nas próximas 24 horas.

Este caso acende um alerta vermelho para toda a indústria de IA de fronteira, demonstrando que as agências de segurança nacional dos EUA estão dispostas a usar mecanismos de controle de exportação e segurança para intervir diretamente na operação de modelos comerciais ao menor sinal de risco.