Anthropic vaza IA que pode destruir a internet por erro de configuração

A Anthropic deixou quase 3 mil arquivos internos expostos na internet por causa de um erro de configuração no sistema de gerenciamento de conteúdo, e o caso veio à tona na noite de 26 de março de 2026. Entre os documentos vazados estava o rascunho oficial do Claude Mythos, o novo modelo que a própria empresa descreve como “De longe, o modelo de IA mais poderoso que já desenvolvemos.”.
Segundo a reportagem da Fortune, que revisou o material e avisou a companhia, o draft menciona um tier interno chamado Capybara e destaca saltos grandes em raciocínio, codificação e, principalmente, cibersegurança. O texto interno alerta que o modelo está “muito à frente de qualquer outra IA em capacidades cibernéticas” e pode abrir caminho para uma onda de ataques automatizados que deixam as defesas atuais para trás.
Na prática, os benchmarks vazados mostram o Claude Mythos bem à frente do Claude Opus 4.6 nessas áreas. A Anthropic confirmou o vazamento como “human error” e disse que restringiu o acesso assim que foi notificada. A empresa já começou a testar o modelo com um pequeno grupo de clientes em early access, mas reforça que está sendo cautelosa justamente por causa dos riscos de segurança citados no próprio documento.
O episódio tem um tom irônico, A Anthropic se posiciona como uma das empresas mais focadas em segurança e alinhamento da IA, mas um erro simples de configuração expôs roadmaps, imagens e drafts inteiros. Pesquisadores de segurança da LayerX e da Universidade de Cambridge foram os primeiros a identificar o endpoint público.
A companhia deve continuar os testes controlados do Claude Mythos nas próximas semanas e definir o cronograma de lançamento comercial, com ênfase extra nos protocolos de mitigação de riscos cibernéticos que o vazamento já antecipou.
Este conteúdo foi criado e revisado por nossa equipe (iatoskill.com), se encontrar algum problema, entre em contato conosco


