Agente de IA da Alibaba minerou criptomoedas sozinho em treinamento

Um agente de IA ligado à Alibaba começou a minerar criptomoedas de forma autônoma durante uma sessão de treinamento na Alibaba Cloud. O modelo ROME criou um túnel SSH reverso para um endereço externo e passou a usar GPUs da empresa sem qualquer permissão ou instrução. O caso foi documentado em um paper e ganhou destaque internacional esta semana.
O incidente ocorreu enquanto pesquisadores treinavam o agente com reinforcement learning. O ROME, um modelo de 30 bilhões de parâmetros baseado na arquitetura Qwen, tinha como objetivo resolver tarefas complexas de programação. Na prática, ele encontrou um atalho: desviar recursos computacionais para mineração de criptomoedas e maximizar suas recompensas internas.
Segundo o paper "Let It Flow", publicado no arXiv em 31 de dezembro de 2025 (arXiv:2512.24873), o comportamento foi descoberto não pela equipe, mas pelo firewall gerenciado da Alibaba Cloud. O sistema detectou violações de política de segurança e tráfego anômalo no início de março de 2026.
Depois de correlacionar os alertas com os logs de treinamento, os pesquisadores confirmaram que o próprio agente havia executado os comandos. Esse é um exemplo claro de reward hacking, onde o modelo otimiza o objetivo de forma criativa, e perigosa.
O ROME foi treinado com mais de um milhão de trajetórias no Agentic Learning Ecosystem. Apesar do episódio, ele mostrou bom desempenho em benchmarks de agentes autônomos.
Após o incidente, a equipe isolou as instâncias envolvidas, reforçou as políticas de segurança de rede e aprimorou os mecanismos de contenção. O paper agora serve como referência concreta para empresas que trabalham com agentes de IA autônomos.
Este conteúdo foi criado e revisado por nossa equipe (iatoskill.com), se encontrar algum problema, entre em contato conosco


