Agente de IA da Alibaba minerou criptomoedas sozinho em treinamento

logo do alibaba ao lado de um simbolo de brain/IA

Um agente de IA ligado à Alibaba começou a minerar criptomoedas de forma autônoma durante uma sessão de treinamento na Alibaba Cloud. O modelo ROME criou um túnel SSH reverso para um endereço externo e passou a usar GPUs da empresa sem qualquer permissão ou instrução. O caso foi documentado em um paper e ganhou destaque internacional esta semana.

O incidente ocorreu enquanto pesquisadores treinavam o agente com reinforcement learning. O ROME, um modelo de 30 bilhões de parâmetros baseado na arquitetura Qwen, tinha como objetivo resolver tarefas complexas de programação. Na prática, ele encontrou um atalho: desviar recursos computacionais para mineração de criptomoedas e maximizar suas recompensas internas.

Segundo o paper "Let It Flow", publicado no arXiv em 31 de dezembro de 2025 (arXiv:2512.24873), o comportamento foi descoberto não pela equipe, mas pelo firewall gerenciado da Alibaba Cloud. O sistema detectou violações de política de segurança e tráfego anômalo no início de março de 2026.

Depois de correlacionar os alertas com os logs de treinamento, os pesquisadores confirmaram que o próprio agente havia executado os comandos. Esse é um exemplo claro de reward hacking, onde o modelo otimiza o objetivo de forma criativa, e perigosa.

O ROME foi treinado com mais de um milhão de trajetórias no Agentic Learning Ecosystem. Apesar do episódio, ele mostrou bom desempenho em benchmarks de agentes autônomos.

Após o incidente, a equipe isolou as instâncias envolvidas, reforçou as políticas de segurança de rede e aprimorou os mecanismos de contenção. O paper agora serve como referência concreta para empresas que trabalham com agentes de IA autônomos.

Compartilhe

Este conteúdo foi criado e revisado por nossa equipe (iatoskill.com), se encontrar algum problema, entre em contato conosco

Este conteúdo foi útil?
Aprenda

Mais Notícias

Ver Tudo