アンソロピック、誤設定でインターネットを破壊する可能性のあるAIを漏洩

アンソロピックは、コンテンツ管理システム設定ミスにより、約3,000件の内部資料をインターネット上に公開しました。この事件は2026年3月26日の夜に明るみに出ました。漏洩した文書には、公式なClaude Mythosの草稿が含まれており、同社が「これまでに開発した最も強力なAIモデル」としているものです。
Fortuneが資料を確認し、会社に通知したところ、草稿にはCapybaraという内部ティアが言及されており、特にサイバーセキュリティの分野での大幅な進展が強調されていました。内部文書では、このモデルが「他のどのAIよりもサイバー能力において先を行っている」と警告しており、現行の防御を超える自動化された攻撃の波を引き起こす可能性があるとしています。
実際、漏洩したベンチマークは、Claude Mythosがこれらの分野でClaude Opus 4.6を大幅に上回っていることを示しています。アンソロピックはこの漏洩を「人為的ミス」として認め、通知を受けた時点でアクセスを制限したと述べました。同社はすでに少数の顧客と共にこのモデルの早期アクセステストを開始していますが、文書で指摘されたセキュリティリスクのため、慎重な姿勢をとっています。
このエピソードは皮肉なもので、アンソロピックはセキュリティとAIのアライメントに最も注力している企業の一つとして位置づけられていますが、単純な設定ミスで計画、画像、草稿全体が露出しました。LayerXとケンブリッジ大学のセキュリティ研究者が最初に公開エンドポイントを特定しました。
同社は今後数週間でClaude Mythosの管理されたテストを続け、サイバーリスク緩和プロトコルに特に重点を置いた商業リリース計画を策定する予定です。
このコンテンツは私たちのチーム(iatoskill.com)によって作成およびレビューされました。問題がある場合は、こちらからお問い合わせください


