Anthropicは7/1、Fable 5の機能をそのままに世界中で復旧させ、フラグが立てられたハッキングプロンプトを99%以上の試行でブロックするフィルターを追加しました。
米国商務省は6/30に緊急輸出命令を解除し、翌日、モデルはClaude Platform、Claude.ai、Claude Code、およびClaude Coworkを通じて再びユーザーに提供されました。主要なクラウドプラットフォーム経由でのアクセスも引き続き提供されます。
有料サブスクライバーは7/7まで週間の利用制限内で使用でき、その後は継続的なアクセスが従量制のクレジットシステムに移行します。
このモデルは6/12に停止していました。規制当局はすべての外国人がそれにアクセスすることを禁止し、企業に遵守のために約90分しか与えなかったため、Anthropicはリアルタイムで一人ずつ審査しようとするのではなく、すべてのユーザーからモデルを撤回しました。
この指示は、Amazonの研究者たちが、一般的なシステムにまたがるソフトウェアの脆弱性のクラスターをフラグ立てするようにモデルを誘導するプロンプトを発見したという報告に続くものでした。ある事例では、それを超えて、単一の欠陥が悪用される方法を示す動作するコードを生成しました。脆弱性のリストよりも、この単一のデモンストレーションが警鐘を鳴らしたのです。
あわせて読みたい: CrowdStrike、Claude Mythosがゼロデイの決定を加速させる可能性があると警告
政府および報告書を提出した企業と並行して実施されたAnthropic独自のレビューにより、Opus 4.8、GPT-5.5、Kimi K2.7など、はるかに弱いモデルでも同じ脆弱性を表面化できることが確認されました。チームがチェックした他のすべてのモデルは、単独のエクスプロイトデモンストレーションをまだ再現でき、Fable 5だけが唯一のサイバー武器を保持しているという主張を弱めました。同社は、この禁止措置は行き過ぎであると主張していました。
修正は限定的なものでした。復帰時、モデルは報告されたプロンプトを捕捉し、より弱いOpus 4.8にリルートする1つの分類器を搭載しており、Fable 5の機能はそのままですが、通常のコーディングで誤検知を引き起こし、介入するたびにユーザーに警告します。
ガードレールが少ない同じ基盤モデルであるMythos 5は、Project Glasswingと呼ばれるプログラム内で、審査を通過した約100の米国組織に限定されています。
同社はまた、ジェイルブレイク報告のための公開チャネルを開設しました。また、将来のフロンティアモデルを発売前にテストするため、規制当局に早期アクセスを提供することを約束しました。
Fable 5は6/9に、Anthropicの広く利用可能な初のMythosクラスモデルとして初めてリリースされ、リリース後数日で姿を消すまで、さまざまな業界ベンチマークで称賛されていました。停止期間はわずか3週間でした。その復帰により、モデルが停止している間に急速に成長する中国の研究所が静かに奪っていたベンチマークの地位を取り戻しました。
次に読む: XRP、6月の拒否が強気派に影を落とす中、再び1.07ドルをテスト

