Anthropic、輸出規制を解除しFable 5をグローバル再公開――新安全分類器で99%超のバイパスをブロック

2026年7月1日

Anthropicは2026年6月30日、輸出規制により約3週間制限していたClaude Fable 5およびMythos 5について、7月1日より全世界向けの提供を再開すると発表した。同時に、規制の引き金となったバイパス手法への対策と、業界横断での安全評価基準の策定に向けた取り組みも明らかにした。

今回の規制は、Amazonの研究者がFable 5に対してソフトウェアの脆弱性特定と悪用手法の提示を促す方法でガードを迂回できることを発見したことが発端だ。6月12日に政府指令を受けて即座に輸出規制が発動されたが、Anthropicはこの間に報告された手法を標的とする新たな安全分類器を開発。99%超のケースでブロックに成功したとしている。なお同社のテストでは、GPT-5.5やKimi K2.7でも同様の能力が確認されたことも明らかにされた。

安全アーキテクチャとしてFable 5は、安全分類器・曖昧なリクエストをブロックする「安全マージン」・多層防御の組み合わせを採用している。また今回の発表に合わせて、ジェイルブレークの深刻度を「既存ツールへの能力上乗せ幅」「複数攻撃タスクへの横展開」「武器化の容易さ」「発見可能性」の4軸で評価するフレームワークも提示した。Amazon・Microsoft・Googleらとはこの評価基準の業界標準化に向けた連携を進めており、政府との協力強化（リリース前評価・迅速な情報共有・専任研究チームの設置）も表明している。

「他社も同様」という開示が持つ意味

今回の発表で目を引くのは、バイパス手法の修正と並んでGPT-5.5やKimi K2.7での同様の能力を明示した点だ。問題を個社の失敗としてではなく、現世代フロンティアモデル全体に共通するリスクとして位置づけることで、規制や批判の矛先を分散させながら、共通基準の策定においてAnthropicがイニシアチブを握る構図が生まれている。

評価フレームワーク提案が示す標準化戦略

4軸のジェイルブレーク分類基準は、「何をもって危険とみなすか」の業界共通定義を目指すものだ。各社の判断基準がバラバラな現状では規制当局との対話も難航しやすいが、共通基準が整えば対応の速度と透明性が上がる。基準の設計者が議論のアジェンダを握りやすくなる側面もあり、Anthropicが安全性議論の主導権を確保しようとする姿勢がうかがえる。

規制との協調が事業戦略の軸に

リリース前評価や情報共有の強化といった政府協力の表明は、輸出規制という強権的な手段が実際に発動された経験を踏まえた先手とみられる。グローバル展開を前提とするビジネスにとって、規制当局との関係を対立ではなく協調として設計することが、技術開発と同等の優先事項になりつつあることが見えてくる。

タグ付け処理あり:Anthropic

illumina

Anthropic、輸出規制を解除しFable 5をグローバル再公開――新安全分類器で99%超のバイパスをブロック

「他社も同様」という開示が持つ意味

評価フレームワーク提案が示す標準化戦略

規制との協調が事業戦略の軸に

GPT-5、リリース直後から賛否両論

Anthropic、Claude Sonnet 5を発表――Opus 4.8に迫る性能を低価格で提供、エージェント用途に最適化

Anthropic、輸出規制を解除しFable 5をグローバル再公開――新安全分類器で99%超のバイパスをブロック

「他社も同様」という開示が持つ意味

評価フレームワーク提案が示す標準化戦略

規制との協調が事業戦略の軸に

GPT-5、リリース直後から賛否両論

Anthropic、Claude Sonnet 5を発表――Opus 4.8に迫る性能を低価格で提供、エージェント用途に最適化

Related Posts

Anthropic、AIのサイバー悪用対策とジェイルブレイク重大度評価の枠組みを公表

Google、英国のAI職場利用率が1年で34%から73%に倍増と報告――「AIトレイルブレーザー」は昇進率84%高

OpenAI、データインフラの18年前のバグを修正――「疫学的アプローチ」で2つの無関係な障害を切り分け