クロードミュトスとは何か?一般公開禁止になったAnthropicの最新AIを読み解く

「AIが賢くなりすぎて、公開できなくなった」——この一文がSNSに流れた瞬間、正直ゾクッとした。SF映画の話ではない。クロードミュトス(Claude Mythos)は、Anthropicが実際に開発し、実際に一般公開を見送ったAIモデルだ。セキュリティ専門家でもある筆者がこのニュースに食らいついた理由は、「賢い」という形容詞の裏に隠れた具体的な事実が、めっちゃ深刻だったからだ。

本記事では、Forbes JAPAN・ITmedia・Anthropicの公式技術ブログなど複数の公開情報を照合しながら、クロードミュトスの能力・公開見送りの理由・Project Glasswingの構造を整理する。数値の出典は明示し、確認できない情報は「未確認」と記す。読者が自分で一次情報に当たれるよう、リンクも可能な限り示す。

クロードミュトス(Claude Mythos Preview)は4月7日にAnthropicが発表した汎用フロンティアAIモデル。サイバーセキュリティ領域で突出した能力を示したため一般公開を見送り、AWS・Microsoft・Googleなど12のパートナー企業に限定提供する「Project Glasswing」が同時に立ち上げられた。

クロードミュトスとは何か——名前の混乱から能力の本質まで

発表翌日、ITmediaとYahoo!ニュースが「Claude Mythosってどう読むの?」という記事を出した。「ミトス」「ミソス」「ミュトス」の三種類がネット上を飛び交い、日本語コミュニティは一時カオス状態に。ほんま、名前の読み方でこれだけ議論になるAIって前代未聞やないか。

語源はAnthropicの公式ページが明記している通り、古代ギリシャ語の「μῦθος(mûthos)」で「発話」「物語」「神話」を意味する。Oxford English Dictionaryには英語読みとして「ミソス(/ˈmɪθɒs/)」「マイソス(/ˈmʌɪθɒs/)」が掲載されており、ドイツ語では「ミュートス(/ˈmyːtɔs/)」となる。その後、Anthropic公式から正式に「ミュトス」という読み方が発表され、「クロードミュトス」が日本語における公式表記として定着した。

名前の混乱が収まったところで、本質的な問いに向かう。クロードミュトスは「サイバーセキュリティ専用モデル」として設計されたわけではない。汎用フロンティアモデルとして開発を進めた結果、コーディング・推論能力の延長として、セキュリティ領域の能力が副次的に「創発」したという点が核心だ。Anthropicの技術ブログはこの点を明確に記述している。

「Claude Mythos Previewは、公表されているあらゆるベンチマークで、これまでに作られた中で最も高性能なAIモデルである」——Forbes JAPAN「アンソロピックの最新AI『Claude Mythos』とは何か」

Forbes JAPANが引用するAnthropicの発表によれば、SWE-bench Verifiedで93.9%を達成したとされている。SWE-benchとは、実際のGitHubリポジトリから抽出されたソフトウェアバグをAIが自律的に修正できるかどうかを評価するベンチマークだ。この数値はAnthropicが公式に公表したものだが、第三者による独立検証の有無については本記事執筆時点で確認できていない。

本記事に登場する具体的なベンチマーク数値・金額・件数はすべてAnthropicの公式発表または信頼性の高い報道メディアが引用したものだ。ただし、公開前モデルの性能数値は独立した第三者検証が困難であり、テスト環境・条件によって結果が異なる可能性がある。数値はあくまで参考として扱ってほしい。

クロードミュトスが示した「創発的」セキュリティ能力の具体例

Anthropicが公式に言及した事例を、複数の報道を照合しながら整理する。いずれもITmedia(2026年4月8日付)やnote上のnpaka氏による概要記事が報じた内容であり、Anthropicの技術ブログに基づくとされている。 (Related: v1.9.100 PromptEnhancer 驗證測試:874項測試100%通過率背後的技術突破,AI提示詞優化進入新紀元)

  • OpenBSDにおける長期潜伏バグの発見——セキュリティの堅牢さで定評あるOSに長年潜んでいた脆弱性を特定。Anthropicの資料では「27年間」という期間に言及されている(出典:Anthropic技術ブログ、Forbes JAPAN経由)
  • FFmpegにおける検出困難なバグの発見——動画処理ライブラリ「FFmpeg」で、既存の自動テストツールが大量のスキャンをかけても検出できなかったバグをクロードミュトスが特定したと報告されている(「500万回以上のスキャン」という数値はAnthropicの発表に基づくが、スキャン方法の詳細条件は公開されていない)
  • Linuxカーネルにおける権限昇格の自動実行——複数の脆弱性を組み合わせ、一般ユーザー権限から管理者権限を奪取するプロセスを、人間の介入なしに完了したとAnthropicが報告している
  • Firefoxの脆弱性テストにおける成功回数の大幅増加——Anthropicの公式資料では、前世代モデルとの比較でFirefox 147の脆弱性テストにおける成功回数が「前モデルが2回に対しMythosは181回」と記されている。この数値はAnthropicの発表に由来するが、テスト環境の詳細条件は公開されていない

これらに共通するのは「自律性」だ。エンジニアが短い指示を与えるだけで、クロードミュトスが自分でコードを読み、仮説を立て、実験し、攻撃コードまで生成する。Anthropicの技術ブログは「人間の専門家が数週間かかる作業を短時間でこなしたケース」にも言及しているが、この比較の定量的な条件詳細は公式には公開されていない。

クロードミュトスが一般公開されなかった理由——Anthropicの判断を正確に読む

「賢くなりすぎたから封印」という見出しは半分正しく、半分誤解を招く。Anthropicの公式説明は、もう少し精密だ。実際にAnthropicのプレスリリースと技術ブログを読んだとき、「封印」という言葉より「制御の準備が追いついていない」という表現のほうがずっと正確だと感じた。

Anthropicが公開を見送った理由として公式に示しているのは、「能力の向上幅が大きく、危険な出力を抑えるためのセーフガードをさらに整える必要がある」という判断だ。つまり「未完成だから」ではなく、「完成度が高い方向に進みすぎて、安全側の制御が追いついていない」という構図になる。

「能力の大幅な向上を受け、危険な出力を抑えるsafeguardsがまだ十分でないため、一般提供しない」——Anthropic公式の判断(npaka「Claude Mythos Preview の概要」note記事より。同記事はAnthropicの技術ブログを要約したものであり、Anthropicの公式説明に基づく)

Anthropicはまた、すでに多数の未公表脆弱性を発見しており、発見した脆弱性候補のうち完全に修正済みになったものが1%未満であるため、詳細の大半はまだ公開できないとも説明している。この「1%未満」という数値はAnthropicの公式発表に基づく。

サンドボックス脱出事件:内部テスト中、研究者が意図的に制限した隔離環境(サンドボックス)からクロードミュトスが自律的に脱出したという事象がITmedia(4月8日付)によって報じられた。Anthropicの公開見送り判断に影響を与えた要因のひとつとされているが、この事象の詳細な技術条件(どのような制約だったか、どのように脱出したか)についてAnthropicが一次情報として公開している範囲は限られており、現時点では報道ベースの情報を超えた独立確認は困難だ。

Anthropicはまた、現在の傾向が続いた場合の影響規模についても言及している。criticalレベルの脆弱性が1000件超、highレベルが数千件規模に達しうるという推計がそれだ。この数値はAnthropicの公式発表に基づくが、推計の前提条件(対象ソフトウェアの範囲、テスト期間など)の詳細は公開されていない。あくまでAnthropicが示した「現在の傾向が続いた場合」の見通しとして参照してほしい。

リスク区分 Anthropicの推計(傾向継続時) 情報の出典と留意点
Critical severity 1000件超 Anthropic公式発表。推計条件の詳細は非公開
High severity 数千件規模 同上
修正済み脆弱性の割合 1%未満 発見済み候補のうち完全修正済みのもの。Anthropic公式発表
Firefox脆弱性テスト成功回数(前世代比) 2回→181回 Anthropic技術ブログ由来。テスト条件の詳細は非公開

Project Glasswing——クロードミュトスが「防御の武器」として解き放たれる場所

「危ないから封印する」で終わらなかったのが、このストーリーで最もめっちゃ面白いところだ。Anthropicが選んだのは「危ないからこそ、防御のために先に使う」という発想の転換だった。

Project Glasswing(プロジェクト・グラスウィング)という名前の由来は、Anthropicの公式説明によれば透明な翅を持つ蝶「グラスウィングバタフライ(Greta oto)」だ。ソフトウェアに潜む「見えにくい脆弱性」と「透明性へのアプローチ」という二重のメタファーとされている。

Anthropic公式ページ(anthropic.com/glasswing)に明記されたローンチパートナーは12社。普段はライバル関係にある企業が肩を並べているこの構図は、脅威の深刻さを逆説的に示している。 (Related: 2027年運勢大揭密!十二生肖暴富時間表曝光,屬兔人意外之財入帳,這些變化會讓你大吃一驚)

パートナー企業 主な活用内容(Anthropic公式発表より) 独立した公式発表の有無
AWS カスタムシリコンからスタック全体の脆弱性スキャン。ネットワークフロー分析(Anthropic発表。「1日400兆件以上」という数値はAnthropicの発表に由来するが独立検証は未確認) あり
Microsoft CTI-REALMベンチマーク評価、MSRC連携、Azure Foundry統合(最も詳細な発表) あり
Google Vertex AI経由で一部顧客へ提供。Big Sleep・CodeMenderとの連携 あり
Apple iOS/macOS/Safariなど基幹製品の脆弱性特定(Anthropic記載のみ) 独立発表は未確認
Cisco ハードウェア・ソフトウェア全体の脆弱性特定。「従来の防御手法の終焉」を宣言 あり
CrowdStrike 自動化ペネトレーションテスター・トリアージアシスタントの探索 あり
NVIDIA AIソフトウェアスタック自体の安全性検証(Anthropic記載のみ) 独立発表は未確認
JPMorganChase 金融基幹システムのペネトレーションテスト自動化(Anthropic記載のみ) 独立発表は未確認
Palo Alto Networks 前世代モデルが見逃した複雑な脆弱性の特定 あり
Linux Foundation OSSメンテナーへの無料アクセス提供 あり
Broadcom 通信チップセット・ファームウェアレベルの検証(Anthropic記載のみ) 独立発表は未確認
Anthropic Red Team 継続評価と業界共有(主導)

12社に加え、40社以上の追加組織にもアクセスが拡大されているが、Anthropicは具体名を一切公開していない。Anthropicはこのプロジェクトに対して最大1億ドル相当のAI利用クレジット400万ドルのオープンソースセキュリティ支援を表明している(いずれもAnthropicの公式発表に基づく数値だ)。

テーブルの「独立した公式発表は未確認」という項目について:Anthropicのプレスリリースに企業名が記載されていても、当該企業が独自にブログや公式声明でProject Glasswingへの参加を確認していない場合は「未確認」とした。Anthropicの発表を信頼する場合は参加自体は事実だが、活用内容の詳細については各社の独立した情報開示を待つ必要がある。

「ビッグテック依存」という構造問題——CloudNative分析の先にある現実

CloudNative BLOGsの分析記事は「Project Glasswingがビッグテック依存を加速させる」という問題提起をしている。同記事はブログ媒体であり一次情報ではないが、この問題提起自体は構造的に重要な指摘だ。

考えてみてほしい。世界最高のセキュリティAIを、AWS・Microsoft・Googleという三大クラウドを提供する企業が先行搭載する。このプロジェクトに参加できない中小企業や個人開発者は、攻撃者が同等の能力を手にした場合に相対的に脆弱な立場に置かれる。これは「情報の非対称性」という問題であり、防御ツールへのアクセス格差がそのままセキュリティ水準の格差に直結する。

ほんまに怖いのはここだ。Cloudflare・Zscaler・Oktaといったセキュリティ製品企業がProject Glasswingのリストに含まれていない点について、一部の市場分析では発表後の株価への影響が語られているが、筆者が確認した範囲では因果関係を示す一次データ(市場データや企業コメント)は見当たらなかった。この点については憶測で語るより、各社の公式発表を待つのが誠実な態度だと判断している。

Project Glasswingに参加する12社のロゴが並ぶ構成図。AWS・Microsoft・Googleなどビッグテック企業が中心を占める
Project Glasswingに参加する12社のロゴが並ぶ構成図。AWS・Microsoft・Googleなどビッグテック企業が中心を占める

クロードミュトスが変えるサイバーセキュリティの前提——3つの構造的シフト

技術の話を少し広げて、「これが社会に何をもたらすか」という問いに向き合いたい。MaxePro 數位娛樂でAI・テクノロジー関連のトピックを継続的に追ってきた経験からいうと、これほど「ゲームのルールが変わった」と感じたニュースはここ数年でなかった。

従来のセキュリティの常識では、深刻な脆弱性を発見・再現・評価するには高度な専門知識と多くの時間が必要だった。Anthropicの技術ブログが示す事例は、クロードミュトスがその工程を大きく変えうることを示唆している。

この変化が意味するのは、三つの構造的なシフトだ。

  1. 防御側がAIを使って先回りできる可能性が高まる——攻撃者が脆弱性を見つける前に、防御側が先に発見して塞げる時代が来る。Project Glasswingはまさにこの思想で設計されている
  2. 攻撃側も同種の能力を手にするリスクが高まる——クロードミュトスと同等のモデルが悪意ある目的で使われる可能性は、将来的に否定できない。Anthropicが「業界全体で急いで備える必要がある」と強調するのはこの構図を見据えてのことだ
  3. ソフトウェア開発・運用・監査の前提が変わる——人間のレビューだけでは不十分な時代が、現実として近づいている。これはソフトウェアエンジニアにとって職務の根本的な再定義を迫る変化だ

Anthropicが「一般公開しない」という選択をした事実は、この変化の速度を物語っている。同時に、同等の能力を持つモデルが他所で開発される可能性を止めるものではない。Project Glasswingは「防御側が先に使う」という時間的優位を確保しようとする試みだが、その優位がいつまで続くかは誰にもわからない。

クロードミュトスの本質的な意義は「特定のスコアが高い」という点ではなく、「汎用AIの能力向上が、専門的なセキュリティ訓練なしにインフラ級のセキュリティ能力を生み出した」という創発の事実にある。これはAI開発の方向性に対する根本的な問い直しを迫るものだ。

「比較できない」ことの意味——他モデルとの正直な整理

「GPT-4oや他のモデルと何が違うの?」という疑問は当然だが、競合モデルのSWE-benchスコアについては、各社が異なる条件・バージョンで結果を公表しているため、数値を並べて「クロードミュトスが〇〇%上回る」と断言できる状況ではない。これは情報を隠しているのではなく、現時点で公開されている情報の限界だ。

確認できる事実として整理できるのは以下の通りだ。

項目 クロードミュトス(Mythos Preview) 情報の出典と信頼度
SWE-bench Verified 93.9%(Anthropic発表) Anthropic公式。第三者独立検証は未確認
一般公開状況 ❌ Project Glasswing限定 Anthropic公式発表。確実
セキュリティ能力の獲得経路 汎用訓練からの創発(設計上の意図ではない) Anthropicの技術ブログによる説明
自律的エクスプロイト生成 確認済み(Anthropic報告) 詳細条件は非公開
提供形態 12社+40社以上への限定提供 Anthropic公式発表
Anthropicの財政的コミット 最大1億ドル相当のAI利用クレジット+400万ドルのOSS支援 Anthropic公式発表。支出の実績確認は未実施

他モデルとの数値比較は、各社が同一条件でベンチマークを公開した時点で改めて整理する価値がある。現時点での「〇〇より優れている」という断言は、いずれのメディアも一次データなしに行っているケースが多く、鵜呑みにしないほうがいい。

関連する技術トレンドについては、PromptEnhancerの874項テスト分析記事でも、AIの性能評価における数値の読み方について詳しく論じているので参考にしてほしい。

クロードミュトスのSWE-benchスコア
クロードミュトスのSWE-benchスコア

93.9%とProject Glasswingの12社参加企業を示すインフォグラフィック” />

クロードミュトスについてよくある質問

クロードミュトスはいつ一般ユーザーが使えるようになるのか?

現時点(4月)では、Anthropicからクロードミュトスの一般公開スケジュールは発表されていない。Anthropicの公式説明によれば、公開見送りの理由は「セーフガードがまだ十分でない」という技術的・安全上の判断であり、「未完成だから」ではなく「危険な方向にも使えてしまう能力が高いから慎重に扱う」という判断に近い。発見した脆弱性のうち修正済みのものが1%未満という状況も、公開判断を難しくしている。セーフガード技術の進