kbits

AIがAIを開発する時代——再帰的自己改善はどこまで来たか

原題: When AI Builds Itself: Measuring Recursive Self-Improvement 著者: Marina Favaro, Jack Clark（Anthropic Institute） 公開日: 2026年6月 ソースURL: https://www.anthropic.com/institute/recursive-self-improvement アーカイブ日: 2026-06-11

要約

AIの歴史の大部分において、開発サイクルのすべての段階を人間が駆動してきた。しかしAnthropicでは、AI開発の作業そのものをAIシステムに委譲する割合が急速に拡大しており、開発速度が劇的に向上している。この傾向を突き詰めていけば、AIが完全に自律的に自らの後継を設計・開発する「再帰的自己改善（recursive self-improvement）」に到達する。Anthropic Instituteは、公開ベンチマークと社内の未公開データを用いて、AIがすでにAI開発を加速させている現実を示す。

AI開発ループの進化

Anthropic社内のAI開発のあり方は4段階で変貌してきた。2021〜2023年は人間がラップトップでコードとドキュメントを書く従来型開発だった。2023〜2025年にはチャットボットがコードスニペットを手伝う段階に入り、2025〜2026年にはコーディングエージェントが自律的にコードを書くようになった。そして現在（2026年）は、エージェントがコードを実行し、さらに他のエージェントに作業を委譲する自律型エージェントの段階にある。この先には、エージェントが自らモデルを構築・訓練する「ループの完結」が想定されている。

外部から見える証拠

AIの自律作業時間は急激に伸びている。タスク持続能力の倍増期間は従来7ヶ月だったのが4ヶ月に加速した。Claude Opus 3（2024年3月）は4分のタスクだったが、Sonnet 3.7で1.5時間、Opus 4.6では12時間のタスクをこなせるようになり、2027年には人間が数週間かけるタスクを処理できると予測されている。ベンチマークの飽和も急速だ。SWE-benchは2年で一桁台から100%に達し、CORE-Benchは15ヶ月で約20%から100%になった。METRの評価では、Claude Mythos Previewが16時間以上自律的に稼働している。

Anthropic社内の証拠

より衝撃的なのは社内データである。2026年5月時点で、Anthropicのコードの80%以上がClaudeによって生成されている（2025年2月以前は一桁台だった）。エンジニア一人あたりの四半期出力量は、2021〜2025年の平均と比較して2026年第2四半期には8倍に達した。社内調査の中央値でも、AI支援による生産性向上は約4倍と報告されている。Claudeは800以上の修正を自律的に出荷し、APIエラーを1000分の1に低減した——人間の見積もりでは同作業に4年を要するとされていたものである。

オープンエンド型タスクの成功率は2026年5月時点で76%、6ヶ月で50ポイント上昇した。コード品質は2025年後半には人間に劣っていたが、現在は同等であり、1年以内に人間を上回ると見込まれている。自動レビューはバグの約3分の1を検出できる。訓練の高速化は、Opus 4（2025年5月）の約3倍から、Mythos Preview（2026年4月）では約52倍に跳ね上がった。エンドツーエンドの研究では、AIは人間研究者の23%のギャップ回復率に対し97%を達成し、研究判断力でも2025年11月の51%から2026年4月の64%に向上して人間の選択を上回った。

三つの未来シナリオ

論文は3つのシナリオを提示する。第一はS字カーブで改善が停滞するケースだが、現在のデータはこれを支持しない。第二は複利的效果の連鎖で、Amdahlの法則に従いボトルネックが逐次的に移動しながら加速が続くシナリオ——これが最も蓋然性が高いとされる。第三は完全な再帰的自己改善で、AIが自律的に後継を設計する段階である。

現場の声

論文はAnthropic社員の生の声も引用している。「約1年前からClaudify（Claude化）に本格的に傾倒し始めた。クレイジーな冒険で、もう5ヶ月ほど自分ではコードを一行も書いていない」「現時点での人間の比較優位は、依然として全体像を見ることにある」「すべてがうまく動いている日は、自分が何をやっても意味がないのではないかと思わずにはいられない」——これらの証言は、AIが補助ツールから開発の主体へと重心を移しつつある現場の実感を伝える。

論評

本論文の価値は、再帰的自己改善という概念を抽象的な未来予測から測定可能な現在進行形の現象へと引き下ろした点にある。80%以上のコードがAI生成であるという数字や、訓練高速化が3倍から52倍へと1年で跳ね上がったデータは、単なる漸進的改善ではなく局面の変化を示している。特に重要なのは、この分析が「AI企業自身の内部データ」に基づいている点だ。Anthropicは自社の開発プロセスがAIによってどの程度変容したかを測定できる唯一の立場にあり、そのデータを公開したことで、AIの自己加速的な性質に関する議論に初めて実証的な基盤が与えられた。

第二に、論文が「複利的效果の連鎖」を最も現実的なシナリオと位置づけた判断はバランスが取れている。S字カーブ停滞を退けつつ、完全な再帰的自己改善を必然とも言い切らない——この抑制の効いた見立ては、ともすればセンセーショナルになりがちなテーマにおいて信頼性を高めている。Amdahlの法則を持ち出した分析は、ボトルネックが逐次的に移動するという技術的洞察であり、AI能力の外挿にありがちな単純な指数曲線信仰への重要な修正でもある。

もっとも、本論文に欠けているのは質の評価軸である。コードの80%がAI生成という数字は壮観だが、そのコードの保守性・可読性・セキュリティ特性は十分に評価されていない。論文自身が「コード品質は現在人間と同等、数年以内に上回る」と述べる一方で、具体的な品質メトリクスは示されていない。また「すべてがうまく動いている日は自分に意味がないと感じる」という現場の声は、AI時代の開発者のアイデンティティとメンタルヘルスという、技術指標では測れない課題の存在を示唆している。再帰的自己改善が「if」から「when」へと変わりつつある今、問われるべきは速度と品質のバランスであり、人間とAIの協調の新しいかたちであろう。