kbits

AIが自らを構築するとき

原題: When AI builds itself
著者: Marina Favaro、Jack Clark（Anthropic Institute）
公開日: 2026年6月
ソースURL: https://www.anthropic.com/institute/recursive-self-improvement
アーカイブ日: 2026-06-11

要約

Anthropic Instituteによる本記事は、AI開発サイクルの各段階をAIシステム自身に委譲する動きがどの程度進んでいるかを、公開ベンチマークと社内データの両面から報告する。主題は「再帰的自己改善（recursive self-improvement）」——AIが自らの後継を完全自律で設計・開発できる状態——であり、そこに至るまでの現状と、それが実現した場合の3つの未来シナリオを提示する。

外部から見える証拠： METRの測定によると、AIが自律完了できるタスクの長さは約4ヶ月ごとに倍増している。2024年3月のClaude Opus 3が4分タスク、2025年3月のSonnet 3.7が約90分、2026年3月のOpus 4.6が12時間タスクをこなす。この傾向が続けば、2026年中に「熟練者が数日かかるタスク」がAIの射程に入り、2027年には「数週間かかるタスク」に達する可能性がある。SWE-bench（実コードベースのバグ修正ベンチマーク）ではモデルが低単位数％から2年で飽和点に達し、CORE-Bench（研究再現性ベンチマーク）でも2024年の20％成功率から15ヶ月で飽和している。

Anthropic内部の証拠： 2026年5月時点で、Anthropicのコードベースにマージされるコードの80％以上がClaudeによって書かれている。エンジニア1人あたりの1日あたりのマージ行数は2024年まで4年間横ばいだったが、Claudeがコードを提案するだけでなく実行するようになった2025年に急上昇し、2026年第2四半期には2024年比で8倍に達した。これは「Claudeがコードを書き、人間が指示とレビューをする」という役割分担の変化による。コードの質についても、2025年後半には人間に劣ると評価されていたClaudeのコードは、現在ほぼ同等と見なされ、年内に人間を上回ると予測されている。

Claudeは研究実験の実行にも使われている。あるチューニングタスクでは、2025年5月のOpus 4がベースコード比3倍の高速化を達成したのに対し、2026年4月のMythos Previewは52倍を記録した。熟練研究者が同じタスクで4倍を達成するのに4〜8時間かかることを考えると、この1年での進歩は drastic である。さらに、Claudeが研究の方向性を自ら提案する能力も向上している。人間が脱線した129のセッションにおいて、「正しい次の一手」を選ぶ割合は、2025年11月のOpus 4.5が51％だったのに対し、2026年4月のMythos Previewは64％に上昇している。

人間の役割は縮小している。 コード記述はAIに委ねられ、人間のレビューがボトルネックになりつつある。実験の実行コストは人間の時間ではなく計算資源だけになった。現時点で人間の比較優位が残っているのは、「どの問題に取り組むべきか」という研究の方向性判断（research taste and judgment）のみだ。しかし、この能力もAIが改善しつつある——限定された状況ではあるが、Claudeが自ら実験を設計して安全研究を進めたデモンストレーションが既に報告されている。

3つの未来シナリオ：

トレンドが停滞する世界：指数関数的改善がS字カーブの天井に達する可能性。しかし、著者らはこのシナリオを「likely」と見なしていない。
効率改善が継続的に積み重なる世界：AI開発の大部分が自動化されるが、人間が研究の方向性を設定し続ける。100人の企業が10,000人〜100,000人規模の仕事をこなすようになる。著者らは「このシナリオに我々は向かいつつある」と評価する。
完全な再帰的自己改良が実現する世界：AIが自らの設計と改良を全て自律で行う。進歩のペースは計算資源の可用性だけで決まる。アライメント問題の解決の仕方次第で、人類にとって計り知れない利益か、制御不能なリスクか——どちらもあり得る。

著者らは、技術の一時的な減速や一時停止を可能にする検証メカニズム（軍縮条約のような仕組み）を構築すべきだと提言する。ただし、AI訓練の検知は核ミサイルサイロより遙かに困難であり、トラストとインフラの構築には通常数十年かかる。一方的な一時停止は実行可能だが効果は限定的だ。Anthropic Instituteは今後、政策立案者・研究者・市民社会・他AI企業を交えた議論を組織すると結ばれている。

論評

本記事は、Anthropicというフロンティアラボの内部から「AIがAIを開発する」というループの実態を、これまでにない詳細さで公開した点で極めて重要な一次資料である。公開ベンチマークに加え、社内のコードマージ率、従業員アンケート、成功率推移、実験高速化率——いずれも外部では得られないデータであり、2025〜2026年というAI開発史の転換期を記録するものとして、長期にわたって参照されるだろう。

特に興味深いのは、8xのコード生産性向上が「品質より量」の誇張であると自ら留保しつつ、それでも「コード記述のコストが人間の時間から計算資源に転嫁された」という構造変化が不可逆であることを示した点だ。「人間がコードを書かなくなる」のではなく、「人間がコードを書く必要がなくなる」——エンジニアの仕事が実装から意図の指示とレビューへ移行するという、多くのソフトウェア開発者が実感しつつも定量化できなかった変化の証拠を、この記事は提供している。

3つのシナリオ分類は「まだ楽観の余地がある」と「既に手遅れかもしれない」の間で、慎重にバランスを取っている。著者らがシナリオ2（継続的な効率改善）を「likely」と評価しながら、同時にAmdahlの法則——高速化した部分の先に別のボトルネックが現れる——を繰り返し強調しているのは示唆的だ。AI開発が加速すればするほど、人間のレビュー、方向性判断、組織の暗黙知の外在化が新たな制約となる。これらの「人間にしかできない仕事」が本当に人間だけにしかできないのか、それとも時間の問題なのかが、次の1〜2年の焦点になるだろう。

本記事では触れられていないが、このデータが示唆する帰結は個人のソフトウェア開発者にとっても深刻だ。「コードを書く能力」の市場価値は、まさに今、急激に低下しつつある。8xの生産性向上が「少人数でより多くを生み出せる」という意味なら、チームの人数は縮小する方向に働く。エンジニアに残された価値は、問題の設定、トレードオフの判断、そしてAIの出力を検証できる深いドメイン知識——いずれも「経験」と「文脈理解」に依存するスキルであり、ジュニア層にとって厳しい環境が予想される。

比較: pro版 · opus版