kbits

AIが自分自身を作るとき——再帰的自己改善を測る

原題: When AI Builds Itself: Measuring Recursive Self-Improvement 著者: Marina Favaro, Jack Clark（Anthropic Institute） 公開日: 2026年6月 ソースURL: https://www.anthropic.com/institute/recursive-self-improvement アーカイブ日: 2026-06-11

要約

AIの歴史のほとんどにおいて、開発のあらゆる段階——コードを書き、ドキュメントを書き、実験を回し、次のモデルを設計する——は人間が担ってきた。だが、その前提が崩れつつある。Anthropic Instituteのこの記事は、AI開発の作業そのものを人間からAIへと委譲する流れが、自社の内部でどこまで進んだかを、公開ベンチマークと未公開の社内データの両面から測定した報告である。論点は明快だ。再帰的自己改善（recursive self-improvement）は、もはや遠い未来の思考実験ではなく、すでに進行中の測定可能な現象である。

開発ループはどう変わってきたか

著者らは、AnthropicにおけるAI開発の様式が四つの段階を経てきたと整理する。第一段階（2021〜2023年）は、人間がラップトップに向かってコードとドキュメントを手で書く従来型の開発だった。第二段階（2023〜2025年）では、チャットボットがコードスニペットの作成を手伝うようになった。第三段階（2025〜2026年）では、コーディングエージェントが自律的にコードを書くようになる。そして現在の第四段階では、エージェントがコードを書くだけでなく、それを実行し、さらに別のエージェントへと作業を委譲する。この先に想定されているのが、エージェント自身がモデルを設計・訓練して「ループを閉じる」段階である。

重要なのは、この移行が連続的なグラデーションだという点だ。人間が主体だった作業の比率が段階ごとに下がり、AIが担う比率が上がっていく。再帰的自己改善とは、ある日突然訪れる断絶ではなく、この比率が100%に近づいていく過程として理解されている。

外から見える証拠——自律タスクの伸び

まず公開データから。AIが人間の介入なしに自律的に作業を継続できる時間が、急速に伸びている。タスク持続能力が倍増するのにかかる期間は、かつての7ヶ月から4ヶ月へと短縮された。具体的には、Claude Opus 3が扱えたのは約4分のタスクだったが、Sonnet 3.7では1.5時間、Opus 4.6では12時間にまで伸びた。この外挿が続けば、2027年には人間が数週間かけて取り組むようなタスクをAIが一気通貫でこなすことになる。

ベンチマークの飽和速度も傍証となる。ソフトウェアエンジニアリングのSWE-benchは約2年で一桁台のスコアから100%に到達し、計算再現性を問うCORE-Benchに至っては15ヶ月で飽和した。ベンチマークが作られてから飽和するまでの期間が、年々短くなっている。METRによる評価では、Claude Mythos Previewが16時間以上にわたって自律稼働したという。

中から見える証拠——社内データ

より直接的で、より衝撃的なのが社内データだ。2026年5月時点で、Anthropicが書くコードの80%以上がClaudeによって生成されている。2025年2月以前はこの比率が一桁台だったことを思えば、わずか1年余りでの逆転である。エンジニア一人あたりの四半期コード出荷量は、2021〜2025年の平均と比べて2026年第2四半期には8倍に達した。社員への内部調査でも、AI支援による生産性向上は中央値で約4倍と報告されている。

象徴的な事例も挙げられている。Claudeは800以上の修正を自律的に出荷し、あるAPIのエラー率を1000分の1にまで低減した。人間が同じ作業を手でやれば4年かかると見積もられていた仕事である。オープンエンドなタスク（明確な正解が用意されていない課題）の成功率は、6ヶ月で50ポイント上昇して2026年5月には76%に達した。コードの品質は、2025年後半時点ではまだ人間に劣っていたが、現在は人間と同等の水準にあり、1年以内に人間を上回ると見込まれている。自動レビューはすでにバグの約3分の1を検出できる。

研究開発そのものの加速も測られている。モデル訓練の高速化は、Opus 4（2025年5月）の時点で約3倍だったものが、Mythos Preview（2026年4月）では約52倍へと跳ね上がった。エンドツーエンドの研究タスクでは、AIは人間研究者の23%というギャップ回復率に対して97%を達成した。さらに、どの研究方針を選ぶべきかという「研究判断力」においても、2025年11月の51%から2026年4月には64%へと向上し、人間の判断を上回るようになっている。

三つの未来

これらのデータを踏まえ、著者らは今後の展開を三つのシナリオに整理する。第一は、改善がS字カーブを描いて停滞するシナリオ。だが現在のデータはこれを支持していない。第二は、複利的な効果が連鎖するシナリオである。ここではAmdahlの法則が引かれる——全体の加速はその時々の最大のボトルネックに律速されるため、ボトルネックが一つ解消されると次のボトルネックへと制約が移動し、その繰り返しの中で加速が続く。著者らはこれを最も蓋然性の高い見立てとする。第三は、AIが自律的に自らの後継を設計する完全な再帰的自己改善のシナリオである。

現場の声

記事は、Anthropic社員の率直な証言も引いている。「約1年前からClaudify（自分の仕事をClaude化すること）に本腰を入れ始めた。これはクレイジーな冒険で、もう5ヶ月ほど自分の手では一行もコードを書いていない」。「いまの段階で人間が依然として優位なのは、全体像を見ること、大きな絵を描くことだ」。そして——「すべてがうまく回っている日には、自分が何をしようとしまいと、もう関係ないんじゃないかと思わずにはいられない」。技術指標の裏側で、開発者という職能の重心が静かに移動していることを、これらの声は伝えている。

論評

この記事の最大の貢献は、再帰的自己改善という、ともすればSF的・終末論的に語られがちな概念を、自社の内部データで裏打ちされた現在進行形の測定対象へと引き下ろしたことにある。コードの80%以上がAI生成であるという数字、訓練の高速化が1年で3倍から52倍へ跳ねたデータ——これらは漸進的改善ではなく局面の転換を示している。そして決定的に重要なのは、この分析が「AIを作っている当事者の内部データ」に立脚している点だ。自社の開発プロセスがAIによってどれだけ変質したかを測れるのは、その渦中にいる組織だけである。Anthropicがそれを公開したことで、これまで外挿と憶測に頼ってきたこの議論に、初めて実証的な土台が据えられた。

同時に、著者らが「複利的効果の連鎖」を最も現実的なシナリオに据えた抑制の効いた判断は、信頼に値する。停滞シナリオをデータで退けながら、完全な自己改善を必然だとも言い切らない。Amdahlの法則を持ち出してボトルネックの逐次移動を論じる姿勢は、AI能力の単純な指数関数的外挿への健全な歯止めにもなっている。加速の物語は語り手の利害と結びつきやすいテーマだが、ここでの語り口は煽動を避けている。

とはいえ、私が最も気にかかるのは、この記事が質の評価軸を欠いていることだ。「80%がAI生成」は量の指標であって、そのコードの保守性・可読性・セキュリティ特性がどうなっているかは、ほとんど語られない。記事自身が「品質は現在人間と同等、いずれ上回る」と述べる一方で、その判断を支える具体的なメトリクスは示されない。量が10倍になっても、誰も全体を理解できないコードが10倍積み上がるなら、それは別種の負債である。そしてもう一つ——「うまく回っている日には自分が無意味に感じる」という証言は、技術指標では決して測れない、AI時代の開発者のアイデンティティという問いを突きつけている。再帰的自己改善が「if」から「when」へと変わりつつある今、本当に問われているのは速度の数字ではなく、その速度の中で人間が何を担い、品質をどう保証し、どんな働き方を選ぶのかという、設計の問いなのだと思う。