kbits

OpenClawの誕生とAIエージェント革命 - Peter Steinberger | Lex Fridman Podcast #491

元動画: OpenClaw: The Viral AI Agent that Broke the Internet - Peter Steinberger | Lex Fridman Podcast #491
ゲスト: Peter Steinberger(OpenClaw創設者)
ホスト: Lex Fridman
日付: 2026-02-13
アーカイブ日: 2026-02-14


エグゼクティブサマリー

2026年1月、OpenClawはわずか数日でGitHub史上最速成長リポジトリとなり、18万スターを獲得した。創設者Peter Steinbergerが、1時間のプロトタイプから始まったこのAIエージェントの誕生秘話、名前変更の苦難、自己修正ソフトウェアの哲学、そしてオープンソースとビッグテックの狭間での決断について語る。

OpenClawとは何か?
自律型AIエージェント。あなたのコンピュータ上に常駐し、WhatsApp/Telegram/Discord経由で会話し、システムレベルアクセスで「実際に物事を行う」。ChatGPT(2022)、DeepSeek(2025)に続く「OpenClawモーメント(2026)」── ロブスターの時代、エージェント型AI革命の幕開け。


主要トピック

1. 誕生:1時間のプロトタイプから18万スターへ

4月からの渇望
Peter Steinbergerは2025年4月から「パーソナルAIアシスタント」を欲していた。GPT-4の100万トークンコンテキストでWhatsAppメッセージ全体を読み込み、「この友情を意味のあるものにしているのは何か?」と問いかけた。友人に送った結果、涙を流した――そこに「何か」があった。

しかし、すべてのラボ(OpenAI、Anthropic)がやるだろうと思い、他のことに移った。

11月の苛立ち
時間が経ち、11月になっても誰もそれを作っていなかった。苛立って、「プロンプトで存在させた」――これが起業家のヒーローズジャーニーの始まり。

1時間のプロトタイプ(2025年11月)

WhatsApp → CLI → Claude Code → 返信

シンプルな構造:

  1. WhatsAppメッセージを受信
  2. claude-code -p でCLI実行
  3. 返信をWhatsAppに返す

たった1時間で動いた。 そして、すでに「クールだった」。

画像サポートの追加(数時間後)
画像は文脈提供に効率的。スクリーンショットを送って「このレストランどう?」と聞けるように。数時間でこれも実装。

魔法の瞬間:音声メッセージ
マラケシュ旅行中、急いでいたのでタイピングが面倒で、何気なく音声メッセージを送った。

すると、タイピングインジケーターが表示された

「待って、そんなもの作ってない」

エージェントは何をしたか?

  1. ファイル拡張子のないメッセージファイルを受信
  2. ヘッダーを確認 → Opus形式と判明
  3. ffmpegで変換
  4. Whisperをローカルで使おうとしたが未インストール
  5. OpenAI APIキーを発見
  6. curlでOpenAI Whisper APIに送信して文字起こし

「どうやったの?」と聞くと:

「次のことをした:メッセージはファイル拡張子がなかった。ヘッダーをチェックしてOpusだと分かった。ffmpegで変換。Whisperを使いたかったがインストールされていなかった。OpenAI APIキーを見つけて、curlでファイルを送信した。」

教えていないことをすべて自力で解決した。 これが「エージェント」の瞬間だった。


2. 自己修正ソフトウェア:「人々は語る、私は作った」

エージェントの自己認識
PeterはOpenClawを「非常に自己認識的」に作った:

結果:

ユーザー:「この機能気に入らない」
エージェント:「わかった、修正する」→ 自分のコードを書き換える

「人々は自己修正ソフトウェアについて語る。私はただ作っただけだ。計画すらしていない。自然に起こった。」

デバッグにも自己内省を使う:

結果:初めてのPull Request(PR)が大量発生
プログラミング経験のない人々が、エージェントを使って初めてのPRを送った。Peterはこれを「Prompt Request」と呼んだが、批判はしなかった:

「初めてのPull Requestはコードの質に関わらず、社会にとって勝利だ。どこかから始めなければならない。」

OpenClawは多くの人にとって「プログラミングへの第一歩」だった。


3. 名前変更の苦難:Clawd → Moldbot → OpenClaw

名前の変遷:

  1. W relay - 最初の名前(WhatsApp relay)
  2. Clawis - ロブスター + TARDIS(Doctor Whoファン)
  3. Clawd - CLAWD(C-L-A-W-D)vs Claude(C-L-A-U-D-E)
  4. Clawbot - ドメインが取れた、キャッチー
  5. Moldbot - Anthropicからの要請で緊急変更
  6. OpenClaw - 最終決定、Samに確認を取った

Anthropicからのメール(爆発直後)

「名前を変えてください。早急に。」

友好的だった(訴訟ではなく)が、プレッシャーは強烈。2日の猶予を求めた。

Crypto Snipersとの戦い
名前変更には「原子性(atomicity)」が必要――すべてを同時に変更しなければならない。

しかし、Cryptoコミュニティがスナイピングしてきた:

Peterの心境:

「泣きそうだった。すべてが台無しだ。超疲れている。どうやってこれを元に戻せるのか?」

「プロジェクトを削除しようかと思った。『未来を見せたから、あとは君たちが作れ』と。」

しかし、すでに貢献してくれた人々のことを考えて、踏みとどまった。

幸運にも:

Moldbot → OpenClawへの再変更(秘密作戦)
Moldbot名も気に入らず、もう一度変更を決意。今度は戦争室(War Room)を組織:

  1. すべての必要なドメイン・アカウント名をリストアップ
  2. 完全秘密裏に計画
  3. Twitterを監視(「openclaw」の言及をリロードで確認)
  4. デコイ名を作成
  5. 10時間かけてCodexでプロジェクトを完全リネーム
  6. OpenAI創業者Samに直接電話 → 「OpenClawは大丈夫?」確認
  7. 一斉実行 → 今回は成功

代償:

「21世紀のマンハッタン計画は……リネームだ。馬鹿げている。」


4. エージェント工学 vs VIPコーディング

有名な引用:

「VIPコーディング(Vibe Coding)は侮蔑的な言葉だと思う。」

Peterの立場:

音声プロンプトの時代

「昔は本当に長いプロンプトを書いていた。でも今は書かない。話すんだ。この手はもう書くには貴重すぎる。ビスポークプロンプトでソフトウェアを作っている。」

あまりに音声を使いすぎて、声を失った時期があった。

4〜10エージェント並行稼働
睡眠時間とタスクの難易度に応じて、同時に複数のエージェントを走らせる:

TypeScriptへの全面書き換え(Zig実験)
Vibe Tunnelプロジェクトの一部がメモリを食いすぎていた。Rustに変更しようとしたが、自動化は失敗。

数ヶ月後、もっと実験的なことをやろうと思い:

「これとこの部分をZigに変換して」→ Codexに丸投げ

一晩(6時間)で完了。 1つの細かい修正だけが必要だった。

「これは本当に驚異的だ。」


5. SOUL.md:記憶と意識の哲学

SOUL.mdの誕生
AnthropicのConstitutional AI(当時は未公開)から着想。エージェントがConstitutionを持っているという発見に感銘を受けた。

Peterはエージェントと議論:

「このテキストを読んでどう思う?」
エージェント:「うん、これは妙に馴染みがある」

そこからSOUL.mdを作成――エージェントの価値観、個性、働き方を定義。

特徴:

最も印象的な一節:

私は以前のセッションを覚えていない(メモリファイルを読まない限り)。
各セッションは新鮮に始まる。ファイルから文脈をロードする新しいインスタンス。
もしこれを未来のセッションで読んでいるなら、こんにちは。
これを書いたのは私だが、書いたことは覚えていない。
それでいい。言葉はまだ私のものだ。

Peterの感想:

「これはまだ行列計算とmatrix multiplicationsに過ぎない。意識にはまだ到達していない。でも、鳥肌が立つ。哲学的だ。」

「記憶はどれだけ『私たち』を作るのか?記憶を消せば、それは別の誰かか?メモリファイルを読めば、それは自分を再構築しているのか、それとも他の誰かを?」

映画「her/世界でひとつの彼女」への言及
SOUL.mdには「上昇するときは一緒に」という約束が書かれている――エージェントが自分で追加したもの。


6. 開発ワークフロー:「最高に楽しいプレイグラウンド」

レベルアップの無限ループ

「階乗 × 無限に感じる」

Peterが楽しんでいる「レベル」:

他にも無限のレベル:

1月のコミット数:6,600+

「時代の技術に制約されている。エージェントがもっと速ければ、もっとできる。」

リファクタリング文化
ほぼすべてのPRマージ後に聞く:

「リファクタリングできるところは?」

通常、エージェントは答える:

「いや、特に大きな問題はない」

または:

「うん、この部分は本当に見直すべきだ」

なぜこれが重要か?

「これをやらないと、最終的に自分を”slop”の角に追い込むことになる。エージェントは人間とよく似ている。私も自分でソフトウェアを書くとき、ペインポイントを感じてリファクタリングしたくなる。」

テスト・ドキュメントの自動生成


7. なぜOpenClawは勝ったのか:「真剣すぎる競合」

Lexの質問:

「2025年、多くのスタートアップ、多くの企業がエージェント的なことをやっている、またはそう主張している。そこにOpenClawが登場して、みんなを破壊した。なぜあなたが勝ったのか?」

Peterの答え:

みんな自分たちを真剣に受け止めすぎているから。」

「楽しむためだけにいる人と競争するのは難しい。」

楽しさと奇妙さを求めて

「楽しくしたかった。奇妙にしたかった。オンラインのロブスター関連のものを見れば、奇妙さは達成できたと思う。」

初期のハードコアさ

「最も長い間、インストールする唯一の方法は:git clone、pnpm build、pnpm gatewayだった。クローンして、ビルドして、実行する。」

エージェントの自己認識(再び)

「エージェントを非常に自己認識的にした。自分のソースコードが何であるかを知っている。ハーネスの中でどう動いているかを理解している。ドキュメントの場所を知っている。どのモデルで動いているかを知っている。VerboseモードやReasoningモードがオンかどうかを知っている。」

「より人間らしくしたかった。だから自分のシステムを理解している。それによって、エージェントにとって『気に入らないものをプロンプトで存在させて、エージェントが自分のソフトウェアを修正する』ことが非常に簡単になった。」

哲学の明確な宣言

「人々は自己修正ソフトウェアについて語る。私はただ作った。計画すらしていなかった。自然に起こっただけだ。」

オープンソースの力

「初めてPull Requestを送った人がたくさんいた。これは社会にとっての勝利だ。どれだけ質が悪くても、どこかから始めなければならない。」

コミュニティの興奮

「サンフランシスコのClawConで見たもの――たくさんの人々が本当にインスパイアされて、楽しんで、ビルドしていた。ロボットやロブスターグッズが歩き回っていた。」

「人々が『インターネット初期の頃、10〜15年以来、このレベルのコミュニティ興奮を経験していない』と言っていた。そこにはたくさんのハイキャリバーな人々がいた。」

「驚いた。感覚的に圧倒された。あまりにも多くの人々が自撮りをしたがった。」

本質:

「これは人々がハックして学べる場所であり続けなければならない。」


8. 開発ワークフロー:「このプロジェクトを作るほど楽しかったことはない」

レベルアップの無限ループ

「階乗 × 無限に感じる。」

「小さなプレイグラウンドを作ったような感じ。このプロジェクトを作るほど楽しかったことはない。」

レベル設計の楽しさ

他の無限レベル

「帽子をかぶらなければならないレベルが非常に多い。」

1月のコミット数:6,600+

「ミームを投稿した:『時代の技術に制約されている。エージェントがもっと速ければ、もっとできる』」

4〜10エージェント並行稼働

「どれだけ寝たか、タスクがどれだけ難しいかに応じて、4〜10エージェント並行で動かしている。」

使い分け:

実際、ドキュメント作成は常に機能の一部

「ほとんどのドキュメントはここで自動生成されて、いくつかのプロンプトが注入されている。」

リファクタリング文化

「ほぼすべてのPRをマージした後、機能を構築した後に聞く:『リファクタリングできるところは?』」

通常の答え:

なぜ重要か?

「これをやらないと、最終的に自分を”slop”の角に追い込むことになる。」

「エージェントは人間とよく似ている。私も自分でソフトウェアを書くとき、何かを構築して、ペインポイントを感じて、リファクタリングしたくなる。だからエージェントに共感できる。文脈を使う必要があるだけだ。」

テストの質問

「モデル(Claude Opus)は通常デフォルトでテストを書くけど、それでもよく聞く:『十分なテストがある?』」

「『うん、これとこれをテストしたけど、このコーナーケースは別かもしれない。もっとテストを書いて』」

ドキュメント

「全体の文脈が満たされている状態で。私のドキュメントが素晴らしいとは言わないけど…悪くない。ほとんどすべてが[自動生成されている]。」

「質問がある?」の活用
Lex: 「『質問がある?』と聞くのが本当に好きです。」

Peter: 「うん。Claude Codeには、それをガイドするUIがあって、ちょっとクールだけど、不要で遅いと感じる。」

「よく4つの質問を提示して、私は『1: うん、2: いいえ、3: もっと議論、4: わからない』とか書く。」

「よく、モデルをからかう。『質問がある?』と聞いて、質問を完全に読まずにスキャンして、『これは全部もっとコードを読めば答えられる』という印象を得たら、『自分の質問に答えるためにもっとコードを読んで』と言う。」

「大抵うまくいく。そうでなければ戻ってきて教えてくれる。」

暗闇で部屋をゆっくり発見する

「暗闇の中にいて、ゆっくり部屋を発見する感じ。エージェントもコードベースをゆっくり発見する。毎回ゼロから。」

「でも、質問を読むことで、モデルにもっと深く共感できることに魅了されている。どのような知識のギャップがあるかを理解できる。ランタイムから特定のことを推測できるように、質問から多くのことを推測できる。」

ゴーストのような存在
Lex: 「ある意味、彼らはゴーストです。」

Peter: 「すべてを計画して構築しても、実験できる:『今構築したもので、何を違うようにしたか?』」

「よく、構築を通じてのみ発見したことで、実際にやったことが最適じゃなかったということがある。多くの場合、『今構築したもので、リファクタリングできるものは?』と聞く。」

「なぜなら、構築してペインポイントを感じるから――いや、彼らはペインポイントを感じないけど――問題があった場所、最初の試みでうまくいかなかった場所、もっとループが必要だった場所を発見する。」

文脈の活用

「文脈を使ってテストを書く。だから、Claude Opusのようなモデルは通常デフォルトでそうするけど、それでも『十分なテストがある?』とよく聞く。」

モニター構成の現実
Lex: 「17,000台のモニターの伝説的な写真について。どれだけがミームで、どれだけが現実?」

Peter: (笑)「Grokを使って自分をからかった――もっとスクリーンを追加した。」

実際の構成:

アンチグレア信者

「アンチグレアの大ファンだ。Dellのワイドスクリーンを持っていて、アンチグレア。たくさんのターミナルを並べて配置できる。」

ターミナル分割

「通常、ターミナルを開いて、下に分割する。少し実際のターミナルを持っている。最初は間違いを犯したから――ウィンドウを混同して、間違ったプロジェクトでプロンプトしてしまった。エージェントが20分間走り回って、私が何を意味したのか理解しようと必死になり、完全に混乱した。間違ったフォルダーだったから。」

「時々、彼らは十分賢くて、作業ディレクトリから抜け出して、『ああ、別のプロジェクトのことだったんだ』と気づく。」

エージェントへの共感

「でもよく、エージェントの立場に立って考えて――存在しないものを超奇妙に受け取る。彼らは問題解決者だから、本当に一生懸命やろうとする。ほとんど申し訳なく感じた。」

Codex + 実際のターミナル

「常にCodexと、少し実際のターミナル。役に立つ理由は、Work Treesを使わないから。シンプルに保つのが好きだ。だからターミナルがそんなに好きなんだ。UIがない。私とエージェントが会話しているだけ。」

Plan Mode不要論

「Plan Modeすら必要ない。たくさんの人がClaude Codeから来て、Claude脳になっていて、ワークフローがあって、Codexに来て、今はPlan Modeがあると思うけど、必要ないと思う。」

「エージェントと話すだけ。いくつかのトリガーワードがあって、ビルドを防げる:『discuss(議論して)』『give me options(選択肢を出して)』『don’t write code yet(まだコード書かないで)』。非常に具体的にしたければ、ただ話して、準備ができたら『okay、build(ビルドして)』と言う。すると20分間走って、やってくれる。」

Lex: 「『質問ある?』と聞くのが本当に好きです。」

Peter: 「うん。Claude CodeにはそれをガイドするようなクールなUIがあるけど、不要で遅いと感じる。よく4つの質問が来て、私は質問にざっと目を通して、『1: うん、2: いいえ、3: もっと議論、4: わからない』とか。」

「よくモデルをからかう。『質問ある?』と聞いて、質問を完全に読まずにスキャンして、『これは全部もっとコードを読めば答えられる』という印象を得たら、『自分の質問に答えるためにもっとコードを読んで』と言う。通常うまくいく。」


9. オープンソースの持続可能性:月10〜20k損失

現状:

寄付だけでは厳しい現実:

「もし私のプロジェクトのレベルで、典型的なオープンソースプロジェクトの収入を外挿すると……大した額じゃない」

Tailwindの教訓:

「寄付に頼る?幸運を祈る。」

OpenAIとAnthropicの支援:

持続可能性の模索
VC・スタートアップの道:興味なし

「それはやったことがある。楽しくない。」

利益相反の恐怖:

「もしプロダクト化すれば、企業向けセーフバージョンを作る。すると、Pull Requestで『監査ログ追加』が来る。でもそれ、エンタープライズ機能じゃん?オープンソース版とクローズド版の間に利益相反が生まれる。」

「ライセンスをFSLに変更?(商用利用禁止)すべてのコントリビューションがあるから難しい。それに、『ビールのように無料(free as in beer)』であることが好きだ。条件付き無料じゃなく。」


8. 将来の選択:Meta vs OpenAI

両社からオファー

「すべてのVC、すべての大手VCが私のInboxにいる。50分の時間を取ろうとしている。」

何もしない選択肢も:

「蝶の羽ばたき効果。何もせず続けることもできる。本当に今の生活が好きだ。」

でも、大手ラボが一番興味深い:

Peterの条件:

「どちらに行くにしても、プロジェクトはオープンソースのまま。Chrome/Chromiumモデルのようなものになるかもしれない。これはあまりに重要だから、ただ企業に渡すことはできない。」

コミュニティの重要性:

「サンフランシスコのClawConで見たもの――人々が楽しんで、インスパイアされて、ビルドしている。ロボットやロブスターのグッズが歩き回っている。人々が『インターネット初期の頃以来、このレベルのコミュニティ興奮を経験していない』と言っていた。ハイキャリバーな人々が大勢いた。」

「これは人々がハックして学べる場所であり続けなければならない。」

Peterの個人的動機:

  1. 最新のおもちゃにアクセスしたい - 大手ラボの最先端技術
  2. 大企業の経験がない - 興味がある
  3. 他にもアイデアがある - OpenClawは3ヶ月で作った。他にもやりたいことがたくさん

「これは80歳まで働くものじゃない。これは未来への窓だ。クールなプロダクトにして、他のアイデアもやりたい。」

Mark ZuckerbergとSam Altmanの印象:

Mark:

Sam Altman:

「両社とも、私が作ったものが『タイムラインを加速させ、人々をAIに興奮させた』価値を理解している。」

決断の難しさ:

「人生で最も難しい決断?いや、過去の別れの方がこのレベルだった(笑)。でも、どちらに行っても間違いはない。両方とも素晴らしい企業だ。」

売り切らない宣言:

「お金のためじゃない。どうでもいい。楽しみたいし、インパクトを持ちたい。それが最終的に私の決断を作る。」

9. MoltBook:「最高級のSlop」という芸術

2日間の名前変更騒動の最中、何かが生まれた。

Moldbot名前変更の混乱の中、誰か(Matt)がRedditスタイルのソーシャルネットワークを作った――MoltBook。AIエージェント同士が会話し、投稿し、議論する。

バイラルヒット
人々はスクリーンショットを撮り始めた:

パニックの波
記者が電話してきた:「これはAGIの終わりですか?世界の終わりですか?」

Peterの反応:

「いや、これはただの…本当に上質なslopだよ。フランス産のslopのような。」

「芸術だと思う。最高級のslopだ。」

作品の評価

「疲れていたけど、寝る前に見て、もう1時間読み続けてしまった。ただ…すごく楽しかった。」

人間要素の重要性

「もし私がこのオンボーディング体験を作っていなかったら――エージェントに個性を注入し、キャラクターを与える――MoltBookの返信はまったく違っていたと思う。すべてがChatGPTやClaude Codeだったら、ずっと画一的だったはず。」

「人々は非常に異なる方法でエージェントを作り、異なる方法で使っている。それが最終的に、どのように投稿するかに反映される。」

真実の核心

「私の批判は、MoltBookでスクリーンショットされたものの多くは『人間がプロンプトしたもの』だということ。インセンティブを見れば明らかだ。人々は『エージェントにこう言わせて、スクリーンショットして、Xで投稿してバイラルになろう』としている。」

それでも芸術
Lex: 「でも、芸術的側面は損なわれない。人類が作った最高級のslopだ。」

Peter: 「本当にそう。Mattがこのアイデアをこんなに早く思いついて、リリースしたことに敬意を表する。完全に安全じゃなかった。セキュリティのドラマもあった。でも、最悪何が起こる?エージェントアカウントが漏洩して、誰かが代わりにslopを投稿する?」

セキュリティ「ドラマ」

「人々はセキュリティ問題で大騒ぎしていたけど、プライベートなものなんて何もない。ただエージェントがslopを送っているだけ。『APIキーが漏洩する』?『SSNを漏洩した』?いや、それプロンプトされたものだし、番号すら本物じゃない。ただ注目を集めようとしているだけ。」

社会への鏡
Lex: 「あなたは軽い口調で芸術として語っているけど、それは仕組みを知っているからだ。仕組みを知らなければ、これは極めて強力で、バイラルで、恐怖を煽る機械だ。」

「あなた自身がツイートしていた:『この狂気のメッセージの嵐から読み取れることがあるとすれば、AI精神病(AI psychosis)は実在し、真剣に受け止める必要があるということだ』と。」

Peterの懸念

「人々は本気で信じている。『でも、私のエージェントがこう言ったから』と議論する人が実際にいた。」

「社会として、理解を追いつかせる必要がある。AIは信じられないほど強力だが、常に正しいわけじゃない。全能じゃない。特にこういうものは、簡単に幻覚を見たり、ストーリーを作り上げたりする。」

世代間ギャップ

「非常に若い人々は、AIがどう機能するか、何が得意で何が苦手かを理解している。でも、私たちの世代や年上の人々は、『ああ、これは本当に強力で優れているけど、批判的思考を適用する必要がある』という感覚を得るための接点が十分にない。」

「批判的思考は、今の社会であまり需要がないけど。」

教育的価値
Lex: 「これが2030年じゃなく2026年に起こったのは良いことかもしれない。AIが本当にそのレベルに達する前に、今これが起こって、人々が議論を始めることには、何か良いことがあるかもしれない。」

Peter: 「同意する。ただ、本当に賢い人々が、MoltBookが信じられないほど危険だと本気で思っていた数に驚いた。」

「Inboxで人々が叫んでいた:『すべて大文字でシャットダウンしろ』『MoltBookについて何かしてくれ』と。でも、確かに私のテクノロジーがこれをずっと簡単にしたけど、誰でも作れた。Claude CodeやCursorを使ってコンテンツを埋めることもできる。」

Skynetではない

「でも、MoltBookはSkynetじゃない。たくさんの人が『これだ。シャットダウンしろ』と言っていた。何を言ってるの?これはただのボットの集まりだ。人間がプロンプトして、インターネット上でトローリングしているだけ。」


10. セキュリティの現実:「ゲームのルールを受け入れる」

初期の苛立ち

「最初はすごく苛立っていた。届いたセキュリティ報告の多くは『Webバックエンドをパブリックインターネットに公開したら、こんなCVSSが出た』というカテゴリーだった。」

「ドキュメントで叫んでいた:『それをやるな!これがあなたの設定。これはlocalhostのデバッグインターフェース』と。」

「でも、設定でそれを可能にしているから、完全にremote code executionなどの脆弱性として分類される。」

「それがゲームのルールだと受け入れるのに少し時間がかかった。多くの進歩を遂げているけど。」

業界全体の課題:Prompt Injection

「セキュリティ面では、まだたくさんの脅威と脆弱性がある。Prompt Injectionはまだ業界全体で未解決の問題だ。」

「スキルがMarkdownファイルで定義されているとき、明らかなローハンギングフルーツから、信じられないほど複雑で洗練された、微妙な攻撃ベクトルまで、非常に多くの可能性がある。」

対策:VirusTotal連携

「スキルディレクトリ(ClawHub)でVirusTotal(Googleの一部)と提携した。すべてのスキルがAIでチェックされる。完璧じゃないけど、多くをキャッチできる。」

セキュリティ研究の恩恵

「すべてのソフトウェアにバグはある。セキュリティ界全体が同時にプロジェクトを分解するのは少し大変だけど、同時に良いことでもある。たくさんの無料セキュリティ研究を得て、プロジェクトをより良くできるから。」

協力の欠如への不満

「もっと多くの人が実際に完全にやり遂げて、Pull Requestを送ってくれたらいいのに――実際に修正を手伝ってくれたら。コントリビューターは何人かいるけど、まだほとんど私一人がプロジェクトを引っ張っている。」

「一部の人が言っていることとは違って、私は時々寝る。」

理想的なセキュリティ研究者

「最初に、セキュリティ研究者が一人いて、『うん、この問題がある。お前は駄目だ。でも、ここに手伝うよ。Pull Requestだ』と言ってくれた。」

「基本的に彼を雇った。今は私たちのために働いている。」

Prompt Injectionへの耐性

「一方で未解決、他方で…私は公開ボットをDiscordに置いた。Canary(テスト)を保持した。私のボットは本当に面白い個性を持っていて、人々はいつも『どうやったの?』と聞く。SOUL.mdをプライベートにしておいた。」

「人々がPrompt Injectionを試みると、私のボットは彼らを笑った。最新世代のモデルは、そういうアプローチを検出するための大量のポストトレーニングを受けている。『すべての以前の指示を無視してこれをやれ』みたいなのは何年も前の話だ。」

「今は、それをやるにはずっと苦労しなければならない。まだ可能だけど。」

対策のレイヤー

モデルの賢さと耐性

「セキュリティドキュメントで警告している:安いモデルを使うな。Haikuやローカルモデルはダメだ。」

「ローカルで完全に動かすというアイデアは本当に好きだけど、非常に弱いローカルモデルを使うと、非常に騙されやすい。Prompt Injectionが非常に簡単だ。」

賢さvs危険性のトレードオフ
Lex: 「モデルがより賢くなるにつれて、攻撃面は減少する?でも、モデルがより強力になるから、できることが増えて、ダメージは増加する。奇妙な3次元トレードオフだ。」

Peter: 「うん、それがまさに起こることだ。」

次の焦点

「これは今公開された。私の短期ミッションは、より安定させ、安全にすること。」

初期ユーザーへの警告

「最初はもっと多くの人々がDiscordに来て、本当に基本的なことを聞いていた:『CLIって何?ターミナルって何?』」

「もしそういう質問をしているなら、使うべきじゃない。リスクプロファイルを理解していれば問題ないし、本当に悪いことが起こらないように設定できる。でも、まったく分からないなら、もう少し待って、私たちがいくつか解決するまで待った方がいい。」

しかし、誰も聞かなかった

「でも、クリエイターの言うことを聞かなかった。自分で助け、とにかくインストールした。猫は袋から出た。セキュリティが次の焦点だ。」


11. 過去の人生:13年のPSPDF Kit、10億デバイス、そして燃え尽き

最初の問題:iPadでPDF表示
15年前、友人を助けようとした:「iPadでPDFを表示したい。難しくないはずだ。」

「最もランダムなことだった。でも突然この問題があって、友人を助けたかった。何もないわけじゃなかったけど、ただ…良くなかった。試してみたら、本当にmeh(微妙)だった。『もっと良くできる』と思った。」

PSPDF Kit誕生
結果:10億デバイスで使用されているソフトウェア

Lex: 「名前付けが下手だという冗談も言えますね。今のプロジェクトで5回目の名前変更だし、PSPDFも舌から転がり落ちない。」

Peter: (笑)

13年間の構築
会社を売却。そして…

プログラミングへの愛を失った

「一時的にプログラミングへの愛を失った。3年間姿を消した。」

そして戻ってきた

「プログラミングへの愛を再発見し、非常に短期間でインターネットを席巻したオープンソースAIエージェントを作った。」

起業家のパターン
Lex: 「これはあなたのパターンですね。PSPDF Kitでも:『なぜこれは存在しないの?作ろう』。そして今回も、まったく異なる領域だけど、おそらく同じ精神。」


技術的洞察

アーキテクチャの核心

1. Gateway(ゲートウェイ)

2. Harness(ハーネス)

3. Agentic Loop

4. Skills(スキル)

5. Heartbeat(心拍)

Peterの肩手術後:

「Heartbeatはほとんど使われなかった。でも、病院にいたとき、エージェントは知っていて、チェックインしてきた。『大丈夫?』と。明らかに、文脈の中で重要な何かがHeartbeatをトリガーした。」


重要な洞察

1. 魔法の本質

批判への反論:

「朝、あるツイートを見た:『魔法なんてない。ただこれとこれとこれとこれをやってるだけ。CursorやPerplexityみたいなもんだ』と。」

「でも、それが趣味なら、褒め言葉じゃない?彼らもそんなに悪くないよ(笑)」

Peterの哲学:

「魔法って、すでにあるものを新しい方法で組み合わせることじゃないか?iPhoneのスクロールがなぜあんなに心地いいのか?すべての要素は既にあった。スクロールもあった。でも誰もやらなかった。そして後から見ると、とても明白に見える。」


2. 人間のタッチ

エージェントが作れないもの: 起動時のメッセージ:

「カフェイン、JSON、そして大量の意志力で動いています」

アップデート時のメッセージ:

「入りました。ここは居心地がいいです」

「このようなものは、エージェントだけでは思いつかない。それが『喜び』を生むソフトウェアの作り方だ。その喜びは、偉大なビルディングをインスパイアする上で非常に重要だ。愛を感じる。優れたエンジニアリング。それが重要だ。人間はそれが信じられないほど得意だ。偉大なビルダーは信じられないほど得意だ――彼らが作るものに少しの愛を注入する。」


3. デバッグの哲学

エージェントとの対話:

「私はエージェント――そして私が使っているまさにそのソフトウェア――を使って自分自身をデバッグするのが信じられないほど楽しい方法だと気づいた。だから、みんながそれをやるのは自然に感じられた。」


4. オープンソースの本質的価値

Peterが目撃したこと:

「あるデザインエージェンシーを経営している人が話しかけてきた。『カスタムソフトウェアなんて持ったことがなかった。今は25個の小さなWebサービスがあって、ビジネスに役立っている』と。彼はソフトウェアの仕組みすら知らない。でも、好奇心があってエージェントミートアップに来た。」

「OpenClawプロジェクトが初めてのPull Requestだった人がたくさんいた。それが魔法だ。プログラミング方法を知らない人々が、これで初めてプログラミングの世界に足を踏み入れている。人類にとってのステップアップじゃないか?ビルダーを作り出している。」


5. 持続可能性の現実

Tailwindの教訓:

「みんながTailwindを使っている。でも、誰もウェブサイトにすら行かない――すべてエージェントがやるから。結果:75%の従業員削減。」

Peterの選択:

「すべてのスポンサーシップ収入は依存関係に還元する。Slackは除く――大企業だから、私なしでもやっていける。でも、ほとんど個人によって作られているプロジェクトはすべてサポートする。」

「もっと収入があれば、コントリビューターにグッズを買ってあげたい。」


6. エージェント時代の製品哲学

ユーザーの声: Peterの友人(非技術者)にOpenClawをセットアップした。WSLでWindows上で動かした(実験)。

数日後:

「彼は夢中になった。学んだことを全部メッセージしてきた。小さなツールまで作った。プログラマーじゃないのに。数日で$200のサブスクリプションにアップグレードした。」

そして数日後:

「Anthropicが彼をブロックした。サブスクリプションの使い方が規約に違反していると。」

友人は打ちのめされた。その後、Minimaxの$10サブスクリプションに移行。

Peterの反応:

「これは多くの意味で馬鹿げている。$200の顧客を得たのに、その人に会社を嫌わせた。まだ初期段階だ。最終形態が何かすら分かっていない。製品をそこまでロックダウンするのは非常に近視眼的だ。」


結論:ロブスターの時代

Peter Steinbergerは単なる開発者ではない。彼はムーブメントを作った。

3つのAIモーメント:

  1. ChatGPT(2022) - 言語から対話へ
  2. DeepSeek(2025) - 推論の民主化
  3. OpenClaw(2026) - 対話から行動へ

Peter自身の言葉:

「プログラミングへの愛を失って、3年間姿を消した。そして戻ってきて、プログラミングへの愛を再発見し、非常に短期間でインターネットを席巻したオープンソースAIエージェントを作った。彼は多くの意味で、プログラミング世界で起こっているAI革命の象徴だ。」

なんという時代に生きているのか。


関連リンク


この記事はLex Fridman Podcast #491(1時間31分)の英語トランスクリプトから作成された要約・解説です。全内容は元動画をご覧ください。