この動画は、従来のAIチャットボットとAIエージェントの違いを、OpenClawを例に解説する内容である。LLMが単に回答を返すだけでなく、ツールを使い、情報を取得し、判断し、実行するAgentic Loopの仕組みを説明している。さらに、OpenClawの構成要素、スキル拡張、ローカル実行、SlackやiMessageなどとの連携、そしてプロンプトインジェクションや誤設定によるセキュリティリスクまで扱っており、AIエージェントの実用性と注意点を俯瞰できる解説である。

AIチャットボットからAIエージェントへ
さて、こういうことです。私たちはみんなAIチャットボットを使ってきましたよね。ユーザーであるあなたが、何らかのLLMに質問を投げかけます。お気に入りのGPTやClaudeのモデルかもしれません。そして、ここにある大規模言語モデルから答えを受け取るわけです。彼は私たちに会えてとても嬉しそうですね。
この仕組みでは、たとえばメールへの返信を手伝ってくれるかもしれません。そのためにGmailから情報を取り込んでコピー&ペーストしたり、会議のスケジュール調整を手伝ってもらうためにカレンダーの空き状況を取り込んだりします。
しかし、実際に行動しているのはあなたです。情報をコピー&ペーストし、タブを切り替え、ボタンをクリックし、それらをすべてLLMへのプロンプトのコンテキストウィンドウに入れているのです。
お気に入りのLLMに、この会議をスケジュールしてほしいと頼むことはできます。そして、LLMはそれをどうスケジュールすればいいかを正確に教えてくれるでしょう。
ただ問題は、それが実際にあなたのカレンダーへ行って、その会議をスケジュールしてくれるわけではないということです。
ここに、知っていることと、今日話す実行することの間にあるギャップがあります。大規模言語モデルをツールと接続することで、AIエージェントを作成できるようになります。これによって、通常なら人間が情報を行ったり来たりさせ、自分でツールを使わなければならないような問題を解決できます。
そしてOpenClawのようなエージェントを使えば、それを自律的に実行できるようになるのです。
OpenClawの仕組みはかなり興味深いものです。今日はその仕組みに加えて、実際のユースケースや、エンタープライズ対応のためのセキュリティ上の考慮点についても話していきます。
AIエージェントの世界へようこそ。
AIエージェントの基本とAgentic Loop
まずは基本から手早く始めましょう。OpenClawのようなAIエージェントとは、大規模言語モデルと、ツールを使う能力、そして自律的に行動する能力を組み合わせたシステムです。
チャットボットとのやり取りは、一般的にはユーザーがプロンプトを送り、モデルが応答を生成するというものです。
一方でAIエージェントは根本的に異なります。AIエージェントは、Agentic Loopと呼ばれるものの中で動作します。
OpenClawの場合を見てみましょう。
通常、この仕組みでは、まずタスクがエージェントに入ってきます。このタスクは、さまざまな場所から来る可能性があります。
たとえば、ある組織がOpenClawを運用していて、それをSlackに接続しているかもしれません。あるいは、自分のデバイス上で使っているならiMessageかもしれませんし、WhatsAppかもしれません。つまり、エージェントとやり取りするための何らかのコミュニケーションプラットフォームです。
そこから、このAIエージェントの本当の魔法が始まります。
AIエージェントは、LLMに渡されるコンテキストを組み立て始めます。
ここには会話履歴が含まれます。長期記憶も含まれます。システム指示も含まれます。そして最も重要なのは、モデルが追加情報を取得する必要がある場合に使える利用可能なツールも含まれるということです。
ユーザーからの最初のリクエスト、つまり初期リクエストに答えるために、必要であればモデルが追加情報を取り込めるようにするのです。
次のステップでは、その蓄積されたコンテキストをLLMに送って推論を行わせます。
するとモデルは判断します。自分の応答のためにデータを取り込むツールを使う必要があるだろうか、と。
ここで下のほうへ進み、ツールが必要かどうかを確認します。
もしツールを使う必要があるなら、その時点で追加情報を取り込む必要が出てくるかもしれません。
たとえば、ターミナルコマンドから情報を取得する、ハードドライブ上のファイルを読む、Webを検索する、APIを呼び出す、といったことです。
そしてそのツールが実行されると、エージェントは結果を受け取ります。その情報は、もともとあったコンテキストウィンドウに再び渡されます。つまり、既存の情報すべてに加えて、ここで行ったツール呼び出しの結果も入るわけです。
この推論、行動、観察のループは、タスクが完了するまで続くと考えてください。
もしもうツールを使う必要がなければ、下へ進んで、ツールは不要だと判断できます。そして最終的な応答が作られ、こちらのユーザーへ返されます。このユーザーもまた、SlackやiMessageのような最初のプラットフォームを通じてやり取りしています。
これがReActパターンと呼ばれるものです。
つまり私たちは、ユーザーから提供された情報や、エージェントに接続されたさまざまなシステムから提供された情報をもとに推論しています。そして同時に、その情報に基づいて行動もしています。
そして皆さん、これこそが、世の中にあるあらゆるエージェントフレームワークの背後にある中核的なパターンなのです。
OpenClawの全体像
ではOpenClawを見てみましょう。これはおそらく、現時点でAgentic AIアシスタントが実際に動いている最良の実例です。
OpenClawは、2025年後半に作られた無料のオープンソースAIエージェントですが、現在ではGitHub上で総スター数が最も多いプロジェクトの一つになっています。
では、その仕組みを学んでいきましょう。
OpenClawエージェントは、あなたのマシン上のローカルNode.jsサービスとして動作します。これはノートパソコンでも、仮想マシンでも、Raspberry Piでも構いません。個人アシスタントを利用できるようにしたい場所ならどこでもいいのです。
OpenClawはハブ・アンド・スポーク型のモデルに従っており、その中心には単一の重要な部分があります。それがゲートウェイと呼ばれるものです。
このゲートウェイは非常に重要です。これはコントロールプレーンであり、WebSocketサーバーとして常時稼働しています。メッセージルーティング、セッション管理、複数エージェントを作成する機能、そして少し後で見るように、ツールの使用などを扱います。
では、このメインのゲートウェイと実際にどのように通信し、アクセスするのでしょうか。
方法は2つあります。ゲートウェイを実際に管理するためのUIとCLIです。ただし、エージェントへリクエストを送るときには、さまざまなチャネルを通じたメッセージング連携があります。
その例としては、先ほど話したSlackやTeamsがあります。さらにDiscord、iMessageなどもあります。基本的に、エージェントにアクセスしたいコミュニケーションプラットフォームであれば、ほぼどんなものでも利用できます。
ただし、それらをOpenClawのようなものに対して標準化する実際の方法は、こうしたさまざまなアダプターを通すことです。
アダプターは、さまざまな種類の入力データソースを受け取り、それらを統一された内部フォーマットに変換します。そして、そのフォーマットがゲートウェイに提供されるのです。
先ほど、リクエストが実際にこちらのLLMへ渡される前に、完全なコンテキストを組み立てるために使われるAgentic Loopについて話しました。
OpenClawのLLMは、ローカルで動作しているモデルかもしれませんし、ローカルシステムの外部へデータを送ってAPIにアクセスする、ホストされたモデルかもしれません。
しかしこのLLMには、ユーザーからのリクエストだけでなく、追加データも必要になります。
その追加データは、さまざまなデータベースから来る可能性があります。そこには、会話やエージェントが行ってきた作業に関する長期記憶を保存できます。
このデータは、メインの中央ゲートウェイを通じて渡されます。さらに、プロンプトテンプレートやagents.md、sole.mdiのような情報も渡されます。
これらはMarkdownファイルで、エージェントがどのように応答するか、そしてエージェントの仕事が何かを決めるものです。
この点については、下部にあるスキルと実行レイヤーのところで少し話します。
ツールとスキルで能力を拡張する
もう一段下へ進むと、ツールを使う能力があります。ここがまさに、エージェントの能力を作り込める部分です。
たとえば、Webブラウザを使ってさまざまなタスクを自動化する能力があります。これはかなり面白いです。あるいはターミナルを使う能力もあります。
コマンドを実行したり、さまざまなCLIにアクセスしたりする必要がある場合、OpenClawにはそれを行うための組み込みツールがあります。
スキルこそが、OpenClawをAIパーソナルアシスタントとして拡張可能にしているものです。
スキルとは本質的には、Markdownのスキルファイルを含むフォルダです。そのファイルには、特定のタスクやワークフローを実行してユーザーを支援する方法をエージェントに教えるための指示が含まれています。
そして面白いのは、OpenClawがデフォルトでこの情報をすべてモデルに自動的に渡すわけではないという点です。そんなことをすれば、LLMのコンテキストウィンドウはすぐに埋まってしまうからです。
代わりにOpenClawは、利用可能なスキルと簡単なメタデータを注入します。そうすることで、LLMは特定のタスクに役立ちそうなものを選び、必要に応じてその完全なスキルを読むことができます。
そして世の中には何千ものスキルがあります。
たとえばTrelloボードを使って管理し、それを更新できるようにするものがあります。あるいはGoogle Calendarにアクセスしてカレンダーを編集できるようにするものもあります。
エンジニア向けであれば、Dockerを使ってコンテナイメージをビルドし、実行し、テストできるものもあります。さらにはCRM、GitHub、さまざまな種類のデータソースに接続するものもあります。
私たちは、通常なら自分たちで行っていたこうした機能の実行方法をモデルに教えているわけです。そして、必要なあらゆることをエージェントで自動化できるようにします。
それは、ここにある連携機能の一つを使ってオンデマンドで利用する場合もあります。SlackやiMessageを使ってエージェントと会話するような使い方です。
あるいは、自動化されたcronジョブを設定して、必要なときにいつでもこれらのタスクを実行することもできます。
OpenClawのセキュリティ上の注意点
ただし、本格的に導入する前に、OpenClawのセキュリティについて少し話しましょう。大きな力には大きな責任が伴うからです。
OpenClawはローカルで実行され、ファイルシステム、ターミナル、その他の連携機能にアクセスできます。そのため、設定を誤った環境は、実質的に自分のマシン上の強力なバックドアになってしまう可能性もあります。
そしてすでに、インターネットに公開されてしまっているOpenClawインスタンスが何千も存在します。これは単なる誤設定によるものだったり、悪意あるコードを含むスキルによるものだったりします。
そこで注意すべき2つ目の点が、プロンプトインジェクションです。
これはLLMに典型的な脆弱性で、エージェントがメールやWebページのような信頼できない入力を処理するとき、そのデータの中に悪意ある指示が埋め込まれている可能性があります。
そしてLLMは、それを正当なコマンドだと思い込んで実行してしまうかもしれません。
AIエージェントでは、隔離された環境で実行することも重要です。また、実行するコードやスキルを確認し、さまざまな種類のバグに遭遇しないようにすることも重要です。さらに、認証情報をLLMに送る前には必ず暗号化するようにしてください。
会話するAIから実行するAIへ
何年もの間、AIは単なる会話でした。モデルとやり取りして会話するものだったのです。
私たちのやり取りは、LLMとの単純な会話にすぎませんでした。何をすればよいかは教えてくれるけれど、実際にそれを行う手助けまではしてくれないものだったのです。
しかし今、そのやり取りは変わりました。
AIモデルは本質的にオーケストレーターとなり、必要なタスクを実行できるようになります。計画し、実行し、観察し、そのループが完了するまで進められるのです。
オープンソースのOpenClawプロジェクトは、AIエージェントで課題を解決するための一つのアプローチを示しています。
ただし、エージェントを構築するためのフレームワークはたくさんあります。LangGraphなどもその一例です。そしてOpenClawの勢いは否定できません。
今日学んだパターンは、あらゆる種類のAIエージェントに適用できます。ただし、セキュリティ、ガバナンス、そしてデプロイの実践についても、責任を持つことを忘れないでください。
まとめと視聴者への呼びかけ
さて、皆さんはどう思いますか。
AIエージェント、OpenClaw、あるいは今日取り上げた内容について質問やコメントがあれば、下のコメント欄でぜひ教えてください。
そして、この動画から何か学びがあったなら、いいねを忘れないでください。AIやそれ以外の分野について、より深い内容を見たい方はチャンネル登録もお願いします。
ご視聴いただき、本当にありがとうございました。


コメント