Hermes Agent あなたを学習する自己改善型AI

AIエージェント
この記事は約11分で読めます。

Nous Hermesが開発したHermes Agentは、使えば使うほど賢くなる自己改善型のオープンソースAIエージェントである。Open Clawの代替として急成長を遂げており、タスクから自動的にスキルを生成し、ユーザーの好みや作業スタイルを学習してパーソナライズされた支援を提供する。モデル非依存の設計により、Open RouterなどのプラットフォームでGemini、Claude Opus、Qwenなど100以上のモデルを自由に切り替えながら利用できる点が特徴だ。15回のツール呼び出しごとに自己評価を行い、ユーザープロファイルを構築していく独自のメモリシステムを持ち、繰り返しタスクの効率化とコスト削減を実現する。

Hermes Agent: The Self-Improving AI That Learns You
Open Router gives you access to 100+ models through a single API endpoint. Try it free and find the best model for your ...

Hermes Agentの概要と急成長

それでは、現在最も急成長しているプロジェクトの一つであるAgentの使い方を見ていきましょう。これはオープンソースのエージェントシステムです。Open Clawの代替として考えてください。ただし、本当に素晴らしい新機能がいくつか搭載されています。ユーザー体験から自己改善し学習する能力も含まれています。これはNous Hermesという企業によるもので、彼らは本当に素晴らしいオープンウェイトモデルをいくつか生み出してきました。

成長という点では、GitHubで指数関数的な成長を見せています。実際、Open Routerでは、現在最もトレンドになっているコーディングエージェントです。そしてOpen Clawと比べてはるかに新しいプロジェクトであるにもかかわらず、プラットフォームで使用されるトークン数という点では、Open Clawのすぐ後ろに迫っています。このビデオでは、他の提供サービスと比較して、このエージェントの何が特別なのかを見ていきたいと思います。

自己改善ループの仕組み

では、Hermes Agentの中核にあるこの自己改善ループを見てみましょう。これが他のシステムとの違いを生み出しています。これは閉じたループです。使えば使うほど良くなるフライホイールなんです。コーディングでも執筆でも、どんなタスクを割り当てても、それは自分が行ったことを見て、このタスクからの学びを保存する価値があるかどうかを自問します。

もし答えがイエスなら、そのためのスキルを作成します。そしてアイデアとしては、将来繰り返さなければならないタスクについて、ゼロから始めるのではなく、それを持っているということです。これは時間の節約だけでなく、トークンとコストの節約にもなります。でも今、ここで興味深いことがあります。同じタスクを実行しようとして、より良い方法を見つけた場合、スキルを更新し続けるんです。

ここで自己改善が作用します。すべてがメモリに永続化されます。これから見ていく複数の異なるタイプのメモリがあります。でも、それだけではありません。周期的なナッジと呼ばれるものがあります。つまり、15回のツール呼び出しごとに、エージェントは一時停止して、自己評価を行います。何が起こったかを振り返り、永続的なメモリに保存する価値があるものを決定します。

ユーザーモデリングとメモリシステム

そして、Humeと呼ばれるものを通じたユーザーモデリングもあります。アイデアは、あなたが言ったことを覚えているだけでなく、あなたが誰であるかのモデルも構築しているということです。あなたの好み、コミュニケーションスタイル、目標を追跡し続けます。基本的にユーザーの好みに対して強化学習を行うんです。これらすべてが次のタスク実行にフィードバックされます。

彼らの主張は、長く使えば使うほど、あなた特有のワークフローに対してより優れたものになるということです。では、個人AIという概念全体を本当に始めたOpen Clawのようなものと比較してどうでしょうか。これらは同じ問題を解決しようとしている、まったく異なる2つの哲学だと言えるでしょう。

Hermes Agentの場合、この学習要素を伴うエージェントループが第一で、スキルをその場で自動作成します。また、非常に異なるメモリシステムを使用しています。でも両方とも独自の位置を持っていると思います。しかし、Hermes Agentを特別なものにしている何かがあります。それは自己改善コンポーネントだけでなく、APIプロバイダーに関して馬を持っていないということだと思います。

モデル非依存性の利点

Open Clawはオープンソースプロジェクトです。しかし、現在の作成者はOpenAIで働いており、Anthropicのモデルに関してはかなり強い意見を持っています。Anthropicには独自のClaude Co-workがあり、これはOpen Clawの代替競合のようなものです。GeminiもGemini agentsに取り組んでいます。しかし、それぞれがベンダーロックインや特定のモデルへの好みを何らかの形で持っています。

Hermes Agentに関しては、本当にモデルに依存せず、オープンモデルとの連携が優れています。これは、現在最もトレンドになっているコーディングエージェントであるOpen Routerのデータから明らかです。そして生産性アプリのトークン使用量という点では、Open Clawのすぐ後ろにいます。Open Routerのデータから、実際に人々がHermes Agentを多数の異なるモデル、オープンウェイトとクローズドウェイトの両方で使用していることがわかります。

これは、どのモデルを使用するかを決定する際に役立ちます。では、Open Routerについて少し話しましょう。これはLLMのための統一インターフェースを提供する優れたプラットフォームだからです。同じAPIエンドポイントを使用して、多数の非常に信頼性の高いモデル、オープンウェイトとクローズドウェイトモデルの両方を使用できます。

開発者がアプリケーションを強化するために使用している異なるモデルが何であるかを本当に示してくれるランキングも気に入っています。これらのLLMの上に構築している場合、素晴らしい洞察になります。また、最も多くのモデルへのアクセスを完全に無料で提供しており、どのモデルを使用するかを決定する前にこれらのモデルを実験できます。

同じプロンプトで複数の異なるモデルを比較することもできるので、どのモデルがあなたのタスクに適しているかを実際に見ることができます。これは、アプリケーションのために異なるモデルのパフォーマンスの感覚をつかむのに最適です。スポンサーシップを通じてこのビデオを可能にしてくれたOpen Routerに心から感謝します。

セットアップと初期設定

Hermes AgentでOpen Routerを使用する方法を後で紹介します。でも、まず、ローカルマシンでHermes Agentをセットアップする方法を紹介します。これは、Hermes Agentに関する一連のビデオの最初のビデオになります。異なる機能を探求し、基本的にシステムを使用しながら自分自身の学びを共有したいと思っています。

ローカルシステムにインストールするために、これが必要な唯一のコマンドです。さて、Mac OSで実行していますが、これで基本的に必要なものすべてがインストールされます。インストールしたら、Hermesで開始できます。でもセットアッププロセスを実行したい場合は、ここでHermes setupを実行できます。

いくつかの異なるオプションがあります。クイックセットアップは、欠けているアイテムのみを設定します。フルセットアップがあり、これは基本的にすべてを再設定します。そして、モデルとプロバイダーがあります。ここでプロバイダーを選択できます。Open Routerを使用します。これにより100以上のモデルへのアクセスが得られ、使用した分だけ支払うことになります。

サブスクリプションサービスに支払うわけではありません。これをセットアップするには、Open RouterからAPIキーを取得する必要があります。アカウントに移動し、新しいAPIキーを作成して、有効期限を設定できます。では、APIキーを作成しましょう。さて、APIキーを設定したので、Hermes Agentで使用したいモデルを選択できます。

Open Routerはたくさんの異なるモデルへのアクセスを提供します。素晴らしいのは、ニーズに応じてモデルを切り替えられることです。では、適度な価格のモデル、Qwen 3.6のようなもので始めましょう。より複雑なタスクには、Opusを使用します。

Open Routerは、オープンウェイトとクローズドウェイトモデルの両方の本当に良い組み合わせを提供します。だから、さらに別の統合を心配することなく、特定のユースケースに適したモデルを実際に確認できます。Hermes Agent内の素晴らしい機能があります。特定のレート制限がある場合、APIキーをフォールバックおよびローテーションする機能を提供します。

現時点では、それは必要ないので、ノーと言います。音声合成と音声認識システムを設定できます。現時点ではデフォルトで行きます。また、ツール呼び出しに関して、エージェントの最大反復回数を設定できるので、ここでもデフォルトで行きます。

ツール呼び出しを行うときに正確に何が起こっているかの可視性を提供するので、それを行います。また、独自のコンテキスト圧縮を設定する機能も提供します。再びデフォルトで行きます。必要に応じて設定できることがたくさんあります。

ツールと実践的な使用

ここで、APIキーや接続性を提供することにより、エージェントがアクセスできるさまざまなツールを設定できます。これには、ブラウザ自動化、ターミナルアクセス、ファイル操作が含まれます。異なるメモリシステムを使用したい場合は、それを使用できます。探索したいことがたくさんあります。でも現時点では、シンプルな設定を確認したいだけで、必要に応じてこれらのものを使用します。

さて、準備が整いました。Hermes Agent自体を起動します。これが表示されるインターフェースです。利用可能なすべてのスキルがリストされ、現在使用しているエージェント、または現在使用しているモデルが表示されます。実用的な例を示すために、既存のプロジェクトの1つでコードレビューに使用します。

これはより個人的なエージェントであるはずですが、繰り返し使用でどれだけ優れたものになるかを見たいと思います。既存のコードベースを見て、現在の実装について徹底的なコードレビューを行うというようなことを言います。これはGemini 1.5 Proを使用します。インターフェースがどのように見えるかをお見せしたいと思います。今、それらを探しているさまざまなツールを使用しています。

潜在的に使用できるコードレビュースキルがあります。そしてプロセスにおいて非常に透明性があります。取るすべてのステップを示します。また、エージェントが使用している現在のコンテキストウィンドウの表示方法も本当に気に入っています。さて、エージェントを使用して包括的なコードレビューを行いました。でも、GitHubにプッシュする前に、すべての機能実装についてコードレビューを行いたいと言いました。

ここでメモリシステムを更新しており、ユーザープロファイルも更新されました。独自のメモリシステムについて尋ねました。私についてどのタイプのユーザープロファイルを持っているか教えてもらえますか。これまでに正確に何を持っているか見てみましょう。現在、このGemini 4とSegment Anythingベースのビデオ認識実装に取り組んでいます。これが書き留めたことです。

これは、それと行った以前の会話のいくつかに基づいていると思います。エージェントとともに作業するにつれて、ユーザープロファイルを更新しているようです。これは本当に興味深いです。はい、エージェントをますます使用するにつれて、これを見直し続けます。それが私とともにどのように進化するかを見たいと思います。さて、このプロジェクトがどのように機能するかを紹介します。

アプリケーション開発の実例

これが私が構築しているアプリです。この場合、基本的にビデオをアップロードします。Geminiモデルを使用してビデオに何があるかを把握し、追跡するオブジェクトを識別します。そして、Segment AnythingモデルをGeminiモデルが指示するものを正確にセグメント化するために使用します。そして、それらのオブジェクトを追跡するために追跡モデルを使用します。現時点では、このUIデザインが本当に好きではありません。Gemini 1.5を使用しています。

どのタイプのデザインスキルが利用可能かを尋ねました。以前、これらの1つをインストールしました。これは基本的に、さまざまなウェブサイトから抽出された54の本番品質デザインシステムへのアクセスを提供します。そして、デザインコンサルテーションに関するものがもう1つあります。UIを実装したい場合、デザインスキルを持つClaude Opus 4.5のようなモデルに切り替えるか、Gemini 3.1 Proに切り替えます。

Open Routerには、単一のモデルセレクタースイッチでこれらすべてのモデルがあります。だから、さらに別のAPIプロバイダーを心配する必要はありません。Opus 4.5に切り替えましたが、今では単純にOpusに、人気のあるウェブデザインスキルを使用してLinearのスタイルでこのウェブアプリケーションを再デザインするように伝えることができます。

さて、それを今インスピレーションとして使用します。異なるモデルを持つサブエージェントを作成できますが、素晴らしいのは、特定のタスクでもモデル間を切り替えられることです。より高度な推論タスクには、より高価なより知的なモデルを使用します。そして、よりシンプルなタスクには、同じAPIエンドポイントへのより安価なモデルの1つを使用するだけです。

コストとパフォーマンスの最適化

さて、これが作成したUIです。確かにLinearのテーマに従っていると思いますが、バナーは少し作業が必要かもしれません。これらのエージェントシステムを使用する際の非常に重要なことは、使用するモデルの選択です。このシンプルなワークフローで約14ドルを費やしました。約500万トークンを使用しました。

その大部分はOpusから来ています。だから高価になります。これにより、消費またはコストがどこに向かっているかについて、非常に詳細で透明性の高い概要が得られます。これを使用して、特定のアプリケーションにとってコスト効率の良いモデルがどれかを把握できます。Hermes Agentには現在、使用できるUIがありません。

Open Clawには、エージェントとチャットできるコントロールセンターのようなものがあります。現在はターミナルのみですが、UIがかなり早く登場すると思います。とにかく、これはこのエージェントがどのように機能するか、開始方法の簡単な概要でした。これに関して多くのコンテンツを作成するつもりです。興味があれば、チャンネルを購読してください。

とにかく、このビデオが役に立ったことを願っています。視聴していただきありがとうございました。そしていつものように、次回お会いしましょう。

コメント

タイトルとURLをコピーしました