この100%ミニマルなAIエージェントはなんだってこなせます…まあ見ていてください

AIエージェント
この記事は約29分で読めます。

本動画は、究極にミニマルで高度なカスタマイズ性を持つAIエージェント「Pi」について解説したものである。読み取り、書き込み、編集、bashというわずか4つの基本ツールのみを搭載し、無駄を徹底的に省いた設計が特徴である。動画内では、Piエージェントの導入方法や設定手順、他のエージェントとの違い、さらには独自のUIや拡張機能を追加するカスタマイズの具体例が紹介されており、開発者が自身のニーズに合わせた専用のAIエージェントを構築するための実践的なガイドとなっている。

Pi Agent - The Only REAL OpenClaw Competitor
Try Openrouter today: learn how to code with AI? Go here: me on Instagram - ...

最も過小評価されているAIツール「Piエージェント」の真実

Piはおそらく、現在世に出ているAIツールの中で最も過小評価されている存在かもしれません。さて、Piエージェントとは一体何なのでしょうか。これは、OpenClawをはじめとする、今最も人気のある多くのプロジェクトを裏で支えているハーネスなのです。そしてPiは、スーパーカスタマイズが可能であるため、現在のすべてのパワーユーザーたちが実際に動かしているエージェントでもあります。ですので、この動画では、なぜPiエージェントがそれほどまでに重要なのか、実際のセットアップ方法、そして他のどのエージェントよりも強力なものにする方法についてご説明します。

究極のミニマリズム:4つのツールだけで動く仕組み

まずは、Piエージェントの根底にあるコアなアイデアについてお話ししましょう。最大のテーマは、AIエージェントとして可能な限り最もミニマルなバージョンを作ることでした。つまり、文字通り「読み取り」「書き込み」「編集」「bash」という4つの組み込みツールしか持っていないということです。これによって無駄なシステムが一切なくなり、システムプロンプトも非常にコンパクトになっています。余計なナンセンスは全くありません。これにより、皆様のあらゆるユースケースに合わせてPiエージェントをカスタマイズし、真に自分だけのものにすることができるのです。

先ほども触れましたが、世界で最も人気のあるAIエージェントであるOpenClawは、文字通りこのPiの上に構築されています。それなのに、ほとんどの人はPiエージェントのことを聞いたことすらありません。世間がPiの存在に全く気づいていない一方で、本物のプレイヤーたちは何が起きているのかをちゃんと理解しています。OpenClawは大衆向けですよね。誰もが使えるように、使いやすく、始めやすいように設計されています。しかしPiは、常に最先端にいたいと考える人々のためのものです。

例えば、ShopifyのCEO兼創設者であり、100億ドルの資産を持つトビー・リュトケは、Piをメインのアシスタントとして使用しています。彼は一晩でShopifyの速度を53%も向上させるためにPiを活用し、今では彼のメインのコーディングエージェントであり、パーソナルエージェントとなっています。また、Mosaicウェブブラウザの発明者であり、テクノロジー界全体で見ても最も重要な人物の一人であり、VC業界で最も成功した投資家の一人であるマーク・アンドリーセンは、これを歴史上トップ10に入るソフトウェアのブレイクスルーだと呼びました。

ですから、Piエージェントは本当にすごいものなのです。真面目な話、皆様もPiをマスターするための時間をしっかりと確保するべきです。実際に10分間座って、この動画でお見せする手順に従っていただければ、AIの分野において99.9%の人々の一歩先を行くことができるでしょう。

セキュリティ制限のない圧倒的なパワー

ただし、気をつけていただきたいことがあります。Piは常にYOLOモード(自己責任モード)で動作するからです。つまり、権限の問題も、事前のチェックも、ガードレールも一切ありません。Piはただ自分がやりたいことをそのまま実行します。Piエージェントの創設者であるマリオ・ゼヒナーが言うように、もしエージェントがコードを書いて実行できるのであれば、セキュリティプロンプトなど無意味なのです。

ですから、Piにはプロンプトによる防御機能のようなものは一切組み込まれていません。エージェントに純粋なパワーだけを与えているのです。これはつまり、Piエージェントが初心者向けではないことを意味しています。AIの最先端に立ちたいと願い、自分に最も適した、自分がやりたいどんな仕事にも最高に対応できる自分だけのパーソナルエージェントを構築することに本気で取り組んでいる人のためのツールなのです。

さて、根本的なミニマリズムこそがPiエージェントの哲学です。例えば、システムプロンプト全体でも1,000トークン未満しかありません。これがどれほど異常なことかピンとこない方は、例えばHermesエージェントを見てみてください。様々なツールや自己構築スキルが搭載されているため、デフォルトのシステムプロンプトだけで12,000トークンを超えています。

それに対してPiは超ミニマルで、超無駄のない設計です。これがPiの美しさなのです。わずか4つのツールしかありませんが、皆様が想像するあらゆることを実行するために、エージェントに必要なのはこれだけなのです。それがカスタマイズ性を高め、最も強力なビルダーや起業家、億万長者、プログラマーたちがデフォルトのAIエージェントとしてPiを使う理由になっています。

Piエージェントを構成する4つの基本ツール

それでは、最初のツールである「読み取り」ツールについてお話ししましょう。シンプルですが、非常に美しいツールです。このツールにより、エージェントは皆様のコンピュータ上の任意のファイルや、特定のフォルダで実行している場合はその特定のフォルダを開いて読み取ることができます。そして、これがエージェントの学習方法となります。ログを読んだり、設定を確認したり、あらゆるテキストファイルをターミナルから調べたりすることができます。

つまり、読み取りツールはターミナルで実行できるもう一つのツールなのです。この読み取りツールがなければ、エージェントは目隠しをされた状態になります。皆様のコンピュータに何があるのか分かりませんし、何がインストールされているのか、コードのどこが壊れているのかも分かりません。単に盲目的に動作することになってしまいます。

2つ目のツールは「書き込み」ツールです。これは非常に分かりやすいですね。エージェントがディスク上に新しいファイルを作成できるようにするものです。そして、これがエージェントが仕事を進める方法になります。例えば、認証機能付きのREST APIを作成するよう指示すると、ルート、ミドルウェア、設定など、すべてのファイルを書き出してくれます。

ここで皆様はこう思われるかもしれません。わかったよデイビッド、でもPiエージェントがそれほどシンプルなら、本当に何かができるの?と。では、人々がこれで何を構築しているのか、いくつかの例をお見せしましょう。ある開発者は、デスクトップアプリのUIに満足していませんでした。そこで彼はPiエージェントを使って、自分が使っている多くの異なるアプリのカスタムUIをデザインし始めました。繰り返しますが、これもPiとターミナルUIを活用して構築された、完全にカスタムされたアプリの全体像なのです。

Piエージェントのバックエンド構造と強み

なぜこれほど多くの人がPiの上にシステムを構築しているのかをより深く理解していただくために、バックエンドの仕組みをお見せしましょう。Piは基本的に、AIエージェントの上に何かを構築するためのツールキットを提供してくれます。もちろん、Piそのものを完全なエージェントとして使うこともできますし、私自身もそのように使っています。しかし、エージェントファーストのアプリケーションを構築したい場合は、Piをツールキットとして使うことができるのです。

まず1つ目に、pi-tuiという名前のターミナルUIライブラリを提供してくれます。これは、マークダウンの表示、マルチラインエディタ、ローディングスピナー、ちらつきのない画面更新などを可能にします。これはClaude Codeがいまだに持っていない機能ですね。そして、これがターミナル内ですべてを美しく見せるためのビジュアルレイヤーとなります。

次に、Piコーディングエージェントです。これは、ターミナルでPiを実行する際に多くの人が使用するもので、コーディングに特化しています。これについても、Claude CodeやOpenClawとどう違うのかを含め、後ほど設定方法をお見せします。

そして、PIエージェントコアがあります。これがエージェントの頭脳であり、カスタムツールの定義を可能にします。エージェントがLLMを呼び出し、ツールを実行し、結果をフィードバックして、タスクが完了するまでこれを繰り返します。これは純粋なエージェントのロジックであり、どのツールを使うかについて特定の意見を押し付けることはありません。

4つ目にPiが提供してくれるのが、pi-llmです。これは、Anthropicであれ、OpenAIであれ、Googleであれ、その他のどんなモデルであれ、単一のAPIを通じてすべてのLLMにアクセスできる統合インターフェースです。これら4つの理由が、多くの人々が自分のアプリをPiの上に構築している理由です。

別の例をお見せしましょう。ある方は、わずか5分以内で自分専用の完全なDeepResearchエージェントをPiの上に構築しました。Perplexityがこういった機能に月額200ドルを請求していることを考えると、これは本当にすごいことです。

残りのツールとOpenClawとの違い

Piエージェントに搭載されている3つ目のツールは「編集」ツールです。これにより、Piは既存のファイルに変更を加えることができます。編集ツールがなければ、Piは新しいファイルを作成することしかできず、当然ながらそれを編集する方法が必要になります。だからこそこのツールが存在するのです。例えば、42行目のログインのバグを修正してと指示すると、その行と、その前後数行だけを触り、ファイル全体をリファクタリングするようなことはしません。何百行ものコードを書き直す必要はなく、編集が必要な箇所だけを編集します。

そして、4つ目のツールが「bash」ツールです。これが最も強力なツールとなります。Piにターミナルコマンドを実行させ、パッケージのインストール、テストの実行、サーバーの起動、Gitのステータス確認など、皆様がターミナルで打ち込むあらゆることを可能にします。他の3つのツールがファイルを処理するのに対し、bashはそれ以外のすべてを処理するわけです。だからこそ、Piエージェントはたった4つのツールだけで信じられないほど強力なのです。

さて、ここで疑問に思われるかもしれません。デイビッド、なぜOpenClawじゃないの?すでにOpenClawをセットアップしている人もいるだろうに、なぜわざわざPiエージェントを試す必要があるの?と。

まず第一に、徹底的なミニマリズムという哲学があります。OpenClawはその上に大規模なプロダクトレイヤーを被せています。ですから、まったくの初心者であれば、それは良いことかもしれません。しかし、カスタマイズして自分専用のものにしたり、その上に何かを構築したりしたい場合は、無駄な部分が多すぎるのです。

また、Piを使えば完全な透明性とコントロールが得られます。すべてが公開されており、抽象化のレイヤーの裏に隠されているものは何もありません。Piでは、パッケージ全体、エージェント全体をコントロールすることができ、隠されたものや変更が困難な隠しプロンプトなども一切ありません。Piを使うことで、誰か他人のエージェントではなく、皆様自身のエージェントを構築することができるのです。もしOpenClawを使うなら、ピーター・スタインバーガーの好みをすべて受け入れることになります。それが自分に合っていれば良いですが、そうでない場合もありますからね。

コーディングスキルを飛躍させるためのご案内

少しだけお時間をください。もし3週間でAIコーディングをマスターしたいとお考えなら、ぜひ新しいソサエティに参加してください。新しいトレーニングを公開したばかりで、これを使えば文字通り全くの初心者でも、これからお見せするような初期状態から、3週間以内に想像するあらゆるものを構築できるレベルまでAIコーディングをマスターすることができます。

こちらが新しいモジュールです。第1週目だけでこれだけのことを学びます。私は本気で言っていますが、これがAIコーディングを学ぶ最も簡単な方法です。想像したものを何でも構築し、それをカスタムソフトウェアにするスキルを身につけたい方は、ぜひ新しいソサエティにご参加ください。

実際、これからの6日間は月額37ドルという割引価格でご提供しています。これは新しいソサエティの歴史上、過去最安値です。6日後には月額77ドルに値上がりしてしまいます。ですので、3週間以内でコーディングをマスターしたい方は、動画の下のリンクからぜひご参加ください。

Piエージェントのインストールと初期設定

それでは、皆様専用のPiエージェントのセットアップ方法をお見せしましょう。公式のウェブサイトは pi.dev で、Piエージェント全体と同様に非常にミニマルな作りになっており、文字通り1クリックのコマンドが用意されています。ですので、pi.dev にアクセスし、このコマンドをコピーしてターミナルに貼り付け、Enterキーを押してください。これにより、マシン全体にPiがグローバルにインストールされます。

Piが正常にインストールされたか確認するには、pi -v と入力するだけで特定のバージョンが表示されるはずです。しかし、ここで一つ問題があります。私が pi と入力するとエージェントが起動しますが、皆様の場合はプロバイダーもAPIキーも設定していないため、エージェントは起動しません。実は、この2つがPiにおいて最も難しい部分なのです。

これはトレードオフだと理解していただく必要があります。OpenClawはこれを簡単にしていますが、同時に多くの不要な機能も持ち合わせています。使いやすさを追求すれば、必然的に多くの不必要なトークンが含まれることになります。だからこそOpenClawを使うと、メッセージを送るたびに1万2千から1万6千トークンを送信することになり、その分の費用を支払うことになるのです。もしGPT-4oやClaude Sonnetのような高性能モデルを使っていたら、決して安くはありません。OpenClawが重いというだけで、皆様はサム・アルトマンやダリオ・アモデイといった大企業に毎回お金を払っているようなものです。

Piではそんなことはありません。非常にミニマルで最適化されています。ただし、セットアップは少し複雑になります。ですから、これからその方法をお見せします。あと60秒だけお付き合いいただければ、すぐに使えるようになりますよ。

毎回の手間を省く環境構築

Piをインストールしてバージョンを確認し、問題がないことが分かりました。次に、2つのことを行う必要があります。毎回実行する手間を省くために、デフォルトのプロバイダーを設定する必要があります。そうしないと、Piエージェントを実行するたびに、いちいちカスタムパラメータを設定するようなコマンドを入力しなければならず、単にpiという2文字を打ち込むのに比べて非常に不便です。

私は皆様に、私の環境のようにできるだけシンプルにしていただきたいのです。私の環境はとても美しく、piと入力するだけですべてのスキルが読み込まれ、やあと声をかければ即座に起動して状況を把握してくれます。モデルも選択されていて、OpenRouter経由で動いています。モデルの切り替えも簡単ですし、ターミナルセッションのたびにAPIキーをエクスポートする必要もありません。本当に美しく便利で、超簡単で素晴らしい環境です。今からその環境を手に入れる方法をお見せします。

インストールした直後のデフォルトの状態では、Piはすべてのターミナルセッションで毎回設定を強制してきます。毎回APIキーをエクスポートし、プロバイダーをOpenRouterに設定し、モデルも指定しなければなりません。Piはそれを記憶してくれないからです。そこで、Piにこれらの設定を記憶させる方法をお教えします。

実は、この一連の作業を一つのプロンプトにまとめました。動画の下にリンクを貼っておきます。これはGitHubのGistで、コピーして皆様がすでにインストールしているClaude Codeや他のエージェントに渡すだけで、代わりに手順を実行してくれます。もちろん、ご自身で手順に沿って進めていただいても構いません。

まず、piの設定ディレクトリを作成する必要があります。ここにコピー&ペーストできるターミナルコマンドがあります。次に、OpenRouterのAPIキーを auth.json ファイルに保存します。OpenRouterのAPIキーの取得方法をお見せしましょう。まず openrouter.ai にアクセスしてください。このリンクも動画の下に貼っておきます。右上でログインするか、アカウントを作成してください。超簡単で完全無料ですし、20秒ほどで終わります。

次に設定に進み、左側にあるクレジットをクリックします。ここで少しクレジットをチャージする必要があります。私のように167ドルも入れる必要はありません。私は自分のすべてのエージェントを動かすために、OpenRouterに月に何千ドルも費やしているだけですから。皆様は5ドルか10ドルくらいチャージすれば十分です。APIの価格設定の素晴らしいところは、使用したトークンの分だけ支払えばよいという点です。ですから、数ドルチャージすることをお勧めします。

APIキーの取得と設定の自動化

チャージができたら、左上のAPIキーをクリックしてください。ここでキーを取得します。右上にある作成という青い大きなボタンをクリックし、PI agent YouTube subscribeのように名前を入力してください。もしこの動画をご覧になっていて、Piエージェントのような高度なAIツールに関する動画をもっと見たいと思っていただけたら、ぜひチャンネル登録をお願いします。

私と私のチームは、何を使うべきか、何がそうでないかを見極めるために、リサーチをしたり、Twitterをスクロールしたり、様々なツールをテストしたりするのに膨大な時間を費やしています。皆様が1つの動画を見る裏では、実際には使い物にならないと判断してボツにしたAIツールが5つから10個はあると思ってください。

世間の多くがOpenClawのようなメインストリームのAIエージェントのことしか語らず、本当のAIの最先端について教えてくれない中で、皆様自身がもっと賢くなるためにこういった情報をYouTubeのフィードに流したい方、そして完全無料で私をサポートしたいと思っていただける方は、ぜひチャンネル登録をお願いします。繰り返しますが完全無料ですし、動画の下から登録できます。現在、視聴者の25%しか登録してくださっていませんので、せめて30%に届けば本当に励みになります。ありがとうございます。

さて、次のステップはオプションですが、私はAPIキーにクレジットの利用枠の上限を設定するのが好きです。もしキーが漏洩した場合に備えて、10ドルや20ドルといった上限を設けておくと安心です。そしてAPIキーをコピーします。完璧です。Gistに戻りましょう。これも動画の下にリンクがあるので簡単に追えますよ。

正直に言って最高なのは、AIエージェントを使って別のAIエージェントをセットアップすることです。冗談で言っているわけではありません。私が以前、Clawdbotについての最初の動画を出したとき、VPS内でデバッグするのにClaude Codeを使いました。当時はバグだらけで、いろいろと問題が起きていたからです。これは単なるネットのネタではなく、本当に正しいやり方なのです。

ですので、皆様に強くお勧めしたいのは、権限を危険な状態までスキップする、つまり自己責任モードでClaude Codeを実行する設定にして、Claude CodeにPiエージェントのセットアップを手伝わせることです。すでにインストールされているCodexや他のエージェントでも同じことができます。もしエージェントを一つも持っていない場合は、私が用意した手順にそのまま従ってください。そのために1つの場所にまとめておいたのですから。

私が初めてPiエージェントを使ったときのように、皆様が何分もかけて理解に苦しむ必要はありません。私も最初は、なぜ毎回プロバイダーを設定しなければならないんだ?なぜ毎回APIキーをエクスポートしなければならないんだ?もっといい方法はないのか?と思っていました。はい、もっといい方法があります。この手順に従うだけです。

とにかく、もしClaude Codeを使っているなら、ここのRawをクリックして全体をコピーし、Claude Codeに切り替えてこれらの手順を実行してと指示してください。あるいは、危険なモードで実行しているために安全に行きたい場合は、まだ何も変更しないで。ただ、私のPiエージェントのセットアップ手順として、以下のステップが実装されているか確認してと言って、あの巨大なGistを貼り付けます。そして再度まだ変更しないで。これを調べて、超簡潔に答えてと指示します。

さあ、見てください。皆様、これが未来ですよ。AIエージェント同士が連携するのです。高速モードを使うと、私が文を言い終わる前に、Claude Codeがもうレポートを返してくれました。すべてのステップが実装されていますとね。私はすでに実行済みなのでそう出ますが、初めて行う場合は未実装と出るはずです。その場合は、Claude Code、Claude Sonnet、Codexなどを使ってセットアップを手伝ってもらうことを強くお勧めします。

モデルの選択とグローバルプロンプトの設定

さて、変更すべき点の1つにデフォルトモデルの設定があります。デフォルトでは特定のモデルに設定されていますが、当然もっと良いものを使いたいですよね。理想的にはAnthropicのClaude Sonnetか、お金を節約したい場合は少し軽いモデルを選ぶのも良いでしょう。中国製のモデルも価格効率の面で驚異的です。本当に強力なパワーが欲しくて、かつアメリカのホスティングモデルを使いたいなら、OpenAIのGPT-4o miniは素晴らしい選択肢です。正直驚くべき性能ですし、1秒あたり100トークン近く出ます。バランスを求めるなら、AnthropicのClaude Sonnetシリーズをお勧めします。ハイエンドモデルほど高くなく、それでも非常に強力です。

とりあえずモデルを設定したとしましょう。ターミナルで設定のモデルはこれになっているか?と聞いて確認できます。もしClaude Codeが間違った方向に進みそうなら、Escキーを押して中断できます。はい、モデルはちゃんと設定されていますね。

それではPiエージェントのセットアップを続けましょう。これが終わったら、Ctrl+CでClaude Codeを終了し、piと打ち込むだけでPiエージェントが立ち上がるはずです。やあ、君は誰?と聞けば、やあデイビッド、調子はどう?私はPiエージェント、強力で拡張可能なAIコーディングエージェントです。ファイルの読み込み、コマンドの実行、コードの実行、新規ファイルの作成、そして専門スキルの実行を通じてあなたをサポートします。何か必要なことはありますか?と返してくれます。今、私たちはPiエージェントと直接話しているわけです。

さて、ここでagents.mdファイルに基づいているという表示にお気づきかもしれません。しかしデフォルトでは、Piにagents.mdファイルは付属していません。実のところ、これが最初にセットアップすべき最も重要なものなのです。これはPiエージェントとのすべてのセッションに影響を与えるグローバルなシステムプロンプトです。これからその設定方法をお見せします。

Ctrl+Cを押してPiのセッションを終了させます。ターミナルで上矢印キーを押して最近実行したコマンドを呼び出し(これはプロのテクニックです)、再び権限確認をスキップするモードでClaude Codeを起動します。そしてClaude Codeにこれをデバッグさせましょう。Piエージェントのセットアップ用にagents.mdファイルがあるか確認してと指示します。変更はしないで、短く答えてと。

皆様、これこそが文字通りのやり方です。秘密でも何でもありません。あるAIエージェントを使って別のエージェントをセットアップするのです。はい、セットアップされていますと返ってきましたね。私はすでに設定済みだからですが、場所は ~/.py/agent/agents.md です。ご覧の通り、私の情報が少し入っていて、さらにプロジェクトごとの指示もあります。5つの異なるリポジトリにそれぞれagents.mdファイルがある状態です。もしagents.mdファイルがない場合は、この場所に作成する必要があります。

これについても、今の動画の画面をスクリーンショットで撮って、Claude Codeに貼り付け、このファイルを作成して、基本的な指示を入れておいてと頼めばいいのです。その後はご自身で自由にカスタマイズできます。agents.mdファイルの目的は、皆様が望む通りにカスタム指示を出すことです。例えば指示がない限りTypeScriptを使うこと、許可を求めず、とにかく実行することなどです。Piの場合は許可の概念があまり必要ないかもしれませんが、要点は伝わるかと思います。

要するに、皆様自身の好みやルールをここに書き込むのです。英語ではなくドイツ語で返答してほしい、長文のほうがいい、すべて小文字にしてほしい、もっと感情的でサポートしてくれる口調がいい、いや、もっと冷淡でロボットのような答えがいいなど、人それぞれ好みは違いますし、それこそがPiの真骨頂なのです。

Piエージェントの自己改修能力とUIカスタマイズ

これが完了したら、ついにPiエージェントのテストを開始し、エージェント自身に変更や改善を行わせることができます。皆様が信じられないほどのレベルでこれをやってのけます。Claude Codeは自分自身のUIを変更できませんし、Codexも自身のUIを変更できません。しかしPiエージェントなら、完全にそれが可能なのです。

そこで、Piのためにマトリックス風のテーマを作成するプロンプトを用意しました。これにより、Piが自分自身のインターフェースを更新し、UIを再設計できるという自己更新の特性をお見せします。

見てください、エージェントは自分自身について読み取り、何をすべきか把握し、設定とユーザーインターフェースの一部を置き換えようとしています。繰り返し強調しますが、Claude Codeでは絶対にこんなことはできません。Claude CodeはUIの自己更新を許可していません。AnthropicがUIの見た目を決めているからです。Codexも同様で、OpenAIがUIを決めています。しかしPiエージェントの目的は、自分だけのエージェントを作ることです。ターミナルのユーザーインターフェースの見た目を変更したいと思えば、それは完全に可能なのです。

これらの変更が適用されたら、/reload というコマンドを1つ実行します。私はこのコマンドが大好きです。他のすべてのエージェントにも導入されるべきですね。新しいターミナルやセッションを起動する代わりに、ただ /reload と打つだけでエージェントが再読み込みされ、すべての設定が適用されるのですから。

さあ、このマトリックス風のテーマがどうなったか見てみましょう。ちなみに、チャット入力欄の下には、コンテキストウィンドウのパーセンテージ、現在のセッションのコスト、使用中のモデル、そして推論にかかっている負荷など、非常に役立つ情報がクリーンな形で表示されています。これも、他のすべてのエージェントが採用してほしいと思うほど素晴らしい機能です。エージェントが何をしているのか、現在のセッションがどれくらいコストがかかっているのかが一目でわかります。

今回は高性能なモデルを使用しているのでコストもかかりますが、バランスを求めるならAnthropicのモデルあたりから始めることをお勧めします。もっと安く済ませたいなら、OpenAIの軽量モデルや新しい中国製モデル、あるいは小規模ですがGemmaなども良いでしょう。Grokなども驚くほど優秀で、公平に見て素晴らしい出来です。イーロン・マスクが私のツイートをリツイートしてくれたのもそのためかもしれません。

さて、処理が終わったようです。リロードしてみましょう。ドーン!見てください。Piエージェントのユーザーインターフェースを完全に変更してしまいました。Claude CodeやCodexでは絶対にできないことです。しかしPiなら、たった1つのプロンプトでこれが可能なのです。もちろん、これはアニメーション的な遊び心のあるテーマですが、少しでも想像力があれば、これがどのように活用できるかお分かりいただけるでしょう。Piを皆様の好みに合わせて更新し、インターフェースを変え、ツールを変え、新しいスキルを与え、システムプロンプトを変更することができます。Piには最初から組み込まれた偏見や押し付けがましい意見は一切ありません。

システム監視拡張機能の追加とツリー機能

これはほんの第一歩にすぎません。さらに一歩進めてみましょう。これをさらに改善して、ハッカースタイルのシステム監視を表示する拡張機能を構築してと指示します。CPU、RAM、GPUの負荷など、AIエージェントを使用している間に役立つかもしれない現在のシステム情報を表示させるようにします。これをPi自身に更新させ、完了したら /reload して変更を適用します。

エージェントが自分でリロードしようとしていますが、できるかどうか分からないので、私が自分でリロードします。リロード。ドーン!またしても見てください。現在のシステム情報が表示されたシステムモニターが完成しました。エージェントを使いながら、RAM、負荷、温度、ディスクの状態などをリアルタイムで確認できます。私のMacBookの実際のデータが動いているわけです。

もちろん、このユースケースが皆様全員にとって関連性があるわけではありませんし、アニメーションが少しバカバカしくて実用的ではないかもしれませんが、重要なのは、私がこれをたった2つのプロンプトで作ったということです。こんなことができるエージェントが他にあるでしょうか?Piはわずか4つのツールと1,000トークンのプロンプトという超ミニマルな状態で提供され、それを皆様が望むどんな形にも構築できるのです。

たとえそれがバカバカしいハッカーテーマでなくても、Piを自分の好きなようにアップデートし、どんなユースケースにもカスタムされたUIの操作感にするのがいかに簡単か、お分かりいただけたと思います。Piエージェントの8つのユースケースのような動画を作って、これが実際に何に使えるのかをさらに深く掘り下げるのもいいかもしれませんね。とりあえず今は、皆様の想像力を働かせてみてください。

ちなみに、これを元に戻したい場合、すべてのファイルは /extensions フォルダと themes フォルダに保存されています。ですので、これらを削除したい場合はPiに指示を出せば、変更を元に戻してくれます。気に入らないテーマや拡張機能を作ってしまったときは、いつでもPiエージェントに削除させて無効化できます。そしてリロードすれば、デフォルトのクリーンなインターフェースに戻ります。ほら、この通りです。ですから、何かを台無しにしてしまうのではないかと恐れる必要はありません。

次に紹介したいPi内の機能は、/tree コマンドです。これにより、新しいセッションツリーを作成できます。例えば、ある機能を作っている最中に何かが壊れたとします。ツールに問題があったり、テーマを変えたくなったり、新しいスキルを追加したくなったりした時などです。そんな時にツリーを開始します。1本の太い幹が育っていて、そこから枝分かれしていく様子を想像してください。メインのブランチを汚す代わりに、別のブランチでその問題を解決できるのです。

/tree と入力するとインターフェースが開き、どのメッセージから枝分かれさせたいかを選択できます。最新のものか、あるいは少し前のものか。そしてEnterを押すとツリーが作成されます。すでにこのポイントにいますと表示された場合は、少し前に戻って選択し直します。すべてのステップには、皆様のメッセージだけでなく、アシスタントのメッセージも記録されています。userは常に皆様で、assistantはAIエージェントです。これはAIモデルの学習における標準的な形式ですね。

例えば、ここに戻って要約するか要約しないかを選びます。要約しないを選ぶと、ドーン!私たちは今、新しいツリーの中にいて、メインのブランチに影響を与えることなく別の作業を続けることができます。

/tree コマンドを簡単に理解するなら、AIとの会話における元に戻すとブランチングの機能だと思ってください。ほとんどのAIチャットボットやエージェントは直線的で、前後にやり取りはできても同じ一直線上にとどまります。そのため、変更を加えたい場合は、コンテキストウィンドウを汚すか、エージェントに知る必要のない情報を教えなければなりません。

Piの場合はツリー構造になっています。機能を構築していて別のバグが発生した時、メインの会話を脱線させてそのバグの話をするのではなく、/tree で戻ってブランチを分け、バグを修正してからメインブランチに戻ることができます。Piはサイドブランチで何が起きたかをスーパーコンテキストで要約してくれます。コンテキストは常にツリーのメインブランチに保たれるのです。

フォーク機能、セッションの継続、そして拡張パッケージ

次に不可欠なコマンドは /fork です。会話に戻って /fork を実行すると、前のメッセージから新しいフォークを作成します。ここでの会話は非常に短いですが、まったく別のセッションにフォークすることができます。1つのセッション内ではすべてがツリー構造ですが、異なるセッションを持つことができるのです。

任意のポイントでフォークしたい時、これはGitHubリポジトリをフォークするのと同じです。良いリポジトリがあって、このプロジェクトが進んでいる方向性は好きじゃないけど、基盤はとても気に入っている。ここに組み込まれているものは素晴らしいと思った時にフォークしますよね。オープンソースのコーディングエージェント界隈でも、ClineからRoo Codeが生まれ、さらにそこから別のプロジェクトがフォークされたのと同じように、Piの会話のコンテキスト内でもそれが可能なのです。

もう1つの便利なコマンドは -c パラメータです。最後に開始したのと同じセッションを継続したい場合は、単に pi -c と入力します。Piを終了して普通に pi と入力すると、当然新しいセッションが始まり、そこには何もありません。しかし、前回のセッションの続きから始めたい場合は pi -c と入力すれば、直前に話していたセッションが開きます。

これは私が最も頻繁に使うショートカットコマンドで、文字通り pi -c という2文字のパラメータで前回の会話を続けるという意味になります。コンテキストがゼロのまっさらなセッションを始めたい時もありますし、前回の中断したところから続けたい時もあるので、その場合は単に c を付けます。

ちなみに、すべてのセッションは自動的に ~/.py/agent/sessions ディレクトリに保存されます。手動で特定のセッションを選びたい場合は、pi -r または -res と入力すれば、過去のすべてのセッションを閲覧して1つを選ぶことができます。

また、pi.dev/packages にアクセスすると、Piエージェント用の最も人気のあるすべてのパッケージを1か所で見つけることができます。ここには、オープンソースコミュニティから提供された拡張機能、スキル、テーマなどが含まれています。デフォルトではダウンロード数順に並んでおり、なぜかpi pom pomが最も人気があるようですね。次にpi sub agents拡張機能があり、これはサブエージェントへのタスク委譲、並列実行、明確化などを可能にするものです。

OpenClawやHermesなどのエージェントには最初から組み込まれている機能もありますが、もし必要なければ、それらはシステムやプロンプトを無駄に圧迫しているだけです。他にも、curlリクエストにAPI認証情報を注入するツールや、Piの並列タスク実行をオーケストレーションするツールなどもあります。これを見てください。ダッシュボード、レーン、タスクを管理するオーケストレーターで、Piエージェント用に設計された非常に興味深い見た目をしています。

繰り返しますが、Piエージェントの最も人気のあるパッケージを見たい場合は pi.dev/packages にアクセスしてください。これも面白いですね。Piエージェント用のPi studio extensionです。なんと、スクリーンショットをペイントスタジオで編集できる機能です。皆様、これ見てください。これらの興味深いパッケージのいくつかについては、まるまる1本の動画を作る必要があるかもしれません。もしPiエージェントに関するコンテンツをもっと見たい場合は、下にコメントを残し、必ずチャンネル登録をしてください。この動画から多くの人が登録してくれたのを見れば、皆様がPiについての動画をもっと見たいのだという非常に強いシグナルになります。

もう1つ、デザイン決定を視覚的に行うためのdesign deckというPi拡張機能もあります。これはブラウザでマルチスライドデッキを開き、各オプションのライブプレビューを表示します。比較し、選択し、さらに多くのオプションを生成できます。UIや色を設計・構築する際に、様々な選択肢を提示してくれるのです。これはやばいですね。動画を見てみましょう。

ウェブアプリのUIやスタイルの選択肢をデモンストレーションしています。まず好きな色を選ぶか、どれも気に入らなければ別のオプションを生成できます。ピンク色を生成しましたね。そしてピンクを選択し、次はタイポグラフィ、そしてナビゲーションパターンを選びます。皆様、これがこれからのモノづくりの未来です。自分の頭の中からすべてをゼロから生成するのではなく、オプションを選択していくことで自分のテイストが洗練されていきます。もし良いオプションがなければ生成し直せばいいのです。これは本当に強力です。

今度はデザインデッキを作成しています。セキュリティモデル、ダッシュボードの美学、データ視覚化スタイルなど、必要なオプションを選択するだけで、それに基づいたアプリが構築されていきます。本当に、本当にかっこいいですね。

おわりに:AIコーディングをマスターするための招待

あ、もう1つ。shittycodingagent.ai というドメインを見かけても驚かないでください。これは pi.dev の創設者たちのジョークです。最初、私はこれがフィッシングサイトのドメインかと思いましたが、ちゃんとした正規のドメインだということが分かりました。それでも、Piエージェントをインストールしたい場合は pi.dev に行くことをお勧めしますが、もしそのふざけた名前のドメインを見ても、フィッシングリンクではないので怖がらないでください。

というわけで、もし皆様がAIに真剣に取り組んでおり、AIコーディングをマスターしたいとお考えなら、ぜひ新しいソサエティにご参加ください。最初の3週間で、たとえ完全な初心者であっても、これまで何も構築したことがなく、コーディングエージェントを一度も使ったことがなくても、AIを使ってあらゆるものを構築する方法を学びます。

このモジュールごとの概要を見てください。すべてのモジュールで新しいことを学び、前回の内容の上に積み上げていきます。1つ数分のモジュールなので、セットアップの方法やツールの使い方、アプリのデプロイ方法などのリソースに従えば、誰でもついていくことができます。これが第1週目です。

第2週目ではさらに踏み込みます。第2週目の計画はこちらです。Claude Codeの改善方法、限界の思い込みを壊すこと、ターミナルの基礎、そして簡単な英語を打ち込むだけでカスタムソフトウェアを構築するために必要なすべてのこと。3週間でコーディングをマスターしたい方は、ぜひソサエティにご参加ください。

繰り返しますが、価格は過去最高の条件です。私たちは多くの新しいコンテンツを刷新し、リリースに向けて準備を進めています。実際、今から6日後には月額77ドルに値上がりします。ですから、今が参加する絶好のタイミングです。3週間でコーディングをマスターしたい方は、下のリンクをクリックして新しいソサエティに今すぐご参加ください。

コメント

タイトルとURLをコピーしました