
4,322 文字

皆さん、OpenAIがエージェントを公開しました。これを利用するにはPythonプログラミングを使います。今日は、OpenAIのエージェントを実行するための最初の簡単なPythonプログラムを作成し、また、私たちが大好きな成功を収めているブラジル人のジョアン・モウラのCreo AIエージェントシステムと簡単に比較して、これらが本当に価値があるのか見てみましょう。
まず、いつものように「いいね」をしてくれた皆さん、チャンネル登録してくれた皆さんに感謝します。特に、このAIチャンネルを支援してくれるメンバーの皆さんに特別な感謝を。メンバーの方々はエージェントに関する独占動画にアクセスできることも忘れないでください。見逃さないようにしてくださいね、価値があります。
OpenAIは多くの新機能を発表しました。そのひとつがエージェントで、それと共にウェブ検索、ファイル内検索、コンピュータ使用のツールも公開しました。これらのツールを利用するために、彼らはかつての「swarm」というプロジェクトから更新されたエージェントを導入しました。ウェブサイト内でオンラインでログを確認できる機能もあり、エージェントが何をしているかを追跡できます。今からこれがどのように機能するのか、実際に動作するのか見てみましょう。私はまだ触ったことがないので、非常に興味があります。
まずは、このクイックチュートリアルに従って、必要なものをすべてインストールし、基本中の基本を実行していきましょう。最初のステップはインストールです。「pip install openai-agents」を実行します。これによりOpenAI自体のライブラリを含む多くのものがインストールされ、更新されます。インストールが完了しました。
次は彼らのハローワールドの例を取ってコードに入れましょう。基本的に、ここでは「agents」と「Runner」をインポートしています。ここの「Agent」の部分は、「mano」(兄弟)に変更しましょう。「あなたはマノのアシスタントです」というように。Runnerでは「run_sync」を実行し、このエージェントを実行します。「AIマノの生活について話してください」という指示を出しますが、これは実際には存在しないので、何を作り出すか見てみましょう。最終的な結果をプリントします。
実行する前に、APIキーが必要です。「from dotenv import load_dotenv」として、環境変数を読み込みます。私の環境ではすでにAPIキーが設定されているので、彼らが言っている「export OPENAI_API_KEY」は必要ありません。では実行して、これが機能するか見てみましょう。初めてなので、指を交差させましょう、何が起こるかわかりません。
ここに結果が出ました:「AIマノの生活はユニークで挑戦に満ちています。彼らは非常に献身的なデジタルアシスタントのようなもので、テクノロジーの中心に住んでいます。常に助ける準備ができており、マノたちは常に学習し、新しいことを吸収し、相談者のニーズをより良く満たすために急速に進化しています。要するに、AIマノの生活はデータに満ち、絶え間ない学習と、知性と献身をもって必要とする人々を助けるという疲れを知らない使命があります。」
皆さん、AIマノたちがすでに到着していて、OpenAIもそれを知っていることがわかりますね。
次に、このデータがどこにログされるのか確認したいです。OpenAIのプラットフォームにアクセスすると、ダッシュボードの一番上に「logs」があります。ここには「completions」と「responses」があります。以前の動画で説明したように、見るべきは「responses」で、これがOpenAIが最近導入した新機能です。ここではアクセスが表示されています。「instructions」を見ると「あなたはマノのアシスタントです」、「input」は「AIマノの生活について話してください」、「output」は私が先ほど読んだ内容です。
素晴らしいですね、機能していて、すべてがログに記録されていることがわかります。これは素晴らしいと思います。
次にステップ2に進み、小さなエージェントのオーケストレーションを作成し、もう少し高度なテストを行いましょう。彼らの提案は、歴史の教師と数学の教師という2つのエージェントを作成することです。このコードをコピーして変更しましょう。
歴史の教師:「歴史の専門家エージェント。あなたは歴史分野での助けを提供し、明確かつシンプルに説明します。」
数学の教師:「数学の専門家エージェント。あなたは数学の問題を解く手助けをし、すべてをステップバイステップで説明し、例を提供します。」
面白いのは、各エージェントに名前があり、「handoff_descriptions」があることです。これは、このエージェントが他のエージェントを呼び出して、このテキストに基づいてタスクを渡すために使用されます。
次に私たちの振り分けエージェントを作成します:「あなたは質問に応じてどのエージェントを呼び出すかを決定します」。呼び出せるのは歴史の教師と数学の教師です。
最後にRunnerを設定し、振り分けエージェントを呼び出します。「ブラジルの首都は何ですか?」と尋ねてみましょう。実行して何が起こるか見てみましょう。
「ブラジルの首都はブラジリアです。」
一見すると、通常のチャットボットの典型的な応答のように見えますが、ログを確認してみましょう。ログを更新すると、新しい会話が表示されています。彼は質問がブラジルの首都についてだと理解したようですが、アシスタント自身が答えており、他のエージェントに質問を渡していません。関数は正しく設定されているようです。
歴史の部分のアクセントを取り除いて、もう一度試してみましょう。「ブラジルの首都の歴史は何ですか?」と尋ねてみましょう。
今度はより詳細な回答がありました:「ブラジルの首都ブラジリアには魅力的でユニークな歴史があります。以下は要約です…」と長い説明が続きます。これは私たちが指定した「明確かつシンプルに説明」というガイドラインに沿っています。
ログに戻ると、機能したことが確認できます。システムは「ブラジルの首都の歴史は何ですか?」という質問を受け取り、「transfer_to_tutor_de_historia」という関数呼び出しを行いました。歴史の教師に転送されたのです。次のメッセージには、歴史の教師からの詳細な応答が含まれています。
もう一つ確認したいのは「traces」です。ここにエージェントのワークフローが記録されています。初めのマノのケースではhandoffがなく、最初の振り分けエージェントの実行でも歴史の教師に渡されなかったため、handoffもありませんでした。しかし3回目の実行では、振り分けエージェントが歴史の教師を呼び出し、handoffが行われました。
トレースをクリックすると、詳細が表示されます。応答を投稿し、歴史の教師にhandoffし、最終的に歴史の教師が回答しています。右側には完全な回答が表示されています。完璧です。
最後にもう一つ試したいことがあります。第三のエージェントを追加して、ウェブ検索を行わせましょう。「web_search_agent」を作成します。handoffの説明は「あなたはウェブ検索を行い、結果を返します」とします。そして「web_search_agent」を追加し、「web_search_tool」のインポートも追加します。
間違えてしまいました。toolsは振り分けエージェントではなく、web_search_agentに追加する必要があります。修正しました。
次の質問は「人工知能に関するウェブ上のニュースは何ですか?」としましょう。ここで期待されるのは、検索エージェントが呼び出され、検索を実行し、結果を表示することです。
素晴らしい結果が出ました。トレースで何が起こったか確認しましょう。振り分けエージェントがウェブ検索エージェントを呼び出し、handoffが行われました。応答では「最新のニュースを検索している間、お待ちください」と表示され、その後ウェブ検索を実行し、情報を返しています。
「偽画像作成におけるAIの使用」というリンクと、記事の要約、「戦争情報におけるAIに関する国連の警告」、「AIにおけるヨーロッパの協力」、「AIを使った詐欺」など、いくつかの良いニュースが表示されています。検索結果は少し変わっていますが、すべて正確に処理されています。
最も重要な質問をしそうになるところでした:これらすべての質問と検索にかかったコストはいくらでしょうか?すべての質問と検索に6セントのコストがかかりました。内訳は、ウェブ検索が4セントで最も高く、出力用のGPT-4が1セント、残りのテスト埋め込み、入力用GPT-4、ミニGPT-4などはすべて1セント未満でした。明らかに最もコストがかかっているのはウェブ検索(紫色)と出力用のGPT-4(ピンク)、入力用のGPT-4(濃いピンク)です。色で明確に誰が最もコストがかかっているかがわかります。
皆さんはどう思いますか?簡単でしたか、難しかったですか?私は非常に簡単で単純だと思いました。エージェントを使い始めるには絶好の場所です。ジョアン・モウラのCrew AIと比較すると、このエージェントシステムははるかにシンプルでコンパクトです。これには長所と短所があります。
例えば、私がやったように、時間をあまりかけずに小さなエージェントシステムを立ち上げたい場合、これは素晴らしいです。しかし、ジョアン・モウラのシステムにはより多くのフィールドや情報があり、より複雑に見えます。一方が他方を無効にするわけではありません。このエージェントの一部の機能を使うことができるでしょうし、OpenAIのこれらのツールもすぐにジョアン・モウラのシステムで利用可能になるでしょう。
テストしていないのは「computer_use」で、これはもう少し複雑だと思うので、将来の動画のために残しておきます。
以上です。コメントを残して、このシステムをテストするかどうか教えてください。チャンネルを支援したい場合はメンバーになってください。メンバーはWhatsAppグループや先行公開動画にアクセスできます。「いいね」をお願いします。ありがとう!


コメント