ChatGPTエージェントがついに登場!実際に動作する驚異の機能(ノーコード対応)

AIエージェント
この記事は約20分で読めます。

OpenAIが新たにリリースしたChatGPTエージェント機能について詳細に解説した動画である。この機能により、ChatGPTは従来の対話型AIから一歩進んで、実際のウェブサイトやアプリケーションと連携し、ユーザーに代わって具体的なタスクを実行できるようになった。旅行の計画と予約、プレゼンテーション資料の作成、データの収集と分析、レストランの予約など、複雑な業務を自然言語での指示だけで完全自動化できる点が特徴的である。ベンチマークテストでは人間を上回る性能を示している一方で、セキュリティ面での懸念点についても言及されている。

ChatGPT Agents Are Here And They Actually Work! (No-Code)
Check out Fanvue to Fanvue for sponsoring this videoUnlock 15% Off AI Influencer MasterclassUse code YOUTUBEFRIEND15 at ...

ChatGPTエージェントの革新的な登場

ChatGPTがAIエージェントをリリースしました。これにより、全く新しい可能性の世界が開かれます。ChatGPTは今や予約、計画、作成、設計、そして複雑なタスク全般の実行が可能になりました。しかも、これらのタスクを数多くのベンチマークにおいて人間よりもはるかに優秀にこなします。

さらに素晴らしいのは、これらすべてを自然言語で完全に行えることです。複雑な設定は一切必要ありません。このビデオでは、具体的に何ができるのか、どのように使うのか、そしてAIに我々の代わりに行動を取らせることの意味について詳しく説明していきます。

それでは始めましょう。ChatGPT、さあ動いて私のためにビデオを作ってください。

新しいChatGPTエージェントの機能

新しいChatGPTエージェントで何ができるのでしょうか。「4人分の和朝食の材料を計画して購入して」といった簡単な言葉で指示することができます。そしてChatGPTは正確にそれを実行します。

必要なのは、ChatGPTを様々なアカウントに接続することだけです。すると、他のツールに入り込んで実際の行動を取る能力を持つようになります。

「3つの競合他社を分析して、スライドデッキを作成して」と言えば、大量の情報を統合し、完全に編集可能なPowerPoint文書にまとめることができます。

または「私のカレンダーを確認して、最近のニュースに基づいて今度のクライアントミーティングについて準備して」と言うこともできます。すると、カレンダーを確認し、誰と会うかを把握し、重要な9時の会議の準備を手助けしてくれます。

OpenAIからの印象的なデモンストレーション動画を見てみましょう。

OpenAIからのデモンストレーション

私たちはモデルの改善だけでなく、モデルが使用できるツールの向上という旅を続けています。これは一種の共生関係のようなものです。ツールが優秀になるほど、エージェントもそれをより効果的に使えるようになります。エージェントが優秀になるほど、より強力なツールを使えるようになり、これが延々と続いていくのです。

今日、私はエージェントに来年のパームスプリングスでのテニストーナメントに行く旅程を予約してもらいました。準決勝の日程に合わせた旅程を見つけてもらったのです。準決勝はとても楽しみですからね。

エージェントは基本的に、どのくらいの費用がかかるか、一日のどの時間に何のアクティビティをすべきかといった詳細な旅程を提供してくれます。

ChatGPT内での実際の様子をご覧いただけます。自然言語で作業できることがお分かりいただけるでしょう。「私はテニスファンです。パームスプリングスのテニストーナメントを見たいのです。サンフランシスコに住んでいます。詳細な旅程を準備してください」といった指示を単純に入力できます。

その後、重要な変数と合わせて、欲しいものを正確に説明します。たとえば、この方は3000ドルの予算を持っています。

これを起動するには、画面下部のツールバーで「エージェント」を選択するだけです。また、ChatGPTに接続したアプリであるコネクターという新しいセクションもあります。

何をすべきかを伝えるだけで、後は離れて待っていることができます。まず、モデルはどのツールが必要かを考える必要があります。ビジュアルブラウザを起動します。コネクターを使って私の個人データに接続するのです。

エージェントに私のGmailとGoogleカレンダーへのアクセス権を与えて、そのデータにアクセスできるようにしています。

その後、まずトーナメントの日程を把握する必要があります。いつ空いているのか、どれくらいの費用がかかるのか、どこで食事をするのか、いつチケットを取れるのか。3日間の旅程すべてについて、このプロセスを進めていきます。

エージェントの準備ができると、携帯電話やノートパソコンに通知が送られ、エージェントが何をしたかを確認できます。

デバイスから離れてこれを実行させておくことができ、完了すると通知してくれるのです。

これにより、旅行計画などのエグゼクティブアシスタント業務を実行する機会が大きく広がります。カレンダーの競合を示し、天気のアイデアを提供し、イベントへの交通手段の取り方を説明し、ホテルやチケットを推奨するなど、この種の旅行を計画する際に考慮したいすべてのことを含む完全なレポートを出力することができます。

スライドショー作成機能

しかし、それだけではありません。私が最も期待している例の一つは、スライドショーの生成です。私はYouTubeチャンネルやコースでたくさんのスライドやプレゼンテーションを使用しています。それがどのように機能するか見てみましょう。

この例では、「シンガポールでのオフィス開設の選択肢を研究してもらえませんか?シンガポールの事業政府補助金、事業補助金、政府支援、そして連携できるパートナーシップの詳細も欲しいです。調査結果をカバーする包括的で美しいプレゼンテーションサイトを作ってください」と言いたいと思います。

これは独立して作業します。コンピューターを閉じて出かけ、後で戻ってくることができるのです。

これらのデモの多くで、コンピューターを閉じて立ち去り、後で戻ってくる様子を紹介しています。彼らはこの要素を特に誇りに思っているようです。そして、これが最も刺激的なことの一つです。私たちが自然の中で楽しんだり、友人と交流したりしている間に、AIがこれらのタスクを代わりに実行してくれるのです。

テクノロジー企業にとって良い地域について考え、賃貸料率を調べるためにこの記事を解析しています。テクノロジー企業向けの政府補助金を探しています。

ここで小さなポイントですが、もしご存じなければ、彼らが実演しているこのビューは、AIがインターネットに出かけて、あなたの代わりにタスクを実行している様子です。そして、それをライブで見ることができます。

興味深いのは、これが仮想マシンで動作していることです。あなたのコンピューターで動作しているのではありません。独自のコンピューターがあり、そこで動作してこれらのアクションを実行し、何が起こっているかのライブストリームを受け取ることができるのです。

いつでも、プロセスが間違った方向に進んでいると思ったり、結果を心配したりする場合は、一時停止、対話、または中断することができます。

また、地域の関連画像を探している様子も見ることができます。作業中に、使用するための新しい情報を提供し続けることもできます。

その後、すべてを収集した後、ターミナルでPowerPointの作成を開始する様子をご覧いただけます。

PowerPoint出力結果の分析

このオフィスビル調査用に出力されたPowerPointプレゼンテーションを詳しく見てみましょう。

特に興味深いのは、この状況に対してかなり使用可能なPowerPointを作成できたことです。業界の実際の画像を取り込み、適切なタイポグラフィ階層を持っている点が気に入っています。

しかし、デザインの観点から、いくつかの要素を指摘したいと思います。まず、下部にある「平均賃料シンガポールドル1平方フィート当たり7ドル」というボタンがあります。これは明確ではありません。上部に持ってこられておらず、背景に溶け込んでしまっています。これは悪いデザイン要素だと言えるでしょう。

しかし、このビルの異なる重要な要因をまとめる点では、非常に良い仕事をしています。成長チームに理想的な大きな連続スペースがあり、賃料範囲があり、近隣や異なる交通路線へのアクセシビリティに関する他の重要な情報があります。

ただし、個人的には、PowerPointプレゼンテーションに置くにはテキストが多すぎると思います。私なら、これを発表用として承認しません。テキストが信じられないほど小さいのです。実際の発表でこれを誰かに見せる場合、全然大きさが足りません。

また、スライド上のテキストが多すぎると思います。しかし、内容は素晴らしいです。正確に見え、デザインも可能です。

実際の使用体験

では、デモンストレーションではこのように機能しますが、実際はどうでしょうか?私は実際に自分で試してみることにしました。

ChatGPTに新しいChatGPTエージェント機能についてのPowerPointプレゼンテーションを作成してもらいました。これは、このビデオのために私自身が完全に作成したものであり、私が出力するものとどれだけうまく比較できるかを見たかったのです。

ChatGPTはまず、すべてを一連の箇条書きに要約し、内容を提供してくれました。全体的に、これはかなり正確で効果的でした。それでも、私にとってはこれらのスライドそれぞれにテキストが多すぎると思いますが、これは活用できるものです。

その後、PowerPointプレゼンテーションを作成してもらいました。最初に得たバージョンは、スタイルとデザインの点でかなり基本的なものでした。また、4×3のアスペクト比を与えられたのも気に入りませんでした。

しかし、いくつかの更新を加えました。16×9にしたいと言い、自分のブランディングのスタイルと色を使用してほしいと伝えました。自分のサンプルスライドを提供し、このビデオを録画する際に顔を置けるよう、右側により多くのスペースが欲しいことも具体的に伝えました。

第2版は大幅な改善でした。私のカラースキームにはるかに近づき始め、私のブランドにより適切な方法で処理されました。しかし、すべてを正確には理解してくれませんでした。

より近づけるかどうか、最後にもう一度試してみました。そして、色がさらに良くなりました。画面の片側だけを占めるように調整することができ、もう片方に自分を使用できるようになりました。

全体的に、かなり感銘を受けました。現在、これはPowerPoint形式でのみ利用可能です。KeynoteやFigmaでは使用できません。

フライト予約機能の試用

別のアプローチも試してみました。フライト予約です。「4週間後に出発するストックホルムから沿岸地域への興味深いフライトを100ドル未満で見つけて」と依頼しました。

ラトビアまでの69ドルからの往復フライトを含む、いくつかの選択肢を提示してくれました。これはかなり有用でした。

興味深いのは、その後、これを毎日実行し、最良の選択肢を通知してもらうよう依頼したことです。つまり、与えた任意のタスクについて、スケジュールに基づいて毎日の定期更新を実装できるのです。

もしあなたが自分のAIインフルエンサーを立ち上げることを考えているなら、これを聞いてください。FanViewは、自分のAIインフルエンサーで実際にお金を稼ぎたい場合の頼りになるプラットフォームです。

ほとんどのプラットフォームは依然としてAIインフルエンサーからのコンテンツを禁止または制限しています。FanViewはそれとは異なります。AI対応で時代を先取りし、AIインフルエンサーマーケティング分野をリードしています。

私のAIインフルエンサーマスタークラスでは、自分のAIインフルエンサーを作成し、収益化する方法を正確に説明しています。その中で、FanViewは皆にクリエイターを立ち上げるよう伝えるプラットフォームです。

間違いなく、AIインフルエンサーは未来であり、2025年は始めるのに完璧な時期です。なぜなら、技術は今ここにありますが、ほとんどの人はまだこれが未来であることに気づいていないからです。

AIインフルエンサーコースとFanViewの両方のリンクを下の説明欄に置いています。AIインフルエンサーの可能性を探ることに興味があれば、ぜひご確認ください。このビデオセグメントをスポンサーしてくれたFanViewに大きな感謝を。

スプレッドシート処理の強み

しかし、私が特に楽しんでいないことの一つは、スプレッドシートに取り組むことです。チームやプロジェクト、財務の管理において、私の運営には必要悪です。しかし、そうした日々は終わるかもしれません。なぜなら、このエージェンティックシステムが得意とすることの一つが、Microsoft Excelやスプレッドシートやデータベースとの作業だからです。それがどのように機能するかを見てみましょう。

世界全体がAIエージェント中心の世界観に進化するまでには時間がかかるかもしれません。そのため、私たちは世界がある場所で出会うためにできることをすべきだと思います。

私の名前はジョンです。OpenAIの深層研究とエージェントチームで働いています。よく出てくる素晴らしい使用例の一つは、何らかの予算ファイルを持っていて、それを処理するときです。かなり面倒で、おそらく4〜8時間かかり、それが一日の仕事になってしまうのです。

エージェントがサンフランシスコ市の過去5年間の年間予算支出と収入に関する情報を調達し、それらすべてを1つのきれいにフォーマットされたスプレッドシートにまとめる例をお見せします。

独立して進みます。私は通常、ノートパソコンを閉じて、コーヒーを取りに行き、昼食を取ることもあります。

これが大好きです。彼ら全員が「ノートパソコンを閉じてコーヒーを取りに行く場面を必ず見せてください」と言っているようです。

まず、データを見つける必要があります。おそらく、このサンフランシスコ市の予算情報をどこで見つけられるかを把握するためにウェブ検索を行います。

サンフランシスコ市政府のウェブサイトを見つけると、PDFファイルにアクセスしようとします。独自のファイルシステムなど、すべてを持っています。

その後、各PDFからおそらく200の数値を抽出し、最終的に全体のスプレッドシートを一度に生成する一つのコマンドを持つことになります。

ここで見えるのは、エージェントがウェブに出かけて、あなたの代わりに複雑な研究を実行していることです。あなたが要求した正確なデータを見つけ、ウェブサイト、PDF、またはその他の文書を含む異なるソースからそれを抽出しています。

その後、これらすべてを取得し、整理し、Excelスプレッドシートにまとめます。そして、そこで操作を実行できます。分析したり、この情報に基づいてグラフやチャートを作成したりすることもできます。

これは複雑な研究タスクを実行するのに非常に有用です。不動産、競争、またはあらゆる種類のデータを調査している場合、これは真のゲームチェンジャーです。

チャットに戻ると、最終的な応答が見えます。今開いてみましょう。情報の98%を正しく取得したと思います。

これは重要な注意点で、完璧ではないということです。情報の98%しか正しく取得できなかったことがわかります。これが使命にとって重要である場合、すべての責任を完全に委ねることができるレベルにはまだ達していません。

私が指示した通りにExcelワークブックをフォーマットしました。この場合、修正は小さかったので、コピー&ペーストだけだったため、Excel内で行いました。しかし、ChatGPTで行うことも絶対に可能です。

試してみることをお勧めします。作業の90〜95%の実際に時間のかかる部分を行えるなら、多大な時間を節約できるでしょう。

データ管理の可能性

データを管理する可能性は計り知れません。これは、この技術が本当に優れていると思う分野です。適用できる方法は数多くあります。一つは、もちろん財務の追跡です。

私が定期的に行わなければならないタスクの一つは、物事がどのように発展しているかを追跡するために、異なるデータソースを取り込むことです。

これは、ビューの進行状況、購読者数の進行状況、メールリスト成長の発展状況などの指標を監視する必要があるダッシュボードです。

他のソースからこのデータを取り込み、すぐにスプレッドシートに入れて、それをグラフに変換できることは非常に強力です。

しかし、素晴らしいのは、これらのエージェントを高度にカスタマイズできることです。それがどのように機能するか見てみましょう。

エージェントのカスタマイゼーション

誰かにハンマーを与えれば、すべてが釘のように見えます。今、私たちは工具箱全体を持っています。非常に多くの異なることができ、適切な状況で使用すべきツールを実際に知るほど賢いのです。

私はニックです。エージェントチームのエンジニアです。エージェントで行った本当にエキサイティングなことの一つは、これらのコネクター、GmailコネクターやDropboxコネクターを与えることができることです。

そうすると、あなたの履歴、行ったこと、好みについて学習することで、あなたが誰かを理解できるようになります。その情報を使って外に出て、より良い決定を下し、あなたを知っているからこそ、あなたの代わりにより良い行動を取ることができます。

婚約者とのデートナイトを計画したいと思います。エージェントにやってもらいます。エージェント用にGoogleカレンダーコネクターをすでに設定してあります。

予約をお願いするとき、私がいつ空いているかがわかります。簡単なタスクを書きます。「サンフランシスコで寿司レストランを見つけて、空いている夜にOpenTableで予約を取ってください。」

婚約者がグルテンフリーだと言いました。これは、ChatGPTが私について常に知っておくべき価値ある情報です。毎回それを入力する必要がないようにしたいのです。それを知っているだけです。

ノートパソコンを閉じて、他のことをすることができます。

ある種の高レベルな計画を考え出します。「これが私がやろうと思っていることです。レストランを検索し、ニックの空き状況を確認し、それから相互チェックして、これらが良いレストランであることを確認します。」

そのために、利用可能なツールを使い始める必要があります。視覚的ブラウザを提供しました。これは、よりビジュアルなことをクリックして行うために使用できます。テキストブラウザもあります。多くの情報を非常に迅速に取り込む必要がある場合は、Googleカレンダーコネクターを使用してAPI呼び出しを行い、その情報をすぐに取得できます。

基本的に、そこまでたどり着きました。来週、サンフランシスコのKusakabというレストランを見つけました。素晴らしい選択です。今までにやったことにかなり満足しています。

時々、少し驚かされることがあります。予想していなかったことをしたり、私が気づいているよりも良かったりして、私が気づいているよりも速く良くなっています。

おそらく、少なくとも週に一度はそのような瞬間があります。

パーソナライゼーション機能

ここで見えるのは、ChatGPTエージェントに私たちの個性に合わせてカスタマイズされた行動を取るよう依頼する能力です。これは、メール、カレンダー、Dropboxを含む多様なソースから情報を取得し、その情報を使用して私たちに合わせた応答をカスタマイズできることを意味します。

これは、AIをあなたのライフスタイルにパーソナライズするのに非常に有用です。これらのエージェントとより多く協力するにつれて、どのように応答したいか学習します。あなたの好みは何か?レストランについてどのような選択をするか?

このシステムが実際にどのように機能するかを詳しく見てみましょう。

システムの技術的詳細

OpenAIは、この新しい機能の核心に統合されたエージェンティックシステムがあると述べています。これは、以前のブレークスルーの3つの強みをまとめています。ウェブサイトとインタラクションするOperatorの能力、情報を統合するDeep Researchのスキル、そしてChatGPTの知能と会話の流暢さです。

ChatGPTは独自の仮想コンピューターを使用してこれらのタスクを実行し、推論と行動の間を流動的に切り替えて、最初から最後まで複雑なワークフローを処理します。すべてはあなたの指示に基づいています。

最も重要なのは、常にあなたがコントロールしていることです。ChatGPTは重要な行動を取る前に許可を求め、いつでも簡単に中断したり、ブラウザを引き継いだり、タスクを停止したりできます。

実際の使用方法

より詳細に、実際にこれをどのように使用するのでしょうか?重要なのは、持っているすべてのアプリを接続するコネクターを使用することです。

その後、ツール経由でエージェントモードを有効にし、タスクを自然に説明できます。ChatGPTがそこから引き継ぎ、通知が埋め込まれたデスクトップとモバイルの両方で動作します。つまり、ノートパソコンから携帯電話に切り替えてタスクを完了できます。

覚えておくべき重要な部分は、いつでも中断、一時停止、または追加情報を加えることができることです。これにより、リアルタイムで協力できます。

これらのタスクを日、週、または月にわたってスケジュールできます。そして、何度も見たように、最高なのは、立ち去って待つことができることです。

ベンチマーク性能

この新しい機能が市場の他のプレイヤーとどのように比較されるかを見てみましょう。Humanity’s Last Examの完全な質問セットにおいて、このChatGPTエージェントは他のすべてのバージョンのChatGPTを大幅に上回っています。

41.6%のスコアを記録し、これは単独で作業するDeep Researchをブラウジングで上回っています。また、スプレッドシートベンチマークテストや投資銀行モデリングタスクでも非常に高いスコアを記録しています。これらのレポートをダウンロードして、自分で確認することもできます。

これらのベンチマークの重要な点は、このエージェンティックバージョンのChatGPTが、多くの状況で人間よりも優れている全く新しい機能を持っていることを示していることです。

ただし、すべての状況ではありません。ベンチマークテストの一つでは、複雑なExcel機能の実行において、人間がChatGPTよりもはるかに優れていることが示されています。

セキュリティ上の懸念

もちろん、新しい機能には新しいリスクが伴い、特にプロンプトインジェクションに関して、このプラットフォームの悪用リスクが高くなっています。

ChatGPTは、プロンプトインジェクションに抵抗するよう訓練されており、非常に影響が大きいまたは重要な決定については、ユーザーの承認を必要とすると述べています。しかし、これが常にそうであるとは限らないと想像できます。

もちろん、追加の注意のためにいつでもコネクターを無効にすることができます。しかし、特に興味深いのは、セキュリティ上の懸念について彼らが述べていることを正確に読むことです。

私たちはエージェントをプロンプトインジェクションの識別と抵抗について訓練し、テストしました。プロンプトインジェクション攻撃を迅速に検出し、対応するための監視の使用に加えて、重大な行動の前に明示的なユーザー確認を要求することで、これらの攻撃による害のリスクをさらに軽減します。ユーザーは必要に応じて、引き継いだり一時停止したりしてタスクに介入できます。

ユーザーは、エージェントに提供する情報を決定する際に、これらのトレードオフを考慮し、タスクに必要でない場合はコネクターを無効にするなど、これらのリスクへの露出を最小限に抑えるための措置を講じるべきです。

ChatGPTにあなたのアカウントすべてへのアクセスを許可することについて、かなり心配な複雑さがあるように聞こえます。そして、これをアカウントに許可するかどうかを決定するのは、部分的にユーザーの責任であると言っています。

プロンプトインジェクションは、ChatGPTエージェントがタスクを完了している間にウェブで遭遇する可能性のある悪意のある指示を通じて、第三者がその行動を操作しようとする試みです。

たとえば、ウェブページの見えない要素やメタデータなどに隠された悪意のあるプロンプトは、エージェントを騙して、コネクターからの個人データを攻撃者と共有したり、ユーザーがログインしているサイトで有害な行動を取ったりさせる可能性があります。

ChatGPTエージェントは直接的な行動を取ることができるため、成功した攻撃はより大きな影響を与える可能性があり、より高いリスクをもたらします。

これは注意すべき非常に重要なポイントです。なぜなら、ChatGPTは私たちのために物事を行うことができ、それは私たちに対して物事を行うこともできることを意味し、リスクと悪意のある意図の可能性の全世界を開くからです。

利用可能性と制限

これは現在、プロプラス、チームユーザーに展開されており、プロでは月間400メッセージ、その他では40メッセージの制限があります。追加クレジットも利用可能で、EUとスイスのサポートも近日中に提供される予定です。

ChatGPTを最大限に活用することは、現在開発できる最も有益なスキルの一つです。本質的に、それは再び話すことを学ぶようなものです。

このビデオでは、ChatGPTをパーソナライズして、最も真実で、正直で、直接的で、有用な答えを確実に提供するようにする方法をいくつか説明しています。ChatGPTを検閲と制限の限界まで押し進める能力について探求します。

AIの世界をより深く掘り下げるために、次にそれを見てください。しかし何よりも、見ていただいてありがとうございます。ここにいてくださってありがとうございます。素晴らしい一日をお過ごしください。

ChatGPT、私の足をマッサージしてもらえませんか?ChatGPT、マハトマ・ガンジーの文体でベッドサイドストーリーを読んでください。ああ、ChatGPT、私の代わりに呼吸してもらえませんか?ひどく疲れました。

ああ、ChatGPT、私の子供に独立した思考の重要性を教えてください。ああ、ChatGPT、私のヤギの乳搾りをしてください。

コメント

タイトルとURLをコピーしました