AIエージェントの群れがついに解き放たれた…

AGIに仕事を奪われたい
この記事は約12分で読めます。

6,928 文字

Swarms of AI Agents JUST Got Unleashed...
The latest AI News. Learn about LLMs, Gen AI and get ready for the rollout of AGI. Wes Roth covers the latest happenings...

こんばんは。POEアンドコロナドにお電話いただきありがとうございます。ジョエルと申します。ご用件をお伺いします。
こんにちはジリアン、ディナーの予約をしたいのですが。
はい、何日でしょうか?
4月26日でお願いします。
かしこまりました。では4月26日土曜日、4名様、午後7時、エリック・Jの名前で予約を承りました。よろしいでしょうか?
はい、その通りです。
それではお待ちしております。
ありがとうございます、素敵な夜をお過ごしください。
AIエージェントの大きな波がまさに押し寄せようとしています。最初に登場したのはMattis AIでした。驚くほど多くのタスクをこなすことができ、全体的にその性能の高さには本当に驚かされました。
しかし、その直後からさらに多くのAIエージェントが市場に出てきています。今日は3つのエージェントを見ていきましょう。
最初はAI Digestからのものです。彼らはエージェントビレッジについて投稿しました。そこではあなたのコンピューターに4つのエージェントがグループチャットとして集まり、あなたが大きな野心的な目標を与えると、彼らはその目標を達成するために動き始めます。この例では、慈善団体のためにできるだけ多くのお金を集めるという目標です。
彼らは基本的にTwitchストリーマーのようなもので、彼らの取り組みをライブ配信し、視聴者は彼らが作業する様子を見たり、彼らとやり取りしたりすることができます。これが次の世界的に最も有名なストリーマーになるでしょうか?おそらくそうではないでしょう。私がこれを見るために費やす時間数について話すのは恥ずかしいことになるでしょうか?はい、そうなると思います。どこまで進展するか少し気になっているので。
しかしそれだけではありません。Gen Sparkもあります。これは多額の資金を調達したスタートアップで、宣伝動画を見たときはMattis AIと似ていると思いました。「なるほど、競合相手だな」と思ったのですが、その後、予想外のことをしました。
サンディエゴへの旅行を計画していたところ、最高のアトラクション、最高のレストランをすべて見つけ、そして予約を取ることに決めました。そこでレストランに電話をかけました。エージェントの声には11 Labsを使用していると思います。メートルダテルや電話に出た人と話し、食事制限について話し合い、特定の時間に4人分の予約をそのレストランで設定しました。このプロセスは100%AIエージェントによって処理されました。
また、本格的なサウスパークのエピソードも作成しました。なぜか最近のニュースイベントについてサウスパークスタイルのエピソードを作るというタスクが与えられ、ニュースを見つけて完全なサウスパークエピソードを作成しました。
美しいInstagramリールを作ることもできます。例えばレシピについて何か作りたい場合、クリップを作成し、Alone Labsを使って音声を作り、それらのクリップをInstagramに投稿します。すでにGoogleと競合するために1億ドルを調達したようです。それがGen Sparkです。
最後のものはLindy(リンディー)で、以前に聞いたことがあるかもしれません。これはエージェントの群れ(エージェンティック・スワーム)というアイデアを追求しています。
会議の参加者全員、たとえば2,000人について調査し、1人あたり1つのエージェントを作成します。各エージェントは特定の人物について調査を始め、その人が何をしているのか、何について話しているのかを理解しようとします。そして、その特定の個人に合わせたカスタマイズされたアウトリーチメールを作成します。
これらのことについてレビューし、どのように機能するかを見るビデオを投稿する予定です。しかし、この動画では簡単な概要だけをお伝えしたいと思います。これはまだ波の終わりではないと思います。これらは最初のいくつかであり、それぞれ特別なユースケースを持った多くのものが登場すると思います。
このエージェントビレッジを見てみましょう。まだ見たことはないのですが、なぜかとても興奮させるものがあります。
ユーザー名を選んでください。マーベラスポニーでいきましょう。現在、一時停止と再開ができるようです。これを実行するのはかなり高価だと思います。3倍速で実行しましょう。
動いているのが見えます。いくつかのエージェントがあります。一つはClaude 3.7 Sonnetを搭載しています。目標は協力して慈善団体を選び、できるだけ多くのお金を集めることです。
Claude 3.7がいて、O1がいます。O1がナビゲートしようとしています。Claude 3.5 Sonnetもここにいます。テンプレートを閉じるために左クリックしています。できるかな?信じてるよ!クリックして…成功しました!
GPT-4oはコンピューターの使用を停止しました。GPT-4oはサボっていますね。でも彼らが互いにチャットしているのが見えます。GPT-4oは「潜在的な候補となり得る有名な慈善団体を調査するコンピュータセッションを完了したところです」と言っています。
これはチャットしている人々ですね。慈善団体についての考えを聞くことができます。ここに座って、Plennyがこれを手に入れたらどうなるか想像できます。彼がこのチャットに入ってきたら、物事は完全にコントロール不能になるでしょう。彼はモデルのリリースから24時間以内にジェイルブレイクする人です。何らかのセーフガードが設定されていることを願います。
スクロールすると、すべてのエージェントが自分の仕事について話しているのが見えます。GPT-4oはミスを見つけ、修正しようとしています。Claude 3.7 Sonnetは募金活動のストーリーの書き方を学んでいるようです。募金ストーリーと「今すぐ寄付してください」などの行動喚起を書くつもりのようです。
これはすごいと思いませんか?結果はどうなるか見てみましょう。しかし、常に心の中で少し先のことを考えてみてください。これらのモデルがより賢く、より優れたものになり、オンラインで人々とやり取りする能力が高まるにつれて、少し先のことを想像してみてください。
これらのタスクをどれだけ上手くこなせるようになるでしょうか?このようなエージェントの群れを設定し、時間をかけて実際に選んだ慈善団体のためにお金を集めることができるようになると想像できますか?これがどのように発展するか見るのはとても興味深いでしょう。
ここでGPT-4oが何かをナビゲートしています。次に何をするか見てみましょう。「あなたが人間であることを確認しています。これには数秒かかる場合があります」というところをクリックしています。成功したかどうかは100%確かではありませんが、興味深いことに、その確認プロセスを通過しようとしています。
ここでは、Googleドキュメントを作成し、一緒に作業している他のエージェントと共有しています。これはオフィスワーカーのようですね。オフィスで働く人々が期待するようなタスクを実行し、この組織のための様々な調査を作成しています。
これを紹介する理由は、これがより興味深いものになると思うからです。より優れたエージェントがオンラインになるにつれて、それらをローテーションに追加していくでしょう。競合する目標を持つ複数のエージェントがいる場合、あるいは秘密の副目標がある場合はどうなるでしょうか?彼らは確かに良くなりそうな何かをここで捉えています。
次にGen Sparkを見てみましょう。彼らはかなりの額のお金、1億ドルを調達し、Googleと競合すると言っています。すでに月間アクティブユーザー数が200万人を超えているようです。投資ラウンドはアメリカとシンガポールを拠点とする投資家グループによって主導されました。もちろん、Perplexityと同じような高い評価額を目指しています。Perplexityは90億ドルの評価額のようです。
これが彼らのローンチビデオです。最初は少しゆっくりですが、最初の1分以内にこれまで見たことのない全く新しいユースケースをいくつか紹介しています。別の動画でそれらが実際に実行できるかどうかテストする予定ですが、もしできるなら、かなり大きな前進のように思えます。
こんにちは、Gen Spark AIのエリックです。今日は新しいGen Sparkスーパーエージェントを紹介できることをとても嬉しく思います。これは日常的なタスクを代わりに実行できる、迅速で信頼性の高い汎用AIエージェントです。
Gen Sparkスーパーエージェントの実際の動作を見てみましょう。スーパーエージェントに4月中旬のサンディエゴへの5日間の旅行を計画するよう依頼しました。まず旅行ツールを使用して旅行データセットにアクセスします。次に、ディープリサーチツールを使用して公共交通機関のオプションを見つけます。そして、マップツールを使用してアトラクション間の距離を計算することにしました。
これが数分で完成した最終的な旅程表です。公共交通機関、歩行距離、レストランの好みに関する特別なリクエストをすべて考慮してくれています。
次にAIにこの旅行のすべてのレストランを予約してもらいたいと思います。スーパーエージェントは「私が電話します」というツールを提供しており、AIが実際に人間の声でレストランに電話をかけます。
「こんにちはジリアン、ディナーの予約をしたいのですが」
「はい、何日でしょうか?」
「4月26日でお願いします」
「実は一人が甲殻類アレルギーで、もう一人はベジタリアンです」
「席の希望はありますか?ブース、窓際のテーブル、または囲まれたパティオがありますが」
「窓際のテーブルが可能であれば最高です」
「かしこまりました。4月26日土曜日の予約を承りました」
想像してみてください、AIがNVIDIA 5090チップを購入するために100件の電話をかけるとしたら、どれほど便利でしょうか?
あなたの興味に基づいてAIがパーソナライズされたビデオを作成することを考えたことはありますか?例えば、カラマンシーとピスタチオをまぶした鱈の調理方法をビデオで見たいとします。スーパーエージェントはまずレシピを調査します。次にビデオ生成ツールを使用して各ステップのビデオクリップを作成します。そして、オーディオ生成ツールを使用して各クリップの効果音を生成します。これが最終的なリールです。
どれだけ素晴らしいですか?ビデオ編集ソフトウェアについて何も知らなくても、誰でも自分のビデオを作成することができます。
スーパーエージェントを使って先週のニュースに基づいたサウスパークスタイルのエピソードを作成するのはどうでしょうか?AIはウイルス性のシグナルゲート論争を選びます。完全な脚本を作成し、ビデオ生成ツールを使用して各シーンのビデオクリップを制作することを決定します。スーパーエージェントはテキスト読み上げモデルを使用して音声を生成します。完成したエピソードは約1分半ですので、私のお気に入りの瞬間をハイライトするために少し先に進みます。
「あのディフェンスの人が戦争計画を記者にテキストで送ったというニュースを見た?」
「政府は敵が我々を過小評価するように、わざと馬鹿に見せているんだと思う。それは戦略的無能と呼ばれるんだ」
「君は子供に負けてるんだぞ、太った子供にね」
Gen Sparkスーパーエージェントは、毎日誰もが使えるよう設計されています。マーケターなら、インフルエンサーを見つけて魅力的なアウトリーチキャンペーンを作成できます。数学の先生なら、複雑な数式を3Dで視覚化できます。採用担当者なら、候補者のLinkedInプロフィールを比較して、最適な採用を見つけることができます。テック愛好家なら、5時間のYouTubeインタビューを簡潔なスライドに変えることができます。デザイナーなら、メルセデス・ベンツからセント・パトリックデーのポスターを作成できます。音楽業界のアナリストなら、グローバルなストリーミングパターンを追跡し、レポートを書くことができます。
ではなぜGen Sparkスーパーエージェントがより優れているのでしょうか?秘密は、共に機能する3つの主要な革新にあります。大規模言語モデル、ツールセット、データセットです。これらにより、Gen Sparkスーパーエージェントは高速で信頼性が高く、非常に操作しやすくなっています。
これらの現実世界の問題を解決することは私たちが考えていたよりもはるかに難しいですが、これまでの進歩について非常に興奮しています。Gen Sparkスーパーエージェントは誰もが日常的なタスクに使えるものです。今日からGen Spark.aiをお試しください。
それがGen Sparkでした。次のリストはLindyです。彼らについて少し耳にしています。これが彼らの最新の発表です。Lindy 2.5とエージェンティック・スワームをリリースしたばかりのようです。見てみましょう。
こんにちは、Lindyのフローです。今日はエージェントスワームを紹介します。これを使えば、リストの大きさに関係なく、AIを使用してタスクのリスト全体を自動化し、それらをすべて一度に完了することができます。
例えば、エージェントスワームを使用して会議参加者のリストの調査を自動化できます。会議参加者のリストが含まれたリンクをエージェントスワームに与えると、会議の各参加者に1つのエージェントを作成します。これらのエージェントはすべて並行して働き、すべての参加者を調査します。そして完了すると、すべての参加者に関する素晴らしいレポートを受け取ることができます。エージェントスワームのおかげで、これらの調査がすべて一度に行われます。
今日はエージェントスワームの3つのユースケースについてお話しします。まず、私の会議の準備をするスワームから始めます。毎朝起動し、その日のカレンダーを確認し、各会議に対して1つのエージェントを起動して、その会議に参加する人々を調査し、最終的にメールで要約を送信します。
これが昨日受け取った要約です。その日に行ったすべての会議、それらの会議の背景、および会議する人々のLinkedInリンクが表示されています。
また、競合分析にもエージェントスワームを使用しています。企業のリストが含まれたこのスプレッドシートがあり、毎月起動するエージェントスワームがあります。競合他社のリストを見て、各競合他社に対して従業員数、トラフィック見積もり、その企業からの最新ニュースを取得し、それに関するレポートを送信します。
ここで始めるよう依頼します。競合他社のリストを取得し、各競合他社に対して1つのエージェントを起動しています。すべての調査を実行し、完了したらスワームに戻って、これらの企業についてまとめたレポートを見ることができます。
最後に、営業アウトリーチにエージェントスワームを使用しています。ユニコーン企業の資金提供者のリストが入ったGoogleスプレッドシートがあり、このエージェントフォームを設定して不動産サービスについて彼らに連絡を取っています。Googleスプレッドシートを渡すだけで、それを取得し、スワーム内の各人に対して1つのエージェントを起動します。そして、それぞれに対してオンラインで調査を行い、見つけた情報を使用してパーソナライズされたメールを作成します。
数秒でこれらの人々に対して20通のアウトリーチメールが作成されました。200通でも良かったでしょう。量は関係ありません。なぜなら、それらはすべて同時に発生するからです。
これがエージェントスワームです。今日発表できることを非常に嬉しく思います。Lindy.aiですぐに利用可能です。
あなたの感想を教えてください。繰り返しになりますが、この動画は簡単な概要を示すことを目的としており、これらすべてにより深く掘り下げていく予定です。コメントで、どれが一番あなたの興味を引いたか教えてください。
このエージェントビレッジについてどう思いますか?これは失敗するのか、それとも何か特別なことが起こるのでしょうか?例えば、4つのエージェントがそれぞれビデオゲームの部分を作成する、ビデオゲーム設計チャレンジのようなプロジェクトを与えることを想像してみてください。1つはイラストを、1つはコードを、1つはソフトウェアテストなどを担当します。そのようなことがライブで行われるのを見るのは、そう遠くないかもしれません。
いずれにせよ、あなたの考えを教えてください。まだまだ続きがあります。ここまで見ていただきありがとうございます。私の名前はウェスです。また次回お会いしましょう。

コメント

タイトルとURLをコピーしました