
5,011 文字

この業界に新しいAIエージェントが登場し、私が想像もしなかった方法でAI業界に衝撃を与えています。これは中国の企業から登場したManus AIエージェントで、彼らは「汎用AIエージェント」と呼ぶこのAIエージェントを導入しました。それはブラウザ上で様々なタスクを実行することができ、本当に効果的です。
これがAI業界に衝撃を与えている理由は、OpenAIのDeep Researchやそのオペレーターに匹敵するものだからです。そして正直なところ、様々な異なるタスクにおいて、より良いパフォーマンスを発揮しているように見えます。このビデオでは、このエージェントが何をできるのか、欠点や制限、もちろん利点なども含めて、様々な側面を紹介します。
最初に紹介するのは、このエージェントが複数のファイルを扱い、インターネット調査を行い、複数のツールを使用して、最終的に素晴らしい結論に至る使用例です。これは「履歴書のスクリーニング」と呼ばれています。
「簡単な例から始めましょう。この例では、Manusに履歴書のスクリーニングを手伝ってもらいます。10件の履歴書ドキュメントを含むZIPファイルをManusに送信しました。各Manusセッションは独自のコンピューターを持っており、人間のように働きます。まずファイルを解凍し、各履歴書をページごとに閲覧し、重要な情報をドキュメントに記録します。Manusはクラウド上で非同期で動作するため、いつでもラップトップを閉じることができ、すべてが完了するとManusが通知してくれます。もちろん、いつでもManusに新しい指示を与えることもできます。」
ここでは、さらに5つの履歴書をManusに送信しました。15件すべての履歴書を慎重に読んだ後、Manusはランキングの提案と、候補者のプロフィールおよび評価基準を補助資料として提供します。これはかなり良いですが、スプレッドシートの方が好ましいです。Manusにスプレッドシートを作成してもらいましょう。Manusは独自の知識と記憶を持っているので、次回似たようなタスクを処理する際には、すぐにスプレッドシートを提供するよう教えることができます。
この例では、Manusに調査を行ってもらいます。複数の基準に基づいてニューヨークの物件をフィルタリングする必要があります。複雑なタスクの場合、Manusはまずそれらを分解してToDoリストを作成します。Manusは安全な近隣地域についての記事を検索し、慎重に読むことから始めます。次にManusはニューヨークの中学校を調査します。そしてManusは私の予算に基づいて予算を計算するPythonプログラムを書きます。予算に基づいて、Manusは不動産ウェブサイトの物件をフィルタリングします。最後に、収集したすべての情報を組み合わせて、Manusは詳細なレポートを作成し、すべてのリソースをまとめます。
Manusエージェントがテスラ株を深く分析しているところも見られます。これについての面白いことの一つは、財務データを自動的に取得できることです。おそらく多くの異なるAPIに接続されていると思いますが、これは様々な異なるツールにアクセスでき、実際のチャットボットよりもはるかに多くのことができることが分かります。
もちろん、いつものように、これらの再生は2倍速になっています。Manus AIエージェントはOpenAIのものほど迅速ではないからですが、財務分析などの一部の分野ではより効果的であるように見えます。データを引き出し、これらのチャートを作成し、様々な異なることを分析することができます。私がこれについて気に入っていることの一つは、思考プロセスとすべての進行状況を明確に見ることができることです。
ここではすべてのデータが完成していて、金融業界にとって真に貴重なものになるでしょう。金融空間内でどのようなタスクが自動化されるのかはわかりませんが、市場の更新を探している場合など、多くの研究、特定の研究事項があることは確かです。「XYZをやってほしい」と簡単に言えるようなこのようなものは、エージェントの価値を明確に示し、基本的に多くの研究を簡単に行うことができます。特に金融空間にいる場合は、これは非常に価値のあるツールになるでしょう。
膨大なウェブサイトを閲覧してすべてのデータを取得し、それらをすべて書き留める代わりに、分析しやすいように指先で簡単にこれらの情報をすべて用意することができます。
ここには旅行保険ポリシーの比較分析がありました。エージェントが何をしているかを見ることができます。提供された旅行保険ポリシーを分析し、違いを強調し、調査し、全体的にこのエージェントが様々な異なることを行って、物事をさらに良くすることができるのが分かります。
リスト全体があり、それは本当にクールで、リストを通じて分析し、結果が必要なものであることを確認しています。前にも言ったように、これは基本的に何時間もかかることが単に数分で済むことを意味します。これはもちろん、私たちの代わりに役立つことを行うエージェントがいるため、様々な異なる業界を加速することになるでしょう。
ここではすべての情報、すべての方法論を手に入れ、私たちが時間をかける必要がある何分の一かで重要な洞察を提供することができます。ほとんどの人が実現していないこのような多くのタスクは、実際に大量の時間を要します。
Manus AIエージェントができた別のことは、リードを取得することでした。これは特にビジネス空間で調査を行っている人々にとって非常に価値があると思います。リードの取得は、多くのビジネスが苦労する最も困難なことの一つです。今やビジネスはこのAIツールからリードを潜在的に取得することができ、多くの異なるウェブサイトをスクレイピングしてメールやその情報を取得し、簡単に連絡を取ることができるので、OpenAI Deep Researchも今これをできると思いますが、これはManusが特定のタスクを行う必要がある場合に何ができるかのデモンストレーションに過ぎません。
前にも言ったように、個人的に本当に価値があると思う様々な多くの異なるユースケースがあります。OpenAIがやるべきだったことだと思います。なぜなら、OpenAIオペレーターがエージェントを紹介したとき、実際に良いユースケースをあまり紹介していなかったからです。このユースケース、例えばB2B航空会社のダッシュボードでは、訪問できるすべての企業や場所、すべてのウェブサイトを見ることができ、特定の詳細に基づいてここですべての連絡先の詳細を持つことができます。
OpenAIのページに行くと、Deep Researchのユースケースがいくつか見られます。例えば、GPT-4oがDeep Researchとどれほど異なるか、UXデザイン、ショッピング、一般知識についての話があります。ここには単に十分なユースケースがないと思います。1、2、3、4、5、6のユースケースしかありません。これはもちろん適切な量ですが、実際に人々に創造的にこれをどのように使用できるかを考えてもらうには多くありません。
一方、このユースケースギャラリーでは、機能タブ、研究タブ、生活、データ分析、教育、生産性、WTFなど、膨大な量の異なるユースケースがあります。Twitterにも行けば、人々が革新的に作成した様々な異なるユースケースを見ることができます。これは人々が以前には思いつかなかったことを探求することを可能にするものだと思います。それが本当に重要だと思います。これがこの会社が最初から成功している理由です。
Gaia Benchmarkでは、これは基本的にAIエージェントがどこにあるかをベンチマークするための一般AIエージェントのベンチマークですが、彼らが実際に最先端の成果を達成したことがわかります。これは非常に興味深いことだと思います。なぜなら、長い間OpenAIはほぼすべてのカテゴリで常に最先端でしたが、AIエージェントは比較的新しいカテゴリであり、企業がその空間で革新していることを考えると、彼らがかなり狭く、特化し、焦点を絞っていることを考えると、OpenAIが特定のカテゴリ、このGaia Benchmarkのようなカテゴリで負けることは可能です。
大幅な差ではないですが、十分に有意な差があり、人々がOpenAIのProサブスクリプションの支払いを再考する可能性があります。今年は多くの新しい企業が現れ、AIエージェント空間における主要企業としてのOpenAIの地位に挑戦しているようです。
これはOpenAIを貶めるビデオではありません。実際に、私は将来の技術についてはまだかなり強気ですが、競争の激しい空間が最終的なユーザーに何をもたらすかを示しています。結局のところ、これはOpenAIが製品をより迅速に、より効率的に提供するという点で最善の行動をとることを確実にすると思います。
Twitterにもこれがありました。これは実際にはManusではありません。インターネット上でこのクリップが流れている場合、これは携帯電話デバイス上のManus AIエージェントではありません。Manus AIの共同創設者がここで言っています。「Manusへの関心をありがとうございます。しかしこのビデオは明らかにManusではありません。私たちの公式アカウントはManus AIHQであり、ManusはOpenAIオペレーター/Deep ResearchのようなウェブベースのAIエージェントであり、スマートフォン用のVNCではありません。」
ManusをDeep Researchと比較する人々について見てみましょう。MD Dera Unut Maという人物が、Manus AIとOpenAI’s Deep Researchを比較するテストの追跡調査を共有すると言っています。彼はこのプロンプトが非常に複雑で、ME/CFS疾患を評価し、新しい仮説を生成し、最近のマルチオミックAI論文を初期のコンテキストとして使用して神経治療法を特定したと話しています。
この状態は長期のCOVIDに似た非常に衰弱性の慢性疾患で、何百万人もの人々に影響を与え、彼はこの状態を10年以上研究し、いくつかの発見と分野への貢献をしたので、それに深く精通していると言っています。彼は明確に述べています。「これら数時間で生成された2つのレポートは、この疾患の理解と治療を数ヶ月、あるいは数年加速させる可能性があります。人々はAIが生物医学研究の進歩にどれほど深く影響を与えるかを認識する必要があります。」
彼は比較の簡単な要約とレビューについて話しています。Deep Researchは約12,000語の分析とレポートを生成し、予想通り素晴らしかったです。そして驚くべきことに、Manus AIも非常に良いレポートを作成し、ほぼ2倍の長さ(21,000語)で、仮説生成と治療法の提案においてDeep Researchよりもわずかに革新的で包括的でした。
しかし、Manus AIは分析を完了するのに4倍の時間(約1時間対Deep Researchの15分)がかかり、そのレポートはもう少し短くてもよかったでしょう。両方のモデルは分析に大きな重複がありましたが、それぞれが他方に言及されていない重要な参考文献を独自にハイライトし、次に探求する補完的な可能性を示唆しています。
要約すると、彼は基本的にManus AIがOpenAI Deep Researchに驚くほど匹敵すると言っており、人々はこれが別のDeep Seek AI的な瞬間だと言っています。正直に言って、そうだと思います。ウェブページ上の他のユースケースを見ると、それらは本当に印象的です。
Manus AIエージェントについてどう思いますか?これは非常に効果的だと思いますか、それともそれほど効果的ではないと思いますか?これはもちろん、中国がAI努力を増強していて、西洋のカウンターパートを追い越すかもしれないというAI業界へのもう一つの警鐘だと思います。


コメント