マヌス – オールインワンAIエージェント

AGIに仕事を奪われたい
この記事は約10分で読めます。

5,946 文字

Manus - The ALL-IN-ONE AI AGENT
Check out Langtrace's GitHub here: discount for Langtrace here: Langtrace’s upcoming webinar...

これがマヌスです。汎用AIエージェントシステムで、構築や研究、あるいは基本的には何でもできるようになっています。最先端のツールを組み合わせたもので、オペレーターとDeep Researchを組み合わせ、独自のLinux環境を与え、複数のエージェントを協力させるシステムです。そして、とても効果的に動作します。どのように機能するかデモを見てみましょう。
これはテスラ株の詳細な分析を行っているところで、これは録画されたものです。「テスラ株の徹底的な分析が欲しい」という指示を出し、さらに詳細な指示を与えています。最初に見られるのはToDoリストを作成していることで、それが今表示されています。このシステムは同時に動作していて、プロジェクトディレクトリの作成、ToDoファイルの作成、すべての要件の概要などを行っています。素晴らしいのは、作業の過程を実際に見ることができる点です。ブラウザを使用でき、いつでも操作を引き継いでLinux環境を確認することができます。非常に印象的です。
興味深いのは、これらのツールのほとんどがオープンソースであることです。おそらくバックグラウンドではClaude 3.7 Sonnetを使用し、ブラウザを制御するためのエージェントにはBrowser Useを使い、Linuxを使っています。つまり、技術的には誰でもこれを作ることができるのです。正しく実装するのは非常に難しいとはいえ、彼らは微調整されたモデルを使用しているわけではなく、自分で使えないようなものは何もバックグラウンドにはありません。繰り返しますが、非常に印象的で、うまく実装するのは難しいのです。
ここでは「テスラ株の包括的な分析を作成するお手伝いをします」と表示され、データソースに接続しています。もちろんウェブ検索も可能です。独自のLinux環境を操作しているのが見えます。「mkdir -p Tesla_analysis」とディレクトリを作成し、そのディレクトリに移動してToDoファイルを作成しています。これは間違いなく、私が今まで見た中で最も包括的なノーコードエージェントソフトウェアです。ディレクトリ内を移動し、Beautiful Soupをインストールしているのが分かります。そして情報の出力を開始しています。
先に進むと、コードとターミナルが表示され、ToDoリストに戻って作業を進めながらチェックオフしていくのが分かります。本当に素晴らしいです。最も印象的な部分は、エラーを起こしてそれを修正する能力でしょう。マヌスでタスクを開始する際は、長時間動作することを想定しておくべきです。私は今までに2つのゲームを作成してもらいましたが、完了するまでに何時間もかかりました。これらすべての出力を見てください。これはすべて行っている研究です。
実際に異なるチャートやグラフを作成しているのが分かり、最後には実際にライブダッシュボードがあります。ここをクリックすると表示されます。これはマヌスが一度に作成したものです。投資推奨、異なる財務パフォーマンスと評価分析、市場分析、テクニカル分析が見られます。これは絶対に素晴らしく見えますし、完全にマヌスによって構築されました。
彼らにはさまざまな例があります。ここに「4月の日本旅行」があるので、結果にスキップしましょう。これは既に完了したものを再生しているだけです。ここに7日間の旅程があります。1日目:東京到着、2日目:探索、3日目:隠れた名所、本当に印象的です。私たちの代わりに多くの調査を行いました。
ベンチマークもあり、GAIAベンチマークを使用していますが、興味深いことにDeep Researchとのみ比較しています。レベル1、レベル2、レベル3があり、すべての3つのレベルでマヌスはレベル1でDeep Researchをはるかに上回り、レベル2ではほぼ同等、レベル3では再びDeep Researchをはるかに上回っています。繰り返しますが、独自の環境、コーディング能力、コード実行能力、ウェブの閲覧能力など、Deep Researchよりもはるかに多くの機能を持っているため、Deep Researchとのみ比較しているのは非常に興味深いです。
Xで、Jenがこう言っています:「マヌスにファイルを要求しただけで、サンドボックスランタイムコードを提供してくれました。29の異なるツールを持つClaudeです。マルチエージェントなしと書かれていますが、マルチエージェントを使用していると確信しています。マネージャーエージェントがあり、そのマネージャーエージェントが専門エージェントにタスクを割り当てていると思います。Browser Useというオープンソースフレームワークを使用してエージェントがブラウザを制御できるようにしています。」
マヌスのCEOが実際に参加し、「それほど複雑ではありません。サンドボックスは各ユーザーが直接アクセス可能で、各セッションには他のセッションから完全に分離された独自のサンドボックスがあります。ユーザーはマヌスのインターフェースを通じてサンドボックスに直接入ることができます」と確認しています。マヌスが印象的なのは、私が見てきた中で最も全体的なAIの使用法だからです。基本的に、これまで見てきた最高のものをすべて集めて、非常に優れたパッケージにまとめています。
サンドボックス内のコードはエージェントからのコマンドを受け取るためだけに使用されています。ツールの設計は秘密ではなく、「マルチエージェントの実装はマヌスの主要機能の一つです。マヌスとメッセージを交換する場合、実行エージェントとのみ通信し、そのエージェント自体は知識プランナーや他のエージェントの詳細を知りません」と記載されています。これは本当に素晴らしいです。
Browser Useのオープンソースコードを使用していますが、それはオープンソースなので素晴らしいことです。実際、多くの異なるオープンソース技術を使用しています。だからこそ、発表ビデオでマヌスはオープンソースコミュニティなしでは存在しないだろうと具体的に言及したのです。近々、謝辞とコラボレーションのシリーズを発表します。マヌス自体がオープンソースになることを心から願っていますが、期待はしていません。しかし最後に「近い将来、かなり良いものをオープンソース化する予定です」と言っています。
Claude Sonnetを使用していると報告されていますが、「当社には多くの微調整されたモデルがあります。マヌスの計画手法の一部は、昨年10月にオープンソース化したこのモデルから生まれました」と述べています。そこにあるのがSteiner 32b Previewです。
このセグメントのスポンサーであるLang Traceに感謝します。彼らは素晴らしいパートナーで、今日も彼らについて話せることをうれしく思います。Lang Traceは、あなたのビジネスを前進させるAI製品を構築する先進的なAIソフトウェア開発コンサルティング会社です。これらの製品には、アプリケーション内でのLLM使用を評価・改善するのに役立つ、オープンソースおよびOpenTelemetryベースの可観測性と評価プラットフォームが含まれています。初期段階の企業からフォーチュン500の企業まで、数千人の開発者に信頼されています。
Lang Traceは開発者がトレースを収集・分析し、データセットを収集し、評価を実行することを支援し、その結果、高い信頼性と安全性を持つAIシステムを構築できます。Lang TraceはオープンソースでOpenTelemetryに基づいており、OpenAI、MRAW、Deep Seek、Gemini、Weeva、Pineconeなどと簡単に連携します。L Traceはエンドツーエンドの可観測性を提供し、LLMからベクトルデータベース、Crew AI、LlamaIndex、DSP、Langchainなどのフレームワークレベルの呼び出しまですべてをトレースします。
私が愛するCrew AIのネイティブサポートにより、L TraceはクルーAIセッション、エージェント、タスク、ツール、メモリを追跡するためのカスタムビルトダッシュボードを提供します。エージェントがしていることをすべて追跡できます。Lang Trceを使用すれば、華やかなデモから信頼性の高いAI製品に簡単に移行できます。Lang Trceをチェックしてください。これはオープンソースであり、ホスト版を使用したい場合は、説明欄のリンクを使用すると現在20%オフで利用できます。詳細を知りたい場合は、すべてを解説する彼らの今後のウェビナーに参加してください。彼らをチェックしてください。彼らは素晴らしいパートナーでした。彼らのGitHubにスターを付け、L Traceに再度感謝します。
では、ビデオに戻りましょう。人々がマヌスで何を構築したかの例をいくつか紹介します。これはTwitterのAKのプロンプトで「three.jsの無限ランナーゲームを作成して」と頼んだものです。これは本当に印象的です。一つのプロンプト、一度の実行でできました。他の例もあります。ここではAppleのウェブサイトのクローンが作られ、私にはとても良く見えます。そしてもちろん、3Dブラウザベースのフライトシミュレーターゲームもあり、これもとても良く見えます。AIゲームもあり、レッド・デッド・リデンプションのように見えますが、まだ歩き回ることはできませんが、それでも非常に印象的です。信じられないようなアニメーションもあり、本当にクールで目が回りそうです。
また、使用していると知られている別のオープンソースプロジェクト、e2bがあります。これはAIエージェント用のオープンソースコーディングランタイムです。非常に多くのクールなオープンソース技術がすべて一つの非常に洗練された製品にまとめられています。
Crueのハティスからマヌスの招待コードを得ることができました。彼女に感謝します。驚いたことの一つは、マヌスは実際にmonica.imを作った同じ会社だということです。monica.imはこのチャンネルのスポンサーをしていますが、このビデオはスポンサー付きではなく、私は自分でマヌスにアクセスしました。
試しに2つの異なるゲームを作成しました。最初はオンラインでよく見かける「3Dブラウザベースのマルチプレイヤーフライトシミュレーター」です。一度でどこまで進められるか見たかったのでそうしました。すでにディレクトリを作成し、ToDoを作成しているのが分かります。クリックすると、ToDoリストが表示されます。3Dウェブ技術の調査、マルチプレイヤー実装の調査、フレームワークオプションの評価などが含まれています。時間がかかりましたが、もちろんそうあるべきです。大きなプロジェクトですから。
すべての出力がここに表示され、最後には実際に自身の環境内でゲームを実行しようとしましたが、動作させることができませんでした。そこで「ファイルをダウンロードして」と言ったところ、驚くことに機能しました。ファイルをzip圧縮して簡単にダウンロードさせてくれました。
作成したもう一つのゲームは「チューチューロケット」というゲームです。おそらく聞いたことがあるかもしれません。昔のドリームキャストコンソールで非常に楽しいゲームでした。小さなネズミがボード上を走り回り、基本的には穴に落とすように試みるようなユニークなゲームで、マルチプレイヤーゲームで、高強度で高エネルギーな非常に楽しいゲームでした。それも作成してもらいました。
実際に調査を行ったのが分かります。PDFを見つけてスクロールし、ゲームについてすべてを学びました。これがそのゲームです。このPDFでは少し読みにくいですが、本当にクールです。基本的にはこのゲームの動作に関する正確な説明書です。そして構築を開始しました。「チューチューロケットのウェブ実装のためのコアゲームメカニクスを正常に実装しました」と言い、最後には完成させて実行方法を教えてくれ、ファイルをダウンロードすることもできました。
残念ながら、作成した両方のゲームはそのままでは完全に動作しませんでした。起動に近い状態でしたが動作しませんでした。ここに例があります。3Dフライトシミュレーターが読み込まれていますが、明らかに動作していません。そしてチューチューロケットでは「名前を入力してください」「部屋に参加」「準備完了」と表示され、「すべてのプレイヤーの準備が完了しました。ゲームを開始します」と表示されますが、実際には開始しません。
マヌスともう少し作業すれば動作させることができるかもしれませんが、ただお見せしたかっただけで、時々最初から完全に機能するわけではないことを示したかったのです。そしてマヌスの基盤技術の多くがオープンソースで構築されており、特別なものは何もないため、すでに複数のオープンソース版のマヌスが存在します。
最初はCamel AIによる「Owl」と呼ばれるもので、すでに8,500のスターを持っています。GAIAベンチマークで58.8のスコアを達成し、それは作成されてからわずか数時間でのことです。マヌスと同様に、リアルタイム情報検索、マルチモーダル処理、ブラウザ自動化、ドキュメント解析、コード実行、そして多数の組み込みツールを備えています。
そして「Anis」(そう、そのように発音します)と呼ばれる別のバージョンもあります。同じく複雑なタスクを実行し、マルチエージェント環境で協力し、ウェブサービスで実行します。これは本当に素晴らしいです。新しいプロジェクトがクローズドソースで登場するたびに(マヌスがオープンソースになるかどうかはまだ分かりませんが)、オープンソースコミュニティが飛びついて構築を始めます。面白いことに、これらのオープンソースプロジェクトの一つは実際にマヌスを使って構築されました。マヌスを使ってオープンソースプロジェクトが作られたのです。
マヌスは非常に印象的です。多くの本当に良く機能するデモを見てきました。ウェブサイトで自分自身で確認することもできます。引き続き使い続けていきますので、皆さんの意見をお聞かせください。このビデオが気に入ったら、ぜひいいねと登録をお願いします。次回のビデオでお会いしましょう。

コメント

タイトルとURLをコピーしました