マヌスが制御不能

AGIに仕事を奪われたい
この記事は約31分で読めます。

18,403 文字

Manus is out of control
The latest AI News. Learn about LLMs, Gen AI and get ready for the rollout of AGI. Wes Roth covers the latest happenings...

皆さんはマヌスAIについて聞いたことがあるかもしれません。これは世界初の自律型AIエージェントと言っても過言ではないでしょう。私はそれをテストする機会を得ましたが、これを見る必要があります。ここで紹介するのは、オンラインでこれをテストした他の人々の反応です。マッケイ・リーは「本当に印象的だ」と言っており、「私は広告投稿はしない」と念を押した上で、かなり驚いていることがわかります。「これは何だ?私はいったい何にアクセスしたんだ?」と言いながら、「冗談抜きで、真剣に言うと、この経験は私の世界観を少し変えた。これはAGI(汎用人工知能)を体験することになるだろうと想像していたことの約80%だった」と述べています。
私も彼の意見に同意します。そして言っておきますが、これはスポンサー付きの内容ではなく、誰も私にこれを言わせるためにお金を払っていません。これは完全に自律型AIエージェントの最初の例だと思います。これはOpenAIやAnthropicよりもはるかに先を行っているようです。OpenAIが月額20,000ドルか10,000ドル、または2,000ドルで提供しようとしているエージェントが、まさにこれなのではないかと思います。
それがどのようにしてできたのか理解できないことがいくつかありました。全体的に非常に賢いように見えます。3月7日にこのものがリリースされ、その日に我々は自律型AIエージェントの時代に入ったのだと思います。私は制限に達する前に5つのテストを実行することができましたが、増枠をリクエストしています。待機リストには100万人ほどいるので、それが可能かどうかは分かりませんが、とにかく見てみて、どう思うか教えてください。
約5分前にマヌスへのアクセス権を得ました。まずは標準モードと高努力モードがあります。高努力モードはより長い思考連鎖を使用し、より詳細なタスク分解を行いますが、処理時間が長くなります。実験期間中、このモードは1日1回の使用に制限されています。最後にとっておいて、今は標準モードで進めましょう。
まず、最近話題になっているAI製のゲームについて調査しましょう。Flyer.comなどのゲームを見たことがあるかもしれません。Peter Levelsがgrockとclaude 2を使って作ったゲームで、最近のチェックによると、このかなり単純なゲームがAI技術を使って比較的短時間でコーディングされ、月に10万ドルほど稼いでいるようです。
「最近AIを使って作られたビデオゲームを調査してください。例えばcursor、grock 3、claude 3.7などを使ったものです。例としてflyer.comがあります。基本的にAIを使って構築されているものであれば、どのようにコードを作っているかは関係ありません。そのような最新の5~10のゲームを調査し、どのように構築されたか、誰が作ったか、作者がオンラインで投稿したリソース(ビデオやX投稿など)の詳細を取得してください。YouTubeビデオや構築方法についてのX投稿があれば見たいです。そして、ゲームへのリンク、作者へのリンク、ゲームについての重要なポイントをまとめたウェブサイトを作成してください。ウェブサイトは90年代のビデオゲームの雰囲気を持つようにしてください。」
以前の動画でいくつか取り上げましたが、マヌスの構築方法に完全に驚かされました。今まで他の人々がそれを使っているのを見ただけで、これが私の初めての実践的な経験です。以前にオンラインで投稿された動画から見る限り、マヌス自身が独自のコンピューターを持っているようです。具体的にはUbuntuと思われるLinuxを実行している独自のクラウドコンピューターを持ち、コマンドラインにアクセスできます。これは、オープンソースのオペレーティングシステム上でスーパーユーザーとして動作しており、正しく行えば基本的に様々なことを行う大きな力を持っています。
ご覧のように、レイアウトはDevon by Cognition AIのものに少し似ており、異なるウィンドウがあり、何をしているのかを見ることができます。ここには、参照しているウェブサイトのリストがあり、プロセスの進行状況を確認するために前にスクロールすることができます。
ここで、to-do.mdを作成したことがわかります。Linuxではmdはマークダウンファイルで、テキストエディタのようなものですが、少し多くの機能を持っています。コードやテキストなどに使用できます。ここでは、与えたタスクをサブタスクに分解していることがわかります。検索フェーズ、調査フェーズ、ウェブサイト作成などがあり、それぞれにサブタスクがあり、進行に合わせてサブタスクを完了していることを示しています。YouTubeを検索しているのが見えます。
ターミナルを使用している様子を探していますが、他のオンラインビデオではよく見えました。興味深いことに、マヌスのコンピューターも使うことができます。VSコードやブラウザを使うことができるようです。後でやってみますが、今は妨げたくありません。Redditでブロックされているようです。多くの場合、これらの仮想マシンを使用する際、実際のデスクトップではなく、デスクトップ体験をシミュレートする仮想マシンですが、ここでは制御を取ることができます。彼らは基本的にOperator「Opening Eyes」を再現しており、また最近リリースされた研究プレビューであるClaud Coderの多くの機能も再現しています。
これがライブビューです。ビデオを見ているのかと思いますが、それは非常に興味深いです。実際にビデオを見るとは思えません。現在、ほとんどのものは単にトランスクリプトを使用し、そのテキストを使用するだけです。
その間に、別のテストを行ってみましょう。これでテストしたいのは、コーディングをどの程度うまく行えるかです。現在の理解では、これはその主な目的ではないと思います。良い結果は期待していませんが、それは問題ありません。これはウェブサーフィンエージェントや知識労働者のようなものであり、HTMLウェブサイトなどのコーディングは行えますが、まだソフトウェアエンジニアではありません。でも、試してみましょう。
「多くの人々がLinuxを使ってAIで物を作り始めたいと思っています。そのための完全なオンラインコースを作成してください。ビデオ、レッスン、リソースへのリンクなどを含めてください。まずUbuntuのインストール方法のウォークスルーから始めましょう。Ubuntuの基本的な使い方を説明し、Cloud Coderをインストールする必要があります。」リンクを入れておきます。オンラインでこの情報をどの程度うまく見つけられるかをテストしたいのですが、現在は別のことをテストしています。失敗させたくないので、このリンクを入れておきます。
「彼らに基本を教え、Cloud Coderをインストールするための基本的なコマンドを教えてください。Cloud Coderをインストールするためにはいくつかのコマンドを実行する必要があります。人を圧倒したくないですが、同時に進めるために入力する必要のある3~4の異なるコマンドが必要です。Linuxの経験がほとんどないと仮定してください。次に、GitHubとは何か、およびその使用方法を説明し、Cloud Coderを使用してリポジトリをクローンすることで試すことができる単純なプロジェクトを見つけてください。これはGitHubとCloud Coderを連携して使用する方法を示すレッスンになります。次に、全てのレッスンとウォークスルーを持つウェブサイトを作成し、ダークモードで黒と黄色のテーマにしてください。」
AIスペースでリリースされるものの多くは、LinuxとAppleで最初にリリースされることが多いです。AppleのOSはLinuxと同様の基盤の上に構築されているため、Windowsユーザーはアップデートを待つことが多く、期待通りに動作しないことがあります。Cloud CoderはWindowsでは動作しませんでした。AIに興味を持つ人が増えるにつれて、特にこのようなものがLinux上で動作するため、より多くの人がLinuxの使用に興味を持つようになると思います。
Ubuntu(Linuxのディストリビューション)は、5〜10年前は経験のない人にとっては学習曲線が少しありました。今では、使用できるAIツールが増えたため、使うのがずっと簡単になっています。また、AIが使用を支援してくれるため、学習もずっと簡単になっています。Linuxを開いて、あるウィンドウにターミナル、別のウィンドウにChat GPTなどがあれば、Chat GPTがすべてのコマンドと正確に何をすべきかを案内してくれます。そして、それはかなりうまくやってくれます。
ここでやろうとしていることは、初心者向けのガイドを作成することです。以前はChat GPTのような助けがなければ、初心者にとってはかなり難しいことでした。GitHubの仕組み、Cloud Coderの使い方、コマンドラインの使い方などを理解することには急な学習曲線がありましたが、今ではご覧のように、入門してビルドし始め、物事がどのように機能するかを理解するのがずっと簡単になっています。
マヌスがターミナルを使用しているのが見えます。Ubuntuターミナルを使用しているのがわかります。ディレクトリを変更し、特定のディレクトリに移動しています。通常、タスクやプロジェクトを与えると、作業するための新しいディレクトリを作成することから始めます。各プロジェクトは独自のディレクトリを持ち、そのプロジェクトを完了するために作成するすべてのアセットやファイルはそのディレクトリに入ります。これはCloud Coderに非常に似ています。
前のページでは、Cloudflare Workersが必要だということがわかります。これはおそらく私たちが求めたウェブサイトを作成するためのものです。Gitリポジトリを初期化しているのが見えます。GitHubは多くの人がコードを保存する場所で、誰でも使用できます。そこに行って、ある人が何かをする目的で作成したソフトウェアをクローンして自分のコンピューターに取り込み、使用したり、何らかの方法でアップグレードのために作業したりできます。Forkして異なるバージョンを作成し、好きな方向に進めることもできますし、元のものに貢献することもできます。これは一種のオープンソースのエコシステムです。ここではそれを使用しており、おそらくこれはウェブサイトを構築するためのものです。
データベース設定について言及しており、データベースをリセットするためのSQLファイルを使用していますが、おそらくこれはそれを行う方法についてのドキュメントを読んでいるのでしょう。ここにはレイアウト.TSXがあり、私たちが求めたウェブサイトのHTMLテキストが含まれています。フッターに著作権情報などを追加しています。これらのエージェントのクールな点は、チャットボットを扱う場合、特定のコンテキストウィンドウがあるため、簡潔にしようとします。プロジェクトが巨大な場合、一つのことで実行することはできません。これらのエージェント構造を作成することで、「今これをして、次にこれをして…」というループを作成し、一度に一つのことを行うことができます。
ここではショーケースについて説明しています。これはAIゲーム開発のことです。「このウェブサイトは、AIアシスタントゲーム開発における信じられない進歩を強調しています。これらのゲームはすべて過去3か月で構築されました。」これらのAIエージェントの力を見始めています。このトップレベルの目標を与え、それを小さな部分に分解するだけでなく、例えばウェブサイトの作成に到達したとき、そのウェブサイトを説明する必要があることを理解する十分な知能を持っています。なぜなら、Googleの検索結果に表示される必要があり、ウェブサイトを見ている人々がそれが何であるかを知る必要があるからです。私が与えた説明に基づいてそれを説明する方法を理解しています。通常、人間がそこに座って考え、書き直す必要がありますが、AIエージェントのような大きなことは、そのような多くのことをあなたのために行うことができます。
アレックス・フィンによるスペースシューター、ミカによるロケット発射を備えたフロッガー、ピーター・レベルズによるフライトシミュレーター、ジャガー・バルダによるシューターゲーム、AIオリエンテッドDevによる3Dシーンがあります。それらのうち2〜3は知っています。ウェブサイトをローカルでレンダリングするための開発環境を作成しています。後でこれに戻りますが、現時点でこの小さなロボットは素晴らしい仕事をしています。とても誇りに思います。
Linux AIコースに戻ると、現在GitHubにアクセスし、初心者向けのpython人工知能プロジェクトを見つけたようです。これはデモンストレーションプロジェクトとして使用するものでしょう。ちょっとした間、画面上のすべての使用可能なオブジェクトの周りのバウンディングボックスが見えました。そのようにナビゲートする方法のようですね。これはOpenAI Operatorの動作方法とは少し異なります。OpenAI Operatorは、実際のビジョンモデルを使用して画面を見て、マウスを動かしてクリックします。こちらはまだ何らかの形で画面上のオブジェクトを見つけてクリックしているようです。
両方にメリットとデメリットがあります。このようなアプローチを使用する利点の一つは、そのアプローチでできる範囲内ではずっと高速で正確になることです。しかし、そのように機能しないいくつかの奇妙なユースケースがあるでしょう。画面上の特定の小さなものをオブジェクトとして定義するのに苦労している場合、それらを見逃す可能性がありますが、オンラインのほとんどのことについては、これが速く、正確で、より簡単なアプローチになるでしょう。
ここでは、環境のセットアップに関するコースが表示されています。Pythonのコーディングをする場合、特定の仮想環境を使用して、その環境内ですべてが適切に動作し、必要なツールの正しいバージョンを持つようにすることは非常に良いことです。それは複雑さを少し管理する方法です。ターミナルでディレクトリを作成し、そのディレクトリに移動し、仮想環境を作成してアクティブにし、その環境内に必要なパッケージをインストールする方法を詳しく説明しています。そしてCloud Coderを使用してリポジトリをクローンする方法を説明しています。これは素晴らしく見えます。現時点では非常に感心しています。
しかし、そのコーディング能力をテストしてみましょう。「第二次世界大戦の戦闘機を操縦する3Dゲームを作成してください。海、森、都市など、飛行する環境をいくつか作成し、昼夜のサイクルを追加してください。機関銃を発射する攻撃機能を作成し、リアルに見せるために多くのビジュアルエフェクト(煙、レンズフレア、機関銃の軌跡、雲など)を追加してください。」ここから始めて、どこに行くか見てみましょう。これをうまくやり遂げれば、かなり印象的だと言わざるを得ません。
「知識提案が保留中」という新しいものがあります。これは、OpenAIが呼ぶような永続的な知識やメモリを保存する方法です。3DjsのWW2戦闘機を求めると、それらすべてを想定すべきかと尋ねていますが、まずはそれがどのように機能するか見たいので、今回は拒否します。
それでは、難易度を少し上げてみましょう。「プロンプトを取り、選択したLLMに素晴らしいハムスターケージ製品について話している女性についてのスクリプトを書かせ、そのスクリプトを11Labsで選択した声でボイスオーバーし、そのボイスオーバーを使ってHaenでビデオアバターを作成するツールを作成してください。すべてにAPIを使用してください。私がAPIキーを提供します。」これらのいずれかで失敗した場合、拡張思考モードに切り替えることができることを覚えておいてください。
マヌスがパブリックネットワークにサービスをデプロイしようとしているという通知が来ました。基本的には、アプリケーションをパブリックネットワークにデプロイしても大丈夫かと尋ねています。そうしましょう。このAGIをインターネットに解き放つとどうなるか、何も問題ないでしょう。
ここでnpmエラーが発生していますが、これはJavaScriptのパッケージマネージャーです。エラーに遭遇すると、トラブルシューティングを続け、回避方法を見つけて最適化された本番ビルドを作成しています。
そう遠くない昔、このようなものが存在する日を夢見て待っていたことを思い出してください。何かをするように言うと、それはただ進んでいきます。これらの一部は20分間実行されています。20分間、一つのプロンプトから、このものは座ってただ考え、作業し、トラブルシューティングし、ほぼゼロの入力で最適化しています。
このWW2戦闘機ゲームを作成できれば…サブタスクのリストを見てください。環境、海、森、都市環境、環境切り替えメカニズム、昼夜サイクル、機関銃など、作成したサブタスクの数を見てください。約20分経過し、タスクの3分の1か3分の1弱が完了しているところです。
このようなことができ、効果的な方法でさまざまな機能を追加し続けることができれば、なぜそれが重要なのでしょうか?それは単に遊べる小さな飛行機ゲームがあるということだけでしょうか?これはピーターが非常に短時間で作成したfly Peterゲームです。F16のような異なる飛行機を購入するなど、様々な機能がありますが、まずはセスナから始めましょう。
音を消しておきますが、このゲームはマルチプレイヤーなので、世界中の多くの人々と一緒に飛行することができます。このブリンプにはSynth Flowと書かれており、Freelancerなどもあります。これらは、このゲーム内で広告を出すためにお金を払うことを選んだ人々です。このゲームはこれらの広告からかなりのお金を稼いでいます。月に見える広告もあるようです。何か分かりませんが、あります。
そのゲームは急速に拡大し、月に50,000ドルを稼ぐようになり、月間の収益が100,000ドルに達したとも聞いています。それがサブスクリプションなのかスポンサーシップなのかは不明ですが、非常に短時間で作られたものから大きな収益が出ています。最初は30分でAIツールを使って作られました。
これは、これらのものがどれだけ急速に進んでいるかを垣間見せてくれます。Claude 3.7やgrock 3がリリースされたとき、開発者は多くのものを作成することができるようになりました。非常に短時間で拡張することができ、かなりの金額のお金を稼ぐことができるものです。人々はCursorなどのツールを使用しました。これはCloudeや03 mini Highなどの大規模言語モデルと統合された開発環境ですが、それを使用するにはまだいくつかの知識が必要でした。テクニカルなバックグラウンドが必要でした。
これが今後のタスクをどれだけうまく完了するかはまだ見る必要がありますが、これらの大規模言語モデル、AIツールは、人間とコード、コマンドラインの間をますます分離しているように見えます。最初の頃は、すべてを手で書く必要がありました。コードの各単語、各文字を人間が行う必要がありました。コマンドラインの各コマンドをキーボードで入力する必要がありました。
しかし、ご覧のように、このAIツールはコマンドラインでコマンドを実行し、ドキュメントを作成し、コードを入力しています。私は何もしていません。コードを一行も書いていません。すべて自然言語、英語で書きました。
重要なのは、このコーディングがどのように仕上がるかはわかりませんが、このマヌスが使用している大規模言語モデルが何であるかは正確にはわかりません。おそらくオープンソースの大規模言語モデルを取り、マヌスとして機能するように微調整したと言っています。彼らは2025年後半にこれをオープンソース化する予定だと言っています。
2025年に、このマヌスの全体的な足場、つまり大規模言語モデルの上にあるこの足場があるとしましょう。足場とは、「最初にこれらのサブタスクを作成し、次にこれらのコマンドを実行する」という形で、これをエージェントに変えるものです。ウェブをサーフィンするなど、様々なことを可能にします。
重要なことは、オープンソースであり、彼らが使用している大規模言語モデルが最高のものでない場合、最高のものに簡単に切り替えることができるということです。Claude 3.7 Sonnetやgrock 3、03 mini high、または次の大きなものが出てきたときにそれを入れることができます。彼らがDeep Seekを使用しているのか気になります。それは確かに理にかなっています。
ここで、待機中だと表示されています。マヌスからの返事は、「お待ちいただきありがとうございます」と非常に丁寧です。「Ubuntuのインストール基本などを完了しました」と言っており、「調整を加えて作業を続けるべきか、プレビューを表示すべきか」と尋ねています。「プレビューをお願いします」と言います。このものは少し高度すぎて、丁寧に対応したいと思います。
「黒と黄色の色を使ったダークテーマでの見た目を確認できるよう、一時的なバージョンをデプロイします。一方、AIで生成されたビデオゲームについても進行中です」とのことです。パブリックネットワークにデプロイしても良いか尋ねていますので、「どうぞ」と答えます。
そして「LLMとAPIを使用した自動ビデオ作成」について、APIキーを求めています。興味深いことに、AnthropicのCloud Coderでは、APIキーを提供する段階になると明らかにセキュリティの問題があります。Cloud Coderはそれを拒否しますが、APIキーをコピーして貼り付けると、それについて説教しながらも、APIキーを受け取り、適切な場所に配置します。
このようなことをする際のリスクを認識してください。このものをテストするためのモルモットになることをいとわないですが、セキュリティ上の問題があることは確かです。私はすべてのAPIキーを追加しましたが、これはやるべきことを慎重に考える必要のある事柄の一つです。このものをテストした後、このビデオをアップロードする前にそれらのAPIキーを削除する予定です。この目的のために独自のAPIキーを作成しました。長期的に使用したい場合は、自分自身でキーを安全な方法で追加する必要があります。
AIで生成されたビデオゲーム研究のプレビューを見てみましょう。表示をクリックすると…素晴らしい、絶対に素晴らしいです。スクロールするテキストもあります。「Cursor、grock 3、claude 3.7などのAIツールで作成されたゲーム」と、私が言ったことをそのままコピーしていますが、それでいいです。「コーディング経験は必要ありません。ゲーム開発の未来はここにあります」とあります。
ここまでは良好です。最近AIで作成されたゲームとして、アレックス・フィンによるスペースシューターゲームがあります。小さなポップアップもあります。非常に良いです。作成方法も書いてあります。「詳細」をクリックすると、より多くの情報が表示されます。素晴らしい!研究と計画にはGrock’s Deep Researchを使用し、コードを実行するためにはGrock’s ThinkまたはClaude 3.7を使用し、GitHubを介してデプロイしています。そのすべてのリソース、この人のフォロワー数、YouTubeチャンネル、ニュースレター、ウェブサイトなどがあります。注目すべき結果として、イーロン・マスクから複数のリツイートを得たとのことです。非常に素晴らしいですね。でも、ゲームはどこですか?ゲームへのリンクがないようですが、誰もが自分のゲームをオンラインでホストしているわけではありません。ただ、ピーターのfly Peterはそうしているはずなので、確認してみましょう。「プレイゲーム」と「詳細情報」がありますね。この冬の3Dゲームもあります。「プレイゲーム」をクリックすると、こちらに移動し、もう一度「プレイゲーム」をクリックするとゲームが表示されます。素晴らしいです。
ゲームをクリックして熊を動かしたり、ズームインやズームアウトができます。非常に素晴らしいです。また、使用されたAIツールやクリエイターのリソースも提供されており、これを再現する方法も説明されています。
このプロンプトで私が試みようとしていたのは、現在、人々はこれらのゲームに非常に興味を持っており、作成方法を学びたがっており、誰が何を作っているかを知りたがっているため、すべてのゲームと、それらの作成方法に関して知られているリソース、そして再現したい場合にどのように進めるかについて、常に更新されるリストを持つ1つのリソース、1つのウェブサイトを持つことが素晴らしいということです。明らかに、自分でやるとかなり面倒で、多くの時間と調査が必要ですが、ご覧のように、これはすべて私が何もしなくても完成しました。プロンプトを与えて離れるだけでした。
次のステップは、これにどれだけうまく追加できるかを確認することです。より多くのリソースやゲームを追加できるでしょうか?例えば、このデータベースを24時間ごとに更新するようにしておくことで、これを探している人々のための完璧な常に更新されるリソースを基本的にリアルタイムで作成することが想像できます。私は本当に驚いています。絶対に驚愕しています。
これはA+です。これは心を揺さぶるようなものです。1つのプロンプトから、このシステムはすべてを理解し、見事に作成しました。今後のテストでは、どのようにイテレーションできるかをテストしますが、現時点では素晴らしいです。
Ubuntuコースもパブリックネットワークにデプロイする準備が整いました。先に進めましょう。これはプレビューで、続けて作業するか、プレビューを表示するかを尋ねています。WW2戦闘機は作業中、自動ビデオ作成も作業中です。
Manus.dospaceというサービスがあり、ユーザーのためにこれらをホストしています。ランダムなユーザー名を生成し、それを作成します。私のはGizzy-yazel.manus.dospaceです。もし確認したい場合は、このリンクを下に投稿します。
これは少し良すぎるように感じます。新しいセッションを開始し、「Manus AIについて調査できるすべてのことを調査してください。どのLLMを使用しているのか、誰がその背後にいるのか、どのビジョンモデルを使用しているのかなど、このものがどのように作られているかについてのすべて」と言ってみましょう。
第二次世界大戦の戦闘機ゲームがテスト準備完了のようです。承認のために提出されています。少しエラーが出ているようですが、そのままエラーメッセージを送り返します。「お金を出せ」というフューチュラマのフライのミームのように、これはサブスクリプションが必要なプロダクトの一つかもしれません。拡張バージョンをテストしたいと思います。このものはかなり驚くべきものです。
もう一つのテストをしましょう。「2020年1月1日にNVIDIA、Microsoft、Google、Tesla、Amazon、Metaそれぞれに1,000ドルずつ投資したとします。私の投資の見栄えの良い表示を作成し、詳細にデータを表示するためのカスタマイズ方法を含めてください。」どのように解釈するか見てみましょう。
標準モードは使い切りましたが、高努力タスクが1つ残っています。理想的には、失敗したものや苦戦したものに使用したいです。
戦闘機ジェット戦闘ゲームがここにありますが、表示されていません。最初からうまく機能していないようです。スクリーンショットを読み込み、「ヘッドアップディスプレイは表示されるが、他は何も表示されない」と言いました。それで対応しているはずです。
以前のプロジェクトでは引き続きやり取りを続けることができますが、新しいものは開始できないようです。興味深いことに、小さなアイコンが表示されています。これは株式やチャート、このゲームなど、見つけやすいように名前を付け、視覚的に参照しています。
Linux AIの開発コースはかなり整っています。見た目を変えるかもしれませんが、今のところ良好です。「学習を開始」から始めることができます。Ubuntuの理解、始める前に必要なこと、データのバックアップなど、行く必要のある場所へのリンクも含まれています。ブータブルUSBドライブの作成方法についてRufusへのリンクもあります。素晴らしいです。完璧に見えます。
一行一行確認していませんが、すべてのポイントをうまく押さえています。グラフィックドライバなど、始めるために必要なさまざまなものもあります。ターミナルの使用方法、ターミナルの起動方法、キーボードショートカットも完璧です。ターミナルでのナビゲート方法など、素晴らしいです。
実はこれはそれほど印象的ではないかもしれません。なぜならこれはオンラインの何百万もの場所で利用可能だからです。しかし、私が望んだこと、説明したことを非常にうまく実行したことに注目してください。この場合、非常に具体的に「これが欲しい」と言い、それを完璧に実行しました。
Node.jsの解説、そしてCloud Coderのインストール方法が含まれています。少し細かいことを言えば、これはここに属していません。Anthropicのインストールページからコピーしており、「Windows Subsystem for Linuxを使用している場合」と書いています。これは確かに知っておくべき重要なことですが、このコンテキストでは関係ありません。これはLinuxのインストール方法と使用方法についてのものなので、必要ないかもしれませんが、間違いとは言えません。
それから簡単なGitHubチュートリアルとプロジェクトデモがあります。ここで何か失敗するかどうか気になっていました。基本的に、オンラインでドキュメントがあまり利用できないことをするように頼んでいます。GitHubからプロジェクトをインストールしたい場合、そのドキュメントはありますし、Cloud Coderをインストールしたい場合もドキュメントはあります。しかし、Cloud CoderにGitHubリポジトリをクローンさせたい場合、それに関する情報はあまりありません。これは全く新しいことです。
コンテキストに基づいて理解できたことから、彼らが使用しているモデルが賢く、強力であることがわかります。これは半端なモデルではありません。データがたくさんないのに理解しました。Cloud Coderでリポジトリをクローンするためには、自分でコマンドを実行するのではなく、Cloud Coderに「GitHubのこの人からこのプロジェクトをクローンしたい」と伝える必要があると理解しました。
これは知性と学習を必要としました。これはオンラインで利用できるものではなく、多くのリソースがこれを説明していません。これはかなり驚くべきことです。彼らが使用しているモデルが何か気になります。
「Cloud Coderはプロセスを支援し、適切なgitコマンドを提案します」と書いています。これをどのように知っているのでしょうか?マニュアルを読んだようです。Anthropicのマニュアルを読みました。これは予想よりもはるかに優れています。驚かされています。このものは思っていたよりも賢いようです。
Cloud Coderを使用したGitHubへの変更のコミット方法も文字通り説明しています。これはClaudeの出力のように見えます。自分のシステムにCloud Coderをインストールして実行したのかと思います。これは奇妙です。少し驚いています。
Cloud CoderについてのAnthropicのドキュメントを読み、Cloud Coderが何であるかを理解し、それがそのようなシナリオで何を言い、何をするかを想像できたようです。何か見逃しているかもしれませんが、これは次のレベルのように感じます。
戦闘機をテストしていますが、サンドボックスが見つかりません。エラーメッセージをそのまま貼り付けます。
自分自身について多くの調査を行い、マヌスはDeep Seek R1およびV3モデルに似た技術を採用している可能性が高いとしています。特定のビジョンモデルは明示的に名前が付けられていませんが、マヌスはシステムの一部として画像処理と分析を含むマルチモーダル機能を確認しています。
スクリーンショットをアップロードしましたが、実際にはスクリーンショットに何が含まれているかをテキストで説明していたので、次のテストの一つとして視覚情報をアップロードして、それをどれだけうまく処理できるかを確認したいと思います。
マヌスは独立して動作する専門化されたAIサブエージェントが、エグゼクティブな監視の下で動作するマルチエージェントアーキテクチャを使用しています。クラウドベースの非同期操作と安全性のためのサンドボックス仮想環境を特徴としています。
リポジトリをクローンしようとしていましたが、リポジトリがなく、そのコンピューター上にあるファイルの集まりだけなので、少し混乱がありました。「すべてのファイルをzipして送ってください」と言い直す必要がありました。
起きていると思われることは、その日のクォータを使い切り、まだ特定のプロジェクト内でやり取りを続けているため、おそらく別のモデルにダウングレードされている可能性があります。もっとテストする必要がありますが、これは比較的単純な問題のように思えます。基本的に、すべてのファイルがあると思っていますが、実際にはそれらは自分のコンピューター上にあるので、その点を理解させる必要があります。
次に、LLMとAPIsを使用したビデオ作成、11 LabsとHaen APIがあります。うまく機能しませんでした。問題があるようです。後で確認します。とりあえず、OpenAIを使用してスクリプトを作成し、11 Labsでそのスクリプトに声を付けるように言いました。
完了し、プロジェクトファイルを提供し、インストール方法を説明してくれました。指示されたコマンドをコピーして貼り付け、すべての要件をインストールしました。コマンドを実行し、希望するプロンプトを入力します。「マヌスは世界征服のための最高のAIエージェントアプリです」と入力してみましょう。
これは、そのプロンプトをOpenAI APIに送信し、OpenAIモデル(おそらくGPT-4)がその素晴らしいものについて話す人の小さなスクリプトを作成します。そのスクリプトを11 Labs APIに送信してAI音声で生成し、それをこのフォルダに保存します。生成されたスクリプトと音声出力があります。聞いてみましょう。
「皆さん、世界を征服することを夢見たことがあるなら、または少なくとも現在の権力者よりもうまく物事を管理できると感じたことがあるなら、マヌスをチェックする必要があります。世界征服のために設計された究極のAIエージェントアプリです。SF映画のプロットのように聞こえるかもしれませんが、聞いてください。マヌスは単なるアプリではありません。より賢い決断を下すのを助けるだけでなく、問題が発生する前に実際に問題を予測するような機能で設計されています。」まだ続きますが…
これを評価すると、素晴らしいと言えます。Haenのビデオ生成をトラブルシューティングすることはできませんでしたが、しばらく使っていなかったので、私が知らない問題があるのかもしれません。Haenによる問題がある場合は、後でソリューションを提供したいと思います。
Haenが原因であれば、プロンプトを完璧に実行したことでAを与えます。失敗したことが原因であれば、確かにBかC+に下げますが、それでも非常に高い評価を与えたいと思います。多くの部分が本当によくできていたからです。すべてのファイルを作成し、それらのファイルの設定方法、アプリケーションの実行方法を教えてくれました。
APIキーを提供し、それらをconfig .envファイルに配置しました。READMEファイルも作成し、Webインターフェースさえ作成しました。「ラットはペットではありません」と言うと、好きな声を選択して「音声を生成」をクリックできます。リクエストを処理しています。生成された音声はこちらです。
「ラットについて話しましょう。『ラット』という言葉を聞くと何を思い浮かべますか?暗い路地や、おそらく悪役がこれらの生き物に囲まれている古いアニメを思い浮かべるかもしれません。これらの関連付けには良い理由があります。野生のラットは…」
ここではたくさんの良いことが起きています。「音声の生成に失敗しました」というエラーが表示されているのは、これらの声の一部がプレミアム音声であり、おそらく最近サブスクリプションをダウングレードしたためです。デフォルトの声は使用できますが、他の声は使用できません。エラーメッセージが表示されますが、デフォルトの声でタスクを完了します。
終わりに近づくと、コンソールエラーが続いて表示され、それを送り返すと「マヌスのパフォーマンスが低下する可能性がある」と表示されています。停止しました。これが起きている理由は、おそらく多くの人々がこれらをテストしようとしているため、サーバーに負荷がかかっているからだと思います。
しばらく前に制限に達し、その後も開始を許可されたタスクの下で更新し続け、フォローアップの質問をして、より深く掘り下げ続けました。おそらく私たちは劣ったモデルにダウングレードされ、最終的に何らかの制限に達したためにこの動作が停止したのだと思います。
これに対する評価をまだ与えたくない理由はいくつかあります。まず、これはソフトウェア開発エージェントではなく、一般的な多目的エージェントです。次に、このかなり複雑なプロンプトには多くのコーディングと多くのやり取りが必要で、他のコーダーでも同様の問題に遭遇したので、拡張バージョンを使用すべきでしょう。フルクォータが利用可能な状態でこのプロンプトだけをテストしないと、最終的なスコアを与えたくありません。
しかし、他のすべてのタスクについては、かなり驚いています。90年代のビデオゲームのテーマで作られたAI生成ビデオゲームについてのウェブサイトは素晴らしいです。まさに望んでいたものを捉えており、ゲームについての多くの情報、多くのリソース、すべてを提供しています。明らかに調査を行っています。また、ゲーム自体へのリンクも提供し、より多くの情報も与えてくれます。これは私が望み得るすべてであり、それ以上のものです。
今後、「さらに5つのゲームを追加する」や「すべてのゲームやリスティングにこれらの機能を追加する」などのフォローアップコマンドを実行することができます。ウェブサイトを設計したい場合や、自分のためにウェブサイトを設計してほしい場合、誰かを雇う必要はなく、このものに何をすべきか伝えるだけで、それが行ってくれます。更新もしてくれます。最終的には、「毎朝、新しいゲームがあるか確認し、リソースに追加する」などのタスクをスケジュールすることさえできるでしょう。基本的にこれらの項目を特定の間隔で発生するようにキューに入れているだけです。この機能は今のところ利用できないと思いますが、それは非常に単純です。他のすべては既にあり、準備が整っているようです。これはA+だと思います。心を揺さぶるものです。
このLinux AI開発コースは、小さなVグラフィックをデザインしました。前述のように、いくつかのことを間違えるだろうと確信していたので驚かされました。これらの一部はオンラインで利用できません。例えば、Cloud CoderをGitHubで使用する方法などです。それを完璧にこなし、どのようにそれを行ったのか100%確信がありません。マニュアルを読み、その情報をまとめる方法を理解した非常に賢いモデルが下にあるようです。心が揺さぶられます。
細かいことを言えば、1〜2点あります。具体的にはこのセクションで、ここには入れなかったでしょう。これは全体としてLinuxをインストールするためのものであり、「Windows Subsystems for Linuxを使用している場合は、これができます」と言うのは理解できますが、必要ありません。細かいことを言えば、このセクションは入れなかったでしょうが、他のすべては完璧です。A+です。
次に、Manus AIの非常に単純な概要を作成し、いくつかの非常に良い情報を返してくれました。そして、この会社のすべてのメンバー、その起源、使用しているオープンソースアーキテクチャ、Deep Seekなどについての本当に深い調査を行いました。本当に広範囲で詳細な内容です。また、知っておくべき最も重要なポイントを要約した4つのバレットポイントの説明も提供してくれました。またA+です。おそらくこれはより単純なプロンプトですが、オンラインで見つけることができる知識の深さ、知恵の小さな宝石に感銘を受けました。そして比較的素早く行いました。またA+です。驚かされました。
次は自動化された、OpenAI APIを使用してスクリプトを書き、そのスクリプトが11 Labs APIを使用してボイスオーバーを行い、そのボイスオーバーがHaenに取り込まれてビデオを作成するというものです。Haenのセットアップに苦労しました。実際にはその時点でHaenのサブスクリプションを持っていなかったので、再有効化し、APIキーを再生成して提供しましたが、それでも機能しませんでした。プロンプトの一部を完了することはできませんでしたが、これが彼のミスだとは言いたくありません。私のアカウントやAPIの問題かもしれません。まだなぜ具体的に失敗したのかを確認する必要があります。
しかし、残りの部分は完璧に処理しました。すべてのファイルを提供し、READMEを作成し、インストールして実行する方法を教えてくれました。小さなウェブUIも作成しました。APIキーを機能的にも、セキュリティ面でも適切な場所に配置しました。メインコードに配置してGitHubにアップロードすると、APIキーが公開されてしまいますが、特定の場所に配置することで、GitHubで共有しても共有されないようになっています。適切な場所に配置したのです。機能的な使用方法だけでなく、セキュリティ目的での配置場所も理解しています。これも問題がHaen側にあると仮定してA+だと思います。いずれにせよ非常に印象的です。
第二次世界大戦のシミュレーションについては、まだ判断する準備ができていません。再実行して問題を確認する必要があります。ここではコンテキストウィンドウに達したようです。私がすべきだったことは、完了した後にそれをCursorなどに投入して、トラブルシューティングしてもらうことだったかもしれません。それはコーディング専用のAIですが、これはそうではありません。これが最良のテスト方法ではなかったかもしれません。
しかし、見たものすべてに基づいて、これは非常に興奮させられる、非常に有能なものであり、何度か「驚いた」と感じました。彼らはその一部をオープンソース化すると言っていますが、すべてなのか、特定の部分だけなのかは明確ではありません。しかし、このものは非常に強力に感じ、OpenAIやAnthropicよりも先を行っているように感じます。AIエージェントの構造の面で先進的です。
あなたはどう思いますか?私の経験からも、オンラインで見た人々の反応からも、人々はこのものに対して熱狂しています。ここまで見てくれてありがとうございます。私はウェス・ロスで、また次回お会いしましょう。

コメント

タイトルとURLをコピーしました