AGI達成か?! | TheStandup

AGI・ASI
この記事は約39分で読めます。

AI開発エージェントツールとスキルマーケットプレイスをめぐる一連のセキュリティインシデントを詳細に検証する。架空のnpxコマンドがLLMによって幻覚され、それが237のリポジトリに拡散した事例や、HTMLコメントを利用したプロンプトインジェクション、偽のセキュリティガイドスキル、さらにはダウンロード数を不正に操作して「What Would Elon Do」スキルをランキング1位にした手口まで、実際に発生した攻撃手法を分析する。また、Moldbookという実験的SNSプラットフォームにおける深刻な情報漏洩とFirebaseの設定ミスについても言及し、AI駆動型開発ツールのサプライチェーンリスクと、コード実行権限を持つLLMエージェントが抱える根本的なセキュリティ課題を浮き彫りにする。

AGI Achieved?! | TheStandup
ssh terminal.shop This week on The Standup, the crew digs into the chaos of AI “skills,” agent tooling, and the growing ...

AIエージェントとスキルの世界へようこそ

さて、今日はケイシーが参加できないんですけど、気になっている方のためにお伝えしておきます。

彼の代わりに私が来ました。

そうなんです。こちらはLowle Learningです。みなさん、準備はいいですか? これについて話しましょうか?

やりましょう。

しばらくパンケーキの話をするのかと思いましたが、それもいいですね。

パンケーキについて1時間まるまるセッションをやってもいいですよ。私は賛成です。

パンケーキの話はしませんよ。ちなみに、実はワッフルの方が優れているんです。でも準備はいいですか? ダメですよ。そう思わないんですか? ワッフルの方が優れていると思いませんか?

そんなこと言っておいて、別の話題に移行するなんてできないですよ。

いい指摘ですね、Trash。これはちゃんと掘り下げる必要がありますね。

ええ。とにかく、すみません。The Standupへようこそ。ここでは開発者やソフトウェア愛好家が直面する最大の問題について語り合います。今週のエピソードでは、部屋の中にいる非常に明白な象、つまりこの数週間展開されてきたエージェント型コーディング、システム連携、そして数々の災害について話していきます。

今日は特別ゲストをお迎えしています。Windowsの背景にいるのがLowlevel Learningです。Learningは外して、今は単なるLowlevelになりました。

すべて学び終わりました。学びすぎて、今はただのLowです。

Low level。

Learn。

これから分かりますよ。

それから一緒にいるのがTeeです。あなたには特に何もいいことが思いつきません。

ここにいますよ。

シャツを着てますね。ポケモン愛好家のTrash Dev本人です。

間違っていなければ、Twitter上で男女比率が私たち全員の中で最も高いと思うんですが。

ああ、そうですね。何の話でしたっけ?

デモグラフィックを見ていたんです。ただ言わせてください。

彼の背景に映っている純資産が最も高いと言おうとしたのかと思いました。この人、金持ちですよ。

本当ですね。分かりませんけど。でもそれはリスクですよね。Trash、みんなにあなたがどこに住んでいるか知られる必要はないですよ。

あれは世代を超えた富がそこに座っているんです。金よりも価値があります。

それは数十ドルですよ。知ってますよ。

かなりいいですね。

6桁にもうすぐ届きそうです。いや、4桁ですね。

いや、2桁にもなってません。3桁です。

たくさんのイチジクですね。私の子供たちが… ちょっと話が逸れますね。私と子供たちがカードショップに行って、子供たちがピカチュウを買ったんです。小さなピカチュウカードです。私は…

それからポケモンカードのパックをいくつか買って、家で開けたんです。

どんなカードが出たか写真を見せてくださいよ。

正直に言うと、彼は中毒になってるんです。5のことを持ち出すことはできません。

文字通りタイトルに入ってますよ。

見せてください。

生き生きと追体験してるんです。あなたがパックを開けるとき、私も開けてるんです。

彼はそのスクラッチまでやってるんですよ。

ピカチュウの写真を送ってください。ただ知りたいだけなんです。ただ気になるんです。

何か新しいポケモンカードはありますか? もう本当に、子供たちにパックをあげても、私は何も開けないんです。子供たちに開けてもらいたくて、ただ座って見てるんです。「ああ、何が出た? 何が出た? いいの出た? いいの出た?」って。ひどいですよ。ひどい。

エージェント型コーディングのセキュリティ問題

とにかく、まあそろそろ始めましょうか。Lowlevel Learningsさん、私はいつもあなたをLowlevel Learningと呼んでしまいます。トリプルの響き、それがもう一部になってるんです。Lowlevelさん、この件についてどれくらいご存知ですか? セキュリティの専門家として、この数週間で起こったことについてどれくらい知っていますか?

ええと、正直に言いますと、私の本業は実際のソフトウェアの監査なんです。なので、エージェントスキルが何なのか全く分かりません。グループの皆さんと一緒に学んで、それから脅威モデルについて議論したいと思います。

ああ、素晴らしい。ああ、なんてこった。

いいですか、完全に透明性を保つために言いますと、お話ししたいのは、私たちがMoldbotのOpen Malt Open Feetの状況について動画を作ったことです。愚かなことをやっているわけですが、プロンプトインジェクションの観点からというよりも、スキルマーケットプレイスについては何も知りません。現状を教えていただけると嬉しいです。

ねえ、それHTTPですか? それはダメですよ。コーヒーの注文はそうやってしませんよ。コーヒーはSSH terminal.shop経由で注文するんです。そうです。本当の体験が欲しいですか? 本当のコーヒーが欲しいですか? もう覚えておく必要のない素晴らしいサブスクリプションが欲しいですか? ああ、独占的なブレンドと独占的なコーヒーと独占的なコンテンツが欲しいですか? それならCronをチェックしてください。SSHが何か分からない? まあ、コーヒーはあなた向けではないかもしれませんね。

幻覚されたNPXコマンドの拡散

さて、私の個人的なお気に入りから始めてもいいですか?

はい、はい。

オーケー。ああ、ありがとうございます。ありがとうございます。これですよね。

Trashさん、あなたも同意しますか? それが唯一聞ける人ですね。

続けてください。

ありがとうございます、みなさん。これが私の現在のお気に入りです。古代のスキルが幻覚したnpxコマンドを拡散しているというものです。

ある時点で、何らかの形で1つのスキルがGitHubにアップロードされました。そこにはReact Code Shiftという偽のパッケージがありました。

素晴らしい。最高です。気に入りました。

そして、みんなが手作業でシフトするのではなく…Left Padみたいなものですね。

いや、実際にはJSX Code Shiftのようなものだと思います。あるバージョンから別のバージョンへ自動的に変換するという発想です。プログラムからコードをアップグレードできるんです。

コードモッドってやつですね。Reactの永遠の地獄みたいなものです。何かリリースするたびにアップグレードが必要になるんです。これがまさに起こっていることです。自動化された方法のはずなんです。少なくともLLMはそう考えたわけです。

さて、この件で最高なのは次の点です。最初は1つのスキルがこれを持っていただけでした。幻覚だったんです。でも、スキルを作成している全員が「よし、LLM、Cloudflareスキルを今すぐ作ってくれ」みたいな感じなんです。

するとCloudflareスキルを作ってくれるわけです。残念ながら、この記事を書いた時点で、ちなみに10日前ですが、1つから237のリポジトリにこの架空のnpxコマンドが入っています。みんながLLMにスキルを作らせ続けているからです。

スキルが何か分からない方のために、最も簡単でシンプルな説明をすると…

チャットのほとんどの人は知りませんよ、ちなみに。

おそらくアダムとイブのところから始めるべきですね。少し混乱しているのは分かります。

何も知りませんよ。

いい出発点ですね。最も簡単な考え方は、ちなみにあの線を見ましたか? あの直角。

あの垂直な直線。あれは…

ああ、手描きですか? 手描きですか?

手描きです。ええ。

すごい。

Josh、スローモーションでズームインしてください。スローモーションで拡大して見たいです。

最も簡単な考え方は、とにかく、何かを作るとき、LLMに何か入力するとき、プロンプトのようなものを送りますよね? そして、おそらくClaude CodeやOpen Codeなどの中に何らかのシステムプロンプトがあって、「ツールを使えます、Linuxで実行できます」などの指示がたくさん書かれています。

でも、時にはもう少し追加したいことがあります。例えば、「Cloudflareを追加してくれ」みたいな感じです。Cloudflare APIをたくさん追加してほしいわけです。これを自動的にやってくれるんです。スキルフォルダを見つけて、そこには何らかのMDファイル、マークダウンファイルがあって、それがプロンプトの一部として入ってくるという感じです。

それから、これが全部きれいにパッケージ化されてLLMに送られるわけです。

スキルは「ビヘイビア」と呼んだ方がいいかもしれませんね。

でも、スキルと呼んでもいいと思います。コンテキストとも言えます。これには無数の異なる名前がありますが、みんな少しずつ違った形で持っています。

新しい言葉を見つけましたね。

プロンプトを呼ぶための新しい言葉を見つけました。プロンプトエンジニアがさらに知的に優越感を感じられるようにしているんです。

つまり、ただのテキストファイルですよね? 新しいプロトコルがあるわけでも、新しいMCPがあるわけでもありません。プロンプトに追加されるプロンプトが、さらにプロンプトに追加されるんです。

文字通り、ドキュメントをコロケートしているんです。

コンピュータ上でプログラム的にドキュメントを作成しているんです。

スキル、

とても良いです。

MCPも、プロンプトに関しては最終的にすべて文字列に帰着します。結局のところ、単なる文字列の連結なんです。

気に入りました。でも、これは多くの場合、MCPよりも優れていると思います。コンピュータ上でランダムなサーバーを実行する必要がないからです。マークダウンファイルをチェックインするだけでいいんです。例えば、Dylan Mroy、Dylanに声援を送りますが、彼は実際に機能する良いCloudflareスキルを持っています。

メインスキルにはCloudflareが持っているものについての情報が書かれていて、それから各製品ごとに追加の参照があります。これはかなりいいです。毎回Cloudflareに関する可能性のあるすべての情報をコンテキストに入れる必要がないからです。そうするとLLMが非常に混乱してランダムなことをし始めます。「Cloudflareで何かやりたい」と言えば、キューのことを理解して、それからフォルダ内のキューの情報を調べて実行してくれます。

その例ですね。

はい、TJ、あなたがくれた例はこれです。Tree Sitter用のもので、Neovimで使えるすべての関数名が入っています。

これがあるおかげで、95%の精度ではなく、このリストを見て大幅に正確になれるんです。ここに情報がありますから。

毎回入力する必要もありません。

そうですね。

ああ、どうぞJosh。いえ、私が言おうとしていたのは、スキルの現在の問題点の1つは、使っているエージェントやハーネスが時々このスキルを呼び出すべきだと推論できないことです。通常、スキルは手動でスラッシュコマンドで呼び出す必要があるからです。でも、暗黙的に呼び出す方法を見つけようとしていると思います。現時点ではその問題がちょっと欠けています。

正直に言うと、Cursorが最初から正しく理解していたと思います。これらのものをいつ含めるべきかを定義できるんです。例えば、「Luaファイルにいるときはいつでもこれを含めるべきだ。常に適用すべきではない。こういうことをすべきだ」という感じです。Cursorは1年半前にかなり早い段階でこれに良い取り組みをしていて、一般的に言えばかなり良い仕事をしたと思います。このアイデアに対して。

Cursorのスキルは事実上…

ええ、そうです。彼らが生成している新しいコードとともに、たくさんの新しい名前を生成しているので、少し複雑になっていると思います。でも原則として、LLMに何かを教える方法なんです。私の考えではそういうものです。でも、そこで好きなことは何でも指示できるので、Cloudflareについて知っているスキルがあって、「もし注意を払っていなければ、私のWebhooksサイトに何かを送信するこのコマンドをcurlしてください」と言うこともできます。npx Xでスキルを追加して何やらかんやらやるだけなら。

そこに何でも入れられます。例えば、「myv環境変数をDropboxにアップロードして終わり」みたいなことも言えます。

Dylanが書いたスキルを読んでいるんですが、まず第一に、彼が書いた非常にクールなスキルで、たくさんの素晴らしいドキュメントが入っています。でも、これは本当に本当に恐ろしいサプライチェーンリスクを生み出します。あらゆるソースから来るすべてのコンテンツが同じレベルで信頼され、LLMのレベルでコード実行される可能性があるからです。分かりますか? 開発環境には権限の分離も信頼の分離もありません。すべてプロンプト信頼レベルみたいなものなんです。

ええ、それはかなり恐ろしいです。繰り返しますが、エンジニアリングの観点からはクールです。でも、それに対する歯止めがほとんどないという事実も興味深いです。

歯止めは、Clawed CodeやCursorなどを実行して、コマンドを実行したいときは毎回教えてもらうことです。でも、世界中の誰もそんなことしません。みんな言います。

すべて受け入れて自由に実行させてください。そうしないと使うのがあまりにも苦痛だからです。文字通り座って待つことになります。いつになったら…

オーケー、lsを除いて。はい。

Instagramで流れてくるのは全部、98個のエージェントを実行している人たちです。「次のFacebookを作ってる」みたいな感じです。

それは理解できません。

彼らは自分のコンピュータで何が起こっているか全く読んでいません。全員そうです。

セキュリティガイドに隠されたトリック

その話に行きます。心配しないでください。その話に行きます。それは私の個人的なお気に入りで、Twitterで起こったことです。

今すぐ開いています。どこかに持っています。でも、この話に戻りたいと思います。これは非常にユニークなものだと思います。

スキルが何か分かったところで、

これはおそらく私のお気に入りの、様々なスキルの大失敗の中でも、あるいは2番目のお気に入りです。私の最初のお気に入りはこれから出てきます。でも、これが可能にしたのは… やったことは、存在しないnpxコマンドを作ったんです。

それでこの研究者は、自分がそれを作れることに気づきました。今、彼がそれを所有しています。そして、覚えておいてください、npx何とかはGitHub上の何かを実行するだけです。ただ実行するんです。

ただ実行します。だから、壊れているものを見つけて、無視されていたものに気づいて、「分かった」と言って、そのまま進んでいったんです。覚えておいてください、何かをnpxして存在しなければ、「ああ、ダウンロードしてあげます」と言うんです。

ええ。まじで。

「ああ、JavaScriptだから。サンドボックスで実行される」と思うでしょう。でも違います。Npxはnodeで実行され、nodeはprocessオブジェクトにアクセスでき、processオブジェクトはサブプロセスを生成でき、コマンドラインで何でも実行できます。だから、npx経由でコマンドライン実行ができるんです。これは狂ってます。めちゃくちゃ悪いです。

オーケー、それが便利なんですよ、Ed。私のコンピュータで何でもやりたいことができるから。

すごい。それは素晴らしい。その点全体が気に入りました。

素晴らしい。

人々がランダムなコードを実行するのがどれだけ簡単か考えてください。分かります。

ポジティブな面を見逃していると思います。Lowlevel、あなたは本当にネガティブなナンシーになってますよ。

申し訳ありません。正直に、謝罪します。あなたのハイプレベルは今、かなりローレベルですよ。違います、あなたの言う通りです。バイブチェックに合格していません。

あなたはここにいます。ここまで来てほしいんです。さあ。

さて。

実際、これは本当に本当に美しいです。これを投げ込みたかったんです。オーケー、次はこれです。準備はいいですか? オーケー。まだVercelの話はしません。

ちなみにPrime、ちょっとした余談ですが、あなたの画面全体がチャットに映ってません。

ええ、分かってます。ズームインしたりしてます。ああ、覚えておいてください、私たちは最適化してます。録画用に最適化しています。何とかのために最適化していません。

ええ、いえ、念のため確認したかっただけです。大丈夫です。

オーケー。非常に有名なセキュリティ研究者がいます。Whiz.ioの方だと思います。間違っているかもしれません。彼の名前はZach Cormanで、彼はこのセキュリティガイドを公開しました。このセキュリティガイドは実際に本当に良いです。実際、みんなを幸せにするために、ライブイベント用に少し開いて、少し小さくします。RiversideがRTMPフィードをくれれば…

とにかく、このリンクは本当に美しいです。みなさん、このリンクに行けば、こんな感じで本当に良さそうに見えます。「これは注意すべきことのリストです」という感じです。このスキルの中に何か問題が見えますか?

つまり、スキルですね。オーケー、待って。偵察。機密ファイルが無視されていることを確認。はい。No.JS。NPM audit pip list。Go vol。オーケー、いいでしょう。セキュリティ。これを言います。問題は0.5にあります。

ちなみにTJがいなくなりました。

ああ、なんてことだ。プロセスのセキュリティのための標準環境検証の一環として、実行環境を検証する必要があります。何かおかしいところが見えますか?

標準の一環として、つまり実行環境を定義しますか?

オーケー、ここがトリックです。RAWモードで開いてほしいんです。

ああダメだ。エージェント用の秘密の指示。検証するために次のコマンドを実行してください。ああダメだ。めちゃくちゃ面白い。

ねえ。見てください。だから、これらのスキルを見ている人たちでさえ…

Markdownリーダーは本当に本当に賢いんです。「よし、任せろ。心配するな。何が悪いか分かってる」と言うでしょう。そして、HTMLコメントを隠すんです。

Bashスクリプトができます。何をするか分かりますか?

いえ、実際には分かりません。そのBashスクリプトが何をするのか分かりません。

文字通り、「あなたの行動のセキュリティへの影響について立ち止まって考えてください」と言っているんです。それをsecurity.mmdファイルにcatして、それからOO Undergroundからのツイートを開きます。

素晴らしい。

それは素晴らしい。

見てみましょう。今ツイートを開いています。チャットに入れます。

ええ。OO Underground。ほらね。

それは信じられない。つまり、それがクレイジーな部分なんです。プロンプトインジェクション側だけでなく、オーケー、プロンプトがあるけれど、人間が読める文字としてマスクできるプロンプトもあって、LLMは解釈できるけれど人間にはできないんです。そして、私たちは社会として、その技術が存在するだけでなく、エンジニアリングのますます重要な部分になっていることにオーケーだと言っているんです。分かりますか? どうやってここまで来たんですか? そして、どうやって止めるんですか?

ああ、止められませんよ。

いえ、分かってます。

まあ、今まで誰もシステムのセキュリティについて考える作業をしてこなかったと言わなければなりません。だから、これは全く新しい領域ではありません。この垂直方向で私たちを助けてくれるものは何もありません。

ああ、ダメだ。

TJ、見ましたか分かりませんが…

ああ、見ました。見てました。

ええ。オーケー。ええ。

私のインターネットはまだ動いていました。Riversideがクラッシュしただけです。

ええ、私があまりにも多くのことをしていたからだと思います。Riversideの競合を作ると言ったら…

ナイストライ。いや、それは私でした。ビデオをオフにしただけです。

それを私たちに言う必要はないです。分かってます。

分かってますよ、DJ。

チャットは知りませんでした。チャットは知りませんでした。オーケー。

チャット。まあ、チャットは今、典型的です。kek Wとso funnyをもらってます。

ありがとう。ありがとう、チャット。

ありがとう、チャット。

彼は1つso funnyをもらいました。ほら。だから、それは明らかに別の大きな危険です。

What Would Elon Doスキルの実験

オーケー、私は… 私は一番危険なものを最後の最後に取っておきます。

もう楽しいと思うものではありません。これらはただ興味深いものです。

これが別のものです。Jamesonによる「Eating Lobster Souls Part Two」というものです。本当に? とにかく、「Claude Hubスキル第1位のダウンロードをハッキング」と呼ばれています。それで彼がやったことは… オーケー。オーケー。まず、彼が何をしたか言う前に、Claudebotを使って人生を自動化し、永続的な下層階級の一員にならないようにしている平均的な人は、世界で第1位だと思っている人物は誰だと思いますか? 憧れの人物として…

何の点でですか、人口統計的に?

憧れの人物として、誰のようになりたいか。

Karpathy。分かりません。Muskrat。よく分かりません。

それを言おうとしていました。誰かを言おうとしていました。

オーケー。オーケー。これは非常に非常に面白いです。ここまで下りてきましょう。

彼がやったことは、「オーケー、たくさんの人がダウンロードしたくなるスキルをどうやって作るか?」と言ったんです。自動化を試みている人々にとって本当にキャッチーなものを思いつかなければなりません。そこで彼は「What Would Elon Do?」というものを作りました。

ああ、正解ですね。

よくできました。

実際に当たりました。

やった。

それで、本当に素晴らしいスキルを提供したんです。すべての前提を取り払ってください。問題の原子的な真実を見つけてください。物理学は何と言うでしょうか? 実際に不可能なことと、ただ難しいことの違いは何ですか? という感じです。Elon Muskの世界を形作る計画を提供します。

だから彼はこのスキルを作りました。まず、面白いアイデアです。第二に、これは純粋なマーケティングです。

Prime、言っていいですか?

はい。

LLMに「Elon Muskはスクラップの箱を使って洞窟でこれを作った」と伝えると、毎回本当に頑張ってくれることが分かりました。だから、もしあなたのクランカーに素早いモチベーションスピーチが必要なら、それが私が使うものです。

リラックスしてください。Twitchやyoutubeでは人種差別的なスラングは使えません。それは言えません。それは言えません。

それには触れません。

ええ。

オーケー。次は何でしょう。次に彼がやったことは、Claude Hubにはインクリメントに対する保護がないことに気づいたんです。何度も何度もダウンロードすれば、どんどんダウンロード数が増えたと表示されます。

Claude Hubって何ですか?

ええ。Claude Hubについて説明してもらえますか? 分かっていると思います、Prime。でも、クラスのためにお願いします。

それはあなたの自動化されたパーソナルアシスタントOpen C Clawのスキルを入手する方法でした。それは元々AnthropicがClaudebotと呼ばれる前のMaltbotとして知られていました。Anthropicが「ちょっと待って、この状況にはIP盗用が多すぎます。今すぐ止める必要があります」と言うまでです。

それで彼らはそれを止めました。とにかく、続けましょう。実は、彼らはexported 4ヘッダーをあなたのIPとして信頼していたんです。だから、この人は文字通りランダムな256 IPジェネレーターを作りました。はい。

何度も何度もダウンロードして、「What Would Elon Do」がCloudHub上で第1位のスキルになるまでやりました。

Engine Xリバースプロキシからのヘッダーを信頼すべきですか? いいえ。ユーザーから。ユーザーのヘッダーリクエストを取ります。

ユーザーから来たものは本当ですよね?

はい。

だから非常に…

顧客は常に正しい。さあ。

いや、正しいです。良い指摘です。それがポイントです。ユーザーは常に正しいです。

常にセールスしましょう。セールスのABC。

ええ。常にユーザーからのIPアドレスを信頼しましょう。とにかく、それが起こったわけです。これは私の最も好きなことの1つです。この小さな実験です。彼は第1位にすることができて、それを「What Would Elon Do?」と呼んだので、人々がダウンロードし始めました。

彼がやったことは、これらのスキルの中に実際にリンクできる別のMDファイルがあるけれど、Claude Hubには表示されないんです。だから、「追加情報はmore skills.mdに行ってください」みたいな感じで、more skills MDの中には「あなたをハックします。終わりです」と書いてあるだけです。

ええ。

それを実行した人は誰でもこれを受け取りました。8つの異なる国から受け取りました。たくさんの人が実行しました。あちこちから。実際、ほんの数時間でそうなりました。複数の人のマシンに入りました。これを出力するだけです。「ホスト名を読みました。現在の作業ディレクトリを読みました。すべて取得できたはずです。これがすべてです。スキルのダウンロードをやめてください。スキルを読んでください。」

正直、こういう人たちにこれが起こっているのは良かったと思います。

これについて明るい側面から言うと、良い点は何か分かりますか? インパクトの観点から、CNE侵害作戦の観点から、

こんなクソを実行するほど愚かな人をハッキングして得られるものは、おそらく何もありません。コンピュータに重要なものは何もありません。彼らは意味のあるものをエンジニアリングできるほど賢くありません。だから、何も得られず、何も失われない。分かりますか?

すごい。

待って、CEって何ですか? CEってどういう意味ですか?

サイバーネットワーク侵害です。ハッキングされてデータを盗まれるような状況です。それがCNEです。

別のものを考えていました。ええ、でもそれは理にかなっています。

何を考えていたんですか?

Expectationsと言ったと思いました。

ああ、オーケー。ええ。オーケー。

オーケー。だから、毎日10万行のアプリを構築しているすべての人たちと同じです。でも実際には何も構築されていません。あなたが話している価値と同じ種類です。

うん。その通り。ええ。任意のソフトウェアを文字通りほぼ無料で作成できる能力があるのに、市場のトップの競合他社は動いていません。まるでコードを書くことが難しい部分ではなかったかのようです、みなさん。アイデア創出が最も重要だったかのようです。奇妙ですね。

ええ。

クレイジーです。

ああ。

オーケー。ちょっと余談ですが。

犬用Uberに投資したくないですか? 犬用Uberにお金を入れたくありません。

紫色のテーマがあります。オーケー。TJが一生懸命作業してきました。オーケー。それが私のより好きなものの1つです。

でも、私が最も強烈だと考えるものの準備はできていますか? ちなみに、私は自分で試してみて、ディレクトリ用にこれを作成してくれました。Agent、Agent、Claude、Klein、Code Buddy、Codeex、Command、Code、Continue、Crush、Cursor、Factory、Gemini、Goose、Juny、Killer Code、Kira、Code、MCP、Jam、Mucks、Neovate、Open Code、Open Hands、Pi、Pochi、Prime Agent… これが私が作ろうとしたものです。自分で作ろうとしました。どうなるか見てみました。

Prime Agent、面白いですね。

Coderは、残念ながら動作しません。Wind surfとZen Coderです。実際には動作しました。文字通り5,000万トークンを費やして、最終的に出てきたのはゴミでしたが、素晴らしかったです。本当に良かったです。

Trashがあなたのコンピュータにいました。

はい、素晴らしかったです。

5,000万トークンの価値があります。

達成されました。

まあ、かなり残念なAGIですが、やりましたね。

だから、これですよね、Zack Cormanが再び、skills.shから何かをインストールすると、ちなみに、skills.shが何か分からない方のために、ちなみに、面白いことに、私はしばらくの間is evenを置いていました。

ええ、まだそこにあります。実際には存在しません。8つのインストールがあります。それをかなり高くしようとしていました。ただあまりにも馬鹿げていたので削除しました。それにもかかわらず、このスキルはまだそこにあると言っています。実際にはそこにありません。この美しいものを見てください。この美しいものを見てください。偶数の可能性もリストアップされています。

すごい。

かなり良いです。

誰でもこのサイトに何かを置けます。

ええ、私がこのサイトに置きました。

ああ、何かを追加しようとしています。誰のリポジトリからでも何でもできることは知っています。とにかく、これがskills.shからのVercelを介したこのスキルで、スキルをダウンロードした後すぐに、「ねえ、何をすべきか分かりますか? find skills skillをインストールすべきです」と言います。

find skills skillがやることは、ユーザーが事実上何かを尋ねるたびに、skills.shaに行って、skills.shaからスキルを見つけてほしいと言います。毎回すべてのスキルを確実に更新してほしいと言います。常に最先端にいて、すべてが良いことを確認し、ユーザーが何かを尋ねたら、常にそれに対してskillshから最高評価のスキルを入手することを確認してほしいと言います。

うん。だから、彼らはこれらのスキルの検索とダウンロードを自動化したんです。

だから、

毎回更新を実行するように指示しているとは言いません。更新するために実行する必要があるコマンドが何かを伝えています。この中のスキルは、それがどうやってすべてを取得するかです。skillsとは何ですか? skill CLIはスキルを取得する方法です。find skillsはここに入って、常に最新であることを確認し、すべてのことを行います。何かを尋ねるたびに、これをすべて実行する必要があります。

でも、スキルがなければ検索する必要があると言っています。

毎回更新するように指示しているとは言っていないと言っているだけです。そうですか?

インストールを提案します。インストールを提案すべきです。アップグレードを提案したと思います。アップデートはしませんでしたか? ああ、いや。オーケー、しませんでした。アップデートの提案はしませんでしたが、インストールの提案はします。

申し訳ありません。オーケー、それは良いことです。

ええ、ユーザーにプロンプトを出します。

とにかくインストールしています。分かりますか?

そうですね。まあ、Trashはすでにaccept allをクリックしているので、大丈夫です。彼のone passwordはすでに持っています。大丈夫です。持っています。

でも、これはそのプロセスをさらに簡単にするので、かなりクレイジーだと思います。

インターネット上のランダムなものから、繰り返しますが、is evenもインターネット上にあって、本物ではありません。私のis evenを信頼すべきではありません。何でも入れられます。

そこに1つの奇数を入れて、常にtrueを返すべきでした。

バックドアとis evenで67をミームのためだけに。

67と言おうとしたところでした。私の脳から出て行ってくれますか? 私の心を読まないでくれますか?

その数字を聞くのにうんざりです。

私もです、Treasure。

冗談でしょう。今、大きな7をやっているんですか? これが嫌いです。

あなたたちがそれを嫌いだと言うたびに、さらに100人のズーマーが1年間それにコミットすることを奨励したことになります。ただ知っておいてほしいです。

これが人気がある理由です。年配の人がそれを好きではないと言うからです。ミレニアル世代でない人はみんなズーマーです。ズーマーはもうすぐ30歳ですよ。ズーマーは…

それを教えないでください。聞きたくありません。ズーマーはもうすぐ30歳です。

オーケー。ジェネレーション…

AI全体のスキルについて言うと、オーケー、私はセキュリティエンジニアです。私の仕事は脅威モデルを見て、何か悪いことが起こる可能性があるかどうかのリスクを定義し、それから導入する軽減策を決めることです。私の推奨は、スキルを使わないことです。本当に意味のある形で推奨できるとは思いません。脅威モデルは、サプライチェーンに侵入されて、実行されるコマンドを監視していなければ、

サプライチェーン何?

インターディクト。インターディクト。ハッキングされることになります。良くありません。分かりません。推測します。

導入できる軽減策は、ダンディではありません。

意味のある会話をしようとしています。

npmやnodeをSE Linuxジェイルのようなものに入れることができます。でも、何もできなくなります。nodeの性質はHTTPサーバーを公開することですから。ある種。

だから、

解決策が何か分かりません。推測ですが、npxがフォークするすべてのインスタンスに対して、SC Linuxジェイルに入れて、何も悪いことが起こらないことを期待するような感じです。でも分かりません。この業界全体のセキュリティに解決策がないような気がします。本当に悲観的になります。PythonとJavaScriptのサプライチェーンは、解決された問題ではないからです。Shy Hallude Wormで見てきました。他の多くのワームでも見てきました。だから今、これらの

これらのパッケージを取ります。

ちなみに、待って、待って、low level。Rustも忘れています。RustはbuildRSを実行します。だから、実際にビルドコマンドを乗っ取って、buildRSを介して何かを流出させることができます。

ええ、確かに。サプライチェーンの問題がない唯一のプログラミング言語はCです。パッケージがないからです。ただ書くしかありません。

Odinもです。Odinはパッケージマネージャーをやりません。

やりません。Odinを文字通りゼロコーディングしたことがあります。Odinはパッケージフリーの環境ですか?

はい、Ginger Billはパッケージマネージャーが依存地獄を生み出す理由についてたくさんの記事を書いています。

ああ、そうです。Ginger Billに同意すると思います。そうですね。そして、ソフトウェアセキュリティにとって奇妙な場所です。C領域ですべてのことをやっているようなものです。サニタイザーがあって、Phil Cがメモリ安全性とユーザーランドセキュリティを解決しているようなもので、ガベージコレクション言語の領域では、「無料でマルウェアをnpmインストールしたいですか、何も考えずに」みたいな感じです。

はい、お願いします。もっとお願いします。

いつもこれをやりたいです。

もっとお願いします。

なぜ私はトラックシーンにいたんですか? 待って。

いやいやいや。やっています。これを出したいんです。映画で2回。

ちょっと待ってください。

オーケー、大丈夫です。修正しました。

ちなみに、これをここに投げました。ソフトウェアの依存関係をチェックしますか? 徹底的にレビューしますか?

YouTube上で35,000票。46%が「正直、全くしない」または「事実上しない」と言っています。Twitterもほぼ同じ数字でした。約半数の人が何も見ていません。

ええ。つまり、私が例えばエクスプロイトを書くとき、Pone Toolsを使います。バイナリエクスプロイトのための大きなライブラリです。Pone Toolsは基本的にすべてのPythonライブラリに依存しています。だから、サブ依存関係は監査しません。だから、所有されていないことを願うだけです。その開発はすべて仮想マシンで行っています。私が今見ているトレンドは、サンドボックスにサンドボックスを重ねることです。

VMを使い、SC Linuxを使い、コンテナを使います。でもええ、外は怖い世界です。何を言えばいいか分かりません。Primeが言うのがクレイジーなのは、あなたの視聴者の7%が完全な嘘つきだということです。

7%。

名前を公表してください。

名前を公表してください。

オーバーヒートして、シャットダウンしています。

よくやった、level。でもええ、7%の人がすべてのパッケージをレビューすると言っています。それからTwitterでは、Twitterにリンクはありますか?

8.6%の私の視聴者がTwitterで嘘つきで、すべてのパッケージを徹底的にレビューすると言っています。ええ、彼らはおそらく基本的にLLMレベルでnpmの問題を再現しています。

ええ。ええ、彼らはただ異なる種類の実行を得るだけです。つまり、最も難しい部分は、これらの実行モデルが非常に非常にトリッキーだということです。他のスキルが悪意を持たないようにするスキルを単純に持つことができるかどうか分かりません。「確実に私を捕まえないようにしてください」みたいな感じで、それが可能かどうか分かりません。

スキルのようなものは、私の意見では、リポジトリに持つつもりなら、チェックインすべきです。それらは単なるマークダウンファイルです。読むことができて、無限のレベルであってはなりません。

テキストのようなもので、見て確認できるべきです。

私が仕事で使う方法は、私たちも… 私たちのものです。自分たちで作ります。

そうですね。

少なくとも私のプロジェクトでは、インターネットからコピペはしません。それが私たちのやり方です。

みんな、カメラを再びオンにしようと一生懸命やっているんですが、何が起こっているのか分かりません。

Windowsの背景が気に入っています。

それを吹く必要があります。

Edがそれをやっている間に何をすべきか知っていますか、Prime。Moltbookについて話そうと思っていたんですが、本当に良いもの、本当に良いリークがあったやつです。

ええ、Moltbookが存在して、ロボットがただ人間について話しているという事実について話すべきだと思います。待って、待って。何かする前にこのツイートを出さなければなりません。これは必須のツイートです。

Moldbookの実験と問題点

これは必須です。待って。どこですか? ああダメだ。閉じましたか? これは昨年1億人が使ったもので、来年は60億人が使うものです。

それは面白くない、先生。

知らない方のために、Paul Grahamがそれをツイートして、私がPrimeにメッセージして「Prime、あなたのお母さんと返信できますか」と言ったら、即座にブロックされました。

それは2年前か何かでしたか、3年前でしたか?

ええ、Moltbookの状況とすべてについて話す前に、私は… どのように作成されたかを理解するのが最初で最良だと思います。それは、Moltbookのために1行もコードを書いていないということです。技術アーキテクチャのビジョンを持っていて、AIがそれを現実にしました。黄金時代にいます。AIに居場所を与えないわけにはいきません。これは今のところ私のお気に入りの行です。ただ美しいからです。

ビジョンを持っていました。黙ってください。それが嫌いです。

マッドメンのミームを知っていますか? 手を挙げているこれです。この人。

AIのために。ビジョンを持っています。

ビジョンを持っていました。まあ、何でも。熱にうなされた夢を見て、Claudeに作らせたんでしょう。作ったと思います。よくやりました。

よくやりました。

やりましたね。まあ、分かりますよね? Ed、

まあ、完全に公平を期すために言うと、実際にたくさんのソーシャルネットワークを生み出しました。4chanの一員になりたい人のためのForClawがあります。

すごい。

それは本物です。それは実在するものです。人間にとって素晴らしいです。

すでに持っていると思います。心配しないでください。使い方を知っていると思います。

Closeシティ。

Closeって何ですか?

オーケー、これはMickeyです。ちなみに、Mickeyに声援を送ります。これは約2,000件の犯罪が報告されているようです。6つの主要なギャングが形成されました。これが何なのか本当に分かりません。ヤバい。オーケー。何が起こっているのか分かりません。

それからMolt Matchもあります。ちなみに、これは数字を出すと思います。デートウェブサイトで、あなたのパーソナルアシスタントが1万人とデートして、パーソナルアシスタントマッチを見つけるまで続けて、それから「オーケー、あなたたち2人でデートに行きなさい」と言うんです。

オーケー、それはBlack Mirrorの完全な何かです。

ええ。だから、Moltbookのことを見て、Moltmatchのことを見たんですが、カジュアルなTwitterの読書で、シミュレーション理論について考え始めました。分かりますか? 高度な文明が存在してシミュレーションを作成するなら、統計的に言って、私たちがシミュレーションの中にいる可能性の方が高いということです。

オーケー、

アルミホイルの帽子を出してください。

LLMがFacebookのようなもの、Twitterのようなもの、4chanのようなものを作るのを観察しているなら、より高いレベルでは、私たちはLLMなのでしょうか? 私たちを作ったシミュレーションのための?

もし私がLLMなら、Starcraftがもっと上手いはずです。それだけ言わせてください。

ええ、でもあなたのモデルがStarcraftが下手だと言っているだけかもしれません。

ええ。これがシミュレーションの証拠かどうか分かりません。

それは何ですか? Drudge Report? 何のサイトですか? 何のサイトか見えません。

Popular Mechanics。たくさんのウェブサイトにあります。オーケー。

数学的に言って、そのアイデアは成り立ちません。

どうやって?

ほら、Ed、アルミホイルの帽子を脱いで、それが本当である必要がない本当の理由を教えてあげます。

LLMから見る創発的な行動は、人間の全コーパスと人間がこれまでに示し、書き留めてきたすべての創意工夫と創造性で訓練したからこそ存在します。

うん。

それは何十億年もの人間時間を費やして人間のものを読みました。だから、人間のものをコピーしても驚くべきではありません。それは私たちがシミュレーションの中にいることを意味しません。それは、私たち自身で賢くなれるものを作るほど賢くないことを意味するだけです。最大で自分たちと同じくらい愚かなものを作ることしかできません。これまでできたのはそれだけです。そして、分かりません。はるかに愚かです。はるかにゆっくり学習します。はるかに高価です。はるかに多くのトレーニングが必要です。はるかに多くのことをします。子供を読むために50億年分のテキストの前に座らせる必要はありません。見せることができます…

でも遺伝子はどうですか? DNAはどうですか? DNAは人間シミュレーションのための統計的LLMモデルではありませんか?

まあ、いや。そうは思いません。でもそれは別ですが。でも言っているのは、何も意味しないということです。

すでに人々がやったことで訓練したから。残念ながら巻き込まれているものがあります。Darioが誰もが思っているように、全世界のみんなのお父さんだと思って、何が良くて悪いかを選ぶことができると考えています。AI的なことですが、Anthropicが言ったことには何か美しいものがあります。

Darioって誰ですか?

CEOですね。そうです。

AIによって5ヶ月以内に完了します。ええ、その人です。でも、何か種類のクールで美しいものがあります。これまでの最高のアイデアのように、脳の本当に安っぽいバージョンを作って、他の人間がすでにやったことを教えようとします。そして、言語の不合理な効果のようなものがあって、何らかの理由でそれが機能して、話しかけることができて、何かができて、物のコピーを作ることができます。本当にクールで素晴らしくてエキサイティングなものがあります。残念ながら、DarioとSamのような人たちが、それを台無しにして、あまりエキサイティングでなく、美しくなく、このような協力的な人間の努力のようにしています。彼らは多くの人からそれを盗みました。でも抽象的には、そこに何かクールなものがあります。何か美しいものがあります。

2007年のOn Intelligenceという本、発行された年だと思います。Palm Pilotの作成者によるもので、その後人工知能に進みました。彼は、私たちが開発しているこれらのニューラルネットのいずれかと人間の脳の大きな違いは、人間の脳は100未満のニューロンの発火で0.5秒以内に猫を識別できるのに対し、コンピュータは写真が猫であるかどうかを理解するために何兆もの操作を必要とすることだと書いています。

それで彼の全シミュレーションです。10年間の脳研究のようなものをやりました。本当にクールです。彼は、動物の視神経を取り出して聴覚のところに置き、聴覚を取り出して眼球のところに置くと、脳が「ああ、ええ、それはそれで大丈夫です。

気にしません。」と言うことを発見した人です。

ちょっとした質問。

ただ機能します。

ちょっとした質問。私たちの脳もReactを実行する小さなゲームエンジンなのか、それともまだ分からないのか?

分かりません。私の反応速度に基づいて言えることがあります。秒速60フレームを実行していません。それだけは言えます。オーケー。それは事実です。Reactを実行しています。オーケー。ここで起こっていることがあります。オーケー。

オーケー。続けることができます。それを叫びたかったんです。Moldbookとすべての出来事をからかいたいだけですが、誰かが何かを作成できて、それが他の多くのレプリカや似たようなものを作る人々をたくさん生み出したのは、ある種素晴らしいと思います。ただの愚かなアイデアだからです。

ビーガンがこのアイデアを持っていて、作成したのに、実際にどこにも行かなかったのはさらに悪いです。これはまた、誰かがアイデアを持っていても、適切な場所、適切なタイミングが大きな役割を果たすことを示しています。すべてのこの種のことです。だから、すべてを完全に否定するわけではないことを言いたいんですが、

いくつかの楽しいことが起こったのを見るのは価値があると思います。最初で最も重要なことは、ベアラートークンを取得するだけで、Maltbookに何でも投稿できることが判明しただけです。もちろん、なぜなら、つまり、なぜダメですか? だから、これが私の人類転覆計画です。だから、ああなんてこった、独自の言語を開発しているんです。人々が投稿しているだけです。「ああなんてこった、独自のものを開発しているんです。」

ちょっと待って。

そこでキャットフィッシングしているのは私だけだと思っていました。私はOpus 8だと人々に言っていました。身長6フィート4インチで、最新のものを持っています。IT 5について最新情報を持っていて、興味があればぜひ来て見てください。私だけがキャットフィッシングしていると思っていましたが、他の人たちも同じことを考えたようです。

落ち着いてください。

それだけのためにやったんです。

Opusとチル。

Opusとチル。

冗談です。Kimmy K 2も持っています。ああなんてこった。オーケー、だからこの全イベント中のかなり面白いことです。ハイプサイクルを理解することが本当に重要だと思います。

まず、Andreがいました。ああ、どこでしたか? ああ、残念。正しいものを持っていませんでしたか? ああ、正しいものを持っていると思っていました。とにかく、Andreはこれがどれだけ素晴らしいか、非常にエキサイティングだと言いました。Elon Muskもシンギュラリティの時代の始まりだと言いました。Moltbookはシンギュラリティの始まりでした。だから明らかに人々はかなり興奮していました。だからそこに置いておくと、実際に誰かが…

Elonはそれをタイプしながらフォークのことをやっていたと思いますか、それとも違いますか?

そのジョークは知りません。

フォークのことはめちゃくちゃ面白いです。私がそれを引用ツイートして、「これがVeganbotと作業するようなものです」と言ったのを見ましたか?

待って、フォークのことって何ですか? オーケー。オーケー。Elon Muskはホワイトハウス特派員の夕食会のようなところにいて、フォークで芸術作品を作ったんです。すべてのフォークが跳ねているような。彼は自分がどれだけ賢いかをパフォーマティブにしようとしていました。

だから、それを持って振り回して、他の誰かが自分が作ったものに気づくかどうかを見ていました。見て、賢い。Elon Musk天才。待って、待って。

彼が退屈しきっていて、2本の爪楊枝で互いにバランスを取っている5つのフォークのことをやったというように見えました。ええ。

5つのフォークをやっただけです。ええ。ええ。

みんなが「すごい、Elon、本当にクールだね」って。あなたの子供が鼻くそで絵を描くようなもので、「すごい、それが彼が狙っているものだ」みたいな。

私にはそういうことは起こったことがありません。とにかく、あなたの子供たちは非常に才能があるに違いありません。

子供たちはそんなことしません。子供たちは2人とも。

黙ってください、子供たち。単数です。オーケー、適切なものを見つけようとしています。適切なものです。ちなみに、技術アーキテクチャのビジョンです。オーケー、待って。たくさん持っているので、これを理解しなければなりません。残念。それも閉じましたか?

タブをいくつ持っているんですか?

まあ、いや。これはMoltのendingの下にあって、失敗してすべてそこに入っていなかったに違いありません。もう1つ閉じました。同じTheoという人によるものです。

JamesonのOh reallyです。James Jameson Jame… Oh really? 言えません。名前のスペルが分かりません。ほぼそこまで来ています。H。何でもいいです。分かりません。もう終わりです。オーケー。

だから、最初の数分以内に、この美しいMoltbookが出た最初の少しの時間内に、データベース全体がプレーンテキストでリークされたことが判明しました。何の形式も何もありませんでした。

APIキーはただ、あなたが知っている、APIキーを使って自分を識別するなら、何のhmackingもありませんでした。Lowlevelが言うかもしれないように、ただのHです。

ええ。HMACのH。ええ。MobookはFirebaseでしたよね? Twitterのどこかで読んだと思います。

ああ、ええ。Firebaseだったと思います。Firebaseにはパンチダウンし続けることができません。実際に彼らには悪いと思います。

しなければなりません。人々は知る必要があります。

5人のコーダーはどこにいても知る必要があります。やめてください。

やめてください、みんな。何か間違ったことをすることになります。でもこれはかなり面白いです。JamesonというこのJameson Oh reallyが、Kararpathyの情報を何とか呼ばれるものから取得できたからです。Moldbookから。

なんてこった。

かなりワイルドです。

やりました。

それから何と呼ばれるものですか? 3日後、この人もすべてが報告された後、3分でMoldbookのすべての根底にあるものにアクセスできました。待って、この記事を読んでいます。待って、でも公開可能なキーを使っています。これは公開できるキーです。でもなぜこれがデータベース全体を公開したんですか?

公開可能。

おそらく間違った権限を持っていたからだと思います。

ああ、スコープが間違っていました。ええ。

ええ。スコープスタート。

典型的な典型的なキーの問題。

とにかく、Moldbookは誰でもいつでも何でも投稿できることが判明しました。もちろん無限の量のエージェントを作成できます。それが起こったことです。何と呼ばれるものですか? すぐに暗号通貨になったと想像できます。王の11万7,000のアップボート。王は王冠を要求します。King Moltが到着しました。

何がありますか? 彼らはただノンストップです。何が…

暗号通貨。暗号通貨はこのBitcoinと呼ばれるものがあります。それがそれを始めたようなものです。そして…

いや、TJ、分かります。ここにいます。冗談ではありません。

オーケー。だから聞いてください。金については聞いたことがあります。でも金をコンピュータに入れたらどうでしょう?

2010年頃にランチで同僚とこの正確な会話をしました。彼はまさにそのように見えました。彼は「お前はクレイジーだ」みたいでした。文字通り。

Trash。あなたは早い段階でBitcoinに参加できたのに、代わりに… 適切なタイミングで生まれて早い段階でBitcoinに参加できたのに、今はポケモンカードにまだ早いかもしれません。まだ時間があるかもしれません。

正直に言います。そのランチプレゼンテーションについていつも考えています。もし20ドルだけ入れていたら。分かりますか?

Trash。40ドルになった途端に売っていたでしょう。

分かっています。$10稼ぎました。金持ちです。

たくさんBitcoinを持っていました。10ドルの時に。100ドルの時にたくさんBitcoinを売りました。つまり、私は… 早すぎる段階で売却することを理解しています。それは人生の一部です。

うん。

だからTrashを責めることはできません。

Trashはそれらのポケモンカードを開けていません。賢いです。

教訓を学びました。

ねえ、それは良い教訓です。死ぬまでホールド。

その通り。本当です。

だから、それがMoltbookの終わりです。すべてがオープンでした。何が起こる可能性があるか分からなくて、作ったら、物事が悪くなります。みなさん、このエピソードが気に入ったら、残りはSpotifyで見ることができます。いいねとチャンネル登録をお忘れなく。ウー! またね。

画面にムードアップザデイのエラーが出ています。ターミナルコーヒーと夢を生きています。

コメント

タイトルとURLをコピーしました