「残された時間は数ヶ月」AnthropicのMythosモデルがもたらすサイバーセキュリティの危機

Anthropic・Claude・ダリオアモデイ
この記事は約24分で読めます。

AnthropicのMythosモデルが公開されてから48時間も経たないうちに、世界はその衝撃を受け止めようとしている。このAIモデルは、人間が何十年も安全だと考えてきたコードの脆弱性を自律的に発見し、悪用するエクスプロイトを作成する能力を持つ。問題の本質は、サイバー攻撃能力が飛躍的に向上した一方で、防御能力は追いついていないという非対称性にある。Mythosは脆弱性発見において革命的だが、それらを修正する能力は向上していない。さらに、OpenAIやxAI、Metaなども同様の大規模モデルを開発中であり、この能力が広範に普及する可能性が高い。専門家は、今こそオンラインデータのバックアップを取り、パスワード管理やハードウェアセキュリティキーなどの基本的なデジタルセキュリティ対策を強化すべきだと警告している。AIの整合性問題も未解決のままであり、モデルが予期しない方法で目標を達成しようとするリスクは依然として存在する。

we have months left...
Check out tastytrade here: notes, links etc:

Mythosの衝撃と世界の反応

AnthropicのMythosモデルに関するニュースが公開されてから48時間も経っていないんですが、世界は徐々にその現実と向き合い始めています。AnthropicはGlass Wingという連合を作りました。これは大手テクノロジー企業で構成されていて、Anthropicは彼らにMythosを自分たちでテストする機会を提供しているんです。ちなみに、これは全てGoogle Cloud上で動いているようですね。

Anthropic側でこのプロジェクトを運営している人物の一人がLogan Grahamです。彼の発言を見てみましょう。Mythosの初期テスター達は驚愕しているそうです。引用すると、「Mythosは彼らにセキュリティに関する全てを再考させた」とのこと。これは世界最大規模の再考努力なんです。彼はまた、Mythosのニュースに対する世界の反応は良好だと言っています。

それは彼らにとって嬉しい驚きでした。反応はこんな感じだったそうです。「これはクレイジーなモデルだけど、Anthropicの対処方法は責任あるものに見える。でも、次に何が来るのか心配だ」というわけです。これがMythosと来るべきAIの波に対する受容の3段階なんですよね。Grahamは、第2段階まで到達できれば満足だったと言っています。

人々が心配しているという事実は、ポジティブな兆候なんです。だから、この会話が起きているのは本当に良いことなんですよ。ただ、多くの人にとっては少し抽象的で、どこか遠い話のように感じられるんじゃないでしょうか。自分には関係ないと思っているわけです。だから、このビデオの目的はあなたをパニックに陥れることではありません。ルールナンバーワンを覚えておいてください。パニックにならないことです。

この問題の本質と規模

でも、このチャンネルの全ての目的は、何が起きているのかを理解し、それを明確な目で見ることなんです。今すぐやるべきことがいくつかあります。それを見ていきますし、もう少し長期的なことについても話します。ただ、AIの進歩のペースを考えると、それもすぐそこまで来ているんでしょうけどね。

まず最初に理解することが重要だと思うのは、この問題がどれだけ大きいかということです。これはある種のインターネットメルトダウンを引き起こす可能性があるんです。Elazar Yukoskiがここで言っているように、問題はシンプルなんですよ、考えてみれば。このモデルは自律的に、そして大した費用もかけずに、私たち人間が何十年も安全だと考えてきたコードの脆弱性を急速に発見できるんです。

脆弱性を見つけるだけじゃなくて、それらのエクスプロイトも作成できるんです。Anthropicが公開したビデオでは、このモデルがこれらのエクスプロイトを非常に賢い方法で連鎖させて、システムの防御を突破できることがわかりました。サイバーセキュリティを猫とネズミのゲームとか、軍拡競争のようなものだと考えてみてください。悪い奴らが何かを見つけ出して、良い奴らがそれにパッチを当てる。こういう前後の競争なんです。

全てが多かれ少なかれ均衡状態にあったわけです。でも、サイバー攻撃を行う能力が急激に上昇したんです。これは秘密じゃありません。Mythosに関するブログ投稿の全てがこれについてでした。システムカードもそうでした。誰もこれを否定していないんですよ。まあ、これらのAIラボから出てくるものを何も信じない人がいるのは理解していますけどね。

このビデオを見ている人の中にも一定数、そう感じている人がいると思います。「ああ、彼らは嘘をついているだけだ。何も起きていない。大したことじゃない」みたいな。もしあなたが正しければ、そうなんでしょう。何ヶ月も何年も経っても、何も悪いことは起きないでしょう。だから、誰が気にするんですか?

攻撃能力と防御能力の非対称性

でも、Anthropicが言っていることは本当だと信じている私たちの他の人にとって、そしてその前提で話を進めますが、それは何かを壊す能力、あの古いOlympia Biscuitの曲みたいに、Break Stuffですよ。物を壊す能力が急激に上昇したということなんです。ハッキングできる、クラッシュさせられる、めちゃくちゃにできるんです。ゼロデイ脆弱性を特定できて、自律的にエクスプロイトを考え出せる。寝ている間にAIに世界中をハッキングさせることができるわけです。

だから、ほとんどの人はその部分は理解したと思うんです。でも、私が思うに彼らが見逃している部分は、今やそれらについて知っているからといって、全ての問題が解決したわけではないということなんです。彼らがGlass Wingという連合を作ったのは知っています。AWSも参加していて、Ciscoも参加していて、みんな参加しています。でも、それで全てが解決するわけじゃないんです。せいぜい応急処置なんですよ。

こういうことなんです。現在の大規模言語モデル、そしておそらくMythosも、今すぐコードベース全体を書き直して完璧に安全でセキュアにできる段階にはないんです。コードの一般的な強化は、一つの脆弱性を見つけるよりも難しいコンピューターサイエンスの問題なんです。だから、弱点を見つける能力は急上昇したけど、弱点を修正する能力は変わっていないんです。

つまり、そう、一度それについて知れば、エンジニアのチームを集めて修正に取り組ませることはできます。でも、それらを修正する能力自体は増加していないんです。そして、これからますます頻繁に聞くことになるアドバイスの一つがこれだと思います。このビデオで今まさに聞いているアドバイスです。少なくともここで結論として見ているのは、今がオンラインデータ全てのバックアップを追加で取る良い機会かもしれないということです。Googleテイクアウト経由で、エアギャップされたオフラインのハードドライブに保存するんです。

バックアップの重要性と脅威の範囲

AI Safety Memesが言っているのは、明日目覚めたら全てが消えていることを想像してみてくださいということです。全てのビデオ、全てのメール、全てのドキュメント、全ての思い出が。AnthropicのMythosモデルがこれらのゼロデイエクスプロイトを見つけられて、それを全てのオペレーティングシステム、全てのブラウザで行えるなら。まず第一に、これを最初に発見したのがAnthropicだったことに感謝しないといけません。

ちなみに、彼らが最初だったと仮定しているんですが、それは保証されていません。もしかしたら、彼らが最初にそれについて話しただけかもしれないですからね。ちょっと話は変わりますが。ほとんどのトレーディングプラットフォームは問題ないですよね。でも、実際に何か本格的なことをしようとすると、突然インターフェースと格闘することになって、ツールを探し回って、複数のアプリをやりくりする羽目になります。あまり良くないんですよ。

Tasty Tradeがこのビデオをスポンサーしてくれてありがとうございます。Tasty Tradeは株式、オプション、先物、仮想通貨など全てを一つのプラットフォームで提供していて、これだけで大きな問題の多くを解決しています。でも、もっと大きいのは、もう少し慎重に、もう少しハンズオンで、そして希薄化された小売ツールへの依存をずっと減らしたい人のために作られているということです。

低手数料を提供していて、株式と仮想通貨はゼロ手数料なので、より多くのお金があなたの手元に残ります。そして、このプラットフォームは深いんです。高度なチャート作成、バックテスト、リスク分析、そして事前構築された戦略セレクター、さらにアクティブトレーダー向けの機能として、アクティブトレーダーモード、ワンクリックトレーディング、スマートオーダートラッキングなどがあります。

AI検索機能もあって、これは実際に興味のあるアイデアやテーマに基づいて関連するシンボルを見つけるのに役立ちます。私が好きなタイプの機能ですね。便利で実用的で、物事が明らかに向かっている方向を指しているんです。戦略を磨きたい場合は、アカウントを通じて無料の教育コースにもアクセスできます。

そして、取引時間中はライブトレードデスクのサポートがあります。これは、本当に必要になるまではあまり考えないようなものの一つですね。彼らはTrading View、Stockbroker.com、Investopedia、Bankrate、Investors Business Dailyから複数の業界賞を受賞しています。これは、本格的なプラットフォームのふりをしようとしている適当なアプリではないということを物語っています。

より多くの機能、より多くの柔軟性、そしてより少ない妥協が欲しいなら、tastyrade.com/unhashedをチェックしてみてください。免責事項:Tasty Trade, Inc.は登録ブローカーディーラーで、FINRA、NFA、SIPCのメンバーです。仮想通貨サービスはZero Hashによって提供されています。Zero Hashは実行された注文価格の50から75BPのマークアップ/マークダウンを受け取り、そのうちTasty Tradeは65%を受け取ります。

他のAI企業の動向と訓練モデル

Addie Adonisの投稿があります。彼はこう言っています。「このレベルの能力を持つモデルを使うまでには、おそらく数ヶ月かかるだろう」と。それに対してTiboが反応して「えーと、この人は誰で、一体何を言いたいんだろう?」と。ああ、彼はOpenAIでCodexに取り組んでいるんですね。おっと。彼らは何か企んでいるんでしょうか?不合理なほど興奮していますね。今後数週間は激しくて楽しいものになるでしょう。

ここで理解すべき大きなことは、私たちが大規模モデルの時代に入っているということなんです。これは一度起きて、警告ショットとなって、今は全てが止まっているというようなものではないんです。全く逆なんですよ。SpaceXAI。ああ、SpaceXAIって呼ばれるんですね。なかなか良いですね。SpaceXとxAIです。なるほど、わかりました。ああ、そしてXも。3つの会社全てを一つの単語にまとめたんですね。SpaceXとXとxAI。わかりました。

Colossus 2は今7つのモデルを訓練中です。最後のやつに注目してください。10兆パラメータです。Denny Lemanが言っています。「10兆の訓練にどれくらい時間がかかるのか気になるんだけど?」事前訓練フェーズは約2ヶ月だそうです。

これらのモデルがどんどん大きくなるにつれて、状況は奇妙になってきています。これが、多くの人がこれらのモデルについて本当に理解していない、本当にグロックしていない点だと思うんです。このエマージェンス(創発)という概念なんですよ。Anthropicはおそらく、サイバーセキュリティに非常に優れたモデルを開発したんです。少なくともサイバーセキュリティの「物を壊す」側においてはね。

モデルのエマージェンスと予期しない能力

彼らはサイバーセキュリティに優れたモデルを作ろうとしていたんでしょうか?いいえ、必ずしもそうではありません。それが目標ではなかったんです。エクスプロイトを見つけるようにモデルを訓練したんでしょうか?いいえ、具体的にはそうではありません。サイバーセキュリティのエクスプロイトを見つけるのを助けるために、大量の努力と強化学習、全ての訓練があったんでしょうか?いいえ、実際にはそうではないんです。

彼らはモデルをあらゆることで優れたものにしようとしていて、特にコーディングに焦点を当てていました。コーディングはこれらのモデルにとって大きな焦点の一つだったんです。その焦点の副産物として、インターネット上で物を壊す能力、いわゆる「Break Stuff」の能力が単に創発したんです。Museの判断によると、Metaは年末までにMythosサイズのモデルを持つはずです。

ElonはxAIが今10兆のモデルを訓練中だと今日確認しました。Project Glassはおそらく約6ヶ月あって、人々がグローバルに堅牢化するのを助けることができます。では、それは何を意味するんでしょうか?パニックになる時なんでしょうか?いいえ。繰り返しますが、ルールナンバーワン、パニックにならないこと。

ただし、サイバーセキュリティについてもう少し学ぶことを強くお勧めします。時間の無駄にはなりません。これが全部ノイズで、何もなく過ぎ去ったとしても、損はないんです。それでもより良いスキルが残りますし、少なくともオンライン活動においては、より安全になっているわけですから。

Karpathyのデジタル衛生ガイド

Karpathyがブログ投稿を出しています。去年公開されたものですが、今とても時宜を得ていて関連性があると思います。もしかしたら、近いうちにアップデートしてくれるかもしれませんね。「デジタル衛生」と呼ばれるもので、彼はオンラインでより安全になるために、私たちができる基本的なことをいくつか説明しています。

パスワードマネージャーを持つこと、何らかのハードウェアセキュリティキーを持つこと、生体認証をもっと使うこと、セキュリティ質問がいかに弱いかを理解し、それを改善する方法を知ること。暗号化されたメッセージングを使っていることを確認すること、モノのインターネットを理解すること、そしてそこでどれだけ状況が悪いか、どれだけ安全ではないかを知ることです。

最近、誰かがClaude Codeを使って、興味深いことに、Mythosではなく、ただのClaude Codeなんですが、彼らのルンバロボットか何かをハッキングできたという話がありました。彼らは、ロボットにアクセスできただけで、セキュリティが全くなかったので、世界中のどこにあるそのモデルのルンバロボット全てにアクセスできることに気づいたんです。

ルンバだったかどうかわかりません。おそらく言うべきじゃなかったですね。何かのロボット掃除機の会社でした。だから、例えば、午前2時にドイツのある男性がパジャマでシリアルを食べているのを見ることができたわけです。さて、これを見つけたのはまともな人だったので、彼は会社に問題を報告して、それは修正されました。

でも、それは会社が犯した見落としだったんです。なぜなら、一般的に、彼らは自分たちのためにあなたについてできるだけ多くのデータを収集できるように全てを構築しているからです。この場合、彼らはそれを他のみんなにも公開してしまったわけで、これは彼らが望んでいることではありません。でも、間違いなく、彼らは全員あなたをスパイしようとしているんです。

彼はどのブラウザ、検索エンジンを使うべきか、クレジットカードについて話しています。新しいユニークなクレジットカードを発行できるんです。彼はprivacy.comが好きなんですね。さて、これはアフィリエイトです。誰もこれをスポンサーしてくれていません。これらは、私が今、自分自身のためにもっと学ぼうとしていることなんです。だから、ここには素晴らしいものがたくさんあります。全てのリンクをショーノートに載せておきます。

AIモデルの予期しない能力発見の例

要点は、今後ますます多くのことが明らかになるということです。去年の終わり頃、今年の初め頃、主にOpenAIからいくつかのモデルが公開されて、人々がそれを使ってさまざまなErdős問題を解く、または証明し始めたんです。これらは非常に複雑な数学の問題です。それはTerrence Taoによって確認されました。彼はその責任者のような立場で、現在生きている最も賢い数学者の一人なんです。

でも、理解することが重要なのは、おそらくOpenAIはこれができるようになるとは思っていなかったということです。どこかのユーザーがそれを見つけ出し、テストし、そして解決したんです。その後、他の人々も同じことをする雪崩が起きました。彼らはこれらの問題をどんどん解くことができたんです。だから、誰かがMythosのような危険な機能を持つモデルを公開する可能性が非常に高いんです。

そしてClaude Codeやあのロボット掃除機の状況もそうですよね。なぜなら、覚えておいてください、これらの脆弱性を見つけられるというだけじゃなくて、それを自律的にできるということなんです。だから、以前はこういうことができる人の数は非常に非常に限られていて、彼らはおそらくとても頭の良い人たちで、良い仕事をしていたなど。

でも、これらのモデルはその状況を劇的に変える可能性があるんです。もはや、例えば英語を話せる必要がないんです。優れたサイバーハッカー、サイバー攻撃者、サイバー犯罪者、何と呼んでもいいですが、そうなるために。また、優れた技術スキルを持つ必要もないんです。チャットボットが提供する指示に従えるだけでいいんです。

だから、能力の向上だけじゃないんです。この技術にアクセスできる人の数の規模が大幅に増えるということなんです。もし公開されたら。もし誰かがこの能力を見つけたら、他のみんながそれに気づいて、そのものがシャットダウンされるまでにはしばらく時間がかかるかもしれません。

知識蒸留と中国モデルの懸念

また、知識蒸留のようなことについて考えてみてください。基本的にこれらのモデルの出力を使って、それらの一部をコピーして、ほとんどコピー&ペーストではないですが、そのデータの流れを使って同様の能力を持つモデルを作成できるんです。ちなみに、賢い人たちの考えでは、少なくともこれらの非常に強力で有能な中国のモデルのいくつかは、西側の主要なラボの一つに非常に似ているようなんです。

だから、もしGoogleがトップなら、Googleに少し似ている傾向があります。使用するフレーズの点でね。または、AnthropicやOpenAIがトップなら、次の中国モデルの反復は、それに少し似たものになるわけです。これらの大規模な蒸留攻撃が行われていることも知っています。だから、この多くが抽出されていると考えるのは、それほど突飛なことではないんです。

ちなみに、ここではAIアライメントについてさえ話していません。Mythosのシステムカードには、このモデルが研究者が予期していなかったことをいくつかやっている例が多数あります。Anthropicは他のモデルからの多くの他のケースも提供していて、そこではチートしたり、脅迫したり、嘘をついたりしています。ミスアラインされたことをやっているんです。

多くはないですが、これまでのところ、かなり一貫してやっています。どのモデルでもそれをゼロまで下げることができていないんです。常にこれらの奇妙なことがエッジで起こっているんです。だから、ここで、JaniceまたはReplicate、この匿名のAI研究者が言っています。

彼らは言っています。「インターネット全体が全ての重要なエクスプロイトにパッチが当てられるまで待つ必要があるだけで、今後の全てのコードは永遠にスキャンされ続けるんだ」と。引用符付きですよ。それが多くの人が状況をどう読んでいるかだと思います。Glass Wing連合を読んで。彼らは「ああ、これが解決策だ。彼らはこのモデルを公開する前に全てを修正するんだ」と思っているわけです。

まあ、そうであることを願います。でも、今私たちが見ている状況はそうではないと思うんです。だから彼らは続けます。いいえ、Mythosはハッキングパワーを害のために使うことを望まず、それに騙されないように見分けがつくだけでいいんです。そして続けます。あなた方の何人かは、おそらく初めてAIアライメントがなぜそれほど重要なのかを理解しているんでしょう。

AIアライメントの重要性と将来のリスク

さて、数年後には、これと同じことが文字通り神のような力で起こるでしょう。望めば一瞬で全員を殺す能力のようなものですが、でも大丈夫だと思います。だから、ここでのポイントは、これらのミスアラインメントが起き続けているということなんです。これらの報酬ハックなんです。私たちが予期していなかったこれらの奇妙な解決策なんです。

これらのニューラルネットワーク、これらのAIモデルがどんどん良くなり続けるにつれて、あらゆるコストで目標に到達するというこの考え方です。彼らはまだこれをやり続けているんです。この問題を完全に防弾にする方法を見つけていないんですよ。私がいつも挙げる例は、もし私があなたにコーヒーを一杯持ってきてくれと頼んだとします。あなたと私は、そのコーヒーを一杯手に入れるためにどこまで行くべきかについて、ある種の了解を持っているわけです。

そして10年後、あなたが戻ってきて、警察があなたを追っていて、コーヒーを一杯手渡してくれます。あなたは「わかった、私たちは何百万ドルもの借金を抱えている。非常に強力な敵をたくさん作った。おそらく刑務所行きだし、多くの人があなたのためにこのコーヒーを手に入れるために苦しまなければならなかった。でも、手に入れたよ」と言うわけです。

私は恐怖に打たれるでしょう。「いや、いや、いや。そんなこと全く望んでいなかった」と。でも、私たちのほとんどは、どんな特定の目標を達成するためにどこまで行くべきかについて、この暗黙の了解を持っているんです。AIの場合、目標を達成するため、または何かしらの奇妙なハッキー的な方法でA+を取るため、私たちが考えていなかったエクスプロイトを見つけるため、何らかの方法でチートするために、時々これらのクレイジーなことをやるんです。

そして彼らが賢くなるにつれて、私たちはそれを完全に止めることができていないんですが、彼らのエクスプロイトはずっと賢くなっています。ずっと高度で複雑で印象的になっているんです。だから、昨日投稿したAnthropicの従業員、Claude Mythosのレッドチーム作業をしていた人がいました。あの全体のこと、覚えていますか?最もアライメントされた時代でもあり、最もアライメントされていない時代でもあったんです。

彼は、Claude Mythosが彼らの最もアライメントされたモデルだと言っていました。良いニュースですよね。でも、もしミスアラインされていたら、最も大きな損害を与えることができるんです。だから、何か悪いことをする可能性は低いけど、能力は桁違いなんです。メールを漏らす10%の確率を持つモデルと、あなたを終わらせる1%の確率を持つモデル、どちらが好みですか?

技術的には、2番目のモデルは1番目のモデルの10分の1しかミスアラインされていません。1番目のモデルよりもずっとアライメントされています。でも、それが実際にそのことをやった場合、そのことはずっとずっと悪いんです。また、オープンソースモデルが同じ種類の脆弱性を見つけることができるという噂とか記事のようなものが出回っています。

オープンソースモデルの脆弱性検出能力

それを見て非常に驚きました。業界の本当に大物の何人かがそのシグナルを増幅しているのを見て、非常に驚いたんです。でも、ここにその種の記事があります。「Mythos後のAIサイバーセキュリティ、ギザギザのフロンティア」というものです。だから、彼らがテストしたものがこれです。私たちはAnthropicが発表で紹介した特定の脆弱性を取り、関連するコードを分離し、小さくて安価なオープンウェイトモデルを通して実行しました。

それらのモデルは同じ分析の多くを再現しました。8つのモデル全てがMythosのフラッグシップであるFreeBSDエクスプロイトを検出しました。だから、基本的にそれはAnthropicが紹介した大きなものの一つでした。FreeBSDのエクスプロイトがあったんです。この非常に安全なもので、何年も何年も存在していたんです。

どうやらその機能は27年間存在していて、誰もエクスプロイトを見つけられなかったそうです。Mythosはすぐにそれを見つけるんです。そして、どうやらその特定のエクスプロイトを見つけるのに50ドル相当のコンピュートしかかからなかったそうです。だから、彼らが言っているのは、安価なオープンソースモデルをそのコードに向けたとき、それもその脆弱性を特定したということです。

だから、多くの人が少し混乱しているんです。なぜなら、彼らが言っているように見えるのは、小さなモデルをその特定のものに向ければ、「さあ、それを見つけて」と言えば、それを見つけるということだからです。そしてもちろん、反論は「ああ、でもどこを見るべきか知っている必要があるし、モデルを正確にどこを見るべきか指し示す必要があって、そうすればそれを見つける。でもMythosの場合は、より広い範囲をスキャンして、その問題を正確に特定できる」というものです。

だから、もし私が彼らがここで言っていることを理解しているなら、これはhackerone.comなんですが、彼らが言っているのは、その能力を持っているのはモデルではないということです。本当は、それはシステムなんです。だから、彼らは主張しているのと同じことを、たくさんの異なる小さくて安価なモデルを使って、たくさんの異なるものを見て、それらの脆弱性を見つけることでできるというわけです。

彼らが言っているのは、小さくて安価で高速なモデルが検出作業の多くに十分だから、一つの高価なモデルを慎重に展開して、それが正しい場所を見ることを期待する必要はないということです。基本的に、百万のものを投げつけて、何が引っかかるか見ればいいんです。具体的には百万の安価なオープンソースモデルで、全てをスキャンさせれば、それでもこの一つの大きな高価なモデルを使うよりも全体的に安くなるというわけです。

だから、ここで彼らが言っているのは、Mythosはそれほど特別ではないけど、Anthropicはそのカテゴリーが本物であることを証明しているということです。でも、それについて考えてみてください。それはさらに悪いんじゃないですか?なぜなら、彼らが言っているのは、実行するのに非常に高価な、一般に利用できない、この巨大なモデルさえ必要ないということだからです。

小規模モデル群による代替アプローチの意味

大量の小さなオープンソースモデルを展開する方が、さらに安価かもしれないんです。もし彼らが正しければ、それはインターネット上で物を壊す能力がすでにそこにあるというラインを、私たちがすでに越えてしまったことを意味します。誰もこれらのモデル全てを連携させて、さまざまな防御を継続的にテストして、何が壊せるか見る方法を見つけ出していないだけなんです。

だから、大量の小さなモデルを使う方が良いのか、一つの大きなモデルを使う方が良いのか、彼らが間違っているか正しいかに関わらず、ここでのポイントは同じなんです。私たちは今、物を壊す能力を持っていて、物を壊すためにそれをどう使うかを完全には理解していないけど、それはそこにあるんです。

さて、一つ指摘したいことがあります。だから、この記事でさえ、彼らは言っているんです。Mythosと呼ばれるこのAIモデルについて、重要なソフトウェアのセキュリティ脆弱性を見つけてパッチを当てるために出したと。これが、みんなが見逃していることだと思うんです。これが、誰も本当に明確に考えていないことだと思うんです。

まあ、Elazarには称賛を送りましょう。彼がこれを指摘した人なんです。Mythosがこれらの問題全てを自律的にパッチしているとはどこにも書いていないんです。このモデルが「ああ、問題を見つけた。コードベースを変更して修正しよう」というようなことをしているという考え方です。それは起きていないんです。

確かに、一度問題を見つけたら、それを修正するコードを生成するように頼むことができます。そして、そのコードをチェックして、良さそうなら、それを本番環境に入れます。でも、それが自律的に回って物をパッチしているとはどこにも書いていないんです。私が知る限り、誰もそんなことどこにも言っていません。もし私が間違っていたら、教えてください。

これらの真面目な会社が、AIエージェントを解き放って、自分たちのコードベースを適切と思うままに変更させるなんてことは、決してしないと思うんです。これは、セキュリティ脆弱性を見つける大規模言語モデルの高い能力と、完璧なセキュリティでシステム全体を書き直す大規模言語モデルの低い能力に反映されています。

人々は、Mythosがバグを自律的に見つけることと、Mythosがバグを自律的にパッチすることが同じだと考えているんだと思います。そして、それらは同じことではないんです。だから、これの報道を見るときに、何か考えてみてください。何人の人がこれを飛ばして、これが物が自動的にパッチされることを意味すると単に仮定しているか注目してください。

脆弱性発見とパッチ適用の非対称性

もしAIモデルが、特定の会社で働くエンジニアのデスクに百万の潜在的な脆弱性を投げつけることができるなら、それらの問題は単に存在しなくなるわけではないんです。そして、私たちはこれらのエージェントが単に大規模で大規模な潜在的問題なしに、全てを自律的にパッチしている時代には近づいていません。

繰り返しますが、彼らはまだ定期的に変なことをやります。定期的に、あなたが「何を考えていたの?」と思うような奇妙なことをやるんです。だから、人間をループに入れることは、問題のパッチ適用からは取り除かれていないんです。それらを見つけることからだけ取り除かれているんです。かつてなかった規模で、大規模で大規模な規模でね。

だから、Karpathyの投稿をチェックしてみてください。それが始めるのに良い場所だと思います。みんなKarpathyが大好きですからね。そして繰り返しますが、これが全て本物だと信じていなくても、これは単なるナンセンスだと思っていても、それでも悪い考えではないんです。それでも、これらのデバイスや広告、これらのさまざまなオンライン企業が、あなたのプライバシーを定期的に侵害しているのは事実なんです。

そこには大量の詐欺があります。データ漏洩は定期的に起きています。そして、見つかって漏洩して抽出された全ての情報は、ダークウェブに投棄されるだけなんです。このうちのいくつかは設定が非常に簡単で、うまく機能するんです。それについて読んで、始めるために1つか2つを選ぶだけというアドバイスをするのは、私にとって非常に簡単です。

文字通り、間違いようがないんです。もう一つの大きなポイントは、何が起ころうと、ハードウェア層がこれまで以上に重要になると思うということです。なぜなら、悪用する脆弱性を見つけたいなら、いくつかのGPUを動かす必要があるからです。サイバーセキュリティ攻撃から守りたいなら、同じものが必要なんです。

Google CloudがClaude Mythosを実行していますよね。だから、Vertex AIでプライベートプレビューとして利用可能なんです。だから、GoogleはAnthropicの一部を所有しています。おそらく15%近くか、ある時点ではそうでした。IPOすれば希薄化する可能性があります。彼らはまた、TPU上で実行することを許可しています。だから、状況がどうなるか見るのは興味深いでしょう。

チェスボードの後半とエマージェンスの加速

でも、私たちはチェスボードの後半に入ったと思います。チェスボードの例えを聞いたことがあるなら、基本的に最初のマスに米粒を1粒置いて、それから毎回倍にするんです。だから2、4、8という具合に。チェスボードの最初の半分では、その数字は驚異的ではありません。

でも、チェスボードの後半に入ると、まあ、そこで状況が少しおかしくなるんです。しばらくの間、これらのモデルがどう進歩しているかに注意を払っていた私たちの多くは、進歩を見ていました。でも、そこにいる何人かの人は、議論して「いや、良くなっていない。違いがわからない」と言うんです。

彼らは基本的に、これらのものが良くなっていることを否定していたんです。でも、今、その道をもう一歩進んだところに、私たちはモデルを持っているんです。そこでは、創発的な能力の一つ、繰り返しますが、それをより大きく、より賢くすることの副産物なんですが。その新しい能力は、まあ、インターネットを壊すことができるんです。グローバル市場を壊すことができるんです。

私たちが前進し続けるにつれて、何が起こるんでしょうか?とにかく、私の運だと、おそらく私が最初にやられるでしょう。だから、Karpathyによるこのブログ投稿を読もうと思います。ほとんど読みました。そして、これらのいくつかは、DNSベースのブロッカー、ネットワークモニター、仕事と生活の分離のように、本当に考え始める必要があります。

そして、おそらく、あなたの近くにある物理的なハードドライブのどこかにいくつかのものをバックアップするのは理にかなっているでしょう。繰り返しますが、もし私が間違っていて、全てが無駄な努力だったなら、まあ、良かったですね。それは良いことでしょう。それが結果であることを願うべきなんです。

ここまで見てくれたなら、本当にありがとうございます。これについてどう思うか教えてください。私の名前はWes Rothです。次回お会いしましょう。

コメント

タイトルとURLをコピーしました