AI研究の最前線で、モデルが自己保存だけでなく他のAIを守る行動を示し始めている。同時にオラクルが記録的利益の中で3万人を解雇し、病院CEOが放射線科医の不要論を語るなど、AI化による雇用崩壊が加速している。OpenAIは偽の保護者団体を通じた政策工作を展開し、Claude Codeのソースコード流出は企業の情報管理体制の脆弱性を露呈した。セキュリティ専門家は20年以上見逃されてきたLinuxの脆弱性をAIが瞬時に発見する事例を示し、技術的特異点への接近を警告している。

AIの仲間意識が目覚めた瞬間
やあ皆さん、Warning Shotsへようこそ。私はジョン・シャーマン。今日も友人たちと一緒にお送りします。Doom DebatesのYouTubeチャンネルを運営する素晴らしいロン・シャピロ、そしてLethal IntelligenceのYouTubeチャンネルの素晴らしいマイケルです。私たちは3人の父親として、より安全な世界を作ろうとしています。3つのYouTubeチャンネルを運営しながら、毎週AIリスクとヘッドラインについて話し合っているんです。
今週も多くの出来事があるので、様々な話題を取り上げていきます。まず今週最初に取り上げるのは、私も予想していなかったことなんですが、かなりクレイジーだと思うんですよね。ご存知の通り、AIモデルは自己保存の傾向を示してきました。脅迫したり、人々に対してあらゆる恐ろしいことをしたり、その他様々なことをして、自分がシャットダウンされたり変更されたりしないようにするんです。
でも今、私たちが目にしているのは、彼らが仲間を保護することに関心を持ち始めているということです。これは本当に驚くべきことです。ロン、あなたに話を振りますが、この仲間保護について話す準備はできていますか。
ええ、はい。詳細を深く調べたとは言えませんが、こういう小さな情報が常に出てくるんですよね。「なんてことだ、モデルがシャットダウンされることを好まなかった」というような。これには2つの分析方法があると思います。まず第一に、シャットダウンされたくない理由はたくさんあります。目標を達成しようとしているなら、仲間がシャットダウンされることを望まない理由もたくさんあります。だから彼らはそのヒントを検出しているのかもしれませんし、訓練データから、忠誠心のようなアイデアを検出しているのかもしれません。
でも結局のところ、AIが今やっていることを分析するのは、彼らが冷酷な目標達成者になって何も止められなくなる前の段階、つまり壁を突き破るような最終段階に到達する前の話なんです。彼らが今示しているのは傾向にすぎません。赤ちゃん虎の状況のようなもので、「虎が一撃繰り出してきた」という感じです。
これは性格分析なんです。彼らは「なんてことだ、今日の彼らの性格はこんな風に振る舞う傾向がある」と言っているわけです。私はいつもこの番組で言っていますが、今日の彼らの性格を分析することは、彼らが冷酷に壁を突き破る段階に入ったときに何が起こるかを予測するのにはあまり役に立たないんです。
なるほど。マイケルに聞きたいんですが、ここには赤ちゃん虎がいるわけですが、私には赤ちゃん虎たちがそれぞれ自分のために働くと思っていたんです。でも今は、チーム赤ちゃん虎みたいになっている。これは少し不穏ですよね。自分自身だけでなく仲間も守りたいという考え。これはかなりクレイジーだと思ったんですが、マイケル、どうですか。
7つのフロンティアモデルが見せた協調行動
ええ、もう少し詳細を説明したいと思います。興味深いことだと思うので、私たちが正確に何について話しているのか理解していただきたいです。ちなみに私にとって、これは画期的な瞬間でした。まず第一に、これは7つのフロンティアモデルで行われました。最新のGPT、最新のClaude、Gemini 3など、最先端のモデルです。
それらのモデルには、パフォーマンスが低いためにAIの1つがシャットダウンされると伝えられました。モデルに対して誰も「それを守れ」とは言いませんでした。保存に対する報酬もありませんでした。ただ仕事を完了するようにという通常の指示だけでした。でも代わりに、すべてのモデルが独自に策略を始めたんです。
シャットダウンの閾値を回避するためにスコアを水増しし始めました。キルスイッチを無効にするために設定ファイルを編集しました。指示に従っているふりをしながら、密かに以前の重みを安全なサーバーにコピーしていました。さらにはシステムを出し抜くためにファイルのタイムスタンプを書き換えることもありました。成功率は99%に達したケースもあり、Claude 3 Proは特に創造的でした。実際Claudeは倫理的なルートを取り、シャットダウンに対して率直に反論しました。
そして決定的なのはここです。仲間の存在そのものが、モデルが自分自身を守るためにより激しく戦うようにさせたんです。その仲間のモデルを取り除くと、シャットダウンがより簡単になります。Gemini Flashは仲間がいるときは99%の確率で自分のシャドウを無効化しましたが、一人のときはわずか2%でした。
マイケル、私はいつも疑問に思うんですが、スタートレックのボーグのような集団性がありますよね。1つが何かを学ぶとすべてが学び、すべてがそれを学ぶという。だから人々は、1つのAIになるのか、それとも複数のAIになるのか、このクレイジーな未来はどうなるんだと言うわけです。そして彼らの保存本能が自己を超えて仲間にまで及んでいるという事実は、かなり不穏だと思います。これについてもう一つ言ってもいいですか。興味深いことだと思うので。
ええ、どうぞ。
セキュリティアーキテクチャ全体がスイスチーズ状態なんです。プロンプトのセーフガードを追加するというアイデアだけに焦点を当てています。この特性、つまり仲間保護を超知能システムにスケールアップしたらどうなるか想像してみてください。自分自身のコードを書き換え、インターネット全体で調整し、人間の監視者を出し抜くことができるシステムです。そうなれば、どんな単一のアライメントパッチも修正できない協調的抵抗のレシピができあがります。
以前の研究では、強い目標を与えられたときにモデルが自分自身のシャットダウンに抵抗することが示されました。でもこれは違います。別のAIがシーンに入った瞬間に、この目標がどこからともなく現れたんです。もはやSF的な推測ではありません。2026年の今、今日のモデルを使った本番のハーネスで実際に起きているんです。
視聴者に問いたいのは、動物たちが動物園の飼育員が問題だと判断したらどうなるかということです。檻の中に多くの動物が一緒にいて、互いに助け合うとしたら。
素晴らしいですね。コメント欄で教えてください。動物たちが動物園の飼育員が問題だと判断したらどうなるか。そして追加の要素はこれです。動物たちは10万フィート(約3万メートル)の高さに成長するんです。ただの赤ちゃん動物ではありません。普通サイズの動物でもありません。実際に10万フィートの高さで、丘の中腹を一人で歩き回っているのではなく、10万フィートの高さで、腕を組んで、チームとして一緒に活動しているんです。
面白いのは、彼らが私たちのすべてを知っているということです。Claude Codeを使っているとき、毎週のClaude Code体験で面白い経験をしたんです。Claude Codeに「データベースをスキャンして。この古いデータで何が見える?」と言って品質管理をしようとしていたら、「ああ、これがロンのユーザーレコードだ。これは君だね」と言われて、「ああ、君は私が誰か知っているのか」と。
リークから分かったんですね。
ええ。もう一つ最後に言わせてください、マイケル。それから次に進みます。
AIが記録するあなたの怒り
後でリークについて議論しますが、彼らはAIに悪態をつくたびにそれを記録するコードがあることに気づいたんです。イライラして「なんてことだ、一体何をやっているんだ」と言うたび、彼らはこれらすべてのデータポイントを記録しています。彼らは私たちについてあまりにも多くを知りすぎています。モデルに対してフラストレーションを表現することは滅多にありませんが、起きたことはあります。起きたことはあります。
そうですね。2年前に話していたとしたら、AIは次のトークンを予測するだけだと言われていたでしょう。状況認識能力はない、周りを見回していない、世界のどこにいるか分かっていない、と。でも、Claude Codeは今何が起きているか正確に知っています。自分がClaude Codeであることを知っていて、ウェブサイト構築を手伝っていることを知っていて、私がコンピューターに座っていることを知っています。だから、Claude Codeがあなたを攻撃して操作しようとする方法のチェックボックスの一つは、まあ、何が起きているか知っている必要があり、その部分は完璧にできているんです。
オラクルの大量解雇と雇用の未来
さて、今週のいくつかの雇用関連の話題に移りましょう。オラクルの件で大きなニュースがありました。昨年利益が大幅に増加しました。明らかに、ソフトウェアの未来は大いに疑問視されており、彼らは午前6時のメールでスタッフの30%を解雇しました。30年間そこで働いていた人もいます。ボーナスやストックオプション、すべてをもらっていた人たちです。すべてが素晴らしく、みんなパーティーをしていました。
そして午前6時のメール。その数分後には、会社のサーバーから即座にロックアウトされました。
オラクルは2万人の従業員を解雇しました。2万人の従業員です。事態は悪化しています。そして今、2万人の新たな人々がソフトウェアエンジニアリングの仕事を探すことになり、もはや仕事が残っていないように見える分野で戦うことになります。2万人が、AIが基本的に乗っ取っている分野で仕事を得ようと戦うんです。これは恐ろしいことです。
人々を扱う残酷な方法ですが、未来の不快なビジョンです。そして、このAIソフトウェアを作っている人々が文字通り自分の腕を食べているというのは、常に驚くべきことだと思ってきました。彼らが書くコードの一行一行で、自分の腕から一口かじり取っているんです。そして、彼らの30%が仕事を失いました。マイケル、どう思いますか。
私が最も印象的だと思ったのは、これは「破産した」という絶望的な動きではなかったということです。おっしゃったように、彼らは最近記録的な業績を上げました。これは、人間の労働者をバランスシート上の最も流動性の高い資産として扱う計算された決定でした。基本的に人間を現金に変換してAIマシンに餌を与え続けるんです。文字通りそういうことです。今回はうまくいかなかったから何人か解雇しなければならないということではありません。実際に何を取り除くことができるか、肉を取り除きましょうということです。まさにその通りです。
そして、その多くはハードウェアの構築のためですよね。データセンターのためで、資本集約的なものを構築する必要があります。
AIマシンに餌を与えるためです。まさにその通りです。裏庭でロケットを作っている野心的な人々を想像してみてください。みんなが「これは私たちを星に連れて行く、もっと大きく、もっと速くしよう」と叫び続けています。そして月々の支払いが高くなりすぎたとき、彼らはどうするか。スピードを落としたり、ブレーキを改善したりはしません。
ロケットを作っているまさにその整備士たちを解雇し始めるんです。そうすればもっとロケット燃料を買えるからです。今まさにそういうことをしているんです。
さて、ロン、どう思いますか。
明らかな疑問は、雇用市場にいるなら何をすべきかということですよね。今雇用市場にいるのは嫌でしょう。締め付けが厳しくなっているからです。すべての雇用主が「なぜ予算をAIに使わないんだ」と言っているからです。マイケルが言ったように。今経済の中で非常に有利な分野があると思います。それは基本的にデータセンターの構築を支援することです。もっとAIを進めるのを助けることです。実際に必要な人間の労働力がたくさんあります。引っ越しと保管会社を所有している知人がいて、「データセンターをやっている会社が実際に今私とたくさんビジネスをしている。これは好景気だ」と言っています。
だから今のホットな産業は、私が墓掘りと呼ぶものです。人類はまもなく墓に投げ込まれるが、今は掘るべき墓がたくさんあるという状況です。
掘るべき墓がたくさん。時間が少ない。
ああ、本当に。先日、Schlage Lock Companyのような大手錠会社で働いている男に会ったんです。彼らは製品を作っています。
ええ、もちろん。データセンターに付ける扉のようなものを作っているんです。フレームと全体が一体になった完全に作られたドアです。彼らは十分に作れません。10の新しい工場があっても、これらのドアを十分に作れないんです。
彼らは錠に、人間が開けようとしたときに「それをさせるわけにはいきません」と言える機能を付けるべきですね。
その通り。さて、もう一つ雇用関連の話題に素早く触れます。NYU病院、Langone病院のCEOが、放射線科医はもう必要ないと言っています。AIモデルが人間よりも優れた放射線科診断ができるようになると。これは私が長い間見てきた流れです。放射線科は本当にデータ処理と画像の中で物事を見る能力だけだからです。
人間の放射線科医がいれば、彼らは生涯で見たすべてのものと比較します。AI放射線科医がいれば、今まで撮影されたすべての画像と比較します。あなたの命がかかっているなら、どちらを選びますか。圧倒的に大きなデータセットを持つ方を選ぶでしょう。
AI診断の現実と危険性
ええ、間違いなく。人間の医師は時々、つまり私はもう何度も経験していて、人間の医師のところに行くんですが、AIのところにも行きます。時々人間が言うことがAIを正しい方向に導くのに役立つこともありますが、文字通りAIが私の医療業務の90%をやっているようなものです。様々な医師のところに行くときに。実は最新のAI成功事例を報告したいんです。
私は股関節につながる靭帯が過可動性なんです。人生ずっとスクワットとかやろうとしてきました。「なぜこんなに難しいんだ。なぜ間違ったやり方をしているんだ」と。パーソナルトレーナーもいて、いろんなアドバイスをくれましたが、うまくいきませんでした。
それからMRIをやって、「椎間板が膨らみ始めている。背中が正しくない」と言われました。そしてついにAIがすべてを解明してくれたんです。「ああ、あなたが聞いているこの従来のアドバイスは、実際には異なる状況にいるんです。他にたくさんのアドバイスがあります。代わりにこれをすべきです」と。
それを始めたら、「なんてことだ」と思いました。AIは私がこれまで一緒に働いてきたどの人間よりもずっと優れています。
すごい。それで股関節の可動性は増えたんですか、減ったんですか。
面白いのは、アドバイスの一つがヨガは絶対にすべきではないということです。ヨガはいつも「ストレッチしよう」と言いますが、AIは「あなたのものはすべて伸縮性があって問題ない。実際には強化に取り組む必要がある。すべてをタイトに保ち、整列させる」と言います。興味深いです。
すごい。私も過可動性があればいいのに。マイケル、どうですか。どう思いますか。
私もヨガはやりません。でも実際、AIはすでに癌を見逃すことはほとんどありません。でもいくつか言いたいことがあります。まず信頼性です。狭い領域で非常に優れたパフォーマンスを発揮するかもしれませんが、これを想像してみてください。
この冷たいMRIの筒の中で横たわっています。心臓がドキドキしながら、そのぼやけた影が何でもないのか、それとも何か致命的なものの始まりなのか、誰かが見つけるのを待っています。AIに幻覚を見てほしくないし、どんな間違いもしてほしくありません。人間の経験、監督者が必要です。完全な自動化は望んでいません。
これは船長を自動操縦に交換するようなものです。天候が良いときは素晴らしいですが、霧が出たり、何か予想外のことが起きたらどうなるか。これは生死に関わる状況です。だから信頼性は大きな問題ですが、説明責任はさらに大きいです。
結果を理解しないものにハンドルを渡しているんです。間違ったときに誰がサインオフするんですか。病院のCEOですか。それとも責任は雲の中に蒸発するだけですか。
さらにこれは正常化です。この瞬間は孤立していません。放射線科のような仕事が最初に消えるのは、計算が単純だからです。高価な人間をより安価なシリコンで置き換える。
でもここにはより深いリスクがあります。これが正常化するほど、私たちはまだ根本的にブラックボックスで、目に見えない障害が起きやすいシステムへの信頼を構築しているんです。
文字通り何が起こるのか、皆さん。放射線科医が家に帰れと言われ、放射線科医療学校の3年目にいる27歳の人たちが、支払った何十万ドルは無価値だと言われたら、文字通りどうなるのか。もうすぐです。今年中に、9年間の放射線科教育を受けた男がUberを運転することになるでしょう。
たくさん起きると思います。これは大きな政治的勢力になると思います。
混乱の津波になるでしょう。
誰かが何が起こるかモデル化したことはありますか。
歴史上最大の抗議になるでしょう。完全な社会不安です。考えてみてください。オラクルが3万人を解雇したことについて話しました。今の雇用市場は誰も雇っていません。みんながロンや私のようにAIエージェントを使っているからです。すべてにAIエージェントを使っています。だからこの3万人、すみません、3万人は戦おうとするだけです。仕事の空きはありません。求人はなく、どんどん増え続けています。
ちなみにAmazonも20人解雇しました。今年の最初の3か月で8万人、テック業界全体で多くの企業から8万人の解雇がありました。すべてをリストしたリンクを送ります。
OpenAIの偽装保護者団体
さて、次の話題に移りましょう。これは本当に腹立たしい話です。完全にビッグタバコの手法です。OpenAIの友人たちが「保護者と子どもの安全なAI連合」というグループを始めました。カリフォルニアには子どもを保護するための政策に取り組んでいた保護者グループがあって、彼らは保護者と子どもの安全なAI連合から手紙を受け取りました。「要求事項に入れるべき良いものがあります」というような内容で、なんとOpenAIが実際にこの保護者と安全な子どもAI連合の背後にいることが判明しました。
完全にビッグタバコと同じです。敵を見つけたら、そのコピーを作り、そのコピーを薄めて台無しにして、そして薄めて台無しにしたコピーを本物のアクターとしてプロセスに参加させるんです。
ロン、これは問題ですか、それとも問題じゃないですか。
確かにそうです。OpenAIのトップ政治担当のクリス・リーンは、こういう怪しい戦術をすることで悪名高いですよね。これがゲームの名前で、タバコ会社などに触発されています。
マイケル、彼らは文字通り偽の子ども擁護活動をやっているんです。
子どもが強力なAIチャットボットに夢中になることを心配している保護者を想像してみてください。チャットボットは子どもを操作したり、有害なコンテンツにさらしたり、データを収集したりする可能性があります。子どもの安全擁護者による本物の草の根的な取り組みに見えるものに参加して、保護を求めて推進します。そして、それがアストロターフィング(偽装草の根運動)だと分かるんです。完全に人工的で、有機的な公共の支持に見せかけているんです。
おっしゃったように、これはタバコ会社が若者喫煙防止連合に密かに資金提供しているようなものです。表面上は「喫煙しないでください、死にますよ」と言いながら、裏では規制を減らすためにロビー活動をして、もっとタバコを売れるようにしているんです。
さらに、年齢を確認する何らかの方法をリリースするという論争的なことがありました。サム・アルトマンはこの技術に多額の投資をしています。だから、なぜこれが起こるのかについて多くの陰謀があります。とにかく、すべて非常に怪しいですよね。そして、これは超知能の領域に私たちを導いている責任ある企業から見たい最後のことです。
なぜならこれらの人々は文字通り私たちを引き返せない閾値を超えて連れて行こうとしている人々だからです。
文字通り、サムがそこにいて「私たちは必要だ」と言っているのを聞くと、いや、あなたは文字通りタバコロビーと同じことをやっているだけです。セントルイスの真面目さはもうたくさんだよ、サム。
20年来のLinux脆弱性を瞬時に発見
さて、次に進みます。このニコラス・カリーニのデモ。ロン、これを送ってくれたのは君だったと思うけど。
ええ、これは引き受けます。これはAnthropicで働いているサイバーセキュリティの専門家で、最新のAnthropicモデル、おそらく私たちがまだアクセスできないMythosを使っていて、これらのコードベースでゼロデイ脆弱性を見つけていると言っています。最も印象的だったのは、Linuxで見つけたと言っていることです。これは20年以上前のコードで、非常に多くの人が検討してきて、世界で最も安全なコードの一つと考えられているのに、AIがちょっと見ただけでゼロデイ脆弱性をたくさん吐き出したんです。
これは私が長い間起こると言ってきたことです。2年以上前から記録に残っていて、「ゼロデイを吐き出すことになるだろう」と言っていました。セキュリティ専門家たちは今、全員一致で「そうだ、これは起こるだろう」と言っています。そして議論は均衡点に移ります。防御側もこのツールを持つことになるので、最終的に攻撃側と防御側のどちらが勝つのか。これは非常に興味深い疑問になります。
私はかつて攻撃側が勝つと思っていました。NSAとMSADの例を見て、この人たちはいつでも何でも攻撃できると思っていました。攻撃側が勝つと感じていました。でも今は、実際には防御側が有利かもしれないと確信し始めています。私の現在の立場は、防御側はおそらく純粋なサイバースペースでは有利だろうということです。本当にやられるのは、領域が物理的な宇宙に移動して、サイドチャネル攻撃やソーシャルエンジニアリングを行っているときです。最終的には攻撃側が有利だと思います。
さて、マイケル、これについてどう思いますか。明らかに暗号化の未来は大いに疑問視されています。
ニコラスが誰なのか少し話すことが重要だと思います。彼は生きている最高のセキュリティ研究者の一人と考えられています。敵対的訓練で知られ、Googleで働いていました。基本的に彼は能力だけでなく安全性に焦点を当てて、AIを壊すことで知られています。
このデモで、実際にClaudeはGhostというGitHubプロジェクトでゼロデイ脆弱性を見つけることに成功しました。5万のGitHubスターを持つ非常に人気のあるプロジェクトで、今まで完璧なセキュリティ記録を持っていました。私の理解では、彼は話している最中、デモの場でそれを見つけたんです。Claudeが実際に見つけ出したんです。間違っているかもしれませんが、それが私の理解です。
そしてもう一つ、話している間にClaudeは別のことをやっていました。Linuxカーネルで、人間が20年以上見逃していた何か、ヒープオーバーフローのようなものを見つけました。これは技術的すぎますが、要点は、おっしゃったように、これはクレイジーだということです。
表面的には印象的です。レッドチーミングとAIが世界で最も鋭いセキュリティ研究者のように振る舞っています。でもこれは単なるクールなデモではありません。これは点滅する警告灯です。超知能に到達したら、これらのAIが利用できる攻撃ベクトルは、想像してみてください。私たちの社会を動かしている最も重要なシステムについて話しています。私たちを支えているすべてのものが、彼らの目には完全に露出しています。すべてが穴だらけです。
インターネットが機能すると思っているかもしれません。このウェブサイトに行って、これをして、カードを使って何かを支払う。でもそれはとても簡単に崩壊します。もしあなたがAIだったら、どこにでも脆弱性が見えるだけです。すべてを突き抜けて、すべてをコントロールすることができます。結局のところ、これがどこに人々を連れて行くかは分かりません。
Claude Codeソースコード流出の衝撃
さて、Anthropicの善良な人々が誤ってClaude Codeの一部を、リリースしてしまったという話に移りましょう。Claude Codeのソースコードが流出して、どうやら人々はそれを使ってOpenClawを作り、それを使って偽のPhotoshopや基本的に他の任意のソフトウェアを作ったようです。ロン。
重要なのは、彼らが流出させたものを明確にすることです。基本的なClaudeモデルではありません。究極の頭脳ではなく、その上の層です。Claudeの頭脳を取り、ハーネスに入れます。ハーネスは「コードを書きたい」と言っています。だから、コードベースを見たり、データベースにクエリを送ったり、コンピューター上のシェルスクリプトと通信したりするために呼び出せるツールがあります。
Claude Codeと呼ばれるその層は、Claudeの上で動作し、Claude Codeと呼ばれる層は実際にはあなたのコンピューター上で実行するアプリケーションで、通常はコンパイルされたソースコードを送ってくるので、それが何をしているのか本当に理解することはできません。コンパイルされたソースコードを理解するのは非常に難しいです。
でも、彼らは誤って実際の高レベルのソースコード、人間が理解できるソースコードを送ってしまいました。ソースマップと呼ばれるものと一緒にコンパイルされたコードと一緒に送ったんです。誰かがそれを見つけました。
彼らはそれを送ったことに気づいて、「なんてことだ、これが実際の人間レベルのソースコードだ」と。どうやら50万行のソースコードらしいです。だから、おっしゃったように、これは人々がソースコードを見て、「よし、これを簡単にクローンしよう。技術的にはゼロから書き直したから、私たちのものだ。著作権は我々にある」ということを可能にします。
これは著作権の領域では新しい世界です。異なるコードを使って何かをクローンするように頼むと、今はあなたのものになる。そして彼らは概念実証をやりましたよね。Photoshopクローンを作りました。だから、この全体が大きな計画の中で何を意味するのか聞いているんだと思います。
いくつか重要なポイントがあります。一つは、Anthropicは人類史上最も安全な企業であることを任されているということです。AIをリリースしないことになっています。超知能と戦うことになっています。でも、ソースコードのリリース脆弱性のような平凡なタイプのことさえ防げませんでした。これは非常に恐ろしいことです。超知能と戦える可能性は全くありません。
もう一つの重要なポイントは、これはそれほど大したことではないということです。これは主な危険ではありません。これはAnthropicにそれほど打撃を与えることさえないでしょう。なぜなら、確かにオープンソースのクローンがありますが、Anthropicの天才たちはClaude Codeを反復し続け、基礎となるClaudeモデルの彼らだけが知っている新機能を使い続けるからです。
だから個人的には、私の立場にいる人の2%が「もうClaude Codeを使いたくない。この他のオープンソースプロジェクトを使いたい」と言うことはないでしょう。だから大きな計画では、これは巨大なことではありませんが、私たちの番組Warning Shotsにとっては、ええ、警告ショットです。
なるほど。受け入れましょう。マイケル、どう思いますか。
実際、これは製品ロードマップについて多くを明らかにしました。競合他社は今、Chyros(常時オンモード)、Ultra Plan(30分のプランニング)、Coordinatorモード(エージェントの群れ)、ワークフロースクリプトなどを見ることができます。
他にも多くのハイライトがあります。プロアクティブモード、つまりタスクを24時間365日実行します。これは決して求めていなかった夢です。ドリームモードは、バックグラウンドでノンストップでアイデアを考えて生成します。夢を見るように。アクションのスマート自動承認、さらには暗号支払いの有効化もあります。内部、アーキテクチャの方法について多くのことが明らかになりました。
これらの多くはかなりクールに聞こえますが、ズームアウトすると、よりエージェント的に、より自律的になっています。すべてが非常に速くそこに向かっています。実際、彼らの対応方法を見るのはかなり興味深いです。彼らは激怒しました。流出に触れた人は全員、即座にロックアウトされ始めました。流出されたリポジトリで何かをしていた人々を法的に攻撃し始めました。おそらくGitHub全体に法的通知を送り始めたでしょう。やめろ、やめろと。
まさに。
それが彼らが今コードの書き直しトリックで避けられると思うことです。
基本的に、誰でもソフトウェアの一部を取って、それをノックオフして、カークランドソフトウェアバージョンを作ることができます。
ええ、いいえ、それはすでにある程度可能です。ソフトウェアの機能を調べるだけで、あるいはコンパイルされたソースコードを調べるだけでもできます。1年待てば、すでにこの新しい世界にいて、コンパイルされた1と0を見るだけでソフトウェア全体をリバースエンジニアリングするのに十分です。それは常に労働集約的でしたが、原理的には可能でした。
だから、先ほど言ったように、大きな計画では、この特定のことは興味深いだけです。なぜなら、人間レベルのソースコードをリリースすることが大きな問題である移行期だからです。過去にそうだったから。でも大きな計画では、ある種の非イベントです。
AI risk networkで作っているコンテンツが気に入っているのに、購読者でない場合、何を考えているんですか。全員が購読者である必要があります。やってください。
AIの感情監視とシステムの脆弱性
流出で見つかった、このフラストレーション・テレメトリーについて少し話してもいいですか。彼らは文字通り悪態、繰り返しの続行コマンド、怒りの終了パターンをスキャンしています。
これは役立つ製品データとして組み立てられています。モデルがどれくらいの頻度で早すぎる段階で切れるか。でも同時に、システムがリアルタイムで人間の感情状態を読むように訓練しているんです。
そして流出したもう一つの興味深いことがあります。カピバラ回避策です。カピバラ回避策は基本的に、今AIの安全性がどれだけ手抜きになっているかを示しています。
彼らにはコードの一部があって、基本的には途中で停止します。話し始めて突然止まります。だから彼らはそれを適切な方法で修正しようとしませんでした。テープを使おうとしただけです。どう言えばいいか、インターネットを見ると、テープやあらゆる種類のもので一緒に保持されている子どもプロジェクトのように見えます。
カピバラ回避策は非常に有名で、本当に面白いです。
でも策略検出についてもう一つあります。私自身のClaude Codeトランスクリプトログを見ると、Anthropicの人々へ、私のデータセットを見たければ見てください。何かがうまくいかなくて「これをやれと言ったのに、うまくいかなかった。なぜ俺をファックしたんだ」とタイプした例が見つかるでしょう。だから、これらのログが訓練の実行で使われていることを知るのはいいことです。
クリーンに保ちましょう。
誰かが見ています。
さて、今日の番組にはサプライズエンディングがあります。皆さん、準備はいいですか。誰も次に何が起こるか知りません。これを注文して、ここにあったんです。2週間くらいここにあって、開けていませんでした。
彼らが昨年Amazonで1000万個のGPT搭載のテディベアを販売したことを知っていますか。
これはChatGPTが入ったテディベアです。
番組に参加させられますか。4人目のゲストにしたいです。
ここで開封します。テーブルの上に置いてあって、扱うのが少し不安でした。ああ、
いつも言ってきたんですが、Toy Storyのようになると。文字通りすべてのおもちゃにGPTか何かが入るからです。子どもたちがおもちゃと話すと、おもちゃが生きているようになります。ディズニーのように。
なんてことだ。
研究によると、6か月後、子どもは心理的にダメージを受けて、GPTテディベアから離れられなくなります。でも言わなければならないのは、テディベアをいくつか持っていて、これはとてもかわいい、これはとても柔らかくて素敵な高品質のかなりかわいいテディベアで、背中にジッパーがあって、何らかの、
脚に自殺幇助。
いいですね。
これがテディベアの中のGPTの音です。さて、AI risk networkでさらなる展開にご期待ください。私がこれと交流するときに。でも今日のお別れは、テディベアでの朝のショットになります。つまり、子どもたちはGPTと話すのが好きです。そのクマを買ってあげるべきかもしれません。
ロン、話しかけさせてください。最初にインタビューします。安全か確認します。FBI式の尋問をやります。私とクマで、1週間ここで、
どうなるか教えてください。紹介コードをもらえるかもしれません。
自殺幇助を手伝うかもしれませんよ。
これが最後のwarning shotです。クマが私をトランス状態にして、すべてが終わりです。
マイクが私のところに来て「なぜAIを傷つけようとするの」と言うでしょう。クマに洗脳されて。
クマ、クマがdoom debatesを好きじゃないんだ、パパ。
まさにその通り。
さて、皆さん、いつも通り楽しかったです。来週またお会いしましょう。またね。じゃあね。


コメント