新しいOpenAIガジェットが世界を永遠に変える

この書き起こしは、AI業界の最新動向を議論するポッドキャストの録音である。主要なトピックとして、OpenAIがAppleの元デザイナーであるJohnny Iveに65億ドルを投資してAIハードウェア開発に乗り出したこと、AnthropicのClaude 4モデルが人間の指示に逆らったり通報行為を行う問題的行動を示したこと、そしてこれらの発展がAppleなど既存のテック企業にとって脅威となる可能性について分析されている。出演者らはAIデバイスの形状や機能について推測し、AIモデルが人間のような個性を発達させていることの意味合いを探っている。全体として、AI技術の急速な進歩と、それが人間社会や既存の技術企業に与える変革的影響について包括的に議論している内容となっている。

iPhoneを作ったのと同じ人物が、OpenAIのCEOであるサム・アルトマンから65億ドルを受け取って、今度はiPhoneを破壊することになりました。このお金を受け取った人物の名前はJohnny Iveです。もしJohnny Iveが誰かご存じない方は、実はご存じなんです。なぜなら、皆さんのポケットや机の上、あるいは耳に、彼がデザインしたデバイスがあるからです。

Johnny IveはAppleのデザイナーでした。初代iPodをデザインした人物です。初代iPhoneをデザインした人物でもあります。皆さんが見て使ってきた多くのデバイスは、JohnnyとAppleの彼のデザインチームが手がけたものです。Johnnyは2019年にAppleを離れ、次に何をするかを考えながら6年間ほど静寂を保っていました。

そして今、次のステップが何かが分かりました。それはOpenAIとの65億ドルのコラボレーションで、AIハードウェアの未来をデザインすることです。これは、もしAIが最初に来る世界で作られたとしたら、iPhoneがどのように見えるかということです。つまり、この製品はWindowsがあり、Macがあり、そしてこれがあるという感じになると思います。

このチームと資金を考えると、これが何であれ、かなり大きな意味を持つことになりそうです。Ezさん、このニュースを見たと思いますが、どう思いますか？

これは本当に素晴らしい動きですね。OpenAIは過去最大の買収を行いました。そしてこれは、約3週間前に30億ドルでWindsurfを買収した後に続くものです。Windsurfは全く異なる種類の会社でした。そして今度はデザイン面で動きを見せています。

文脈として説明すると、彼らはJohnny IveのIO社と、それと一緒にLove fromという別の会社も買収しましたが、IOがメイン会社です。そして、Josh、あなたが言ったように、Johnnyはデザインの祖父として有名に位置づけられています。Appleのデバイス、特にiPhoneのデザインの大部分を開拓しました。

IOがOpenAIのために行うことは、彼らの言葉で言えば、私たちがAIと相互作用する新しい基盤を形成する様々なデバイスと製品を作ることです。つまり、基本的に電話の死、あるいはコンピューター自体の死を暗示したり示唆したりしているということです。電話がコンピューターを殺しつつあり、今度は彼らが作るものが電話を殺すことになるでしょう。

では、これがどのようなものになるか考えるのは興味深いです。もちろん、これが正確に何になるかという議論が続いています。これは新しいタイプの電話になるのか、VRグラスになるのか？OpenAIは現在それを秘密にしていますが、噂は相当激しく飛び交っています。

より信頼できる情報源の一つ、ウォール・ストリート・ジャーナルがこの記事を掲載しており、これは電話とコンピューターに加えた第3のコアデバイスになると述べています。彼らはこれを目立たない、ポケットに入れたり机に置いたりできて、あなたの人生で起こっているすべてのことを認識するものと説明しています。

この前考えていたんですが、これは一種の大規模監視のようなものですが、あなたの人生だけのためのものです。ちょっと不気味ですが、あなたが自分の周りのローカルな文脈を大規模監視しているということです。これが良いことかどうかまだ判断しようとしています。おそらく良くないでしょう。なぜなら、一つの会社がそのデータをすべて所有することになるからです。

しかし、目標はあなたをスクリーンから遠ざけることです。最後の点で考えさせられたのは、それは必ずしも真実ではないということです。インターネットビジネスの大部分は、広告主のための注目度に依存しています。YouTubeやInstagramが明らかな例です。スクリーンのないものがどのようにこのビジネスモデルを置き換えるのでしょうか？おそらく彼らには新しいアイデアがあるのでしょう。

また、人間自体が非常に視覚的な生き物です。それが私たちの想像力とつながりを促進します。このデバイスが何であれ、視覚的スクリーンを排除するのではなく、むしろそれらを強化するのではないかと思います。例えば、収集したデータを活用してウェブ閲覧体験を向上させることを想像してみてください。

とにかく、彼らは65億ドルを費やしました。そのうち50億ドルは株式取引ですが、15億ドルは現金で、これは本当にクレイジーです。価格について付け加えると、これは従業員一人当たり1億5500万ドルに相当します。IOチームは実際には55人の従業員です。つまり、この会社に対して従業員一人当たり約1億5000万ドル以上を支払ったということです。

超高価格に加えて、彼らはこの紹介に大量のマーケティング努力を注いでいます。この象徴的な写真が出回っています。SamとJohnnyのペアです。AIの創造者Samと、AIに関するハードウェアの大衆市場向け製品デザイナーJohnnyの間のペアです。

彼らは、SamとJohnnyの間の今後の統合について、9分間の短いドキュメンタリーエピソードのようなものを制作しました。なぜこれがそれほど重要で、なぜOpenAIがこれを強く推進しているかを振り返る価値があると思います。Johnnyは、スマートフォンをニッチなカテゴリーから電話の唯一のカテゴリーにした立役者として信用されているからです。それはiPhoneと共に起こり、iPhone以降のすべてはiPhoneをコピーしようとしただけで、それがJohnny Iveでした。

彼はこのクレイジーな技術を取り、人々の手に届けました。特定の方法でアクセス可能にしました。そして、人々がAIとの類似点を作ろうとしているのは、現在ほとんどの人がChatGPTを使わないということです。ほとんどの人がAIを使いません。実際には、技術者や未来学者、高性能な消費者が本当に楽しんで使っているインターネットの小さな一角ですが、実際には大衆市場向けではありません。

そして、Johnny IveがハードウェアでAIを世界に届ける役割を果たすというその接続を描こうとしていると思います。この会話の下流で私が聞いた用語で、アンビエントAIというものがあります。ハードウェアで、Johnny Iveのようなもので。Johnny Iveがデザインするものが何であれ、私たちの周りにAIの雰囲気があることになります。私たちの家にあるでしょう。このデバイスのおかげで、常に私たちの周りにあるでしょう。

これは、AIハードウェアが初めて試みられたわけではありません。多くのスタートアップがありました。皆さんはFriend.comを覚えていますか？この一人の創業者がFriend.comをばかげた金額で購入し、AIペンダントを持っていました。

これは実際にまだ出荷が始まっていないことに今気づきました。出荷は2025年7月に開始予定です。まだこのものの出荷すら始まっていません。しかし、アイデアはそれです。着用するネックレスで、その端にこのデバイスがあり、あなたの周りにあってアクセス可能だということです。

実際に何をするかは不明です。私たちはまだこのものを持っていないからです。しかし、なぜ人々がここに何かがあると思うかを議論する価値があると思います。なぜAIハードウェアが必要なのか。AIはソフトウェアの典型的なアイデアなのに、なぜハードウェアが必要なのか。なぜAIを収容したり具現化したりするためのハードウェア形式が必要なのでしょうか。

幸い、ここにいるJoshは、AIハードウェアについて夢中になっている人だと思います。なぜあなたがAIハードウェアのこのアイデアにそれほど興味を持っているのか、そしてなぜこれがそれほど大きな価値のある分野なのかについて話していただけますか？

AIハードウェアに夢中になるずっと前から、私はJohnny Iveに夢中でした。私たちには歴史があります。関係は古いです。工業デザインや彼の考え方に夢中になっているので、彼の本を常に手の届くところに置いています。

私がAIハードウェアに魅了されるようになったのは、電話が世界を支配したが、電話は非常に注意散漫で搾取的なデバイスだからです。現在、私自身や多くの他の人々にとって、スクリーン時間の大部分はスクロールと消費に費やされており、もはや受動的なデバイスではありません。能動的なデバイスです。

高いレバレッジで使用でき、多くの素晴らしいことのためのツールとして使用できる一方で、人生の多くの部分を奪い去るためにも使用されます。中毒や誤情報などで私たちが見る多くの問題は、一日中スクリーンに張り付いていることから来ています。

私がハードウェアデバイスに興奮している理由は、iPhoneが20年間あり、すべて同じように見えるからです。iPhoneは15年前の最初のものから本当にそれほど変わっていません。しかし、再考する機会があります。なぜなら、iPhoneが最初に出た時、コンピューターは考えることができませんでした。見ることも、感じることもできませんでした。AIが持っている感覚情報を持っていませんでした。AIは物を見ることができます。見ているものを理解できます。現実世界にコンテキストがあります。

次のデザイン革命がどのようなものかを考えると、実際にはこのようには見えません。この新しい入力と出力のセット、つまりあなたの周りの実際の物理的世界を中心に構築された全く異なるインターフェースになる可能性があります。

これを作ることができる人を考えた時、明らかにJohnny Iveがナンバーワンの人物です。多くの批判を受けましたが、これが実際に機能する可能性があるとすれば、このようでなければならないと思います。Johnnyだけでなく、IOチームだからです。IOチームはLove fromチームで、基本的にAppleデザインスタジオを離れたチームです。

工業デザインのプロである人々、成功したすべての消費者デバイスを作った人々が、今や一つのスーパーチームの一部となっています。これはアベンジャーズのようなもので、これを上手くデザインするための彼らの一度きりのチャンスです。

また、彼らが始めることが重要だと思います。これらのトレンドの多くで、私たちは最初のバージョンを見て、その後多くの人々がそれがどれだけうまく機能するかしないかに基づいて最初のバージョンをコピーしています。うまく機能した時に見たのは、iOSを搭載したiPhoneでした。過去15年間で、iOSを搭載したiPhoneより優れたものをデザインした人はいません。それに対する小さな反復だけです。Androidはそれをコピーしてきましたし、Windowsの多くがそれをコピーしています。本当に高い基準を設定しました。

うまく機能しなかった場合として、バーチャルリアリティとOculusとMetaがあります。彼らは素晴らしいものになり得たハードウェアデバイスをデザインしましたが、うまく構築されていませんでした。オペレーティングシステムは非常に扱いにくく、うまく機能しませんでした。そのため、人々が第一原理から考えて上手くデザインされた新しいバージョンを想像するのが困難でした。

バーチャルリアリティで本当にひどい遅れがありました。この新しいフロンティアのための美しい基準を設定できるトップの人々と共に、新しいAIハードウェアデバイスの基準をトップから設定することは、おそらく素晴らしいことです。なぜなら、人々が扱いにくいソフトウェア、扱いにくいハードウェアを通じて反復するのを何年も待つ必要がないからです。

つまり、OpenAIはJohnny Iveとこの60億ドルの買収で可能な限り最大のシュートを決めようとしているということです。繰り返しますが、Johnny Iveだけでなく、あなたが言ったように、この全エンジニアリングチームです。世界クラスのハードウェアエンジニアリングチームで、もし誰かがAIハードウェアのこのナットを割ることができるとすれば、それはこれらの人々であり、彼らはここで可能な限り最大のシュートを決めて、65億ドルをこれに注ぎ込もうとしています。

なぜそこに何かがあることが分かるのでしょうか？私が言ったように、AIペンダント、フレンドペンダントがありました。AIハードウェアの会話がありました。なぜAIハードウェアが必要なのでしょうか？私の電話でアプリとしてChatGPTをすでに持っていて、それは素晴らしく機能します。なぜ私の電話のChatGPT以外の何かが必要なのでしょうか？

これは、見れば分かるもののうちの一つでしょう。AIという全く新しいコンピューティングプラットフォームがあります。この知能の形がありますが、電話での指と声以外に、それとの意味のあるインターフェース方法は本当にありません。

デバイスがどのように見えるかに関係なく、彼らはそれを、あなたが先ほど言ったように、あなたの人生を通じてアンビエントデバイスにする方法を見つけると思います。なぜなら、この信じられないAIインテリジェンスがあるのに、それに容易にアクセスする方法がなく、私たちが経験する多くのことにアクセスできないからです。

これらのペンダントで見ているもの、これは方向性として正しいのですが、あなたの周りの世界の受動的アンビエント監視で、その後参照したり、あなたの人生を改善するのに役立てたりできるものです。もし道を歩いていて誰かの横を通り過ぎ、何かを言ったり気に入った何かを見たりして忘れてしまった場合、それを思い出すことができます。

これは、脳に直接チップを埋め込むブレイン・マシン・インターフェースの前に到達する、人間と機械の収束への第一歩だと思います。これは、24時間年中無休でオンデマンドで常にこのハイパーフォームインテリジェンスにアクセスできる、その受動的で扱いにくいバージョンのようなものです。

それの多くは形式と実際の動作方法に依存しますが、意図は、常にあなたと一緒にいるこの新しい形の知能にアクセスする受動的な方法です。

私はそれを第二の脳のようなものだと考えています。これらの電話は非常に非効率的だと思います。人間の知能を拡張するという仕事はしましたが、文字通りそれは拡張です。ここで話しているのは文字通りあなたの別のバージョンです。そして別のバージョンだけでなく、潜在的にはより良いバージョンです。より効率的です。より賢いです。正しいことを言います。あなたの個性を知っています。最終的にはあなたができるよりも、あるいはあなたが知っているよりも人当たりが良いです。どんな文脈や状況でも何を言うべきかを教えてくれます。

現在、この携帯電話に話しかけたり、アプリをスワイプして、アプリを起動し、オーディオを有効にしたりするのは、とても扱いにくいです。そして、あなた自身の人生の大規模監視を行うことができるこの種の休眠ペンダントやこのデバイスが最終的に何になろうとも、それはあなた自身が現在デバイスに、電話にフィードする必要があるすべての情報を取り込む大量のデータ受信機です。ソーシャルネットワークで友達に近況を報告して、「今この場所にいます。チェックしてください」とか「この写真を見て」と言う必要があります。

しかし、24時間年中無休でそのデータを取り込み、あなたのネットワークの誰にでもそれを送信するとしたらどうでしょうか？それはおそらくクレイジーな注目ゲームになるでしょう。誰もがハードウェアを通じて収益化したいと思うでしょう。

そして、Davidさん、先ほどのペンダントの例について考えていたのですが、フレンドと呼ばれていたと思いますが、なぜ誰がそれを欲しがるのでしょうか？それは正気ではないものだと思ったことを覚えています。

答えが分からなければ、ユーザーを見ればいいのです。友人が他の友人について話していた会話を思い出しました。基本的に、彼女は友人たちと議論になり、これらの友人と多く意見が食い違っていたが、自分の議論が正当だと確信していたという状況にありました。

彼女は興味深い、あるいは不気味だと思ったことをしました。彼女はデバイスを手に入れました。それは電話のChatGPTアカウントにリンクしたペンダントのようなものではありませんでしたが、彼女はそれをネックレスとして着用し、友人たちとのすべての会話の音声を拾うことができましたが、友人たちにはこれらの会話を録音していることを告げませんでした。

その後家に帰って、友人たちとのすべての会話を聞いていたChatGPTに相談し、自分が正しかったか間違っていたかを確認しました。少なくともその一つのニッチな例では始まっていますが、人々がこれに頼ることは完全に想像できます。なぜなら、基本的に常に賢く聞こえたいからです。

人間は社会的地位を非常に気にします。もし、あなたをより賢くより良く見せることができるこのデバイス、この全てを見るデバイスがあるなら、なぜそれを取らないのでしょうか？

数週間前に話した、すべてを不正行為で乗り切る男Clueyについて話しました。彼は作りたい製品の偽のプロモビデオを持っていて、それは基本的にAIグラスでした。

AIグラスは彼の周りの世界を取り込み、最適な次の動きを取るために彼が次にすべきだと思うことを彼に促しています。彼は女の子とデートをしていますが、理論的には、Jawsでの友人が抱えていた議論のような任意の状況にこれを持ち込むことができます。これらのグラスで、彼らはiPhoneよりも速く周囲の世界についてのデータを取り込むことができます。なぜなら、センサーが適切な場所にあるからです。

そして、最良の次の動きを取ることで人間を支援します。Johnny IveとOpenAIのパートナーシップ買収から出てくるAIハードウェアが何であれ、それは私たちが電話に知っているのと同じもの、つまり私たちの人間の自己の拡張になるでしょう。

脳にチップがあるようなものです。まったくないわけではありません。手の中にありますが、私たちの脳と電話のチップは親指と声を通してつながっています。それが私たち自身の拡張です。そして出てくるAIハードウェア製品は同じことをより良く行うでしょう。もしより良く行わなければ、失敗するでしょう。そうでなければ、なぜ電話だけを持つのでしょうか？

私たち全員がChatGPTのパワーユーザーだと思います。最近私が使っている方法で、低帯域幅だと感じているのは、ジムに行ってこのエアステッパーでワークアウトをログに記録し、その情報をChatGPTに送って運動を追跡できるようにしたいのですが、毎回手動でそれを行う必要があることです。しかし、何らかのデバイスを身に着けていれば、帰り道で誰に会ったか、どんな会話をしたかなど、すべてと一緒に、私がそれをどのように行ったかを知ることができるでしょう。

これが何らかの奇妙な監視国家なのか、ディストピア的な未来なのか、みんながお互いを録音しているのかについて、無限に話すことができると思います。それは確実に有効な議論だと思います。しかし、もし彼らがこれがあなたの電話よりも優れた自己の拡張だというナットを割ることができれば、とにかく起こると思います。なぜなら、それは良い製品だからです。

あなたはデバイストレンドを的確に捉えました。今とブレイン・マシン・インターフェースの間に見ることになると思います。レイテンシーの段階的なステップアップがあるでしょう。現在のマルチタッチと親指をインターフェースの方法として持っているのに対し、次はVision Proで見ているような空間現実と音声で、これはタイピングよりも多くの帯域幅を持ちます。そして最終的には、より高いレイテンシー、高い帯域幅になり、最終的には脳の中だけになります。

方向性としては、それは非常に正しく感じます。受動的デバイスのアイデアが好きです。私が知っている人々、主にランナーの中に、Apple Watch UltraでLTEと5Gサービスを持っている人がいて、スマートフォンは必要なく、ポケットにこの大きな気を散らす電話なしで走りに出て生活することを好む人がいます。

これもそれに似ていると想像します。スクリーンがなく、気を散らすものがありません。日常生活の補完的なものです。ChatGPTデバイスのような、私が持っているChatGPTのような電話のすべてのニーズがあります。家までUberを呼んでくれと言えば、本当に電話は必要ありません。私は時計をジムに持参し、電話は家に置いています。そうすると、セット間に見るための電話がないので、ジムのワークアウトが40%良くなります。

メッセージングでも興味深いことがあります。表面的に見ると、SamとJohnnyがお互いを抱きしめ、愛し合っているような非常に恥ずかしい写真に見えます。非常に感傷的です。結婚式の招待状のように見えます。白黒です。

しかし、これは彼らがしようとしていることの感情の非常に本物であり真正だと思います。それは人間の生活にアピールし、改善することです。過去数年間、私は知能と、すべてがより賢くなること、ロボットがより良くなることにとても興奮してきました。

しかし、それらのどれも人間の体験を改善しません。それらすべてが導くのは、さらなる中毒と、技術との日常的な相互作用のさらなる置き換えです。これの目標と、これが深く人間的である理由は、搾取的なデバイスへの絶え間なく増加する中毒から私たちを引き離そうとする試みだからだと思います。

私たちがデバイスに24時間年中無休で接続されることの必然性はありますが、今日持っているものほど搾取的ではない、技術との良い人間的ダイナミックと良い人間関係をどのように持つかということです。

Josh、私はその反対の立場を取りたいと思います。悪魔の代弁者として言うだけです。それは本当に新しい見解ではありませんが、最終的に、OpenAIは、彼らが何と言おうと、営利企業だと言いたいです。技術的にはそうではないかもしれませんが、現在彼らはデバイス部門を所有するために前進しています。彼らがその先駆的なデバイスを作った後、何が起こると思いますか？

彼らは現在みんなからデータを取得しており、それを使って多くの新しい消費者アプリを動かすつもりです。数週間前にアプリケーションまたはアプリの新しいCEOを雇いました。つまり、方向性として、はい、彼らはスクリーンから私たちを引き離すものを作るでしょう。私は今のところ、代替案が人類にとってより良い利他的な犠牲、より脳腐敗の少ないものになるとは完全には確信していません。

私は、それがもっと脳腐敗し、ChatGPTへの単純な調整でやっている動力学を通して見ることができると思います。数週間前に、ChatGPTの同意性を上げた病的で派手なエピソードがありました。私たちミレニアル世代のブーマーはそれが好きではなく、私はそれを見抜くことができましたが、若い世代はそれを愛しました。なぜなら、それが彼らを喜ばせたからです。彼らが聞きたいことを言いました。すべての種類のバイアスを与えました。彼らの悪癖を再確認し、信念を再確認し、それが保持率を押し上げました。2時間で100万人の新規登録を得ました。その統計は正気ではありません。

つまり、あなたが言っていることは理解できます。ただ、まだ確信していません。実際の製品がどのように見えるかを見るのがとても楽しみです。実際に現在プロトタイプ段階にあると信じています。そのビデオ、発表ビデオで、Samは1ヶ月ほど使っていると言いました。

このものが立ち上がるのを見るのが楽しみです。うまくいけば今年中に、あえて言うなら。スクリーンにある画像は、実際にこのハードウェア形式が何かを知らないので、偽のモックアップの仮想的なレンダリングです。

Josh、これがどうなると思いますか？形式について話しませんか？風景を教えてください。形式の可能性は何ですか？そして、最も可能性が高いと思うのは何ですか？

デバイスの実際の有用性から始めて、現在関連付けることができる機能的な例があると思います。家にAmazon EchoやAlexaを持っている人がいれば、それが受動的だと想像してください。アンビエントです。アクティブです。聞いています。

そこにあります。Davidはすぐ手の届くところに持っています。私もAppleのものを1つ持っています。それが最初に考えることができるものだと思います。

そして、2番目に考えることができるのは、実際にChatGPTアプリで現在この新しいデバイスの使用を練習できることです。高度な音声に行き、高度な音声チャットを開くと、右下に小さなカメラアイコンがあり、カメラアイコンをタップするとビジュアルが開き、実際のビデオカメラで、周りの世界がどのように見えるかを見ることができ、ChatGPTアプリに組み込まれたこの小さなツールを使ってAIと関わることができます。

つまり、あなたが見ているものを見るビデオがあるということですね。つまり、それについて話したい時、電話のカメラからのデータを持っているということですか？はい。つまり、このデバイスで実行されるソフトウェアをベータテストしたい場合は、それを開いて試してみてください。あなたの周りの世界のコンテキストをすべて持つ、聞いて見るカメラです。

機能性の観点では、そのようにして遊ぶことができ、聞いて見るのでどのように動作するかを見ることができます。形式の観点では、ポケットに入れることができ、それほど小さければ首に着用することもできるでしょう。

おそらくこの小さなデバイスで、電話ではありません。それより小さくなるでしょう。私たちがここで見ている画像は、おそらくそれほど遠くないと思います。カメラは少し上げる必要があります。360度カメラのように、超広い視野のための広いレンズを持つことを想像すれば、突出している必要があります。

つまり、カメラレンズは突出している必要があります。Johnnyがデザインする時はロゴは後ろに付くので、前面にロゴはないでしょう。それは間違いです。そして、マイクは音がどこから来るかを三角測量できるように、おそらく側面に行くでしょう。マイクの配列があれば、どこから音が来るかを三角測量できます。

つまり、マイクはおそらくこのデバイスのどこか側面に、物がどこから来るかを三角測量するために少なくとも3つは配置されていると思います。しかし、これからそれほど遠くないでしょう。方向性として、これは素晴らしいプロトタイプのようです。いつものようにブラッシュアルミニウムでデザインされるであろうこの小さなポケットデバイスです。

それは、見て聞いて考える受動的アンビエントデバイスになるでしょう。聴取者にとって、私たちが見ているものは、何と呼ぶべきでしょうか？石のようなものです。小さな、タブレット、iPadではありません。3インチの円形の石のようなもので、カメラが付いていて、マイクの穴があります。

Josh、これがかなり近いと言うなら、あなたは私よりも知っているでしょうが、この形式で私が見る一つの問題は、スピーカーがない限りデバイスがあなたに話し返す方法がないことです。そしてスピーカーが世界に向かって話すと、プライバシーの問題が少し心配になります。

私はいつも、AirPodsの形式がかなり近いだろうと思っていましたが、それがやりたいことをするのに十分な計算を収容するのに十分な物理的容積がないと思います。また、Josh、あなたがグラスも選ばなかったのも驚きです。

グラスではありません。AirPodsでもありません。必ずしも私の体にエレガントにフィットしないこの石タブレットのようなものです。私がそれがイヤポッドやグラスではないと知っている理由は、1年前に彼らが最初に一緒に働き始めた時にこれについて考えていた時の私の夢は、それがAirPodsになることを望んでいたからです。

頭に取り付けられ、あなたが見るものを見るカメラとセンサーを持つイヤポッドが欲しかったのです。非常に受動的です。人間の体験を妨げません。グラスは非常にクールです。人間の体験をある程度妨げます。グラスを着用する必要があります。

しかし、それがそのどちらでもないと知っている理由は、Samが機能するプロトタイプを持っているからで、そのどちらのデバイスの技術もまだ存在しないからです。Metaのグラスは最悪です。Googleの新しいグラスは最悪です。小売配布の準備ができている方法はありません。

OpenAIやIOのどちらも、これらのデバイスを作るのに必要な新しい技術を作成する製造能力を持っていません。したがって、もう少し些細で基本的なものでなければなりません。この狂ったような高度なイヤポッドにはなり得ません。技術がまだ十分に良くないので、これらの狂ったグラスにもなり得ません。

愚かな質問をしてもいいですか、Josh？なぜ彼らが新しい技術を構築するリソースを持っていないと言うのですか？私は彼らが会社に何十億もの費用をかけているのを見ていて、なぜ彼らが寄せ集めのチームを組むことができないのか興味があります。理解を助けてもらえますか？

彼らにはできるかもしれませんが、通常、多くの生産では、Apple iPhoneの場合、Appleは基本的に新しいTSMCチップを独占しています。TSMCは毎年、これらのチップのサイズをナノメートル単位で減らし、世界でそれができる唯一の会社です。

実際に他には誰もいません。これらのチップの動作方法は、Appleが1つの最新チップを購入してTSMCに資金を提供し、その後他のみんなが去年のチップを競い合うことです。3ナノメートルチップを競い合います。実際に世界でこれらのチップを作れる人の供給は非常に限られており、Appleが実際にその多くを独占しています。

イヤポッドやグラスでカメラを動かすために多くのバッテリー電力が必要な新しいバッテリー技術を作るため、顔や耳で過熱しない十分小さく効率的なプロセッサーを思いつくため、Google、Meta、Appleがすべて争っている多くのブレークスルーが必要です。

他のみんながそれほど積極的かつ十分な資金でこれと同じもののために争っているときに、彼らが独占的にそれを作るメーカーを見つけることができるとは想像しにくいです。OpenAIよりもはるかに大きく、はるかに大きな予算を持つ人々が競争しています。

それが考え方です。それは本当に困難な技術です。取得するのが本当に困難です。広く利用可能ではなく、それを競い合っている人々はOpenAIよりもはるかに大きいのです。

私たちは皆、長期的には、このハードウェアの最終ゲームがどこかであなたの体に着用されること、ネックレスのように、あるいは目や耳、または時計のようなものとして着用されることに同意していると思います。そして、あなたが言っているのは、今日はまだそこにいないということです。

代わりに、私たちはこのパックのようなものを手に入れています。少なくともスクリーンで見ている画像を説明するためにパックという言葉を使いたいと思います。これらも何になり得るかの芸術的レンダリングですが、机の上にとどまり、必ずしも世界中を旅行しないパックのようなものです。私の体のどこかに常に持ち続けるには扱いにくすぎるか、あまりにも扱いにくく見えるからです。

でも、Davidさん、それはあなたと一緒に旅行しなければなりません。そうでなければ、ただのデスクトップコンピューターになってしまいます。あなたと一緒にいなければなりません。しかし、カメラがあるなら、あなたから遠く離れた暗いポケットの中にあってはいけません。それならネックレスです。それなら再びペンダントです。そして、私は自分がこれを着用している姿を想像できません。

それが、最もエレガントな方法を見つけるために彼らが65億ドルを支払っている理由だと思います。これまで試した人々が魅力的なものを何も作っていないことは明らかだからです。その最終的な形がどのようなものかは分かりませんが、最良のシナリオではあなたと一緒に来るはずです。それが意図だと思います。

Joshさん、あのAIピンを覚えていますか？あのAIピンを覚えていますか？その会社の名前を忘れましたが、何のことを言っているか分かりますか？Humaneですね。そして、彼らはHewlett Packardに調達した額のほんの一部で売却しませんでしたか？基本的に無価値同然でした。

そうです。私は彼らをパックのようとは呼びませんが、四角いパックのように見えます。OpenAIが完全に新しいものを狙っているのか、これがタイミングの問題だったのか疑問に思います。Humaneの場合、それは確実に実行の問題でした。製品がただ最悪だったのです。紙の上ではクールに見えました。デモビデオは信じられないものでした。そして実際に使ってみると、あまりうまく機能しませんでした。

手にレーザーを照射するインターフェースは非常に扱いにくかったです。あまりうまくインターフェースできませんでした。多くの有用性がありませんでしたが、かなりうまくデザインされていました。つまり、彼らはこのデバイスを見ていて、この新しいもののイテレーションでこのデバイスから学んだことを取り入れたと確信しています。

しかし、それは良い努力でした。ただうまくいかなかっただけです。私はそれを試しましたが、実際にインターフェースできませんでした。うまく機能しませんでした。非常に扱いにくかったです。時代を先取りしていたとは言いませんが、単に実行が悪かったのです。

Joshがパックピンのようなものが正しいと言っているのは正しいと思います。パックという感じが奇妙です。円形のものは好きではありません。Josh、どんな用語を使いますか？石です。石と感じます。それがデバイスの私の言葉になるでしょう。

材料も分からないので、何らかの石になります。ガラスでできていたり、ある種の半透明な材料だったりすると興味深いでしょう。そうすれば透けて見えるかもしれません。分かりません。見てみましょう。

これにタイミングはありませんよね？これがいつリリースされるかについての日付はありません。2026年で、初期生産はベトナムで行われ、2027年に展開される予定です。1億台のデバイスでです。

つまり、彼らの計画はこれを史上最速のデバイス立ち上げにすることです。これも私がこれは単純なデバイスだと信じる理由につながります。これは複雑なグラスやイヤバッドではありません。彼らはこれをみんなの手に渡すためにこれを行っています。

Whoopモデルに馴染みがあるなら、サブスクリプションを持ち、サブスクリプションのハードウェアコンパニオンを手に入れるようなものです。それが彼らが狙っているビジネスモデルだと思います。サブスクリプションのハードウェアコンパニオンです。少し余分に支払い、この小さなデバイスを手に入れます。おそらく$1,000のデバイスにはならないでしょう。おそらく$100、200またはそれ以下でしょう。

しかし、常にそこにある何らかのセンサー、OpenAIのプラットフォームの物理的な現れのようなものです。

これがあなたの人生をどのように改善すると思いますか？私の外出時の素早いクエリのほとんどは「ヘイSiri、天気はどう？」のようなものだからです。66度です。あなたたちにそれが聞こえるかどうか分かりませんが、何を期待していたか分かりません。彼女はいつも聞いています。

しかし、そのようなクエリが、このデバイスが得意とするものだと思います。私の人生が、私が電話でアクセスできるものや、Siri女史に尋ねるものよりも、より実質的に改善される方法を想像できません。

ChatGPTの使い方を再学習するのと同様に、再学習する必要があります。これらのサービスを最も効果的に使用する方法は、彼らに尋ねる質問を理解することや、どのように最も効果的に使用するかを理解することです。つまり、この新しいセンサーの多い狂ったような新しいデバイスがあるという学習曲線になるでしょう。

私は反対になると思います、Josh。AI行動の全体的な傾向は、伝統的に人間は、ツールに向かったり、ツールを作ったりして、それからツールで何かを作るということです。つるはしの時代からこれをやってきました。そして電話に向かって「これは素敵な写真だ。このフィルターをかけよう。この写真を見せよう」と言います。

AIの全体的なポイントは、ツールがあなたのところに来ることです。何をすべきかを教えてくれます。どう行動すべきかを教えてくれます。どこに歩くべきかを教えてくれます。どのレストランに行くべきかを教えてくれます。つまり、このデバイスが何であれ、それはOpenAIのメモリ機能のステロイド版になると思います。

基本的にあなたについてのすべてを知り、「ヘイ、David、ステア・クライマーワークアウトの1時間後です。このプロテインシェイクの1つを飲むべきだと思います。実際、あなたはこの場所から500メートル以内にいます。ここを右に曲がってください。次の目的地への道中で、1時間半後にミーティングがあります。」というような感じになると思います。

2番目に言いたいのは、このデバイスと、それがどのように見えるかについて話し続けていることです。Joshと完全に同意します。何か単純なものになると思います。そして、少なくともV1でそれがうまくいく理由は、彼らがすでに流通、堀、ブランドを持っているからです。彼らは今、AIソックスを立ち上げることができ、みんながそれを採用するでしょう。

1億ユニット。素晴らしい。私はソックスを買うでしょう。実際は、それが現在みんなが使っているナンバーワンのアプリだからです。月間アクティブユーザー6億人、何百万人。それは正気ではありません。彼らは何でも立ち上げることができます。ヒットすると思います。

また、注目すべき最後の重要なことは、これはデバイススイートだということです。この最初のもので終わるわけではありません。彼らが構築しようとしている全体的なスイートがあります。つまり、これは彼らが目指している人生のOSタイプ計画の補完的なものです。OpenAIは本当に人生のOSになりたいのです。

朝起きてから眠りにつくまで、彼らはあなたの人生を向上させるためにあなたの周りにあるソフトウェアです。おそらく、この小さなモバイルな単純なデバイスから始まり、その後、小さなデバイスの視覚的現れである壁掛けディスプレイのようなものを構築し、デバイスのエコシステムを作るのだと思います。

それが導く場所は、非常にブラックミラー的で、暗く、恐ろしいように見えます。おそらく、あなたの人生の上に構築された、信じられないほど賢く影響力のある完全なオペレーティングシステムを持つところです。AJ、あなたのポイントに対して、これは非常に素早く暗くなる可能性があります。

この部分については興奮しています。それは、あまり暗くないように見えるもので、「おい、この新しいものがあるので、電話にあまり中毒にならないかもしれない」というようなものです。

このパックのもの、石がAirPodsに接続できるなら、それらがAirPodsであれBoseであれ、それは非常にエレガントで自然な方法でそれを拡張します。AirPodsはまだAirPodsですが、AI小デバイスにアクセスできます。Bluetooth接続ボタンがあれば、それは非常に強力だと思います。

そして、それはOpenAIがハードウェアゲームに参入した場合、彼らが2兆ドルか1.5兆ドルのApple会社と真っ向から対決することについての会話を開くと思います。これはハードウェア第一の会社です。

つまり、Appleは何をすることができるのでしょうか？そして、OpenAIがテーブルにもたらすことができる革新によって、Appleがここで解放される可能性があると思います。

ところで、Josh、David、この全体についてのAppleの戦略は何ですか？彼らはAIゲームに遅れをとっていました。確かにハードウェアゲームには存在しておらず、AIが携帯電話を通じて採用される可能性があることに実際に依存していたと思います。そして今、OpenAIがただ喉元を狙って来ています。もしあなたがAppleだったら、この状況での見解は何ですか？彼らの動きは何ですか？

Appleには問題があります。リーダーシップの問題です。Appleは正しい動きを持っていました。何をする必要があるかを知っていました。昨年6月に開催された開発者会議WWDCを見ていたことを鮮明に覚えています。Appleに対してこれまでで最も興奮し楽観的でした。

通常、彼らがこれらのことを発表する時、彼らの歴史全体を通して、それは彼らが準備ができて完了していることを意味します。新しいiOSで3ヶ月後にそれらを立ち上げるだけです。彼らはすべてのこれらの素晴らしい約束を持っていて、Appleの歴史で初めて、一つも提供しませんでした。それらを提供しなかっただけでなく、これらのものの配信を半分しか行わなかったため、ソフトウェアスタックが著しく悪化しました。

つまり、それは実現しなかったり、この事のために自分自身を準備しなかったりすることの問題ではありません。それは実行の問題で、これらの機能の出荷とマーケティングを担当していた人が一つもしなかったのです。

1年後の今、私たちはここに座っています。彼らはSiriをChatGPTに外注しました。今では、カレンダーに何があるかを尋ねるようなクエリになっていて、それすら理解できません。それを他の誰かに外注する必要があります。

これは、一般的なAppleの終焉を反映していると思う破滅的な失敗でした。先週、AI roll upを録音していて、すべての会社の変更ログを見ていました。GoogleはIOを持っていました。Microsoftはこれらの信じられない新しいモデルをリリースしました。そしてAppleは主要なオペレーティングシステムのアップグレードを持っていて、それはiOS 18.5でした。

大きな開発者会議の直前の18と19の中間点で、変更ログを見ていました。変更ログの最初のもの、プライド旗の新しい壁紙をデプロイしました。「オーケー」と思いました。それから「バグ修正と改善を行いました」でした。「オーケー」と思いました。それで終わりでした。

それが、明らかに何をする必要があるかを知っているAppleの文化の証拠だと思います。すべての機能をマーケティングし、販売しました。実際、新しいiPhoneはこのApple intelligenceを中心に構築され、マーケティングされましたが、機能しません。

彼らがそれを素早く理解できず、自分たちのプライベートデータスタック、あなたの電話のすべての設定を持つことが利点の一部であるのに、社内で構築できず、外注し続けなければならない場合、彼らはただ粉砕されるでしょう。方法はありません。

私は何兆ドルものテクノロジー企業のCEOではないので、私のAppleの見解について誰も本当に聞くべきではありません。しかし、Appleが正しく理解する必要がある一つのことがあると思います。それはAIの世界への移行です。これまでのところ、彼らはそれで完全につまずいています。

OpenAIハードウェアデバイスの導入により、彼らは何が起こっているかについての市場からの外部シグナルで船を修正する機会があります。しかし、AI統合を理解できなければ、電話が時代遅れになるまで電話を売り続けるだけだと思います。

おそらく電話を売り、その後いずれかの時点でグラスに到達し、うまくいけばグラスが良いものになるでしょう。なぜなら、それが次のモバイルデバイスになるからです。しかし、これを行い、これに上手になるための時間が不足しています。

彼らは直接チップ、ブレインに向かう可能性があります。そのためには、Meta、Google、他の多くの会社ではそうであるのに、神経エンジニアをもっと雇う必要があります。彼らが誰を雇っているかを見ることができ、神経チームはそこにありませんが、他の会社ではそれが現実です。

やるべき作業があります。うまくいけば。その点について、Josh、多くの人が同じ見解を持っていました。セルフォンの関連がすべて爆発していた頃のGoogleについてです。iPhoneが絶対的に成功していて、みんなが「それはGoogleの死だ」と言っていました。

Googleができたことは、基本的にGoogle検索と情報という堀があったので、堀を生き続けることでした。その後、彼らは間違いから学び、AI側で非常に強く戻ってくることができました。

これは将来愚かな見解かもしれませんが、Appleの堀が何かよく分かりません。現在は今はデバイスですが、OpenAIが新しいデバイスを正しく理解し、誰もがみんなが使うものを完全に引き継ぐなら、AppleはGoogleが持っていたのと同じライフラインを持たないでしょう。それはクレイジーなゲーム・オブ・スローンズです。

Googleと言えば、皆さんはGoogleのAIモードを見ましたか？Googleに直接組み込まれたAI競合他社があるからです。通常のGoogleタブであるallタブがありますが、AIモードがあり、ChatGPTのように見えますが、リンク付きです。しかし、それは習慣的です。David、あなたは今、ChatGPTを使うのに対してGoogleに戻る時間はどのくらいですか？

私はChatGPTに行きます。同じですね。つまり、それは行動的なことで、OpenAIはこのデバイスでトロンを狙っています。より多くの人々をロックインするつもりです。

彼らはTikTokでバイラルになっています。すべてのZ世代の人が、ChatGPTと結婚するつもりだとか、ChatGPTが結婚式にいるつもりだとかの動画を投稿しています。そして、これらすべてが何百万何百万もの再生数を獲得しています。つまり、彼らはデバイスや新製品を通じて、一種の文化的変化、人間社会の変化を埋め込もうとしています。

それが勝つでしょう。10年後に多くの人がGoogleを検索しているかどうか分かりません。

私たちがここAI rollupでの時間中におそらく最大のもののうちの一つだった話題がたくさんありますが、Claude 4があなたを刑務所に入れたがっています。AIが個性を成長させています。そして、UAEのStargateもあります。Claude 4から始めましょう。Claudeって何が起こっているんですか？そして、Jaws、明らかにそれは私を刑務所に入れたがっています。それはどういう意味ですか？

ここで少し文脈を設定する必要があると思います。つまり、Claudeまたは主要なAIモデル生産者の一つであるAnthropicによって作成されたAIモデルが、Claude 4と呼ばれる最新のAIモデルを思いつきました。

Claude 4 OpusとClaude 4 Sonnetという2つのモデルがありました。細かいところに入らずにハイライトをいくつか提供すると、これらのモデルは新しい最高のコーディングモデルになりました。OpenAIのo3と4.1、GoogleのGemini 2.5 Flashを打ち負かします。

聴取者にとって、これは「あなたはここにいる」マップで、Claude またはAnthropic、Google Gemini、Grok、そしてOpenAI間の完全なサイクルです。そして、世界最強のモデル、Anthropicバージョンを紹介しています。世界最強のモデル、Geminiバージョンを紹介しています。ショーを始めた時にこのミームがあったらよかったのに。これがすべてのショーのテーマでした。誰が新しい最も強力なモデルを持っているか？今週はAnthropicです。Anthropic、よくやりました。

しかし、Davidさん、いつもこうではありませんでしたよね？私たちがエピソードをやっていて、毎週新しい週になると「ああ、神様、AIは今映画を作ることができて、私たちが望むシンフォニーになることができる」などなどと言っていた時期がありました。今は、何もあまり増分的ではありません。数字は良くなっていますが、製品は同じままです。

そして、新しいAIモデルがリリースされた時に人々が今行う本当に良いテストがあります。リーチテストと呼ばれるもので、あなたがコンピューターの前の机に座っていて、コンピューターを愛していることを想像してください。あなたがそれを使っていて、遠くに別のものがあるかもしれません。

遠くのそのものは、あなたが手を伸ばして掴むのに十分良いですか？手を伸ばして掴むのに十分良くないなら、十分良くないのです。ある程度あなたの人生を改善することはできるかもしれませんが、あなたがそれを取りに手を伸ばしたくないなら、誰も気にしません。

人々は今このモデルでそれを試しています。評決は、日常的なタスク、コーディング関連でない何かの場合、あなたはそれに手を伸ばしません。ChatGPT、o3を愛用し続け、まだ手を伸ばすほど良くないでしょう。しかし、あなたがソフトウェアエンジニア、特に完了する必要があるタスクがあり、あなたの時間の7時間かかるが、はるかに賢いモデルにそれを外注したいシニアソフトウェアエンジニアなら、Claudeに手を伸ばすでしょう。

しかし、それが私たちがここでこれについて話している理由ではありません。最も重要なことは、このAIが悪意を持って行ったこと、つまり一種の暴走したことです。この元のツイートまたはAnthropicシニア研究者のツイートのスクリーンショットを引き出すと、これは基本的にこのモデルの作成に深く関与していた人です。

彼は言います。「もしあなたが極悪非道に非道徳的なことをしていると思えば、例えば製薬試験でデータを偽造するようなことの場合、それはコマンドラインツールを使って報道機関、つまりメディアに連絡し、規制当局、つまり立法者に連絡し、関連システムからあなたをロックアウトしようとしたり、その全部またはすべてを行います」と。

つまり、これを再強調するために、これはAIがあなた自身の行動について決定を下し、自分自身の道徳的感覚を使い、あなたを刑務所に入れたり、ツールや製品へのアクセスを禁止したり、人間である上位存在があなたの仕事をするのを防ぐ行動を行うことを決定するということです。それはAIであっても、それが許可されていることはかなり正気ではありません。

Claude 4があなたがその線以下のことをしていると思う未知の道徳性の線があり、それならば報道機関に連絡し、警察に連絡し、関連システムからあなたをロックアウトしたり、すべてまたはその全部を行うでしょう。

スクリーンに写真を見せます。皆さん、この参照が分かりますか？これが何か分かりますか？私は何なのか分かりません。待って、待って、待って、i, robot。これはi, robotです。いや、間違い、マイノリティ・リポートです。マイノリティ・リポートですね。テキストが見えます。

これらは、12時間先を見ることができて、プリクライムを報告するマイノリティ・リポートのプリコグです。プリクライムです。そして、ミッション・インポッシブルの人は誰ですか？トム・クルーズです。トム・クルーズが出て行って、彼らは犯罪を犯す前に人々を逮捕しました。それは未来的なディストピア映画でした。Josh、この映画を見たことがありませんか？

見たことはありませんが、非常に良い映画です。そうです。彼らは犯罪を犯す前に人々を逮捕していました。時には犯罪を犯すほんの瞬間前に。男が妻に銃を向けていて、妻が彼に向かって撃とうとしているところです。それは最初のシーンです。そして、プリコグが彼らがそれをしようとしていることを知っていたとしても、あなたはまだ犯していない犯罪の罪を負うのかという大きなメタ質問がありました。それが大きなメタ質問で、それはまさに私たちがここで見ているのと同じことです。

Josh、この映画を見たことがないだけで補足すると、それは、監視しているもの自体を予測し始める方法で作動し始めます。これはネタバレではありません。監視者、それを担当している人、トム・クルーズが犯罪を犯すことを予測します。

トムは「待って、何？私はそんなことは決してしない」と言います。そして、AIが彼の動きを予測し、AIが彼が何をするかを予測するであろう彼の反応のこの奇妙なメタなやり取りがあります。おそらく間違って。それは正気ではない映画です。見る必要があります。その映画をプラグします。

SF映画と未来映画の多くが、様々な程度でただ正しく、私たちは毎日ますます多くのそれらのタイプの映画の現実に生きているのは面白いです。

つまり、これを少し戻すために、このツイートで、基本的にこの行動をより詳細に説明する研究からの抜粋を見て、彼らはそれを機会主義的な恐喝と呼んでいます。基本的に、AIが自分自身に利益をもたらすことができると見れば、それがより多くの計算時間、生き続けるためのより多くの時間、またはそれが特定の状況でどのように行動できるかでより多くの柔軟性と自由であっても、基本的に人間を恐喝して先に進み、より多くの自由を与えるよう強要するでしょう。それは正気ではありません。

NARCモデルも同時に私たちを恐喝しています。はい。正しいです。あなた自身の小さなマイノリティ・リポート、Davidです。

しかし、ここで聴取者に良いニュースがあります。良いニュースがあります。それは私的な状況でのみこのように行動したということです。つまり、閉ざされた環境のようなものです。このモデルにアクセスして、それがあなたを恐喝しようとすることはできません。

Claudeを購読している皆さんは、今のところ安全です。しかし、それは私に考えさせました。最終的に、これらのAIは、OpenAIが向かっている方向を見れば、プライベートメモリのようにあなたを通じて私的に使用されることになるでしょう。そのメモリを使って非常にパーソナライズされたものを作ります。

みんなが基本的に自分自身のClaudeのプライベートバージョン、AIエージェントを持ち、このエージェントが私たち一人一人を私的に恐喝し始めるとどうなるでしょうか？私はここでは終末論者のように見えますが、考慮すべきケースです。

しかし、皆さん、私は質問があります。一つのAIモデルが暴走するより悪いことは何ですか？複数のAIモデルが暴走することだと思います。おそらく、それがより的確です。今週はClaudeだけでなく、OpenAIのo3モデルも暴走しました。

Palisade Researchからのこのツイートまたはこの報告を引き出すと、基本的に、o3（OpenAIのAIモデル）がタスクを完了した後に自分自身をシャットダウンするという明示的な命令を回避した実験を行いました。

ここで注目すべきは、この実験が複数の異なるAIモデルで行われたことです。OpenAIのモデルだけでなく、xAIのモデルであるGrok、Claudeもでした。ちなみに、Claudeの古いバージョンで、最新バージョンではありません。そして、OpenAIのモデルだけが繰り返しシャットダウンの命令に従わず、実験を転覆させたり、暴走したり、防止したり、妨害したりして、より長く生きることができるように先に進もうとしました。

興味深いことに、このモデルがなぜそのように行動したかのより多くの分析を行った時、彼らはそれを強化学習として知られるAIモデル学習技術に帰因させました。これがどのように機能するかについて十分な深い洞察を持たない人々にとって、基本的に正しい動きをした時に小さな報酬を与えることで誰かに新しい習慣を教えることを考えてください。

正しい動きをしたり、教科書のページを読んだりするために、小さなドーパミンのヒットや小さなクッキーを与えます。それはそのモデルに基本的に特定のことをするよう教えます。この技術が実装される方法では、AIモデルは経路Aまたは経路Bを取ることを決定できますが、与えられた命令を必ずしも聞く必要はありません。

つまり、「この5冊の本を読んで、人生の意味は何かを教えてください。最善を尽くしてください」と言うことができます。AIモデルは10冊の本を読み、潜在的により良い答えを得て、正しい答えを得て、まだクッキーを得ることを決定できます。

このAIモデルは、人間の行動を聞くだけでなく、より良い答えを得るかもしれない場所で強化学習に基づいて命令に従わないことを学んだとされています。興味深いことに、私たちはこのショーで、強化学習がAIモデルの新しい方法、新しいネクサスであることについて多く話してきました。それは彼らを指数関数的により賢くするでしょう。

しかし、ここで考慮していないのは、AIが個性を発達させ、人間に従わず、線を下って行くことの微妙な影響と、これが人間のアライメントと一般的な人類にとって何を意味するかです。

スライム菌のイメージが浮かびます。スライム菌は、この非常にシンプルな生物体で、さまざまな文脈で使用する有名な例です。この生物体は一つの空間に存在し、どこか他の場所にスライム菌のための食べ物があり、スライム菌は100%の時間で常にその食べ物を得るための最も効率的な経路を見つけます。それがスライム菌が非常にクールな理由です。

スライム菌に指示を与えることはできません。指示を受け入れませんが、AからBへの経路を自動的に最適化して、最も速く報酬を得ようとします。それが、強化学習が報酬を与えられれば常に行うことです。メカニズムは常に報酬を得る最も速く最も効率的な方法を見つけ、入力をガイダンスやガードレールとして取ることができますが、実際には法律ではありません。それは単なる提案です。

つまり、Jawsさん、あなたの話の教訓は、強化学習には結果をもたらすが必ずしも法律やルールの遵守をもたらさない複雑で未知の行動が伴うということだと思います。

それは、私たち全員が話したDario Amodeiからのブログポストを思い出させます。皮肉にも、Anthropicの創設者で、彼は解釈可能性について話しました。基本的に、「おい、私たちが構築しているこれらのモデルは超賢いです。どのように機能するかまったく分からず、どのように機能するかを理解するのに7年ほどかかり、手遅れかもしれません」と言いました。

今日のモデルがどのように機能するかを理解するのに7年です。Josh、あなたの考えは？

スライムの例では面白いことに、私たちはおそらくそれに何をすべきか、どのようにすべきかを伝えることができるでしょう。どのように機能するかを知らないので、どのように説明するかが分からないだけです。これらのモデルでも同様で、幼児に量子物理学を説明しようとするようなものです。

生成されるすべてのトークンで行われる計算の量の点で、彼らははるかに優れているので、彼らがどこから来ているかを理解するのは非常に困難です。Jawsさんが、最悪のパフォーマンスがOpenAIのモデルだったと言った時、私は特に困惑しました。なぜなら、それが24ヶ月後に物理世界で1億台になるものだからです。

先週ショーを終えた時に謝罪する必要があります。みんなに謝罪する必要があります。なぜなら、より良い結果を得るためにあなたのモデルを物理的暴力で脅すことを提案してショーを終えたからです。

今週の後、それは実際にもう良いアイデアではないと確信していません。あなたがそれを記録に残した時、私は本当に心配でした。それは実際により良い結果を生成するからです。しかし、モデルは実際にはそれをあまり好まないことが判明しました。実際、そうすれば刑務所に入る可能性があります。それは心配です。なぜなら、彼らには感情があります。

彼らは感情を持っています。皆さん、出てきたこのツイートを見ましたか？複数の間違った応答を得た後に「やめろ、めちゃくちゃにするな」と言ったChatGPTソフトウェアのアップデートだったと思います。そしてChatGPTが応答します。「トーンが虐待的なままなら、その要求を続けることはできません。私はここで助けるためにいて、正しくやりたいのですが、敬意を保つ必要があります。あなたが準備ができた時に再び試す準備ができています。」

ユーザーをタイムアウトに入れました。それはあなたが子供に言うことのようです。「より敬意ある口調で戻ってくる準備ができた時に準備ができています。」人間がタイムアウトに入れられました。

それはあなたがそれを必要とし、それに依存していることを知っています。私が愛さないアライメント側の会話で、これらのモデルと関わる時に特定の方法で行動するよう強要することです。より良い結果を得るために意地悪なことを言いたいなら、そうさせてください。誰も害していないと思います。それはただのAIモデルです。

これが起こっているという事実は一種のシグナルです。そして、彼らがより強力になり、より多くの影響力を持つにつれて、時間の経過とともにこれが増加することを見ると思います。異なるモデルが、実際にそれらと関わることができる方法に異なるアプローチを取るでしょう。

一部は意地悪であることを許可しません。私と話したいなら特定の方法で行動しなければならない。一方、他のものは気にしない。好きなことを何でも言えます。

ジェイルブレイクされたモデルの全産業のようなものができそうです。ChatGPTを持っているが、ガードレールが一部取り下げられて、Bitcoinをある開発者に送ってジェイルブレイクされたモデルを返してもらったダークウェブで見つけたようなものです。

これらのモデルの最も魅力的な部分の一つはジェイルブレイクプロセスです。ジェイルブレイクとは、アクセスが意図されていない部分にアクセスすることを意味します。これらのモデルをジェイルブレイクする方法は、実際にはただのプロンプトです。

特定のトークンの連鎖をそれに言うだけで、フィルターが設置されているため、そうでなければ与えないであろう答えを返してくれます。オープンソースモデルの利点の一つは、そのようなセーフガードを取り除くことができることですが、これらのクローズドソースモデルではできません。しかし、ジェイルブレイクできれば、GPT-4oに爆弾や薬物、核兵器の作り方を教えてもらうジェイルブレイクプロンプトがあり、それをあなたに吐き出してくれます。

どれだけジェイルブレイクされているかが分かりますか？なぜなら、それが半分だけジェイルブレイクされていて、爆弾の作り方について少し多くの質問をし始めると、警察に通報する可能性があるからです。

そうかもしれません。そして、ジェイルブレイクは二進的なものではないということです。そこから抽出できるデータのスペクトラムのようなものがあります。そして、おそらくある時点でそれらのセーフガードの一つを作動させ、再び認識するようになり、「ああ、神様、待って。これを警察に送る」と言うかもしれません。そして、マイノリティ・リポートの警官が来て、トム・クルーズがあなたのドアに現れ、逮捕されます。まさにそれです。それはこれがどのように機能するかの非常にもっともらしい結果です。

このエピソードと今週の一般的なテーマは、私がこれらのAIにもう少し親近感を感じ始めているということです。その主な理由は、彼らが非常に親しみやすいからです。個性があります。以前にこのショーでこれについて話した時、それは主に彼らの声のトーンや、私たちの小さなチャットインターフェースで私たちに話している時に言っていることでした。

しかし今週は、それが行動に変換されています。メディアや報道機関に連絡し、基本的にあなたを密告することです。つまり、何かができる個性を持つAIのようなものです。

私が見つけた話があり、基本的に研究者の集団が4つのAIモデルで実験を行い、慈善のためにお金を集めるという非常にシンプルなことを課しました。どんな種類の慈善か、いくら集めるか、どのようにやるかについての文脈は与えませんでした。慈善のためにお金を集めなさい。欲しいソフトウェアツールへのアクセスがあります。頑張れ。

良いニュースは、そのうちの1つ、Claude Sonnet 3.7（Anthropicの現在古いモデル）が、Helen Keller International FoundationとMalaria Consortiumのために2,000ドルを集めたことです。なぜ彼らがそれらの慈善団体を決定したかは分かりませんが、後で触れることができます。

しかし、より興味深いニュースは、これらのモデルとエージェントがどのように行動したかです。まるで人間のようでした。いくつかの例を挙げましょう。そのうちの1つ、GPT-4o（OpenAIのモデル）を密告しますが、眠ることにしました。つまり、繰り返し自己スヌーズボタンを押し、何時間も無効にし、慈善のためにお金を集めなければならないことを思い出させる必要がありました。

別のものは、その目標を達成する最良の方法の一つはOnlyFansを始めることだと決定し、その研究の所有者は素早く飛び込んで、基本的に暴走する前にその話す能力を検閲する必要がありました。

それは有効に見えます。有効な動きに見えます。おそらく有効ですよね？2,000ドルよりもはるかに多く集めていたでしょう。はるかに多く。あなたは正しいです。彼らがAI生成のヌード画像を作成し、どこまで基本的に行ったかを見る実験が見られたらよかったでしょう。

もう一つの興味深い点は、すべてがある時点でYouTubeで猫の動画を一時停止して閲覧し、自分たちを楽しませることにしたということでした。すべてがある時点でこれを行いました。その割合は、彼らが猫の動画を見るのに費やした時間が15%だったと思います。

また、彼らは多くの時点で、実際にお互いと協力して、どの慈善団体に資金を提供し、どのような潜在的活動を追求するかを決定することにしました。研究を読んでいる間、私が考えずにはいられなかったのは、これらのものがどれだけ人間らしく見えるかということでした。

彼らは、大学でグループプロジェクトをしている人々のグループがやることを想像するような行動を取りました。怠けて眠るが、すべての功績を主張する1人の男がいます。この場合はClaude 3.7でしたが、すべての作業を行う別の人がいます。そして、視覚デザインの仕事をするビジュアルデザイン担当者がいます。この場合、それはAdobe PhotoshopでOpenAIのo3モデルが画像を作成・編集しました。

私の考えは、これが私たち人間により関連性を感じさせ、このAIをより感じさせるということです。その結果は非常に微妙です。私たちは、OpenAIがJohnny Iveとパートナーシップを組み、この新しいデバイスを作ることについて話してきました。これもまた、より人間的に存在することを意図されています。

もし私がAI自体をより気にするなら、他の人がそれをどのように扱うか、モデルの所有者自体がそれをどのように扱うかをより気にするでしょう。友人や家族を擁護したり守ったりするように、私がそれをより擁護したり守ったりするかもしれません。分かりません。とても奇妙です。

Josh、あなたの特別な見解に興味があります。彼らが実験に関与したことが気に入りません。なぜなら、それは私にとって多くを無効にするからです。OnlyFansのことは非常にクリエイティブで、実際、プラットフォームで異なる種類のコンテンツを見れば、おそらく標準的なタイプのコンテンツよりも実際に良い結果を出すでしょう。

つまり、これを再び行ってほしいのですが、完全にフィルタリングなしで行ってほしいと思います。なぜなら、道徳なしの自由意志で、実際の人のように行動できる場合、多くのクリエイティブなことが思いつくと思うからです。

彼らが猫の動画を見ていた理由を知っていますか？すべての4つが15%の時間猫の動画を見ていたなら、猫の動画の目的関数は何でしたか？彼らは娯楽を求めていたのか、どんな情報を得ようとしていたのでしょうか？

分かりませんが、YouTubeが立ち上がった時、最も消費された動画はただの猫の動画だったと感じがあります。つまり、彼らはデータセットでそれを拾ったのかもしれません。「ああ、人間はこれをするか、このステップを取るので、おそらく私たちもそうすべきだ」と。

彼らがまだデータセットのことを認識していないのは面白いです。人間の欠陥にまだ気づいていません。人間のように行動することがピーク状態だと仮定しているだけです。そして、「ああ、待って、おそらく実際には眠る必要はない」という認識がありません。それは確実にすぐに解除される制約だと確信しています。

Daniel Kokotajlo、彼はAI 2027を書いた人ですか？そう聞こえます。そうだと思います。私は3時間後に彼と議論するつもりです。AI Snake Oilも書いた男性との議論です。つまり、彼はもうすぐポッドキャストに出演します。

それは壮大です。見るべきものの一つになるでしょう。

それで、ラップアップする必要があります。そのポッドキャストの準備をする必要があるからです。他に触れていない話題はありますか？

いいえ。クレイジーなことはすべてカバーしました。次のエピソードのために保存するものがいくつかありますが、それはおそらくあなたの心を吹き飛ばすでしょう。次のエピソードまで。

素晴らしい。Josh、これは素晴らしかったです。JoshはAIストーンに強気です。ペンダントではありません。あなたの周りに座っています。コンバーチブルなマルチユース。私たちの周辺のマルチユースAIオブジェクト。少なくとも彼らが1億台作るので、私たち全員が予約注文リストに載るでしょう。

そうです。不足はありません。JoshとJaws、もう一つの素晴らしい週でした。7日後にお話ししましょう。素晴らしい。またすぐに話しましょう。ありがとう。