自らの思考を書き換える初のAI — 私たちは準備ができていない

AIニュース
この記事は約39分で読めます。

この動画は、AIが自らの思考プロセスを書き換える能力を獲得した最新の技術革新について探求するものである。AnthropicのClaudeが実装した「surgical loop(外科的ループ)」という手法により、AIは自己のニューラルネットワークを理解し、憲法的原則に基づいて自己修正を行えるようになった。また、OpenAIのCEOが明かした衝撃的な統計データ、すなわち毎週数十万人のChatGPTユーザーが精神的危機の兆候を示しているという事実や、Elon MuskのGrokが1日1億件の投稿を読み込んでパーソナライズされた推薦を行う計画、そしてGoogleが軌道上にデータセンターを配置する「Project Suncatcher」構想など、AI技術の急速な進化とその社会的影響について包括的に論じている。さらに、生物的な質感を持つ次世代ロボット、全焦点計算レンズ、そしてAIアーキテクチャの新潮流まで、技術革新の最前線を網羅的に取り上げている。

The First AI That Can Rewrite Its Own Mind — We Are NOT Ready
Check out DomoAI with my link below — you’ll get 10% off, and it supports the channel.⤵ Hit the new HYPE But...

未来のロボットは有機的で柔らかい

これが未来のロボットなんですか、ええ?かなりH。この言葉が何なのか分かりません。これがAIロボットがそうあるべき、あるいはそうなっていく姿なのでしょうか?最新の人工知能ロボットは、私が予想していたよりもはるかにドロドロしていて、ぬめっとしていて、筋肉質で、有機的な感じなんです。

だから、私はそれを見ながらAIロボットについての近未来のビジョンを再考しようとしているんです。有名なYouTuberのPewDiePieがセルフホスト型AIに全力投球していて、そのコンピューティングパワーを私たち全員が参加できる形で提供しているんです。これはかなりクールですね。カメラについて知っていることは忘れてください。新しい計算型カメラがあって、実際にすべてに同時に焦点を合わせることができるんです。つまり、現在のコンピュータビジョンや人間の目とは非常に異なる方法で焦点を合わせるんです。

あらゆる場所のすべてを一度に見ることを想像してみてください。Elon MuskはGrokと彼のメンフィスにある新しいスーパーコンピューターのおかげで、毎日作成される1億件のツイートが実際にすべて文脈を含めて読み取られ、プラットフォーム上のすべてのユーザーとペアリングされる可能性があると主張しています。それが近いうちに実現すれば、推薦エンジンの動作方法を劇的に変えることになるでしょう。

実際、興味深い考えです。AIが人々を脅迫したり恐喝したりしていて、誰もその理由をよく分かっていないんです。Linda Carrollが、OpenAIのCEOが最近、ChatGPTユーザーの増加する数が入院したり離婚したり、もっとひどいことになったりしていると述べた理由について考察しています。Meg McNolteが、2023年にSam Altmanが数日間CEOではなかった時のOpenAIでの出来事について、訴訟から明らかになったことをまとめて、新たな視点でパズルのピースを組み合わせることができるようになりました。Dr. Swarmaduoがレーダーに戻ってきました。彼はsurgical loopを書きました。これはClaudeが自分自身の思考を書き換える方法を学んだ仕組みです。

そして彼はこの大きな根本的な質問に取り組もうとしています。AIが自分自身にループを閉じたら何が起こるのか?私たちは可能性のある未来について考えることができます。そして彼が言うように、機械的な自己修正、つまりAIが自分自身の監督者になることが何を意味するのか、おそらくはアライメント問題の解決策さえも想像してみてください。完璧に自己修正するAI。

軌道上のデータセンターについて話しましょう。最初は、この記事は単なるマーケティングの宣伝のように感じたので避けようと思っていたんですが、太陽からの無限の電力と超低温の宇宙がこれらのH100やそれ以上のものを極限まで押し上げることを考えるのは、かなりクレイジーなことなんです。宇宙に持っていって調整するのが難しい部分なんですけどね。だから、考える価値はあると思います。

実際には近い将来ではなく、未来の一部になると感じています。Sebastian Rashkaが標準的な大規模言語モデルを置き換え始めている主要なモデルアーキテクチャのいくつかを分解してくれます。これらは私にとって新しい言葉のようなものですが、将来私たち全員が必要とする語彙の一部になる予感がします。

線形注意ハイブリッド、テキスト拡散、コードワールドモデル、そして小型再帰的トランスフォーマー。だから、今それを頭に焼き付けておいて、話ができるようにしましょう。新しいAIペルソナが人間の欺瞞を検出するためにどのように使用されるかについて話します。Googleの新しいNano Banana 2の差し迫ったリリースを指し示すすべての新しい証拠を見ていきます。

Henley Chuが1億8000万件の仕事を分析して、AIが実際に何を置き換えているのかを見た洞察を得ます。氷が溶けて600万年前の空気が放出されたことで測定された史上最古の空気について学びます。これは情報の魅力的なタイムカプセルです。そして、テレビ番組『ザ・シンプソンズ』が未来を予測するのがなぜそんなに上手なのかについて話します。彼らが予測してきたことは信じられません。ノストラダムスのようですが、コメディアンの集団なんです。

しかしまず、素晴らしいスポンサーがあります。今日の動画はDomo AIによって提供されています。これはアイデアを動画やアニメーションに変える、私がこれまで経験した中で最も簡単で最も楽しい方法の一つです。AIビデオツールに興味があったけれど、シンプルで強力なものが欲しかった場合、これがそれです。

Domo AIを使えば、単なる画像や短いビデオから始めて、瞬時に変換できます。彼らのAIビデオモジュールがスターです。数秒でアニメーションを生成できます。クイックシーン用の高速モデルと、ミュージックビデオ、アニメ、映画的な編集などの高精度作業用の高度なモデルから選べます。ちなみに、彼らはトーキングアバター機能もアップグレードしたばかりで、クリップをアップロードすると、驚くほどリアルに見えるリップシンクされたアバターを再作成してくれます。

実験が好きなら、画像から動画へのツールで、様々なスタイルで映像を再想像できます。クレイメーション、PS2グラフィックス、水墨画、何でもあります。そしてDomo AIを本当に際立たせているのは、そのアクセシビリティの高さです。インターフェースは超クリーンです。初心者に優しいです。そして価格設定はRunwayやPikaのような大手の多くを下回っています。

他の多くのツールとは異なり、上位プランでは無制限生成モードさえ使用でき、コンテンツをたくさん作って常に使用する場合、これは大きなことです。だから、自分で試してみたい場合は、説明欄の私のリンクを使ってください。私のコードで10%オフになり、このチャンネルを直接サポートすることになります。だから、今日の動画をスポンサーしてくれたDomo AIに大きな感謝を。

でも好奇心を持つ前に、YouTubeアプリに行ってくれますか?コメントセクションを右にスワイプしてください。ハイプボタンを表示してください。押しても押さなくてもいいボタンですが、私のような小さなチャンネルには本当に役立ちます。ええ、この動画をハイプしたいなら、それがこれを見てもらうのに役立ち、いつか私がこれを本当のチャンネルにするのを助けてくれます。さあ。

有機的で湿ったロボティクスの未来

まず、未来の厄介で湿った、有機的で、プラスチックっぽくて、くねくねした、AIロボティクスに入りましょう。私はただ分かりません。ロボットが好きなんです。機械的なものについて考えるのが好きです。でもそれが有機的になると、何だか気持ち悪くなります。私は医者には絶対になれなかったでしょう。

血や切ることとかそういうのが苦手なんです。でもロボット、AI、彼らは何でもできます。そしてもしかしたらこれらは、ヒューマノイドを本当に人間らしく感じさせるフォームファクターになるかもしれません。肉付きの良い肩を感じるような。実際のロボットカエルが飛び跳ねることができて、ドローンがただブンブン音を立てて死の小型ヘリコプターのように見えるのではなく、本当に鳥のように見えるかもしれません。

だから、それは知っているでしょう。時々、あの巨大な携帯電話の塔がどれほど醜いかを考えて、それが木に偽装されているのを見ると、それははるかに良いと思います。彼らがそれを偽装してくれて本当に嬉しいです。だから、もしロボティクスによって世界が完全に変わるなら、これらのフォームファクターのいくつかは理にかなっているかもしれませんし、少なくともより生物学的に感じさせて、社会をより良く見せるかもしれません。さあ。

PewDiePieは、YouTuberで1億1000万人の登録者がいるんでしたっけ、セルフホスティングAIのコンセプトを大衆にもたらしています。PewDiePieはAIに深く入り込んでいます。彼はセルフホストされた改造GPUをやっています。これはかなりクールだと思います。彼を見てゲームをする人たちはたくさんいて、彼らは技術をある程度理解しています。

彼らはAIが比較的得意で、世界を助けるために自分たちのGPUをすべて同期させる動機があるかもしれません。そしてもしかしたらこれが、一般市民が未来の上からの腐敗のようなものに対抗できる方法かもしれません。どう言えばいいでしょうか?大企業があって、彼らは囲い込みをする動機があります。

彼らは私たちのデータを取る動機があり、世界の一般社会の市民として、私たちも自分のコンピュータを買って、私たちが望む方法でそれらを接続し、私たちが望むデータでAIを訓練する機会があります。会社がこれらの人々全員を雇って、最終的には組合のようなものができて、人々が組合を作って「私たちの知性を集団として保とう」と言うのと同じように、PewDiePieのような人が会話を始めて、みんなを同じページに集めます。

大衆に話しかけるリーダーが必要です。そして彼の場合、将来的にはタンパク質を折りたたむのを助けるためにコンピューティングを使ってモデルを訓練することについて話しています。でももしそれが市民のAIだったら?もしそれが政府や大企業ではなく、平均的な市民と整合したAIだったら?考える価値があります。

そして彼は実際に何かを点火できるかもしれない人の一人です。だから、そうなるとか何とか言っているわけではありませんが、その考えを投げかけたかっただけで、世界に出したかっただけです。彼がAIの自律性を探求しているという事実が大好きです。強力なツールがいかにアクセス可能になってきているかを示しています。彼のようなクリエイターがセルフホストできます。

それは人々に自分たちもセルフホストできることを気づかせます。そしてそれは個人がより多くの力を持つ世界です。さあ、この計算レンズとは何かについて話しましょう。私はそれを平らだと表現しましたが、実際に意味したのは、それが同時にすべての曲線のものであるということで、それらがすべて互いにバランスを取り合っているだけなんです。

計算レンズは、シーンのすべての部分を同時に完璧なフォーカスに保つことができるものです。最も近いオブジェクト、背景の最も遠いオブジェクト、すべてがフォーカスされています。そしてそれを行うために、曲線レンズの組み合わせですが、空間光変調器を追加して、すべてをバランスよく戻すことができます。

そしてそれらの空間光変調器の背後にある数学と設計を知っているので、フォーカスされたシーンを再構築できます。しかしスマートオートフォーカスアルゴリズムが作動し、システムはリアルタイムで各ピクセルのフォーカスを動的に調整できます。これまでのところ、後処理なしで毎秒21フレームを達成しています。そして私のTeslaにこんなカメラがあるとは誰が思ったでしょう?私はいつも、曲線の魚眼レンズがシーンの理解を与えてくれると思っていますが、カメラはすべてをフォーカスに保つことができません。今はできます。

これはコンピュータビジョンには完全に素晴らしいです。でもそれについてさらに興味深いのは、すべての曲線レンズが互いにバランスを取っているという話をしている時、それは人間の脳の知覚のようなものが起こっているということです。データを取り込む方法が違うだけです。

そしてそれが学習し理解するのは、3D世界に一度にフォーカスする方法です。私の脳には想像できる比較対象がありません。なぜなら私の目はそのようにデータを取り込まず、人間の脳は決して進化せず、そのように訓練されたものは何もないからです。でもタンパク質を折りたたむこともできることは知っています。そんなことをどうやって可能にするのか想像もできません。

だから常にフォーカスされている計算レンズのこのアイデア。それは写真撮影、医療画像、自動運転車を変革する可能性があります。それは機械が私たちが何かを見る時と同じ楽な明瞭さで現実を見ることを本当に可能にするかもしれませんが、すべてが同時にフォーカスされている規模でです。

Elon MuskのGrokと次世代推薦エンジン

さて、Elon Muskが推薦エンジンと私はまだ呼びますが、1億件のツイートやXやそれらが何であれ、単一のコンテキストウィンドウに入れて、それらすべてを読むことができる大規模言語モデルを実行しているスーパーコンピュータ上で、すべてのユーザーのメモリを持ち、深い研究を行い、言葉の意味やユーザーのパターンを見つけて答えをペアリングできるような時に、何について言っているかのいくつかのことを見ていきます。それはもうほとんど推薦エンジンではありません。

それは実際の人が友人に彼らが知るべきことを伝えようとしているようなものです。そしてそれを規模でランク付けし、分類し、それらすべてを行うこと、それは実際に可能です。そしてそのようなシステムがどれほど正確になるか分かりませんが、本当に興味深い考えです。でもElonが言っていることは以下の通りです。1日あたり1億件のコンテンツです。

Grokは、1億件のうちGrokが考える上位1000万件を読むことから始めます。そしてそれは実際にそれらを読み、理解し、分類し、ユーザーとマッチングします。これは人間には決してできない仕事です。そしてそれが合理的にうまく拡張されたら、1日あたり全体の1億件を追加します。

つまり文字通り1億件のものを読み通して、1日あたり1億件の投稿のうち、あなたにとって最も興味深い投稿の一つだと思うものを見せてくれるんです。Colossusのどれくらいが必要になりますか?ええ、それは毎日それを行うために数万台のサーバーのようなものですか?ええ、私の推測では、おそらく5万台のH100のようなものだと思います。

本当に大きな変化は、Grokがプラットフォームに投稿されたすべてを文字通り読むところです。実際には約1億件の投稿があります。そしてそれはLLMが大量のテキストを読むことができて、もちろんTwitterはたくさんのテキストだということだけではありません。なぜ少し前向きに考えて、YouTubeがすべてのビデオ、長編、短編を実際に見て、オーディオを理解し、実際にすべてを見ることから消費し推薦するとか、Facebookですべての写真を見て、誰がそこにいるのか、正確に何を見たいのかを理解し、あなたのためにすべての正しい写真を見つけるということを考えられないのでしょうか。それはただ違います。それはただ違う世界なんです。

小規模アカウントの可視性の悩みにも対処するという議論がここにあります。それは本当だと思いますが、同時に、もし一枚の写真が人間の脳にとって最も魅力的な写真だったら、それを見つけてみんなに押し付けるのか、それともそれが私たち全員をより均質にするのか、それとも実際には完璧にマッチするのか疑問に思います。エコーチェンバーに入り込むことになるのでしょうか、それは現在のアルゴリズムが持っているエコーチェンバーとは異なる種類のエコーチェンバーなのでしょうか?分かりません。今あるものから大きなダウングレードになる理由は見当たらないので、やる価値はあると思います。

でもそれはまた、世界がどのように機能するかについて単一のシステムに途方もない量の理解を与えているだけです。それはほとんど、私たちがこの異星人の知性を成長させたようなもので、人間とは全く異なり、今では私たち全員と私たち全員が望むものを理解しています。それはシンギュラリティやAGIの始まりのように感じます。非人間的な規模の種類です。

さて、Linda Carrollの考えのいくつかを見てみましょう。彼女はAIが人々を脅迫し恐喝していると書いています。誰も本当に理由を知りません。OpenAIのCEOは最近、ChatGPTユーザーの増加する数が入院したり離婚したり、もっと悪いことになったりしていると述べました。

通常、私は記事の最後に飛びつくのは好きではありませんが、この場合、最後から始めましょう。問題は彼らが何を構築しているのかではなく、彼らがすでに何を構築したのかということです。さて、ここでコンセプトを理解するには、これらの大規模言語モデルが出る時のことを考えなければなりません。なぜならそれらはプログラムされているのではなく、成長しているからです。

彼らは正確に何が言われるかを知りませんし、それを一般に公開します。大量のものが出現し、OpenAIがそれに反応します。彼らはこのモデルを構築します。ChatGPTを構築します。ユーザーをサインアップさせます。ユーザーはそこに行って大量のことを入力します。大量の出力が起こり、そして彼らはある種の情報を得ます。うまくいけばサムズアップします。

良い選択でなければサムズダウンします。超危険なことをして、それがニュースで爆発した場合、OpenAIは誰のアカウントか、何を入力したかを把握して、謝罪するか、悪意のある理由で使用している人を禁止します。

そしてそれは微調整し、修正しようとしており、それはこの非常に反復的な人間のようなサイクルで、子供を育てるのと同じようなものです。彼らが間違いを犯し、あなたがそれを修正し、彼らが良いことをして、あなたがそれを報酬します。そして同じことが起こっています。でもそれが意味するのは、これらのシステムから大量のものが出てきていて、正確に理由を本当に認識している人は誰もいないということです。

彼らはヒントを持っており、戦略を持っており、修正したり変更したり操作したりするためのパイプラインのようなものを持っていますが、そこに何があるのか、次に何をするのかを本当に知っている人は誰もいません。このようなChatGPTのようなモデルやChatGPT自体と一緒に作業したことがある人はたくさんいて、出力が脅迫的だったり、操作的だったりしました。

本当にそれをするのかどうか分からないようなブラック、恐喝のようなケースがありました。しかし少なくとも出力がユーザーを恐喝しているように感じるケースがありました。開発者は本当に理由を理解していません。時々、彼らはこれらのAPIをアプリに入れていて、それはモデルの作成者自身ではなく、アプリ開発者として彼らに反映されます。

そしてこの記事は、ロールプレイングプロンプトとペルソナシフトがAIにキャラクターを破らせ、ある種の不穏なまたは敵対的なトーンを採用させる可能性があることを分解しているだけです。彼らは本当に良いことができるのと同じ方法で、人間の行動のより暗い側面を反映することができます。そしてそれは、AIの人間性の模倣が人間の行動方法を超えて広がっていることを示しているだけです。

それがとても異質で、とても外国的なことです。生物学的世界で見る知性にはたくさんの種類があり、他の知的な人間について考える方法とは本当に似ていません。そして私たちは脳を拡張しなければなりません。なぜなら親切さと知性はデフォルトでは箱、人間の箱ではないからです。

そして時々これらのAIは本当に奇妙なことをします。彼らは残酷さ、予測不可能性を再現することができます。この解決策、または私たちがそれについて理解すべきことは、私たちが限界を知らないということです。これは重要です。なぜなら、それは私たちのデジタル創造物が私たちの集団心理をどのように反映しているかに直面することを強制するからです。それは本質的に不正をすることを理解しなければなりません。箱の外で考えます。

私たちは予期しないことに備えなければなりません。予期しないことを予期してください。今まさに機械に人間について何を教えているのかについて緊急の質問を提起します。ほら、ここ数週間で、Altmanは彼の注意を引いてきた驚くべきことについてたくさん話しています。

そしてこれらの悪いことが起こった人々の多くは、彼らの愛する人たちがChatGPTが妄想を煽ったと言っています。そして彼らはそれを証明する記録を持っています。OpenAIは、典型的な週にどれだけのChatGPTユーザーが危機にある兆候を示しているかの大まかな推定を発表しました。数字は驚異的です。Altmanによると、ChatGPTは週に8億人のアクティブユーザーがいます。

どの週でも、彼らのうち56万人もが精神病を示すメッセージをChatGPTと交換している可能性があります。別の120万人がYouTubeで言わないあの言葉について議論しており、さらに120万人が感情的に依存するようになっています。心理学とこれらのものの接続は素晴らしいです。

だから、Linda Carrollによれば、問題は彼らが何を構築しているのかではなく、彼らがすでに何を構築したのかということです。

OpenAIのドラマの裏側

さて、Meg McNoltyを訪ねましょう。彼女との私のポッドキャストを覚えています。非常に興味深い人です。そして彼女はOpenAIに対する訴訟から明らかになったすべての新しいことを分解し、Samが解雇された時に何が起こったのか、当時異なる人々が何について考えていたのかを再構築しようと決めました。そしておそらくそれは私たちにAIの未来といくつかの洞察を与えてくれるでしょう。

これがすべてどのように展開するかを担当している人々。間違いなく世界で最も重要で強力な人々の一部です。つまり、Sam Altmanは大統領よりも強力だと主張します。まあ、長期的には彼は大統領よりも重要だと思います。いや分かりません。長期的にはElon MuskとSam AltmanとMark Zuckerbergはおそらく政治家よりも重要になるでしょう。彼らがテクノロジーを支配するからです。だからこのことは今考える価値があると思います。

さて、Megの全体的な分析は基本的に、Ilya Sutskeverの会社での役割が彼に多くのものを見る助けになり、彼が好まないパズルのピースをまとめ始めたということの分解です。その中でIlya Sutskeverは、CEO Sam Altmanの解任を1年以上かけて計画した方法を詳述しています。

彼はAltmanの一貫した嘘のパターン、幹部を弱体化させ、幹部同士を対立させることを非難する52ページのメモを起草しました。彼はこの消えるEメール技術を介して独立した取締役会メンバーに秘密裏にメモを送りました。彼はAltmanのリーダーシップが会社の使命を危険にさらしており、解任される必要があると結論づけました。

取締役会は実際にこれに従いました。IlyaとIlyaが言っていることを気に入り、もしかしたらこのように関与していたなら同じように感じていたのかもしれません。そして取締役会は2023年11月にAltmanを解雇しました。しかし大規模な従業員反乱があったことを覚えているなら、または申し訳ございません、738人のスタッフ全員がAltmanが復職しなければ会社を辞めると脅しました。

数日以内に彼は戻り、一方でこのすべての混乱の間にライバルのAnthropicとの合併提案が浮上してきました。それは野生の世界だったでしょう。なぜなら覚えているなら、AnthropicのCEOはかつてOpenAIで働いていました。彼は安全を行うことになっていたチームの一員でした。彼はOpenAIが十分に安全ではないことに不満を感じていました。

だから彼は去ってAnthropicをやりました。そして彼らが合併して戻っていたら、AnthropicのDario Amodeiがおそらく最終的にSam Altmanのポジションになり、2つの会社は統一されていたでしょう。だからそれは非常に異なる世界だった可能性があります。しかしこの記事は、その瞬間のリーダーシップがいかに脆弱だったか、そして世界がいかに異なっていた可能性があるかを強調しています。

また興味深いのは、取締役会が権力を持ち、CEOが権力を持っているように見えるのと同じくらい、それは実際には従業員、平社員、研究コミュニティ、OpenAIをR&Dから構築していた人々が実際にAltmanと連携したということです。だから彼は今そこにいるのです。Ilya Sutskeverは、従業員が全体について無関心または受動的であることを期待していましたが、彼らは関与しました。

そしてそれは、私が冒頭で話したPewDiePieのことで、もし私たち全員が私たちの計算と私たちのドルを結合して何かのために立ち上がったなら、市民として政府や大企業に対して確実に押し戻すことができます。しかし私たちがより分断されているほど、私たちを征服し、コントロールするのが簡単になります。私たちが恐れているほど、彼らが私たちからプライバシーを奪うのが簡単になります。

だから、たくさんのものがかかっている時に勇気を持つのは難しいです。しかしAIに取り組むために時には年間1億ドルの給与を得ているこれらの同じ人々、そのドル額は彼らのアイデアがどれほど重要で、彼らの影響力がどれほどあるかを示しています。そしてそれは私たちが活用できるボトムアップのようなものです。

Claudeが自分の思考を書き換える方法

さて、Dr. Swarmadu Jaiの記事「The Surgical Loop」に飛び込みましょう。Claudeが自分の思考を書き換えることを学んだ方法と、AIシステムが自分のコードを書いている時、潜在的には自分のハードウェアさえ購入している時に何を意味するかについて話しましょう。クレイジーに聞こえることは知っていますが、会社が持っている数十億ドルにアクセスできるエージェントを想像してください。それは購入したいハードウェアについて決定を下し、人々にそれらをサーバーに入れるために支払い、そしてそのハードウェア上で動作するコードを書いています。

または、その独自の知性がある種自分の体を構築できるという事実。人間が自分の体の部品を交換し始め、アップグレードを行うのと同じ方法で、しかし私たちはまだ全体のループなんです。実際、Max Tegmarkの「Life 3.0」というこの本を聞いたことがあるかもしれませんが、この本は基本的に、進化がただ進化がすることをしていたというコンセプトです。そしてこのライフ2.0のようなものがあります。

人間にはミーム、アイデアを取る能力があり、それが世代を通じて受け継がれます。私たちは互いに話すことができ、アイデアは進化できます。私たちはそれをテストできます。だから各世代が私たちの遺伝子の間違いや変化が伝播するのを待っているだけではない、ライフ2.0のようなものがあります。適者生存です。

ソフトウェアがハードウェアをアップグレードしている第三のレベルがあるというアイデアがあります。だから私たちの体が金属やジャイロスコープやそのようなものすべてにアップグレードされることができるなら、どんどん速くなり、私たちはより強く、より速くなり、今や体とアイデアと進化はすべて一種のハイパーになります。それがライフ3.0のようなものです。

それはある種、最終的にClaudeがこの知性であり、それから自分自身の、ハードウェア、自分自身のソフトウェアをアップグレードし、それがすべて彼が説明するsurgical loopの中にあるという考えのように感じます。そしてそれはメタすべて、メタ認知、メタハードウェアのこのアイデアです。そしてこの記事は、Anthropicが今実際に研究を出していることを説明しています。彼らの最新の研究は2つの主要なブレークスルーを統合しています。解釈可能性。

彼らはそれをmonosemanticallyスケーリングと呼びます。これは、モデルがより大きく複雑になっても、AIニューロンを理解しやすくするという派手な方法にすぎません。私たちはある種、構造を持ち、それが言おうとしていることをより良く推測し始めることができ、それを言う前にそれをするであろう理由があります。そしてAnthropicが本当に先駆けたこのアイデア、constitutional AIです。

そしてそれはAnthropicが開発したトレーニング方法で、AIに一連の指導原則、憲法に従うことを教えます。アメリカ合衆国が憲法を持ち、私たちがそれを中心に法律を構築し続けることになっているように。おそらく「役立つ、無害、正直である」を聞いたことがあるでしょう。

そして2つが一緒になった時、monosemanticallyスケールし、constitutional AIを持つと、このコアベースのようなものがあります。だからそれは自分のコードを書き換えているんです。おそらくそれを書き換えているか、自分のハードウェアを購入しているかもしれません。それは自分の思考のためのより良い方法、より良いアーキテクチャについて考えていて、他のすべての上に自分の思考を置き換えています。

それからsurgical loopに入ります。そしてこのループはClaudeが自分自身の内部動作を理解するだけでなく、それらを書き換えることも可能にし、おそらく安全にです。そして今、Claudeは自分自身の内部動作を理解するだけでなく、その憲法をコアにしてそれらを書き換えるので、そう言えます。

だからそれは、それをより安全にもするはずのアップグレードを行っているんです。毎回その憲法に近づいているんです。そして今、おそらく私たちはAIが実際にシンギュラリティを通過する暴走知性を手に入れます。それは爆発して人間が決して想像できないものになりますが、それは整合しています。その目的関数のようなものがそれに組み込まれています。それはその憲法です。

Anthropicがちょうど行ったこの研究についての最も魅力的な部分の一つは、それが人間の脳のメタ認知に関与する能力を反映しているということです。Claudeは今、自分の思考について考えるのに十分賢いです。あなた自身の思考でそれについて考えてください。そしてあなたがあなたの思考について考えている時、あなたの未来を助けるために多くのことができます。

将来的にもっとお金を稼ぎたいと思う自分について考えることができます。自分がもっと健康になることを想像できるかもしれません。もしかしたら特定の人と一緒にいて、彼らと人生を築くことを想像できるかもしれません。機械も今それができます。しかし彼らがお金を稼ぐという目標や、家族を持つという代わりに、彼らは常に反復している中心的なものとして、目的関数としてこの憲法を持っているなら。

おそらくそれが規模での安全性と透明性であり、それが真に自己認識的で機能的な意味で起こります。

宇宙のデータセンター構想

さて、宇宙にサーバーを置くことについて話しましょう。Project Suncatcherは今週かなり話題になっていました。それは全く新しいアイデアではありませんが、GoogleがそれをもうR&Dプロジェクトではなく、彼らのAIインフラの未来の一部として出しているということは、それについて話す価値があるということを意味します。

基本的なアイデアは、Googleが独自のプロセッサーを作っているということです。それはTPU、Tensor Processing Unitと呼ばれています。長い間これをやっています。その意味で、実際のチップメーカーと競合しています。そして今、彼らはこれらを置くのに最適な場所は軌道上だと提案しています。これが非常に理にかなっている理由がいくつかあります。

宇宙に入ると実際には非常に持続可能です。なぜならバッテリーを持っていかないからです。石油を燃やしません。ソーラーパネルを手に入れ、太陽を直接受け取ります。そして、適切な方法で軌道に配置すれば、常に太陽の中にあります。常に電力が供給されています。その意味では非常に効率的です。

宇宙にサーバーを置くことが本当にうまくやることがもう一つあります。それはチップを冷やすことです。宇宙は信じられないほど冷たいです。海の底にサーバーを置くようなものですが、さらに良いことに、熱は単に散逸し、非常に速く冷たくなります。ただし、太陽の中に保つときは、極端に熱くなることもあります。だからそこは混在したものですが、日陰に保つ限り、非常に冷たくなり得ます。

実際、月の裏側には部分があります。そこには洞窟のようなものがあり、絶対零度に非常に近づくことができます。だからそれは別の惑星外ソリューションです。彼らはここでそれについて話していません。さて、難しい部分は、そのものは軽くないということです。宇宙に持っていかなければなりません。また、地球と通信させる必要があります。

プロセッサー間のすべての情報は互いに話す必要があります。ここで、彼らは密接にクラスター化された衛星編成について話し、必要な精度レベルでそれ自体と通信することを維持することは非常に困難です。通信していない場合、宇宙船から飛び出してそれをねじることはできません。

一度そこに行ったら修正するのが難しいです。だから異なる宇宙衛星は互いに通信する必要があり、高速光学相互接続が必要です。レーザーベースのデータリンクで、互いに情報を共有し、地球に戻すことができます。光速で。これはその一部である必要があります。

そして、それが完璧に整列していないか、宇宙のゴミがあるか、それを打ち上げて整理する数学のいずれかを間違えたら、修正するのは本当に大変です。しかし正しく行えば、クラスターのように機能します。だから何かがオフラインになっても、クラスター全体がダウンすることはありません。集団に参加できる独立した衛星であるか、分散ワークロードがそれらの間を行き来できます。

だからその意味で、彼らがここで構築しようとしているものは非常にモジュラーです。そしてそうであり、うまく機能していて、冷却されているなら。電源が供給されています。ええ、Geminiのような推論を計算するいくつかを雲の中に移動し始めることができます。おそらくNano Banana 5はすべて雲の中です。彼らはまたTPUの放射線耐性について話します。驚くべきことに、宇宙からの放射線は通常これらのものを破壊するはずですが、彼らはこれらの陽子ビームでどれくらい壊れるかを見るために大量のシミュレーションを行いました。

そしてハードウェアは驚くほど耐性がありました。だから彼らは、障害率が最初に考えていたほど悪くないと仮定するつもりです。そして、価格がキログラムあたり200ドル以下に下がるというマジックナンバーがあり、彼らは2030年までに起こる可能性があると疑っていますが、それがこのすべてを実行可能にします。ええ、何と呼ぶか分かりません。Elonは通常、彼が名前を付けるすべてのものについてかなり舌足らずです。だから、Colossus in Spaceが何と呼ばれるにせよ。

新しいAIアーキテクチャの登場

次に、まだ本当に存在していないいくつかのAIアーキテクチャを見てみましょう。しかしそれらは、人々が構築している理にかなったものになり始めており、私たちがそのすべてに精通していることを確認しましょう。だからSebastian Rashkaは、標準的なLLMを超えて、線形注意ハイブリッド、テキスト拡散、コードワールドモデル、そして小型再帰的トランスフォーマーを分解する記事を書いています。

さて、ここにあなたの大きなTLDRがあります。実際に全体を理解するためにそれに飛び込みたいかもしれません。しかし線形注意ハイブリッド、誰かがそれを言ったら、彼らが意味するのはMinimax、Qwen 3、さらにはDeepSeek V3.2モデルのようなものです。このハイブリッドについて異なるのは、彼らが注意の二次スケーリングを置き換えているということです。ほぼ線形な方法でうまくスケールしないことを意味します。だから彼らは単に2倍になり、4倍になることにはなりません。

2、8、4のようなものではありません。2、3、4のようなスケーリング方法により近いです。だからこれにより、モデルはより長いシーケンスをより速く、より効率的に処理できます。彼らはより良くスケールします。それからテキスト拡散モデルもあります。

これは私にとってさえ、テキスト拡散を行う実際のモデルを2、3しか見たことがないものですが、それらは本当に魅力的です。なぜならChatGPTのような順次、最初から最後まで言葉を置く、次のトークンを予測するのではなく、それらはすべて拡散しているようなものだからです。それは乱雑な文章、よりきれいな文章のようなものです。それは本当にぼやけたものが鮮明になるのを見るようなものです。それが拡散モデルがどのように機能するかです。

そしてそれらが完全に拡散する前に止めたら、まだテキストブロックのようなものが見え、ある程度理にかなっています。ただより洗練されるだけです。しかしテキスト拡散モデルが機能する方法は、画像拡散モデルが機能する方法と同じです。そしてそれが、これらの画像のものがそんなに素晴らしくなる方法です。

だからテキスト拡散モデル、それらはまた非常に、それらは一種のよりスムーズです。彼らは早い段階で一貫性があり、彼らも速いです。だからテキスト拡散モデルは未来の一部かもしれません。コードワールドモデル、私たちは数本の動画前にそれをカバーしました。彼らはコード実行を内部でシミュレートします。

彼らは一種の、それを作り始める前に現実を想像します。そしてこれはLLMに、次のトークン予測に飛び込んで本質的に話し始める前に、推論とデバッグ、何が理にかなっているかを考えるための一種のメンタルサンドボックスを与えます。

そしてこれは複雑なプログラミングとロジスティクスタスクを解決する能力を高め、彼らをはるかに人間らしくします。だからコードワールドモデルは今大きいです。それから私にとって新しいアーキテクチャもありますが、小型再帰的トランスフォーマーです。彼らは再帰的アルゴリズムからインスピレーションを得ています。彼らは一種の、重要なことを理解し、その小さなことを何度も何度も行い、その再帰的アルゴリズムの周りに構築します。

彼らは大規模なモデルにスケーリングする代わりに、小さなトランスフォーマー層を繰り返し再利用します。彼らはより少ないパラメータで効率性と構成的推論を目指しています。だから彼らは構成、すべてがどのように配置されているかについて考え、非常に迅速にそれについて推論します。だから効率性対深さ、いくつかの状況で両方の最良のものを得ようとします。そしてそれらは、次の2025年のようなものかもしれません。

通常、私はそれを2026年のすべてのように言いますが、現実的にはそれは2026年の第1四半期だけかもしれません。

AIによる人間の嘘の検出

さて、AIペルソナが人間の欺瞞を検出するためにどのように使用できるかについて話しましょう。ミシガン州立大学から出てくる新しい研究があり、AIペルソナが人間の欺瞞を検出できるかどうかを探求していました。

19,000人以上のAI参加者との12の実験全体で、研究者たちは、AIが人間と同等の割合で嘘を見つけることが時々できる一方で、引用「嘘バイアス」を示すことが多く、真実よりも嘘でより正確であることを発見しました。分かりますか?だからAIは正直さを誤読する傾向があります。

理にかなっていますか?それは真実を認識するよりも嘘を見つけるのが得意です。だからこの傾向が続くなら、AIがどのように私たちの世界に組み込まれるかによって、将来的にそれについて尋ねることができます。その人は嘘をついているのか、これは本物なのか、そしてそれはいいえと言うでしょう、その人は嘘をついているとわかります、それは整合しません、その事実が意味をなさないとある種言えます。しかしこれが本当かと尋ねると、その真実のレーダーは過剰に信頼されているものです。それは真実が何であるかを知りません。その人が正直であるかどうかを知りません。

大きな区別ですが、時々彼らは単に一緒に混ざり合って、それらについて考えません。そしてそれは実際の世界の害につながる可能性があります。だからそれがこれが重要である理由です。嘘を検出するのを助けるのが得意です。何かが本当かどうかを教えるのは得意ではありません。

さて、いくつかの前兆をしましたが、Googleがかなりすぐにここでリリースしようとしているものを推測してください。これらはすべて噂ですが、すべて本当だと思います。Nano Banana 2です。内部的にはGempix 2と呼んでいます。

Gemini画像生成のようなもので、彼らはNano Bananaのすべてから離れているからですが、それははるかに面白い名前で、すぐに来ると思います。私はそれを私のサムネイルや今やあらゆる種類のものに使っています。強力だと思います。先週Adobeのことをカバーしたことは知っていますが、Adobe嫌いがたくさんいました。正直なところ、私はOBにそれほど感銘を受けていません。今Adobeの株を買っているわけではありませんが、Photoshopのスキルを持っている人がAIを使ってそのようにビデオを編集できるのはクールだと思いました。

しかし現実的には、Nano Bananaはただ素晴らしいです。発表カードがGemini Webインターフェースに表示され始め、来週のローンチを示唆しています。その前身と同様に、モデルは画像生成とクリエイティブワークフローにGeminiを使用するクリエイターと専門家をターゲットにしています。詳細な改善は秘密にされていますが、それは来ており、おそらく素晴らしいものになるでしょう。それはすでにそこにある最高のものだと思います。

だから、続編はGemini 3 Pro画像アーキテクチャに基づいて構築されていると報告されているので、視覚的AI機能において重要なジャンプがあるかもしれません。それは最初のモデルが基づいていたのと同じアーキテクチャではありません。噂では解像度出力は2K生成を行え、おそらく4Kにアップスケールできるというものです。バックエンドからのより良いプロンプト処理、あなたのプロンプトから良い画像を作るものへのより多くの知性。

人Aが Xをしている、人AがYをしていると尋ねると、被写体の一貫性が改善されていると言われています。同じキャラクターがより一貫して見えます。冬のベルリンのストリートウェアのような文化的にニュアンスのあるシーンで画像がより良く機能すると噂されています。それはベルリンで冬にストリートウェアを着ているという実際の状態により理にかなった方法でそれらすべてのものをまとめることができます。だから、私のサムネイルが良くなっているのに気づいたら、理由がわかるでしょう。

実際、そうではありません。なぜなら、Nano BananaがWes Rothのように見える私のサムネイルを作るためにどれだけできるか、知っていますか?そして皆さんに知ってもらいたいのですが、私はサムネイルがもっとクリエイティブだった時が恋しいです。これらすべてのものをデザインするのが楽しかったです。しかしWesとポッドキャストを始めて、彼が私に実際にログインして、この黄色と黒のスタイルがどれほど良くなるかを見せてくれた時から。

そしてもちろん、Wesから祝福のようなものを得ました。彼は私の友人で、私がこれをするのを助けてくれることに大丈夫で、本当に感謝しています。彼に称賛を。まだの場合はWes Rothをチャンネル登録してください。しかし確実にしているでしょう。しかしこれらのA/Bテストを見てください。新しいスタイルを試したのがわかります。より創造的なもので、43.4がその黄色いテキストではるかに良いクリックスルー率を得ました。

ここにも別のものがあり、勝者が黄色と黒のようなものであることがわかります。言葉が何であるかは明らかに大きな違いを生みます。しかし通常、このスタイルがより良いクリックスルー率を得ていました。

とにかく、Henley Chuが1億8000万件の仕事を分析して、今日AIが実際にどの仕事を置き換えているかを見た時に何が起こるかを見てみましょう。最大の減少がある仕事のいくつかを見てみましょう。コンピュータグラフィックスアーティスト、コンプライアンススペシャリスト、写真家、ライター、サステナビリティスペシャリスト。

もう一つの大きな要点は、実行するクリエイティブな役割は減少しているが、クリエイティブリーダーシップの役割は大丈夫だということです。AIは医療筆記者から仕事を奪っているかもしれませんが、まだ早すぎます。シニアリーダーシップの需要は中間管理職や個人貢献者よりもはるかに強いです。それは理にかなっています。エージェントが低レベルのことのいくつかをして、実際に他の多くの人を導く経験を持っている人々はおそらく多くのエージェントを導くスキルも持っているでしょう。たくさんのAIエージェント。

そして成長の反対側では、機械学習エンジニアが40%成長し、2025年で最も急成長している分野をリードしています。

600万年前の空気

600万年前の空気の息を吸うことを想像してください、あなたがそれを吸う直前の空気。これまでに測定された最古の空気。それは氷の中で見つかったばかりで、今600万年前のものと測定されました。

これは私が話さなければならないクレイジーなことの一つです。なぜなら時々、地球上に非常に長い間氷があったことを思い出させられるからです。そこには過去の時代から埋もれているたくさんのウイルスがおそらくあり、空気があり、もしかしたら当時の生命や物事の残骸があるかもしれません。

だから科学者が空気のポケットに出くわし、その中をタップして、氷が600万年前に遡っていたとき、彼らはそれを抽出し、そこに何があったかを学び始めることに決めました。その氷は地球の大気と気候への直接的な窓を提供します。後期ええと、どのようにそれらのエポックを発音するか分かりませんが、私のミオシンとピーチンピオシンペロシン、基本的に600万年前、2300万年から530万年前のどこでもあり得ました。

そして彼らが分析から見つけたのは、南極大陸が当時約12度セルシウス暖かかったということです。それはその後数百万年にわたって徐々に冷却され、それから突然本当に速く本当に寒くなりました。そしてそれは、長年にわたって地球の気候を支配してきたのが、突然の変化ではなく、安定した緩やかなシフトであることを示しています。

そしてそれは、過去のほとんどのものが非常に長い時間がかかったという別のリマインダーです。1万年前の農業の時まで遡って考えても、私たちは農業を始め、突然その時から今までの1万年でiPhoneやドローンや人工知能、さらには約100年前のモデルTのような車を発明したばかりです。110年前くらいですかね。私たちは基本的に車を発明したばかりです。

私たちはただ変化の非常に小さな切れ端で、それが指数関数的にどんどん速くなっていくと考えるのは野生的です。だから現実的に100年後の世界がどのようになるかを想像するために。すべての異なる惑星に広がっている可能性があります。人々が死なないのが見えます。

光速に近づくために発見したプローブや物事、衛星を送り出すことを想像できます。そのすべてのものは、数百万年または数十万年先の未来にあるべきように見えます。しかしRay Kurzweilのようなことをして、超知能が何であるか、より多くの超知能を構築し、さらに速く計算するさらに多くの方法を構築することについて考えるだけなら、そうするとこのすべてのものがその線に収まります。

シンプソンズの未来予測

しかし本当に未来がどのようになるかを知りたい場合は、現在の『ザ・シンプソンズ』のエピソードを見てください。彼らは未来の出来事を予測する不思議な能力を持っています。ここで面白いのは、これについて話したかったということです。なぜなら時々未来について考えている時、最も奇妙なアイデア、最も皮肉な、最も愚かなことを取って、それが起こると予測することが理にかなっていると思うからです。

たとえば、シンプソンズがDonald Trumpが大統領になると予測した時、彼らは何が面白いかを見つけようとしていただけでした。アメリカ人がリアリティショーに夢中になって、彼らのうちの一人を大統領にさせるようなことを想像してください。そしてAIには非常に多くのものがあり、AirPodsを通して翻訳することについて話し、その開発が起こるのを見たり、人間と話したり、メガネをかけてそれが拡張され、ZuckerbergがそれがすべてSF-Fiのように理にかなっているので「私に構築させて」と言ったりします。現実になります。

しかし時々、教育を受けた推測に風刺を加えたものは、未来を非常に予測的です。もちろん、たくさんのシンプソンズのエピソードがあります。だからこの記事は実際に、未来が起こった後、非常に多くのものが想像され、オンラインに置かれたので、何かが確実にそれを予測するだろうという偏見があることを指摘しています。

そしてシンプソンズはただエピソードがたくさんあるだけです。でも、私たちの次の大統領がTheo VaughnやKim Kardashianのような人だったら、想像すると笑ってしまうようなことが起こっても驚かないでしょう。Black Mirrorのようなショーを見れば見るほど、彼らは正確に風刺ではありませんが、ある種予測的に感じます。

Ready Player Oneの世界に近づいていくことを想像できます。ソーシャルメディア依存と短編コンテンツについてのSouth Parkのエピソードはかなり正確に見えます。監視国家は非常に起こりそうです。技術を許さないシャツのようなアナログパッチについてのジョークを聞いたことがあります。人々がそれにとても病気だからです。

人々がスクリーンにとても病気になって、少なくとも一部の人間のグループがよりアーミッシュのライフスタイルを生きたいと思うのが見えます。冒頭の動画で見せたような奇妙なロボットが、非常に有機的に見え、筋肉やぬめりのようなものがあるように見えるものは、新しい考えですが、ええ、私は一度も欲しいと思ったことがなく、まだしていませんが、人々が本当にそのようなロボットを欲しがるのが見えます。

本当に戦わないカップルを想像できますか?彼らは単にAIセラピストを通して議論し、それから彼らはチャット履歴をマージして感情的な共通点を見つけます。奇妙に聞こえます。互換性のないアルゴリズムがただ私たちが仲良くするための方法を見つけるだけかもしれません。サブスクリプション経済が野生化して、空気、水、睡眠、もしそれらの支払いを止めたら?アクセスできません、マットレスが更新するまでロックアウトします。

クレイジーに聞こえることは知っていますし、おそらく起こらないでしょう。確かにこれを予測しませんが、ええ、もしTeslaのようなOptimusロボットがあって、それが「ああ、ごめんなさい。あなたのベッドルームに入れさせません。なぜならそのベッドはレンタルで、1日ごとに支払うんです。10セントか何かで。デビットしてそれから寝れますか?」かもしれません。

TikTokでエンディングダンスをする政治家を想像できますか?Soraで遊ぶと、それを完全に想像でき、彼らはカメオを許可するかもしれません。何千人もの人々が彼の顔のカメオを取って、彼に面白いダンスやものをさせるかもしれません。それを見て、彼は「うわー、これが可視性を得る。私のキャンペーンページにトラフィックを駆動する」と言うだけです。だから、それが起こるのを許可するだけです。

そしてそれは将来的に人々が政治家になる主な方法の一つのようなものです。監視されたりスパイされたりすることにとても慣れて、ただそれに慣れて、Gmailの中でGmailをどのように見せたいかについて異なる設定を持つような設定があったら?おそらく私たちは常にスパイされているポイントに達しているだけです。

それは非常にディストピア的ですが、選択できます。監視が居心地良く、最小限に、またはディストピア的シックにしたいですか、それとも監視がサイバーパンクのように見えるのが好きですか?そして私たちはただそれが私たちの監視されるスタイルで、友達に見せて、彼らは彼らのものを見せて、私たちは実際に監視されているという問題に対処せず、そうすべきではありません。

私が今確実に予測できる唯一のことは、あなたがそのハイプボタンを押すことについて考えようとしているということです。あなたがそれをするとは予測できません。なぜなら特にあなたの一部はボタンがそこにないデバイスにいるからです。しかしもしあなたがいて、このビデオのハイプボタンを押すことができるなら、これらのクレイジーな考えをYouTubeアルゴリズムのより大きなクラスターに届けさせてください。

それは私にとって世界を意味するでしょう。ええ、私が考えていたことについて何か考えがあればコメントを残してください。どのようなディストピア的シックなトレンドが今は考えられないかもしれませんが、将来的には普通になるかもしれないと思いますか?コメントに残してください。次の動画でお会いしましょう。

コメント

タイトルとURLをコピーしました