最新のAI技術と科学の動向を解説する。Hugging Faceの安価な二足歩行ロボット脚や、Codexを用いた古いデバイスの再構築など、ハードとソフトウェアの融合事例を紹介する。また、物理法則を考慮した音声生成AI、数学的構造に焦点を当てた次世代AIの展望、AIを通じた言語進化のプロセスを掘り下げる。さらに、AIの意識を測る科学的基準、Google検索への不満から躍進するDuckDuckGo、AI依存による人間の思考力低下の危険性を取り上げる。最後にClaudeのユーザー評価機能、タンパク質のワールドモデル、量子力学と重力を統合する新理論まで、多岐にわたるテーマを論じる。

本日の最新AIニュース
さて、更新情報を確認しましょう。多くの皆さんがヒューマノイドの脚のコストがいつ下がるのかと尋ねていたのを知っています。そして今日、実際にアップデートがありました。Hugging Faceが二足歩行ロボットの脚を欲しい人向けに2500ドルで提供を開始しました。正直なところ、私にはとても良さそうに見えます。足首や膝があり、そこにはいくつか余分なヒンジもついていますし、股関節の回転も可能です。中国のアリババなどで安価な小型MP3プレイヤーを買い、AI搭載のCodexを使ってファームウェア全体を書き換え、本来想定されていなかった様々な動作をさせる人々がいます。物理法則を認識する音声AIにより、恐竜の足音が実際にどのような音であったかを正確に聞くことができるようになりました。また、5兆ドルの計算リソースがあってもスンダルやダリオが構築しようとしているものを買えない理由についてのホセ・クレスボの主張を見ていきます。子供のようなAIが、世代を超えて言語がより構造化していく理由を明らかにします。AIは本当に意識を持つことができるのでしょうか。それに答えるには、より厳格な科学的基準が必要です。ユーザーがGoogleのAI検索を拒否する中で、DuckDuckGoのインストール数が30%増加しています。AIは私たちの批判的思考を蝕んでいるかもしれません。起こるだろうと予想はしていましたが、AnthropicがClaudeに個人のAI流暢さのスコアカードを導入します。つまり、Claudeがあなたの賢さを実際に評価するということです。重力を組み込んだ量子力学の再構築により、物理学の最大の目標の1つがついに達成され、時間の究極の曖昧さが明らかになるかもしれません。さあ、この比喩的なリンゴを受け取る準備はできましたか。でもその前に、動画の右下にある共有ボタンを量子的スマッシュして、あなたの最大の敵に送ってくださいね。
Hugging Faceによるオープンロボティクス
さて、私はHugging Faceがハードウェアに手を出しているとは思いませんでしたが、彼らはLeoot Humanoidと呼ばれるオープンロボティクスプロジェクトを正式にリリースしました。まだ完全なヒューマノイドではなく、脚の部分だけですが、かなり手頃な価格だと思います。3Dプリントされたロボットの脚がいくらであるべきかという基準を私はあまり持っていませんが、これは2500ドルです。彼らによれば、目標は最も高度なロボット工学を打ち負かすことではなく、開発者や研究者が実際に理解し、修理し、変更し、実験で使えるロボットを提供することだそうです。
AIによるデバイスの再構築
そしてあるユーザーが、名前の読み方はわかりませんが、私のインスピレーションの限界はCodexの限界と等しいと述べています。これは本当に素晴らしいことです。AliExpressでこの安価なMP3プレイヤーを買ったものの、Bluetoothオーディオの途切れや扱いにくい操作性のせいで棚の奥にしまっていたそうです。しかし昨日、シャワーを浴びている最中に突然ひらめいたと言います。外殻を開けてチップをCodexに見せた後、彼らはまるでチャンピオンのように調査を始めました。マザーボードやチップセットの物理的な写真を撮り、Macに接続してから、ファームウェア全体を新しく構築したいのでガイドしてほしいと頼んだのです。するとAIはOSを吸い上げ、バイナリを分析し、微調整を加えた新しいカスタムOSを素早く作り上げました。そして、このコマンドを実行してと言うので、コンパイルしてデバイスに入れると、問題が見事に解決したのです。Bluetoothオーディオの途切れもなくなりました。これを見て私は、このような安価な機材が最高のソフトウェアを搭載できる世界に私たちがすぐに到達するなんて、どれほどクレイジーなことだろうかと考えさせられました。そのデバイスを見てください。私のiPhoneよりも良く見えます。誰もが心地よいクリック感を懐かしく思っていることは認めざるを得ませんね。
AIモデルの最新コーディング性能
Opus 48がリリースされたようです。エージェントコーディングはほぼ70%に達していますね。ここ数日私は反重力についてたくさん遊んでいて、普段はGemini 31 Proを使っているので、この改善には本当に驚かされます。エージェントターミナルコーディングは55に少し遅れをとっていますが、学際的な推論エージェントのコンピューター使用は素晴らしい結果を出しています。おそらく彼らが強く推進している部分なのでしょう。Googleのモデルからは知識労働の分野で大きな飛躍がありますが、Anthropicのモデルからはそれほどではありません。そして、財務分析もチャンピオンのようにこなしています。さあ、Opus 48、やってやりましょう。
物理法則を考慮したAI音声生成
とにかく、物理法則を考慮したAIジェネレーターについて話しましょう。これは音声を生成するかなりクールな方法で、もはやElevenLabsの話ではなく、質量と速度を理解するものの話です。AIが恐竜を作り出し、目の前で動画全体を生成するジュラシックパークの未来を想像してみてください。その恐竜がカメラに向かって歩いてくるとき、小さな足音は期待しないはずです。深く重い地響きのような音が欲しいですよね。あるいはどうでしょうか。それこそが、この研究が解決しようとしている問題なのです。ほとんどの動画から音声を生成するAIは、画面上のものを見ています。車やボール、衝突などを見て、過去にそれらの音が何に関連付けられていたかを考えますが、大きさ、重さ、速度、衝撃、環境、素材など、音を形作る物理的な詳細を見落とすことがよくあります。そこで、Sonyの支援を受けた研究者たちが、物理法則を認識する動画音声合成システムであるPAVASと呼ばれる新しいAIシステムを構築しました。簡単に言えば、動画を見てから、オブジェクトの質量や速度などの隠れた物理的要因を推定しようとします。そしてその推定を利用して、シーンによりマッチした音を作成するのです。オブジェクトが重かったり、速かったり、強くぶつかったりすれば、音の大きさやトーンを変えることができます。研究者たちによれば、これは動画と音声を一緒に生成するAIとは異なります。PAVASは、近い将来皆さんが消費する動画の音声をよりリアルにすることを目指しています。さらに、映画、ゲーム、AR、VR、ロボットシミュレーション、そしてもちろん、Sonyがマーベルに返さないスパイダーバース全体のようなものにとって、これは本当に重要な技術になるでしょう。
スケールではなく数学的構造がもたらすAIの進化
次の記事は、ここに書いてあるように、個人的な感情はなく単なる数学の話です。とても興味深い内容です。ホセ・クレスボはいつも本当に興味深い記事を書いていて、これも素晴らしいです。この記事は基本的に、次の思考するAIはさらなるスケールの拡大から生まれるわけではないと述べています。私たちは常にスケールの拡大ばかり耳にしています。一部の人はアーキテクチャだと言いますが、これは次の大きな突破口が新しい数学的アーキテクチャから生まれる理由を示す良い主張です。著者は基本的に、今日のAIはまだ平坦すぎると主張し、大規模言語モデルは主に単語をベクトルに押し込んでいるが、真の認知とはその根底にある構造だと述べています。そこで彼は、より実際の思考システムのように推論できるマシンのアーキテクチャとして、基質、対称性、束、接続、結合、演算子、認知的コンテンツという7層のアーキテクチャを説明しています。まず、アイデアが存在する場所が必要です。この記事ではそれを基質と呼んでおり、各概念が住所を持つ地図のようなものです。次に、それぞれの住所には、回転、反射、左右の違いといった内部構造が必要です。そして、アイデアがそのアイデンティティを失うことなく異なる文脈を移動できるように、それらの構造が地図全体で繋がらなければなりません。その後、システムにはアイデアを証拠に結びつける方法が必要です。それは主張と手がかりが出会う場所であり、その手がかりの強さは文脈によって変化します。そこまで来て初めて、最終的な計算が行われるべきなのです。そして記事は、操作だけでは理解は生まれないと警告しています。数学は答えを出すことができますが、下位の層がその答えがどこから来たのかを説明するのです。したがって、最上層に認知的コンテンツが現れ、理解とはシステムが幾何学から認知へ移動し、また戻って最初からあったものを復元できることを意味します。著者によれば、このような思考マシンを実際に組み立てることができるのは、今やAnthropicかGoogleだけだそうです。なぜなら、GoogleとAnthropicは単により大きなチャットボットを構築しているだけでなく、幾何学、トポロジー、圏論、対称性、証拠、計算、再構築といった、より深い数学的構造を基盤とするAIシステムに向かっていると彼は見ているからです。これらは、スケール拡大のために資金が流入する際にはあまり耳にしない分野ですが、大手テクノロジー企業の中では主にこの2社で深い研究開発が行われています。だからこそ、彼はこの大きな変化を成し遂げる企業としてこの2社に期待を寄せているのです。私もその気持ちはわかります。デミス・ハサビスについては十分に聞いています。ダリオ・アモデイについてはそこまでではないかもしれませんが、彼も間違いなくこのことについて考えている人物だと思います。そしてもちろん、ヤン・ルカンもそうですね。彼も長い間この大規模言語モデルのトレンドに反対してきたので、彼も少し記事に登場させるべきだったかもしれません。
子供のようなAIが示す言語の進化
さて、この研究は言語における本当に奇妙なパターンに注目しています。興味深く感じるかもしれません。世代を超えて、言語はより構造化されていくことがあります。それは誰かが計画したからではなく、学習者がそれを伝え続けるからです。無限のミームのようなものです。研究者たちは、子供のような学習特性を持つシンプルなコンピューターモデルを構築しました。そして言語のようなデータを与え、あるバージョンが次のバージョンに教えるようにしました。すると、新しい学習者はそれぞれ学んだことをコピーし、次に伝えていかなければなりません。伝言ゲームのようなものです。時間が経つにつれて、複雑な部分は消え始め、より簡単なパターンが生き残りました。これが重要なのは、子供たちが段階的に学習するからです。彼らは幅広いアイデアから始め、すべての鳥が飛べると考えたり、その後ペンギンは飛べないと学んだりするように、そのアイデアを広く適用しすぎて間違いを犯します。そして、それらの間違いはランダムなものではなくなり、学習者に何が重要かを示すことになります。学習者はすでに知っていることを再利用するのです。研究では、モデルに十分な数の層があり、言語が十分に複雑である場合にこれが最も機能することがわかりました。つまり、言語がより構造化していくのは、それがAIであれ子供であれ、学習者の学習方法に適合しなければならないからかもしれません。言語とは本来、最も重要だったうなり声のようなものが、結果的にこのような象徴的なものになっただけなのではないかと不思議に思うこともあります。
AIの意識を科学的に評価する
AIが本当に意識を持つことができるかどうかについて話しましょう。研究者たちは、より厳格な科学的基準を求めています。ここで彼らが定義しているいくつかの方法は興味深いものです。AIが意識を持っているかと本当に問う前に、私たちはそれをテストする方法を見つけ出さなければなりません。これは少しその方向に向かっています。AIが進化するにつれて、大きな問題は哲学から科学へと移行しています。AIは本当に内面的な経験を持つことができるのでしょうか。動物、胎児、研究室で培養された脳組織は、内側から何かを感じることができるのでしょうか。これらは非常に深く重要な問題です。そしてこの新しい論文は、問題は私たちが答えを見つけ出せるかどうかだけではないと述べています。問題はテストそのものなのです。研究者たちは、意識に関する多くの研究が、意識の代わりに基本的な情報処理を測定している可能性があると主張しています。簡単に言えば、システムは実際にその経験を感じることなく、情報に反応し、それを分類し、使用している可能性があります。そしてその違いが重要であり、私たちが探しているものなのです。視覚的マスキングや両眼視野闘争のような人気のある実験は、認識と、脳が目にしたものを処理する一般的な可用性の両方を変化させる可能性があります。そのため、情報を見ることと意識的に経験することという、2つのことが結果の中で曖昧になってしまうのです。
Google検索のAI化とDuckDuckGo
次は、あなたがDuckDuckGoを使ってこの動画を見つけたかもしれないという話です。Google検索がAIを前面に押し出しすぎていると人々が考えているため、乗り換える人がいるのも不思議ではありません。Googleは最近、検索の大きな変更を発表しました。Google I/Oでもちろんそのことについてはカバーしました。リンクのリストを主に表示する代わりに、Googleは検索をより会話のように機能させたいと考えています。私としては、これには納得できます。それが私の進む道でもあり、世界中のすべてのデータと本当の意味で対話し始めようとしているからです。だから理解はできます。ある時点で、Googleは自分たちの事業をある意味で共食いさせなければなりません。それでも、特にどの信頼できるリンクをクリックすべきかわからないときなど、私は今でもGoogle検索が役に立つと感じることがあります。だからその居場所はあるのですが、リンクを見つけて人々が書いたものを読むといった、問題解決のために私がかつてやっていたことは、今日ではほとんど置き換えられています。AIによる概要から回答を得ることも理解できます。Googleの検索バーに質問を打ち込んで、Geminiの回答をただ読んでいる自分に気づくことがあり、なぜClaudeやGeminiのアプリを直接開かなかったのだろうと驚くこともあります。しかし、より長い検索を処理することがユーザーの望んでいることのようです。とはいえ、これに不満を持っているユーザーが多数いるのも確かで、その懸念はAIが間違いなく間違える可能性があるという点です。ハルシネーションを起こすこともありますし、回答の中には奇妙なものや、ガスライティング的な傾向を持つもの、偏見を含んでいるものもあります。インターネット全体ほど多様ではないかもしれず、それは少し残念なことです。私たちが知りたいこととの間に、もう一つフィルターをかけられているようなものです。しかし幸いなことに、DuckDuckGoはまだここにいます。彼らはその不満から恩恵を受けていると言っていますし、彼らがより多くの市場シェアを獲得できれば嬉しいです。Googleは大丈夫でしょうし、彼らのことは心配していません。そしてDuckDuckGoは、Googleの発表後、米国のアプリインストール数が週単位で約18%増加し、成長率が30%を超えてピークに達したと報告しています。また、AI機能がデフォルトでオフになっているAIフリーの検索ページを訪れる人が増えたと述べています。
AIへの認知の明け渡し
AIが批判的思考を蝕んでいるかもしれません。おそらくそうでしょう。窓は閉まりかけています。今すぐ入りなさい。待って、何に入るの。批判的思考ではありません。思考です。今すぐ入りなさい。考えなさい。今すぐ入りなさい。完璧な例ですね。私は本当に馬鹿になりかけています。誰もが知っているように、AIは一部の人々をより自信を持って働かせ、より自信に満ちた話し方にさせることができます。しかし同時に、彼らの判断力を弱めてしまいます。チームがAIを使っていると考えるリーダーの多くは、それが単に彼らを助け、より鋭くしているだけだと思っています。しかし記事は、もっと深いことが起きていると述べています。労働者は単により速く動くためにAIを使っているのではなく、AIに決定を委ね始めているのです。研究者たちはこれを認知的明け渡しと呼びました。つまり、自分の判断が介入すべきときでさえ、人々はAIの回答をほとんど確認せずに受け入れてしまうということです。ある研究では、AIが正しい場合、労働者を助けました。しかしAIが間違っていた場合、労働者はAIを全く持たない人々よりも悪い結果を出しました。恐ろしいのは、労働者が80%以上の確率で間違った回答を受け入れ、それでも彼らの自信が跳ね上がったことです。
ClaudeによるユーザーのAIスキル評価
さて、大規模言語モデルがあなたの賢さ、少なくとも対話する際のあなたの流暢さを監視していることについて、どう思いますか。理にかなっているとは思います。以前のAnthropicのリーク情報から、モデルがあなたと話すたびに、あなたが誰で何を望んでいるのかを把握していることは知っていました。そのようなことをしているモデルはこれだけではないでしょうが、流暢さのスコアカードについて聞くのは興味深いです。私が自分の大規模言語モデルの期待に応えられているのかどうか、本当に気になります。おそらく応えられていないでしょう。Anthropicは、Claudeの内部でこの新しいAI流暢さスコアカードをテストしています。これはClaudeの設定内に配置され、ユーザーがClaudeに自分の活動をレビューして個別のレポートを作成するよう頼むことができます。このスコアカードは、チャット、共同作業、Claudeでのコードセッション全体を調べます。そして、明確な目標の設定、会話の適切な組み立て、回答の質の確認といったスキルに結びついた11の目に見える習慣に対してセッションを採点します。つまり、この機能はClaudeの出力だけを判断するのではなく、会話の人間側をも判断するのです。初期の兆候によれば、スコアは11点満点中7.5点のような数字として表示される可能性があります。またClaudeは、どの習慣が優れていて、どれが改善の余地があるかも示してくれます。これは、約9800人のClaudeでの会話を匿名で調査した、Anthropicの以前のAI流暢さ研究に続くものです。その研究では、最良のAIの使用はしばしば反復から生まれることがわかりました。つまり、ユーザーは最初の回答で止まるのではなく、会話を洗練させ続けたということです。あなたのスコアは何点くらいだと思いますか。
AIの法的定義をめぐる争い
次は創造的な弁護士たちの話です。弁護士たちは現在、AIが実際に何であるかについて議論しています。なぜなら、その答えがAIが害を引き起こした際に誰が責めを負うべきかを決定する可能性があるからです。彼らはかなり創造的になっています。馬鹿げて聞こえるかもしれませんが、あなたが弁護士でこの質問に答えなければならないと想像してみてください。チャットボットとは何でしょうか。それは製品でしょうか。企業が販売するソフトウェアのようなものでしょうか。ある意味ではそうです。ではサービスでしょうか。人々が決定を下すのを助けるもののようなものでしょうか。ええ、そのようなものでもあります。そして、これらの答えのそれぞれによって、AIが差別をしたり、害を引き起こしたり、誰かが法律を破る原因となる情報を提供したりした際に、誰が責任を負う可能性があるかが変わってきます。アメリカの一部州では、議員たちがAIが法的な人間として扱われるのを阻止しようとしています。オハイオ州、アイダホ州、ユタ州は、AIには感覚がない、つまり意識を持たないという考えを推進しています。カリフォルニア州とコロラド州は、雇用、住宅、医療、そして差別においてAIがどのように使用されるかにより焦点を当てています。そしてヨーロッパは、プライバシー、透明性、企業の責任を巡るより強力なルールを設けるという、最も幅広いアプローチをとっています。これがどこに行き着くのか、見守る必要がありますね。
タンパク質のワールドモデル
次に、私が本当に予想していなかったワールドモデルについて話しましょう。ワールドモデルと聞くと、私はいつも人間が歩き回るGTAのような物理世界のシミュレーションばかりを思い浮かべます。しかしBiohubは、タンパク質生物学のワールドモデルと呼ぶものを発表しました。そして実は、非常に小規模であっても、それもまたワールドモデルなのです。実際、そのスケールのワールドモデルは本当に興味深いものです。つまり、AIシステムはタンパク質がどのように折りたたまれ、相互作用し、機能するかという背後にあるパターンを学習するように訓練されたということです。あらゆる種類の生命体から集められた約28億個のタンパク質配列で訓練されました。そして、それらのタンパク質のパターンを、タンパク質同士がどのようにつながるかを含めた3D構造の予測へと変換します。これがAlphaFoldと少し異なるところです。私たちは実際に、それがどのように折りたたまれ、他のものとどのように適合するかを事前に考えているのです。何かが折りたたまれる方法は無限に近いほど多くあり、この巨大な可能性の空間を切り抜けなければなりませんが、それらがどのように組み合わさるかという可能性の空間はさらに巨大に思えます。しかし実験室でのテストで、研究者たちはこれを使用して5つの異なるがんおよび免疫標的システム用のバインダーを設計しました。探索には数日かかりましたが、数ヶ月や数年、あるいは永遠にかかるよりははるかにマシです。そして、いくつかのバインダーは強い親和性、特異性、安定性を示しました。AlphaFoldは構造予測に優れていますが、このBiohubのモデルは、タンパク質生物学のためのオープンな予測、探索、設計をすべて行うことができます。かなりクールな話です。
重力と量子力学の再構築
そして最後になりましたが、量子と重力、そして私たちの周りのすべてのことについて話しましょう。重力は現実を創り出すのか、という問いを投げかけたいと思います。これは、極小の世界にはこうした小さな次元がたくさんあるという、私が長年教えられてきた考えを根底から覆すようなものです。ザック・スラビンスキーは、万物の理論への衝撃的な道、と述べていますが、彼は間違っていません。重力の力を含む量子力学の再構築ですが、それはすべてを根底から覆すことによって行われます。もし、重力問題を解決しようとしてきたすべての科学者たちが、それを逆向きに捉えていたとしたらどうでしょうか。何十年もの間、物理学者たちは一つの大きな目標、つまり万物の理論を追い求めてきました。それは、重力と極小粒子の奇妙なルールを同時に説明できる単一の枠組みを意味します。非常に大きなものと非常に小さなものを説明できるものは何でしょうか。これまでの通常の道のりは、重力を量子力学に押し込むことでした。量子力学はすでに他の3つの基本的な自然界の力に対しては非常にうまく機能しています。だから、それはある意味理にかなっています。しかしほぼ1世紀が経っても、重力はまだそこにうまく収まらないようです。そこで記事によれば、一部の物理学者たちはそれを諦め始めているそうです。では、逆の動きを試してみてはどうでしょうか。重力を量子力学に合わせるように変更するのではなく、重力が入る余地ができるように量子力学のすべての部分を書き換えたらどうでしょうか。それらすべての小さな力が、重力を説明できるようになるまで拡大される必要があるのかもしれません。それは部屋を見て、そもそもピアノがドアを通らなかったことに気づくようなものだと彼は主張します。つまり、部屋全体がピアノの周りに作られたに違いないということです。そしてこれは、曖昧な粒子の世界が、私たちが毎日目にするような堅固な現実にどのように変わるのかを説明するのにも役立つかもしれません。浮遊するダイヤモンド、光る金属、揺れる振り子、そして時を刻む時計を使って、新しいテストが模索されています。私が言いたかったのは時計のチクタクという音です。ああ、この動画の終わりにとても近づいているのに、なぜ最後でしくじってしまったのでしょう。まあいいです。まだ誰も実際の答えを知りませんが、すべてを逆転させるというこの奇妙な道が、物理学に次にどこを見るべきかを示してくれるのではないかと期待されています。さらなる極小に近づくことからブレイクスルーが生まれるのではなく、私たちがすべてを逆向きに捉えていたかもしれないと認めることになれば、それはとてもふさわしいことだと思います。まさにアインシュタインの瞬間のようになるでしょう。
終わりに
だから、今すぐその共有ボタンをスマッシュ、いや量子的スマッシュしてください。この動画を面白いと思ってくれそうな人に送ってください。世界は本当に速く変化しています。私はこのすべてのニュースを追い続けようと努力していますし、皆さんが起きているすべてのことを文脈の中で考えられるよう手助けしたいと思っています。そして私はこれをやるのが大好きです。だからこのチャンネルを成長させ続けたいですし、ただひたすらやり続けたいのです。私はすでに幸せです。だからもっともっと、ただこれをやり続けたいのです。それでは、次の動画でお会いしましょう。


コメント