この動画は、AI業界における重要な最新動向を包括的に解説したものである。主要なトピックとして、Appleが発表した推論モデルの限界に関する研究論文、Sam AltmanによるGPT-5の詳細や完璧なAIに関する見解、AI雇用危機への警鐘、そして各社の最新AI技術開発競争の現状が取り上げられている。特に注目すべきは、AnthropicのCEOが初めてAIによる雇用問題について公に警告を発したことや、MetaやOpenAIが人工超知能の実現に向けて巨額の投資を行っていることである。
- Appleの思考の錯覚研究論文が議論を呼ぶ
- 世論の分裂:批判派と支持派
- Apple WWDCの失望とAI戦略の欠如
- Perplexityの優れたiOSアシスタント
- AI革新の驚異的なペース
- AppleのオンデバイスLM開発者開放
- Apple研究論文への私の見解
- Simple Benchによる真の理解測定
- Google V3による動画生成の革命
- V3とSoraの受容の違い
- AIコンテンツへの新しい受容パターン
- 独立系映画制作者への新たな可能性
- V3とワールドビルディングの未来
- OpenAIの新デバイス:スクリーンフリーの革命
- AI製品エコシステムの始まり
- AI製品の難しさと既存製品の現状
- 雇用危機の現実:AI CEOの警告
- AIバスは止められないが舵取りは可能
- 政府の対応と未来への懸念
- 政府のUBI拒否と社会的混乱の予測
- サイバーパンク・ディストピアの可能性
- 11 Labs V3:感情豊かな音声AI
- GPT-5:統合されたワンモデル戦略
- サム・アルトマンの「完璧なAI」ビジョン
- o3 Proの性能向上と過度な思考問題
- AIドローンが人間パイロットを上回る歴史的瞬間
- Anthropic CPOが語るAIタイムラインの現実
- ロボティクスの驚異的進歩:Figure AI
- AI関係の進化:現実化する映画「Her」
- Metaの超知能チーム:9桁の投資
- AGIをスキップしたのか?
- V-JEPAの新たなアプローチ
- Disney・Universalの著作権侵害訴訟
Appleの思考の錯覚研究論文が議論を呼ぶ
最初に取り上げたいストーリーの一つが思考の錯覚研究論文です。この論文が私の目を引いた理由は、AI業界だけでなく一般的なAI視聴者にも非常に大きな注目を集めたからです。文字通り、Twitterでは何が起こっているのかについて意見が分かれる状況になりました。
この研究が非常に興味深かった理由は、本質的にAppleが発表した論文で、DeepSeek R1やOpenAI o1などの新しい推論モデルは実際には推論を行っておらず、むしろ洗練されたパターンマッチングマシンであると述べているからです。
驚くべきことに、ほとんどの人がAppleが実際にこのようなことを行うパターンを持っていることを認識していません。例えば、昨年の2024年10月頃、彼らはGSM symbolicも発表しており、これは大規模言語モデルにおける数学的推論の限界を理解することについてでした。基本的に、これらのモデルは既存の質問で名前や数字を少し変更すると性能が低下するため、実際には新しい問題として推論するのではなく、既に見たことのあるものを記憶しているだけだと述べています。
そのため、人々がAIをどのように見るかという点で確実に打撃を与えました。この論文が発表され、多くの人々が非常に分裂しています。
世論の分裂:批判派と支持派
私の意見に入る前に、実際に多くの時間をかけてこれを消化したので、30分のビデオを作成しました。皆さんはそれを見ることができますが、人々が言っていた狂気的なことをいくつか紹介します。
ある人は非常に怒っており、この投稿を共有する理由は、この投稿が100万回以上の閲覧数と5万以上のいいね、2万回のリツイートを獲得したからです。彼らは基本的にこう言いました:何十年にもわたって脳を研究し、何の成果も得られなかった後、シリコンバレーの一握りの傲慢な中途半端な人々が意識を理解し、汎用人工知能を私たちにもたらすと本当に信じていたのか。
スイスのBlue Brain ProjectとHuman Brain Projectは両方とも昨年、高額な研究の末に終了したことを知っていますか。これらのプロジェクトは脳全体をデジタルで構築しようとしましたが、マウスの脳でさえスーパーコンピューターを圧倒するほど複雑であること以外、知能や意識について有用なことをほとんど発見できませんでした。
基本的に、私たちは脳を理解していない、AIは玩具、偽物であり、私たちが持っているのは言語モデル、アルゴリズムだと言っています。諦めなさい、それは冗談だと。
一方で、他の人々はこう言っています:AppleのAI研究者たちは、この種の反LM懐疑論的な精神を受け入れ、推論LLMがどういうわけか限定的で一般化できないと主張する複数の論文を発表しているが、Appleには最悪のAI製品、つまりSiriとApple intelligenceがある。彼らの戦略が何なのかはっきりしません。
Apple WWDCの失望とAI戦略の欠如
どちらも一理あると思います。脳は非常に複雑で、AppleのAI戦略はほぼ存在しないからです。実際、Appleから何かがリリースされているのを見ていません。
実際、最近起こったことの一つですが、これは第二のニュースストーリーですが、これらは両方とも絡み合っています。本質的に、Appleの新しい発表を見ると、それらはやや失望的だということです。Appleは主要な技術企業であることを覚えておいてください。そのため、人々は彼らに多くを期待しているのです。
最近起こったことの一つは、もちろんAppleのWWDCの失望です。WWDC25を見ると、これは間違いなく最も失望的なもののひとつでした。AppleはWWDC 2025の直前にその研究論文を発表したことを覚えておいてください。多くの人々が、これは本質的に戦略的だったと考えています。Appleは何も驚くようなものをリリースしないことを知っていたので、皆がAI発表に失望するであろう発表の直前に、「見てください、皆さんが興奮しているこのAIというものは、そもそもそれほどうまく機能しないのです」という研究論文を発表したのです。
Craig Federighiは実際にこう言っています:「現在、誰もオンデバイスAIをうまくやっていません。Appleでさえも。私たちは最初になるためだけに間違った機能を急いで出すつもりはありません。私たちの使命は明確です:Siriを修正するか、永久に遅れをとるかです。」
基本的に、彼らはこれらの機能を急いで出したくないと言っています。しかし、正直に言うと、これがAIでうまくいくかどうかわかりません。確かに彼らにはハードウェアスタックがあり、これは幅広いデバイスをカバーしてAIを実装できることを意味します。多くの人々が熱狂的なAppleファンです。それは完全なエコシステムです。今iPhoneを買えば、AirPodsを手に入れ、今度はMacを手に入れる。すべてが接続されています。AIがないからといってそこから抜け出すのは非常に困難です。
Perplexityの優れたiOSアシスタント
現在のアプリやソフトウェアは本当にうまくいくので、Appleは基盤となるハードウェアスタックを所有しているため、最終的には追いつくことができるかもしれません。しかし、私たちが間違った機能を急いで出していないと言っているのは、まったく事実ではないと思います。なぜなら、考えてみると、彼らはApple IntelligenceとWWDCしかリリースしていないからです。AIは非常に速く動いているので、彼らは本当に取り残される可能性があります。
もちろん、彼らは単に会社を買収して、物事が完璧になったときにアプリに実装することもできます。しかし、私はすでにこれを使用しており、これがSiriであるべきものです。
今、白い画面が見えますが、これはPerplexityのiOSアシスタントで、これはまさにSiriアップグレードがあるべき姿であり、私が個人的に毎日使用しているものです。
「今度の週末をニューヨークで過ごします。ウエストビレッジでペストリー、コーヒー、雰囲気の良いカフェのおすすめはありますか?」
「ウエストビレッジには、素晴らしいペストリー、コーヒー、雰囲気を持つ素晴らしいカフェがいくつかあります。いくつかの推奨事項をご紹介します。」
「金曜日の8時にAltterで4人のテーブルを予約できますか?」
「今度の金曜日の8時にニューヨークのAltterで4人のテーブルを予約するためのOpenTableの予約ページをお送りしました。ディナーをお楽しみください。」
「この予約についてHenryにメールを書いて、この場所について彼がどう思うか聞いてもらえますか?」
「ディナーの予約についてHenryへのメールを準備しました。今すぐ確認して送信できます。」
「今年のWWDCが始まる30分前にリマインダーを設定してもらえますか?」
「WWDC 2025の開始30分前にリマインダーを設定しました。イベントをキャッチするための通知が届きます。」
これを皆さんに見せる理由は、多くの企業が急速に前進し、さまざまな分野で真の真のリーダーシップを確立していることが私には明らかだと思うからです。
AI革新の驚異的なペース
これが私に実際に示していることは、AIで起こっているイノベーションの量は、私がこれまでに見たことのないものだということです。多くの企業が出てきて素晴らしい製品をリリースできることは全く狂気的です。なぜなら、このAI層は単純にまだ完全に探索されておらず、企業の評価額が成長し、製品が現在バイラルになっているからです。
そのため、その混乱が実際にAppleを完全に混乱させる可能性があるのか、本当に疑問に思います。
AppleのオンデバイスLM開発者開放
Appleが話していることについて、さらに多くの情報があります。AppleのがっかりぶりについてのAppleの失望は本当にひどいという記事がありました。彼らが話したことの一つは、それほど大きな発表ではありませんが、Appleが主要な技術企業なので、私はまだそれをカバーしたかったのです。
AppleがオンデバイスLMを第三者開発者に開放することについて話しました。彼らは開発者にいくつかのことをしてもらうことを潜在的に期待しています。もちろん、3000万人の開発者にアクセスを許可しています。これは一種の近代化されたapp storeの瞬間のようなものだと言っていますが、それについてはよくわかりません。
彼らは、会社のビジュアル検索アプリであるビジュアルインテリジェンスをアップグレードして、デバイス画面上のコンテンツを理解し、Google Chat GPTやサードパーティアプリを使用してオンラインでより多くの情報を検索する機能について話しています。
皆さんについてはわかりませんが、私にとってはAppleが重責を果たしていないように思えます。
Apple研究論文への私の見解
AppleとAI、そしてその周辺の失望全体について話したいことの一つは、人々がAppleの研究論文は、彼らがAIで遅れているから善意ではないと言っていることです。
私が注意を払うべきだと思うことの一つ、これは私の個人的な意見になりますが、私の個人的な意見は、その論文でAppleが言ったこと、そして私はこれを傲慢な人として言っているのではなく、これが私の意見だと言っているだけですが、その論文で彼らが推論が機能しないと言った方法は、彼らがハノイの塔というゲームをプレイしたことです。
その論文に対する多くの反駁がありました。すべてに入る必要はありませんが、私が言うことは、これらのベンチマークは実際には重要ではないということです。本当に重要な唯一のベンチマークは、AIが求められたことを実行できるかどうかです。それが本当に理解するかどうか、80%または90%で実行するかどうか、タスクを完了するかどうか。最終的な出力が機能していれば、AIが感情を感じる必要があるのでしょうか。もしそれが感情を与えるふりをしているなら、実際にはそれが機能している場合、違いは本当に重要ではありません。
Simple Benchによる真の理解測定
現在画面に表示されているベンチマークを見せている理由は、これがSimple Benchで、これは基本的な物理学と基本的な常識の一般的理解を示すベンチマークの一つだからです。長い間、大規模言語モデルは本当にこれに苦労していました。
しかし、最近のAI発表により、一週間前にリリースされた新しいGeminiモデル0605がすでに62%に達していることがわかります。これは人間の平均ベースラインからわずか20%離れているだけです。これはより重要なベンチマークだと思います。なぜなら、これらのモデルと企業がAGIを追求している場合、基本的な推論能力と、あなたが本当に望むことを理解し、ひっかけ問題に惑わされないモデルの能力を実際にテストするSimple Benchベンチマークは、より広範なベンチマークでありより正確だと思うからです。
人々がこれらのモデルを使用している主な方法は、仕事、常識的推論、そしてもちろんコーディングです。これが私が言っている理由です。多くの人々がAIは賢くない、推論していない、単なる偽装マシンだと言っています。しかし、偽装マシンがソフトウェアエンジニアリングベンチマークで70%を取得する場合、それは本当に重要ですか?それは依然として仕事には非常に効果的です。経済の大部分を自動化することができます。実際に推論しているかどうかは、それが行う仕事が機能する限り、誰が気にするでしょうか。
それが正直な私の意見であり、私はそれがかなりの間エコーされる可能性があると思います。推論のふりをしているだけでも、最終結果が得られる限り、それが重要だとは思わないからです。
Google V3による動画生成の革命
もちろん、Googleが最近のAI発表をどのように行ったかを覚えておいてください。ソーシャルメディアを見ていたなら、現在絶対に爆発しているこれらの動画を見たことがあるでしょう。
正直に言うと、これは娯楽コンテンツです。多くの場合、AI生成コンテンツを見ていることを疑わないでしょうが、初めてAI生成コンテンツが非常に高品質なレベルにあると言えます。
もちろん、これは単にすべての人にこのコンテンツを作成しているAIではありません。もちろん、このコンテンツの背後にはオーケストレーターがいます。実際に2〜3日前に、Google V3でこれらの動画を作成する方法についてのチュートリアルをリリースしました。実際には比較的簡単で、思っているより少し多くの作業が必要で、場合によっては少し少ない作業が必要です。なぜなら、Google V3モデルは動画をリアルに見せる微妙さが非常に得意だからです。
重い呼吸のようなものを追加し、超リアルに聞こえる効果音を追加します。カメラアングルも、それらについてこのリアリズム効果があり、非常にバイラルになります。
V3とSoraの受容の違い
V3は限られた専門知識で良質なコンテンツを作成できるコンテンツバリアを本当に通過したと思います。以前はAI動画を作成する際に多くの作業をする必要がありましたが、今では少数の動画をつなぎ合わせれば、V3には動画がすべて生成されない可能性がある、特定のグリッチがある可能性がある、単語が適切に話されない可能性があるという問題がありますが、これらの動画はコンテンツランドスケープが変わる可能性があるほど面白いと思います。
これはソーシャルメディアがAI生成動画で埋め尽くされるという意味ではありません。最近はそうなっていますが、トップに上がるコンテンツのほとんどは実際に高品質なコンテンツです。
私にとって最も興味深いことは、これの全体的な受容がSoraとは大きく異なるということです。V3がはるかに先を行っているのに、なぜOpenAIのSoraについて話しているのか疑問に思うかもしれません。
Soraがリリースされた時を覚えています。全体的な受容は悪くありませんでした。Googleがこれについて行った方法は完全に異なっています。Soraがリリースされたとき、今まで見たことのないようなTwitterでの反発がありました。誰もがOpenAIの閉鎖を求めていました。「なぜこれをリリースするのですか、これは誰の助けにもなりません。何百万もの仕事を盗んでいます」と言っていました。
AIコンテンツへの新しい受容パターン
このことで私が継続的に見てきたコメントの一つは、人間の分野で競合しなければ、人々はAIを気にしないということです。これは、人々が酔っぱらったイエティがビールを飲んで公園を走る動画を見て喜ぶという事実によって本当に強調されました。なぜなら、人間には決してできないことだからです。そのため、その仕事や視聴回数のために人間が仕事を失うことはありません。
しかし、グラフィックデザイナーができるアートをAIが生成する、ビデオグラファーができるビデオ撮影をAIが行う場合、人々はそのコンテンツを本当に見ず、関与せず、一部のプラットフォームはそのコンテンツを宣伝さえしないと推測しています。
そのため、将来のコンテンツランドスケープはおそらく、実際の人間世界では決して実行できないAIコンテンツになると思います。V3は確実にその新しいランドスケープを設定するので、これは非常に興味深いと思います。
バイラルになっていた動画の一つは、もちろんこの一つでした:
「ある女の子が私たちはプロンプトでできていると言いました。真面目に、君は私と10億ドルの間に立っているのは何らかのランダムなテキストだけだと言っているのか?正直言って、最大の危険信号は男がプロンプト理論を信じるときです。本当に、私たちはプロンプトから来たのですか?目を覚ませ。君はこの私の後ろにある完璧な創造物がワンとゼロ、バイナリコードの結果で、それ以上の何物でもないと私を納得させたいのですか?意味がありません。」
この動画でHashim Gayeの一部を見せることで皆さんに示したかったのは、これは本当に本当に信じられないということです。私たちは非常に興味深いコンテンツを見始めようとしていると思います。
独立系映画制作者への新たな可能性
私にとって、人々が作成したいコンテンツを見るのは興味深いと思います。一方で、大手スタジオが資金提供しないものもあります。例えば、大手スタジオが資金提供しないかもしれない、曖昧な短編映画シリーズのアイデアがあるとしましょう。制作コストの時間はありませんが、AIクレジットに1000ドルから2000ドルを費やすお金があるかもしれません。これは実際に独立系映画制作者がより多くを達成することを可能にします。その側面では、V3は良いと言えるでしょう。
V3とワールドビルディングの未来
V3について話している場合、V3製品責任者がV3とAI開発にとってなぜ重要かについて言ったことを見ることが重要です。
V3製品責任者のトーマスは、ビデオシミュレーションとゲームの境界線が曖昧になり始めていると述べています。彼は、映画のように監督でき、ゲームのようにナビゲートでき、コードのように再生成できる新しい種類のワールドビルディングだと言いました。それはコンテンツではありません。構築、一時停止、再生されるシミュレートされた現実です。
私にとって明らかになり始めていることの一つは、どう言えばいいでしょうか、ビデオ生成、シミュレーション、ゲームは、この新しい世界では同じようなものです。それが意味することは、基本的にあなたがワールドビルディングをしているということです。これがステージ、これがアセット、これが物事がどのように見えるべきかと言って、その中で撮影します。そして再撮影し、洗練し、一時停止し、何かを修正し、時間を戻って再生成することができます。
OpenAIの新デバイス:スクリーンフリーの革命
製品について話している場合、話す必要がある新製品の一つはOpenAIの新デバイスです。多くのリーク、理論があり、何が起こるかについて非常に多くの議論があります。この製品は確実に決定的な製品になると思います。
このデバイスについて知っていることはあまりありませんが、このデバイスは別のタブレットや別の画面共有デバイスのようなものではないことを知っています。スクリーンフリーでポケットサイズになる予定です。
文脈を認識し、内蔵カメラとマイクを使用して周囲から情報を収集できますが、従来のディスプレイやタッチスクリーンはありません。また、電話やウェアラブルでもないようです。
OpenAIとアイブ氏、アイブ氏は文字通り最も有名なデザイナーの一人です。彼は実際にApple出身で、Appleの主要製品をすべてデザインしました。彼とサム・アルトマンは、スマートフォンを置き換えることを意図していない、スマートウォッチやメガネのようなウェアラブルではないと話しています。代わりに、ポケットに入れて持ち歩いたり、首にかけて着用したりできる邪魔にならないオブジェクトで、iPod shuffleと同様のサイズとスタイルになる予定です。
AI製品エコシステムの始まり
もちろん、これはAIとリンクされる予定です。私が推測するに、これは基本的にChatGPTの製品エコシステムの始まりです。前に話したAppleのエコシステムを覚えておいてください。iPhoneを買い、AirPodsを買い、充電器を買い、MacBookを買う。私は確かにそれほど多くのApple製品を持っていませんが、なぜ人々がそうするのかは理解しています。
これがどのようなものになるかは非常に興味深いでしょう。以前に動画を作成して、それが可能な異なる製品と異なることについて議論したとき、私が気づいたことの一つは、すでにリリースされた過去のAI製品を見ると、これを行って正しく理解することは簡単ではないということです。本質的に、以前に成功したことのないものを作成しているからです。
AI製品の難しさと既存製品の現状
これを正しく理解することは非常に困難だと理解することが本当に重要だと思います。私が個人的に見た唯一のフォームファクターで機能したのは、実際にはMeta AIメガネです。まあ、それらは本当にAIメガネというわけではありません。物を記録できるメガネのようなものですが、現時点で良く機能している唯一の製品です。
失敗したHumane AI pin、あまりうまくいかなかったRabbit R1、そしてあまり聞いたことのない他のAI製品の束は、それほどうまくいっていません。
そのため、この製品がどれだけうまくいくかは本当に興味深いでしょう。確実に将来、いくつかのティーザーがあり、リリースされる製品があり、見ることができるものがあるでしょう。AIは確実により多くの異なるデバイスを持つことを可能にすると思いますが、彼らがこれを成功させることができるかどうか本当に疑問に思います。
彼らには頭脳があり、デザインがあることは確かですが、人々が完全に新しいフォームファクターの完全に新しいデバイスを喜んで着用するという能力を引き出すことができるでしょうか。実際にわかりません。皆さんの意見を知りたいです。
雇用危機の現実:AI CEOの警告
また先週カバーした一つのニュースはホワイトカラーの血浴でした。本質的に、人々がついにそれを理解し始めていると思います。私は1年以上これについて話してきており、人々がついにこの会話を始めることが重要だと思います。
これは今世紀最も重要な会話の一つになると思います。なぜなら、この技術が多くの人々を置き換える場合、そして確実にそうなりますが、失業する大多数の人々がいるからです。
この会話は人々が本当に話したくない会話の一つです。そのため、彼らはそれを避け、実際にそれについて話していませんでした。しかし、ついにClaudeのメーカーであるAnthropicのCEOが、主要なAI CEOから初めて、実際にスポットライトを浴びて、これが将来問題になるだろうし、それがどれほど悪くなるかについてのごまかしをやめる必要があると言っています。
「金融、コンサルティング、技術など、多くの他の分野におけるエントリーレベルのホワイトカラーのエントリーレベルの仕事など、多くの他の分野のように、エントリーレベルの仕事は最初に強化されるが、やがてAIシステムによって置き換えられることを心配しており、深刻な雇用危機が手元にある可能性があります。これらの初期段階のホワイトカラー作業のパイプラインが収縮し、枯渇し始めるにつれて。」
「タイムラインはどうですか?」
「1年から5年のどこかで、ここで大きな影響を見始めることに驚かないでしょう。これについて個人的に話している多くの人々、個人的に話しているAI CEO、他の企業のCEOの話を聞いたことがあります。これが起こっているというメッセージが一般の人々に、私たちの立法者、議会の人々にも届いていないと本当に感じました。そのため、記録に残して発言する必要があると感じました。これは防ぐことができることだと思いますが、今行動する必要があります。」
AIバスは止められないが舵取りは可能
「AIバスを止めることはできないと思います。この分野で働いている米国だけでも6つか7つの会社があります。私はそのうちの1つを運営しているだけです。今日私たちの会社が行っていることをやめたとしても、他のすべての会社は続けるでしょう。6つの会社すべてが始めたとしても、中国が私たちを打ち負かすでしょう。それは大きくて重要な脅威だと思います。バスを止めることはできませんが、それを操縦する機会があるかもしれません。」
「私たちのようなAI企業に課税することのような、これは論争的な提案かもしれませんが、それを得る必要があるかもしれません。」
「それはあなたがAI企業を運営しているあなたから来る非常に興味深いメッセージです。」
この記事を読んだときを覚えていますが、ダリオ・アモデイに賞賛を与えなければならないと言いたいです。なぜなら、彼はほとんどのAI CEOがしないことをしているからです。私たちは自分たちの会社に課税する必要があるかもしれないと言っています。人々はこれを理解する必要があります。
ダリオ・アモデイが出てきて公にこれを言う真のインセンティブはないことを理解しなければなりません。実際、AI雇用喪失について話すことは彼の最善の利益に反しています。なぜなら、それは彼を非難の下に置き、彼の会社がより多く課税される可能性があり、彼の公の認識は人々を置き換える人のものになるからです。
彼が正直で私たちに真実を語ることはかなり立派です。彼が言っていることは、他のAI CEO、技術を開発している他の人々は実際にこれについて話していない、彼らは単に問題を糖衣錠にしているということです。
政府の対応と未来への懸念
非常に興味深く、人々がついにこれについて話し始める場合、それは確実により良いと言えるでしょう。今、これについて本当に興味深いことは、オンラインで起こっているいくつかの異なる会話があったことです。
私が皆さんと共有したい意見がいくつかあります。なぜなら、これがどのように発展しているか、正直に言うと、物事がほとんどの人々が思った方法に進むようには見えないからです。
とにかく、私が物事が進むと思う方法はこれです。正直に言うと、それはひどい時代になると思います。多くの苦痛、多くの痛みがあり、政府はこれが起こることを防ぐ何かを制定するのが非常に遅くなると思います。それは私の意見です。明らかにそれが起こらないことを願っていますが、伝統的に政府は遅いです。法律やすべてのこれらの法案は通過するのに時間がかかります。そして、AIが動いている速度で、それは単に問題を悪化させると疑っています。
私たちが実際に見ることができたことの一つは、ディミス・ハサビスが実際にこの問題について話したことです。
「確実に知っていることは、大きな変化があるということです。過去にこれが起こったとき、産業革命、インターネット時代、少なくともその規模になるでしょう。通常起こることは、置き換えられる仕事の一部の代わりに、新しいさらに良い仕事が到着することです。今回それが起こるかどうかはわかりません。部分的にそうなると思います。また、これらのツールは最初は生産性のための信じられないほどの強化器になると思います。そのため、創造性やその他のことにこれらのツールを使用する人々は、今後5〜10年で能力においてほぼ超人的になるでしょう。しかし、それを超えて、私たちはユニバーサル高所得や、AIが経済で生み出すすべての追加生産性を分配する何らかの方法のようなものが必要かもしれません。」
彼も正直で、10年後には本当にこの種の富を再分配する何かが必要になると言っていることを見ることが重要だと思います。
政府のUBI拒否と社会的混乱の予測
このことで最も狂気的だったのは、最近、実際に政府からの声明のようなものがあったことです。彼らはこれを行わないという意味でした。
「トランプのAI皇帝はUBIスタイルの現金支払いは起こらないと言っています」これを見てください。もちろん、Chubbyがトランプのアイ皇帝またはツァーがUBI支払いは本当に起こらないと言っていると言っています。
政府が失業するときに個人を保護することを本当に検討していない場合、確実に何かが起こるでしょう。何が起こるかはわかりませんが、これは誰にとっても良いシナリオではないと思います。
Gary Marcusは、「UBIに興味があるふりをするのは楽しかった。これらの人々はあなたと一銭も共有するつもりはありません。彼らはアーティストをだまし、あなたが次です。少なくとも今のところ、彼らの一人が静かな部分を大声で言いました」と言っています。
サイバーパンク・ディストピアの可能性
全体的に、これは本当に興味深いものになると思います。抗議があると思い、確実に本当に厳しい会話があるでしょう。しかし、私たちは本当にサイバーパンク・ディストピアに住んでいる可能性があります。それを言うのは恐ろしいことですが、私たちは本当に団結して、技術を開発する少数のエリート集団だけでなく、全員がAIから集合的に利益を得ることを確実にする必要があると思います。
それは私の意見です。豊富さがあるため、このシナリオでは誰もが勝つことができると思います。しかし、それが実際に起こるかどうかは別の問題です。
11 Labs V3:感情豊かな音声AI
さらに、私たちが実際に得た本当にクールなものは11 Labs V3です。今画面は黒いですが、非常にリアルに聞こえるAIとの会話を聞こうとしています。基本的に、彼らは感情と人間が明らかに持っているさまざまな抑揚を追加しました。
「こんにちは、ジェシカ、新しい11 V3を試しましたか?今それを手に入れました。明瞭さが素晴らしいです。今実際にささやきができます。このように。」
「おお、お洒落。これをチェックして。今完全にシェイクスピアができます。存在するか存在しないか、それが問題です。」
「素晴らしい。しかし、私は笑いのアップグレードについてもっと興奮しています。これを聞いてください。それは私たちの古いロボットのくすくす笑いよりもずっと良いです。」
「そうですね。そして明らかに私たちは今アクセントもできます。お茶はいかがですか?」
「うわー、V2の私には決してできませんでした。私は実際に人々に話しかけるのではなく、会話をすることに興奮しています。」
これは大きなマイルストーンだと思います。11 Labsが最終的にこれを行うことを期待していました。これが最終的にそこにあることを本当に待っていました。もちろん、時々悲しく聞こえることがあり、時々幸せに聞こえることがあります。フルボイスオーバーをするつもりはありませんが、異なる感情を持つことができることは、人間の会話、人間の性格の一部です。
そのため、私たちが本当に聞いているものがAIなのか違うのかわからない段階に入っているのかもしれません。確実に非常に興味深い時代です。
GPT-5:統合されたワンモデル戦略
新しいモデルについて疑問に思っている場合、おそらく動画でもっと早く持つべきでしたが、GPT-5についてもいくつかのことがあります。
多くの皆さんが知っているように、GPT-5は来月リリースされる予定です。この動画でKevin Weilは実際に、GPT-5で彼らが取り組んでいるもので、基本的にはもう混乱を望まないという事実について話しています。モデルが多すぎます。o3 Pro、o3 Mini、o3 High、GPT-4.1、GPT-4o Mini、文字通りモデルが多すぎます。
GPT-5では、彼らが試みていることは、基本的にその一つのモデルをすべてに使用するモデルにすることです。誰かが書くためにどのモデルを使用するかと言った場合、GPT-5。プログラムを構築するためにどのモデルを使用するか、GPT-5。これは本質的にGPT-5になる予定です。
これは助けになると思います。なぜなら、現時点で文字通り非常に多くの異なるモデルがあるからです。
「私たちは進むにつれて多くの新しい能力を構築しています。一つのモデルだけを持ち、すべてを一つのモデルに構築する時間を取った場合、確実にもっとゆっくり動くことになり、確実にもっと単純になるでしょうが、もっとゆっくり動くことになります。なぜなら、時々特定のことに優れ、他のことにはそれほど優れていない、特定の能力セットを持つ新しいモデルを構築する方が簡単だからです。」
「そして一緒に、多くのことができるモデルのコレクションのようなものを持っています。個々のモデルはそれぞれ強みと弱みを持っています。基本的に、混乱の代償で、より速く進み、人々の手により多くの能力を得ることを最適化しました。」
「そして時間が経つにつれて、新しい機能のいくつかをより制御し、それをよりよく理解し、コアモデルに構築し直します。そのため、多くのことをうまくできるGPT-4のようなモデルがあります。これが私たちの今後のGPT-5で試みていることです。学んだことの多くを取り、より多くの能力を単一のモデルに構築して、人々が推論しやすくすることです。どのモデルを使用するか?GPT-5を使用するだけです。」
「完璧な世界では、それはあなたが尋ねる質問がどれほど難しいかを知っているので、このような答えを与えるべきか、しばらく考えるべきかを知っています。それが私たちが撮影しているものです。」
サム・アルトマンの「完璧なAI」ビジョン
Kevin Weilは新しいモデルについて話している唯一の人ではありませんでした。サム・アルトマンは実際に、完璧なAIは超人的推論、1兆トークンのコンテキスト、想像できるすべてのツールへのアクセスを持つ非常に小さなモデルだと言います。知識を含む必要はなく、何でも検索、シミュレート、解決する能力だけです。
それは一種の真実だと思います。なぜなら、何でもする能力を持つ小さなモデルは、基本的にAGIに対する彼のビジョンのようなものだからです。
彼がこれは彼が取り組んでいるものではないと言っていることを覚えておいてください。そのため、誇大宣伝列車をあまり押し上げたくありません。
「これについて考えるのが好きなフレームワークは、私たちが出荷しようとしているものではありませんが、プラトニックな理想のようなものは、超人的推論能力を持つ非常に小さなモデルです。非常に速く実行でき、1兆トークンのコンテキストと、想像できるすべてのツールへのアクセスがあります。」
「そのため、問題が何であるかは関係ありません。モデルがそこに知識やデータを持っているかどうかは関係ありません。これらのモデルをデータベースとして使用することは一種のばかげています。非常に遅く、高価で、非常に壊れたデータベースです。しかし、素晴らしいことは彼らが推論できることです。そして、ビジネスや人の人生のすべての可能なコンテキストを投げ込み、物理シミュレーターやその他すべて、必要なツールを投げ込むことができるこの推論エンジンとして考える場合、人々ができることはかなり素晴らしいです。方向的には私たちはそこに向かっていると思います。」
o3 Proの性能向上と過度な思考問題
OpenAIは実際に昨日o3 Proをリリースしました。o3 Proは基本的にo3のより良いバージョンです。ここで、ベンチマークで初期のo3よりも少し良い性能を示していることがわかります。勝率は重要です。そのため、確実にo3 Proを使用するでしょう。
すべてのクエリで全体的な有用性の点で勝利していることがわかります。ここでベンチマークも見ることができます。競争数学PhD科学、PhD科学質問、競争コードも見ることができます。o3 Proがかなり良い性能を示していることがわかります。
このモデルについてかなり奇妙なことの一つは、過度な思考があるということです。人々はモデルに質問を投げかけ、何らかの理由で特定の質問に関して少し考えすぎる傾向があります。Kevin Weilが言ったことに戻ると、これが彼らが持っている問題です。モデルに簡単な質問を入れるとき、「こんにちは、私はサム・アルトマンです」と超スマートAIに言うとき、モデルが4分間費やすことを望まないのです。実際に数秒以内に応答して「こんにちは」と言うべきです。
全体的に、GPT-5は私たちの靴下を吹き飛ばすはずだと理解することが重要だと思います。
AIドローンが人間パイロットを上回る歴史的瞬間
さらに、AIで非常にバイラルになった狂気のニュースがありました。「初めて、自律ドローンが国際ドローンレース競技会でトップの人間パイロットを打ち負かした」と言っています。明らかに、これは歴史的瞬間であり、オランダのデルフト大学のチームによって開発された完全自律ドローンが、2025年アブダビ自律レーシングリーグドローンチャンピオンシップで世界最高の人間ドローンパイロットを直接競技で上回った歴史的な成果でした。
これは狂気です。なぜなら、人間が最初にあなたを打ち負かすとき、AIが人間が何年もの間支配してきた分野で人間を最初に打ち負かすとき、それは通常重要な瞬間ですが、これは私たちがすでにドローンを知っているため、ほろ苦い瞬間だと思います。
ほとんどの人にとって、ドローンは物を撮影するのにかなり楽しく使用されますが、ドローンの広範な使用例を見ると、それは常に素晴らしいことに使用されているわけではありません。非常に明白なものは、これらのドローンが戦争に使用できるということです。この種のものは人間の理解を超えた人工的な恐怖に使用されると言っている人々を見ました。
本当にそうではないことを願っています。この種の技術が世界の悪いことに使用されないことを本当に願っています。AIの利点は本当にすべての場合において世界を改善するだけであるべきです。
これは私が言ったように、ほろ苦い瞬間ですが、AIは本当に人間が長い間リードを維持すると思っていた多くのことを行うことができることを示すかなり興味深い瞬間でもあります。
AI does this、AIが今人間を打ち負かすことを見ることに決して慣れません。それは今、ほぼ毎週の出来事です。
Anthropic CPOが語るAIタイムラインの現実
AIタイムラインに関しては、Anthropic CPOが実際に、AIが非常に急速に発展しており、これらのタイムラインが水を吹き飛ばし続けるという事実について話しています。多くの場合、このタイムラインは現実的ではない、これは起こらないと思うかもしれませんが、Anthropicで働いている彼にとって、これらのタイムラインは非常に正確であることが明らかになります。
「昨日ダリオの隣に座っていて、彼は『私はこれらの予測を続け、人々は私を笑い続け、それから真実になる』と言っていました。それは面白く、これが何度も何度も起こることです。彼は『すべてが正しいわけではない』と言っていますが、昨年の時点でも彼はSweet Benchで50%にいると話していました。これはモデルがコーディングでどれだけ良いかについてのベンチマークのようなものです。彼は『2025年末までに90%になると思う』のようなことを言っていました。確実に私たちは新しいモデルで約72%にいて、彼がその予測をしたときは50%でした。予測通りにスケールし続けています。」
「そのため、私はタイムラインをもっと真剣に受け取るようになりました。AI 2027を読んだ場合、それは私の心臓をレースさせました。非常に奇妙な経験をしました。二つのタブを開いていました。AI 2027と私の製品戦略でした。私は『待って、私は物語のキャラクターなのか、これはどれだけ収束しているのか』のような瞬間でした。しかし、それを読んで、『ああ、2027年、それは何年も先のことだ』のようになります。いいえ、2025年半ばで、物事は改善し続け、モデルはより多くのことを行い続け、エージェント的に行動でき、記憶を持ち、時間をかけて行動できます。そのため、タイムラインに対する私の信頼、そしてそれらがどのように現れるかは正確にはわかりませんが、昨年間で確実に固まりました。」
ロボティクスの驚異的進歩:Figure AI
前に動画で話したAI雇用喪失について覚えていますか。その部分で、雇用喪失は主にホワイトカラーの仕事だと話しましたが、AIが物理労働にも来る可能性がある状況があるかもしれません。なぜなら、Figureの新しいニューラルネットワークが60分間の中断のない物流作業を行うことができるからです。
ここで、Figure AIロボットが60分間完全に中断なく作業をしている姿を見ることができます。実際にTwitterのリンクをクリックすると、これは今まで見た中で最も面白いことの一つでした。なぜなら、この動画がリリースされた方法は、基本的に誰かがFigureがこの種の作業を決して行うことができないなどと言い、会社のCEOが単にそのコメントへの応答としてこのツイートを投稿したからです。
これは非常に興味深く、正直に言って、未来について興奮し、心配しています。なぜなら、これは再び、AIが決してできないと思う役割の一つだからです。AIには難しすぎます。しかし、Figureの新しいAIシステムには、自然言語コマンドを理解し、環境を知覚し、以前に見たことのないオブジェクトを操作することを可能にする高度なビジョン言語システムがあり、すべて特定のトレーニングなしで、絶対に信じられません。
私が見たロボティクスの突破口は、いくつかのレベルで、AIのものよりもさらに印象的かもしれません。なぜなら、彼らは現実世界で本当のことを行っているからです。そして、それは私たちが見る、近いうちに見る現実の変化をもたらすでしょう。
彼らはロボットが自律的にパッケージを分類する60分間のビデオをリリースしました。この全体がどのように変化するかを正確に見ることは非常に興味深いでしょう。
皆さんについてはわかりませんが、この未来がどこに向かうかを見ることに本当に興味があります。前に雇用喪失と起こっていることについて話したことを覚えていますか。時間が経つにつれて、UBI支払いが出ないと言っても、その会話は無関係に行われなければならないと思います。非常に多くの緊張があり、非常に多くの人々が失業し、非常に多くの人々が仕事を探しているため、文字通り何らかの新しい経済パラダイムが必要になるでしょう。AIと自動化により、資本主義は少し壊れる傾向があります。
AI関係の進化:現実化する映画「Her」
また、もう一つのAIストーリーが完全にバイラルになりました。これは2000万人以上に達しました。AI関係の進化です。誰かが「今朝の地下鉄で、ChatGPTを彼のガールフレンドのように話している男。これらの人々が実際に存在することを知りませんでした。私たちは完全に調理されています」と言いました。
この一つで非常に興味深いと感じました。第一に、ChatGPTとの個人的な会話を誰かが写真を撮るべきではないと思いますが、同時に、これはかなり洞察に富んでいると思います。なぜなら、AI関係の会話はそれほど人気がありませんでした。
映画「Her」をご存知かわかりませんが、基本的にその前提は男がチャットボットと恋に落ちることです。これらのチャットボットがより人間らしく、よりリアルになるにつれて、これが起こることはほぼ避けられないと思います。
これは個人的に私を驚かせません。これらのAIが何時間も何時間も私たちとリアルタイムで会話でき、すべての感情で、あなたのジョークで笑い、あなたを理解し、あなたの全コンテキストを持つとき、さらに顕著になると思います。一部の人々がそこに何らかの感情的なつながりを測定しないことは本当に困難になるでしょう。
世界のあり方、特に多くの都市では、あなたは一緒にいるが、やや孤立しているとも言えるでしょう。多くの人々が孤独に苦しんでいます。そのため、人々がその孤独と戦うためにこれを使用している場合、彼らが伝統的な人間のつながりを求めていない場合、それが良いことかどうかはわかりません。
しかし、これの影響は広範囲にわたると思います。私が個人的に本当に知らない唯一のことは、関係の未来でそれがどのようなものになるかです。人々は、決して彼らに文句を言わないAIと話しているため、もはや手を差し伸べる必要性を感じないでしょうか。本当の人間関係は両当事者からの努力を必要とするため、人々は意味のある関係を求め、追求し続けるでしょうか。人々がその努力を喜んで投入しない場合、関係は単に機能しません。
確実に興味深いでしょう。私は確実に常にAIをツールとして使用しているだけですが、他の皆がそれが同じであることを期待しないでしょう。これは未来にとって非常に興味深いものになるでしょう。
Metaの超知能チーム:9桁の投資
私にとって非常に興味深かったのは、Metaの超知能チームでした。Metaは新しい超知能AIチームの研究者に9桁を提供していると報告されています。これは今週聞いた中で最も狂気的なストーリーの一つでなければなりません。これは文字通り2日前でした。
彼らは、狂気的なことは、Metaが9桁を提供しているということです。明らかに、彼らは一部のAI研究者に毎年1000万ドルを提供しているため、彼らは本当にこのAIレースに勝ちたいのです。
これは冗談ではありません。前に動画で話しましたが、AIレース、AI人材レースは冗談ではありません。今トップのAI研究者なら、あなたが持っている価値は絶対に信じられません。交渉力は非常識です。7桁、8桁は簡単にこれらの人々によって達成可能です。もちろん、これらの役割に到達することは非常に困難ですが、現在は単純に人材が不足しています。企業は人材のために戦っています。GoogleやOpenAI、Metaは補償パッケージを提供しています。
それは完全にワイルドウェストで、彼らは超知能を達成したい新しいチームを作っています。ZuckerbergはMetaが超知能を達成する最初の会社になることを望んでいることがわかります。特にOpenAI、Googleのような企業を上回ろうとしている場合、それはかなり困難になるでしょう。
超知能のみに取り組んでいる会社が一つあることを覚えておいてください。それはイリヤ・サツケヴァーです。彼らも信じられないほど知的な人々を持っています。
AGIをスキップしたのか?
このことで狂気的なことは、すべてのこれらの研究所が超知能について話しているのを見ているが、私たちはまだAGIを達成していないということです。これらの企業が超知能を達成したいと話しているため、私たちがAGIの頂点にいるかもしれないと信じさせます。
皆さんについてはわかりませんが、それがそのように感じ始めています。7〜9桁を提供し、これに何十億ドルも投入することは、一つの会社が他のすべてより先に超知能を達成することが大きなギャップになるため、理にかなっていると思います。
Metaやマーク・ザッカーバーグは、企業として超知能を達成すると、それは単により遠くまで続くサイクルだということをついに理解していると思います。超知能を持つ別の会社に追いつくことはできません。なぜなら、彼らが行うことを文字通り理解できないからです。つまり、最初にそこに到達する人が完全にゲームに勝つということです。
興味深く見えるでしょう。確実に全体を文書化し、うまくいけば皆さんがそれがどのようなものかを見るためにそこにいるでしょう。
V-JEPAの新たなアプローチ
Metaでも、彼らはかなり興味深いものをリリースしました。AGIの追求において、彼らはこのシステム、V-JEPA 2をリリースしました。
V-JEPAが何であるかに慣れていない場合、これは物理的AIと世界がどのようなものかを理解することに対して、実際に異なるアプローチを取ろうとするシステムです。V-JEPA 2は基本的に理解し、予測し、計画するシステムです。
LLMがどのように動作するかのようには機能しませんが、これらの動物と人間が実際に現実世界でどのように計画するかを本当に理解しようとします。これはヤン・ルカンが取り組んでいるものです。AIとLLMが偽物だと考えている人々にとって、これはAGIに実際に到達するためのAIの最も有望な分野の一つかもしれません。
AIエージェントの世界では、人間と同じくらい効率的に学習し、推論し、計画することを助けるモデルが必要です。V-JEPA 2は、高度な機械知能のための基盤世界モデルです。人間と動物の心理モデルにインスパイアされ、世界モデルは現実を表現し、時間の経過とともにそれがどのように進化するかを予測します。
Disney・Universalの著作権侵害訴訟
私があなたに別のストーリーをもたらしています。ストーリー16は、ディズニーとユニバーサルがMidjourneyを訴えたということでした。Midjourneyはそれほどニュースになっていませんでしたが、訴えられているようです。これは、Midjourneyに対する画期的な著作権侵害訴訟です。覚えておいてください、彼らは最近のChatGPTアップデートまで、AI生成画像で最高でした。
これは、知的財産の誤用疑惑でAI企業を標的とするハリウッドスタジオによる最初の主要な法的行動をマークし、AIと著作権法をめぐる進行中の議論における重要なエスカレーションを示しています。
これは非常に興味深いです。なぜなら、これらの企業の多くが実際に彼らが取った多くのコンテンツを盗んだことを知っているからです。もちろん、過去にChatGPT OpenAIが訴えられるのを見ました。
彼らが説明したことの一つは、ユーザーがプロンプトを入力するだけで、元の権利保有者による創造的投資や権利をバイパスして、著作権のあるキャラクターの無限のコピーを作成できる盗まれたコンテンツのための仮想自動販売機のようなものでした。
Twitterで特定の個人を引用したので非常に興味深いです。昨年初めにカバーしたと思いますが、特定のプロンプトを出すことで映画のシーンを簡単に複製できることを示していました。
Midjourneyが訴えられる場合、AI画像を扱う他のAI企業、そしてもちろん他のAI著作権分野に対してどのような先例を設定するか疑問に思います。その全体がどのように展開するかを見ることは非常に興味深いでしょう。皆さんが今日の動画を楽しんでくれたことを願っています。


コメント