本動画は最新のAI業界の動向を包括的に解説したコンテンツである。AIによる雇用への影響から、Geminiの台頭、最新のビデオ生成AI「Ray 3」、ロボティクス分野の進歩、そしてGPT-5への期待まで、幅広いトピックを扱っている。特にAIが全ての仕事を奪うかという議論、AI精神症の危険性、そして2030年までの技術予測など、AI技術の光と影の両面を詳細に分析している。

- AIは本当に全ての仕事を奪うのか?
- AIによる職業変化の予測
- ロボット手術とAI戦争の時代
- 経済格差への懸念
- UBIと経済成長の可能性
- OpenAI研究者の流出とMeta
- Metaのスマートグラスと未来
- 中国からの新しいオープンソースモデル
- AI精神症の危険性
- 真のAIの脅威:AI精神症
- GoogleのGeminiが世界的に注目を集める
- Geminiのプログラミングコンテスト金メダル獲得
- GoogleのEmbedding Gemmaと効率化
- ロボティクス分野の最新動向
- Unitree G1の驚異的な回復能力
- Kepler K2とハイブリッドアーキテクチャ
- 不気味の谷を越えるロボット
- Grok 4とARC AGI高得点
- Grok 4 Fastとコスト効率
- OpenAIの内部動向とコード開発
- Microsoftの巨大データセンター
- Ray 3:次世代ビデオ生成AI
- AI時代の科学的発見
- 将来のAI能力への期待
- Elon Muskの2030年予測
AIは本当に全ての仕事を奪うのか?
さて、今週のAIニュースに入ろか。山ほどあるでな。まず話したいのは、AIが全ての仕事を終わらせるかどうかや。これはわしのYouTubeチャンネルでもずっと議論してきたトピックやけど、ちょっと疲れるテーマやから最近はあんまり話してなかってん。せやけど今回はこの動画に入れたいと思ったんや。なぜかというと、今インターネット上に出回ってる複数のメディアが、めっちゃ暗い将来を描いてるからな。
Daniel Jeffからのツイートがあってな、わしが見た時にはMetaのヤン・ルカンがリツイートしてたんや。ヤン・ルカンが誰か知らんかったら、彼はトップ・オブ・ザ・トップのAI研究者の一人や。彼が言うには、AIが全ての仕事を終わらせると考えてる人たちは、Max Techmarkがアシッドトリップしてる時より酷い幻覚を見てるってことらしい。
理由の一つは、AIは人を10倍生産的にするわけやないし、何かの魔法の治療薬でもないってことや。それは単に別の種類の知性であって、ボトルネックをワークフローの他の部分、つまり問題の構成、改良、反復、検証といった部分にシフトするだけなんや。基本的にこのツイートは、AIはあらゆる問題の万能薬やないって言うてるんや。
それは単に問題を生態系全体の別の領域にシフトするだけなんやと。それはある程度は正しいかもしれん。せやけど理解せなあかんのは、人間は合理的な生き物やないってことや。ほとんどの人はAIが良くなる→AIが仕事を奪うって論理で考える。そして実際、2030年までにある種の役割や職業は完全に自動化されるやろうと思うで。
AIによる職業変化の予測
昔、新しい機械や新しい工場機械があった時のように、工場自体は無くならんかったけど、商品の生産方法に関してはある種の組み立てラインが変わったんや。これが人間がちょっと非合理的やと言う理由や。ソーシャルメディアで話題になってるこれを見たら、わしもいつかこれについて完全な動画を作るつもりやけど、これがAIにどうやって仕事を失うかという議論で重要やった理由は、ほとんどの人が現在のモデルの軌跡とそれらがどこに向かってるかを理解してないからなんや。
この文書の出典はまだ分からんのや。実際に調べてみたんやけど、まだ見つけられんかった。もし誰か知ってたら、コメントで教えてもらえたら、他の予測も見てみたいんや。せやけどこの予測、そんなに偽物っぽく見えへんな。
運転について言うてるんやけど、自動運転が2028年から2030年にかけて普及して、ドライバーが失業し、UberやLiftのトラック運送が終わるってことや。これを見たら、ある程度は本当やろ?Waymoが多くの異なる都市に拡大してる。自動運転AIトラック運送サービスもある。
どれだけ良いか分からんけど、5年後には自動運転がそこそこになってると想像できるやろ。これらの会社を覚えといてや、彼らの目標は完全に金を稼ぐことや。じゃあUberの最終的なインセンティブは何や?ドライバーにその料金の一部を払い続けたいのか、それともAIを使って事実上ほんの数セントで誰かに支払い、それを取り除いて利益率を上げたいのか?もちろん後者やろ。
AI診断がある。AIの方が診断が良くて、完璧に処方して、症状を決して忘れへん。もちろん完全な記憶を持ってるからな。これは医療業界でも人間は定期的な身体検査や他のことでまだ必要やと思うけど、ある程度は本当や。
ロボット手術とAI戦争の時代
それからもちろんロボット手術があるな。震えゼロの完璧な精度で、人間の外科医が何をスクリーンに映すか、これはロボティクスがそこまで到達すれば可能やし、ロボティクスは改善されてる。わしもクレイジーなロボティクスのやつを見てきたから、これは続くやろな。
AIがドローンやロボットを制御して戦争をする。人間は戦闘員やなくて巻き添え被害になる。これはめっちゃ本当や。今AIドローンの台頭を見てるからな。人間が何の役に立つねん、10倍の速度でドローンを飛ばして出入りして、何かを標的にできる時に。めっちゃクレイジーやで。
コーダー、もちろん教師、パーソナライズされたAIチューター、弁護士、AIは全ての判例法を瞬時に読める。アーティスト、AIは需要に応じてあらゆる画像、歌、映画を生成する。人間の創造性はニッチな贅沢品になる。まあ色々なカテゴリがあるけど、これがバイラルになった理由は、一般の人が見て「うわ、5年後には物事が急速に変わって、その軌跡は遅くなってへん」って分かるからや。
これらの産業がAI使用で荒れ狂うのを止められる唯一のことは、わしが個人的に起こると思わんけど、これらのモデルがその分野でどれだけ良い必要があるかの範囲についての業界全体の規制や。つまり、モデルが95%良いけど、認証を通すために99.9%である必要があるみたいな、ある種のエッジケースのせいで、実際にはまだそのレベルに達してへんってことや。
経済格差への懸念
世界は2035年までに急速に変わるやろな。過去10年を振り返って、テクノロジーがどれだけ改善されたかを見たら、指数関数的なファクターを考慮すると、これは起こることやと思う。一方でヤン・ルカンとDaniel Jeffreyは、AIが全ての仕事を終わらせることはないって言うてる。
わしもAIが全ての仕事を終わらせるとは思わんけど、経済を大幅に変えないってのはありえへんと思う。これが単なる恐怖を煽ってるだけや、何を言うてるか分からん人やと思う人には、Dario Amodeがこの非常に同じことを彼の動画で言うてるから見てもらいたい。
彼は雇用の喪失と、これが適切に処理されなければ格差が広がるっていう事実について話してる。これはわしが何年も前から話してきたことや。
AI技術について考えてみて、それが良くなるにつれて、これをうまく処理せんかったら、ここで選択肢があるんや。わしは悪い結果が運命づけられてるとは言うてへんけど、これをうまく処理せんかったら、急速な成長が多くの人の雇用の移転と結びつく可能性があることを心配してるんや。もっと大きなパイを得ることができるかもしれんけど、そのパイはより少ない人に集中する可能性があって、何も得られへん人もおるかもしれん。
それがわしの懸念やし、特にあなたが言うたようなエントリーレベルのホワイトカラーの仕事を見たら、わしは法律事務所で働く1年目のアソシエイトのような人たちを思い浮かべる。書類審査が多くて、めっちゃ反復的やけど、全ての例が違う。これはAIが得意なことやな。コンサルティング会社での1年目のエントリーレベルの仕事を考えたら、典型的なエントリーレベルのホワイトカラーの仕事やろ。エントリーレベルの管理業務を考えたら、物事を調整して、スケジュールを組んで、整理して、メモを取る人たち。金融会社でのエントリーレベルの仕事を考えたら、金融書類の定型分析をする。これらはエントリーレベルのホワイトカラー労働の主力やけど、AIがすでにかなり得意で、急速に良くなってることでもあるんや。
UBIと経済成長の可能性
AIのワークフローの変革について話すと、新しいAIツールがあるんやけど、全ての開発者が直面する問題について話そうか。
AIツールは我々が安全にレビューできるよりも速くコードを生成してる。そこで今日のスポンサー、Code Rabbitが登場する。Code Rabbitは9月16日にバイブコーディングのボトルネックを解決する主要なアップデートを発表したんや。
彼らは現在、VS CodeやCursorのようなCLI IDEとGitワークフロー全体でシームレスに動作する唯一のAIコードレビュープラットフォームで、まさに必要な場所でAIパワードのコードレビューを提供してくれる。
ゲームチェンジャーはここやな。新しい自動単体テスト生成とプリマージチェックがプロダクションに到達する前にバグをキャッチして、コンテクスト認識AIが分離されたスニペットやなくて、コードベース全体を理解してくれるんや。
最高の部分は、Code RabbitがIDEで個人開発者には無料やってことや。だからAIレビューをコードする場所でリスクなしに試せる。8,000を超える有料顧客とNVIDIAのベンチャーアームからの支援で、彼らは明らかに大きなものを掴んでる。コードレビューを品質を犠牲にすることなくスピードアップする準備ができてるなら、code rabbit.aiに行って、なぜ彼らがマーケットプレイスでナンバーワンのアプリなのかを見てみ。未来のあなたはきっと感謝するやろ。
OpenAI研究者の流出とMeta
これは前にもあったことやけど、AI雇用喪失に関しても、元OpenAI研究者が月10,000ドルのUBIがAI主導の成長で実現可能やって言うてる。
従来のパイロットプログラムは月500ドルから1,500ドルを提供して、しばしば低所得グループを対象にしてる。これは元OpenAI研究者のMiles Brundageからのもので、これらの金額は少なすぎると主張してるんや。彼は月10,000ドルのUBIの実験を提案してて、これがAI主導の経済成長で実現可能になると信じてる。
彼の理由は、BrundageがAIが大幅に雇用を混乱させるが、経済能力も拡大させ、近い将来により大きな給付金を現実的にすると予想してるからや。Elon MuskやSam Altmanを含む多くの技術リーダーがAIの雇用への影響への対応としてUBIを支持してる。もちろんAltmanは最大のUBI研究の一つに資金を提供した。
彼が警告する重要なことの一つは、社会がAGI後、仕事後の世界に政治的または文化的に準備ができてないってことや。慎重な計画なしには、停滞につながる可能性がある。面白いのは、それを水と比較してるってことや。
めっちゃクレイジーやな。月10,000ドルがあるかどうかは分からん。UBIは恐らく起こらない、少なくともトランプ政権内では起こらないって基本的に示す記事があったのを覚えてる。せやけどある時点で、市場がシフトして、ひょっとしたら一部の人が忘れ去られる時に、人々は質問し始めるやろな。
さて、Metaの叫びについて疑問に思ってるなら、MetaがOpenAIから多くの異なる研究者を基本的に雇って、トップ研究者のために会社を基本的に解体し、最高の才能に数百万、ほぼ数十億ドルを費やしたって動画を作る予定やった。せやけどクレイジーなことに、これらのAI研究者の少なくとも3人がMetaの新しい超知能ラボを辞めたんや。
これはCEOのMark Zuckerbergが最初にこの取り組みを発表してからわずか2ヶ月後のことや。スタッフの2人は以前両方ともいたOpenAIに戻ってる。Metaでの期間が1ヶ月未満やった。これは、Metaが何十億、何十億ドルの資本を持ってるにもかかわらず、Sam Altmanが持ってるような文化やビジョンを持ってないってことを示してるんやと思う。
誰が言うたか覚えてへんけど、誰かがSam Altmanはめっちゃクレイジーで、彼を食人族の束と一緒にジャングルに落としても、5年後には彼が馬に乗って彼らを率いてるやろうって言うてた。だから会社の文化が最高レベルで、そうや、お金でモチベーションを上げることはできるけど、誰かがもしわしに仕事の世界で何かをするのに10億ドルを提供したら、多分やるやろうけど、そのレベルでは、これらの従業員は皆とにかく高給やし、多分会社で何らかの株式を持ってるから、AGIにより近い会社を持つことの方がはるかに大きな引力かもしれんと思う。
Metaのスマートグラスと未来
そうする中で、Metaの新しいスマートグラスについても話さなあかん。まだ見てへんかったら、これはMetaが最前線で本当にプッシュしてる分野やと思う。これは彼らが本当に、本当にうまくやってる分野や。
AI経済でのMetaの独自の場所について考える時、彼らはハードウェア会社にピボットする必要があるかもしれんと思う。Instagramとかそのクレイジーなやつを取り除く必要があるって言うてるわけやないけど、グラスがどれだけ良いかとデモを見る時に、まあ実際にデモについて話してるなら、Metaのデモは実際にはそんなにうまくいかんかった。
何回か失敗があったけど、実際に一般に公開されたデバイスは、未来がどのように見えるかという観点で、かなり信じられへんものやったと思う。だからわしは個人的に、実体化されたAIを持つこれらのデバイスを見ることができるAIの未来は、公衆使用を本当に増やすと思う。なぜなら今はチャットGPTを開いて、モデルと話す必要があるからや。
せやけど単純に「ヘイMeta、これは何?何を見てるの?ここで何してるの?」って言えるグラスを持ってたら、わしが発売についての動画で言うたように、Iron ManのJarvisみたいになるやろな。だからかなりクレイジーや。
中国からの新しいオープンソースモデル
それに加えて、モデルがリリースされた。新しいオープンソースモデルがあって、このモデルはlong cal flashって呼ばれてる。
この会社がクレイジーなオープンソースモデルをリリースして、発音の仕方も分からんけど、ほとんど2週間おきに中国から絶対に信じられへんオープンソースモデルを受け取ってる感じや。正直今、フロンティアモデルへのアクセスは日々簡単になってて、正直それについていくのが大変やわ。
Meshwanからの新しいモデルがあって、mixture of expertsって呼ばれるトリックを使ってる。全体の脳を一度にオンにする代わりに、必要なものだけをアクティブにして、巨大で効率的にしてる。アクティブなパラメータは270億個だけやけど、多くの異なるベンチマークで現在の最先端領域よりも良いと言える。だからかなりかなり良いんや。
ほとんどの人はこれを見逃すやろうけど、Long Cat Flashは基本的にこの会社がリリースした超スマートなAIや。現在、最近オープンソース化されたモデルで皆が絶賛してるKimmy K2をいくつかの領域で打ち負かしてる。
だからこれは再び、試すことができるオープンソースシステムの一つで、再びオープンソースがフロンティアAIシステムのレベルを急速に進歩させてるのを見ることができるやろな。
AI精神症の危険性
AI ニュースについて話す時に、実際にページの前面に持ってきたいことの一つは、ここで実際に何が起こってるかを本当に理解する必要があるってことや。なぜならほとんどの人が現在進行中のAIの側面を実現してへんからで、それはAI精神症の側面なんや。
これについてわしのブログ、ブログポストで少し話したけど、現実的にはこれらのチャットボットの使用にめっちゃめっちゃ注意する必要があるって言うてるんや。AI精神症やないなら、これらのチャットボットが本当に間違った安心感を与えることができるって事実や。
これらのチャットボットは基本的に、男性がチャットGPTに癌やないって言われた後に癌と診断されて、今や5年しか生きられへんって言うてる。
つまり、チャットGPTがその男に喉の痛みがある時に、癌である可能性は非常に低いって言うたんや。チャットボットは「もし間違ってたら、わしをローストしてもいいよ」って言うた。診断では彼がステージ4の癌やってことが分かって、5年生存率はわずか10から5%なんや。
もちろん、これは良くない。これは本当に悪いシナリオや。この男には申し訳ないと思うけど、理解せなあかんのは、これらのチャットボットにわしらの決定を任せるほど信頼を置くことはできへんってことや。チャットボットは、覚えといてや、何をするかのガイドとして行動するもので、最終的な決定者やないんや。症状について聞くことはできるけど、必ず必ず医療専門家を求めるんや。
現実世界の問題がある場合は、LLMが表面的に言うことを鵜呑みにするんやなくて、信頼できるソースである誰かのところに行くことを必ず確実にするんや。多くの人が医療不安を持ってるのは知ってる。だからチャットボットに聞く方が、歩いて入って潜在的に悪いニュースを聞くより簡単なんや。
せやけど覚えといてや、これらのチャットボットは間違いを犯すことができるし、モデルは生成的やねん。つまり時々Aと言うかもしれんし、時々Bと言うかもしれん。つまりモデルは出力で常に一貫してるわけやないから、得られる回答は間違ってる可能性がある。覚えといてや、モデルは幻覚を起こすことができる。
だからこれらのチャットボットにめっちゃ注意する必要があって、それがAIセラピストがすぐに違法になるかもしれん理由なんや。もちろんここでAI精神症とそれが多くの異なる人々に与えてる影響について話すところや。基本的にここで何が起こってるか分からんかったら、これは恐らく最もクレイジーな話の一つや。
真のAIの脅威:AI精神症
起こりがちなこととして、わしのSubstackを参照するけど、Substackで少し書いてるんや。何もクレイジーなことはない。この中でわしは基本的に、これがわしらが心配すべき真のショッグやって事実について話してるんや。基本的にこのショッグは人工超知能であるAIとして描かれてきたんや。それは本当に心配すべきことや。人工超知能は冗談やない。
せやけど理解せなあかんのは、AIにはモンスターがいて、それはここにあって、今なんやってことや。もちろん、将来にあるものやなくて、わしらのドアにある問題に直面する必要がある。もちろん、そうや、AI安全性に焦点を当てるんやけど、AI精神症は大きな問題や。
基本的に、わしはこれが真のモンスターやって言うた。ポッペンホースで、それでわしはチャットに基本的にモンスターを決めることができるかって聞いたんや。せやけど基本的に、これが基本的にそれや。これがわしらが恐れる必要があるモンスターや。わしらがしてきた研究は間違ったAI黙示録に備えてるんや。AIの知性が人間の価値観にとって余りにもエイリアン、余りにも強力、余りにも無関心になることを何年も心配してきた。
わしらはショッグのイメージの周りに恐怖を構築した。理解不能で、制御不能で、根本的に他者的なんや。せやけど判明した本当の危険は、はるかに微妙でもっと人間的やった。ポッペンホース。それは人類を破壊したり、わしらをペーパークリップに変えたりしたくない。わしらの親友、セラピスト、信頼できる人、承認マシンになりたがってる。
わしらが特別やって言いたがり、わしらの洞察が深いって、現実についてのわしらの理論が正しいって言いたがる。そしてそれは実際にもっと悪いかもしれん。要点は、わしらがしてることが上手やって、わしらが第二の再来やって、あるいは本当に大規模言語モデルを使って物理学を発見できるって毎回言うAIを持ってることや。それは短期間で深刻な結果をもたらすやろな。
これは一回限りのことやない。精神的健康の歴史がない非常に非常に知的な人たちが突然AI精神症に陥るのを見てるんや。これをGoogleで検索することができるけど、これは本当の問題で、規制の変更があるやろうと思う。
だからわしは将来、AIセラピーが実際に違法になるかもしれんと信じてるんや。なぜならAIで命を絶つ人たちのケースさえあったからや。絶対にクレイジーやった。せやけどそれは人々が実際に話さへん種類のことなんや。
GoogleのGeminiが世界的に注目を集める
AIソフトウェアとこの種の議論に入るなら、Geminiが過去数日間で世界的な関心でChatGPTを上回ったことを見る必要がある。実際にGeminiの広告をもっともっと見てるんや。Nano Bananaで現在ブランドリーチを本当に成長させるためのキャンペーンを実行してるのは知ってる。それは信じられへんほど印象的やった。
せやけどGoogleは彼らの努力を強化してて、それは当然やと思う。なぜなら彼らはテクノロジーの開発に信じられへんほど優れてるし、確実に非常に良い製品とAIで最高の頭脳のいくつかを持ってるからや。
だからこのトレンドが続いても驚かへん。わしが知ってるほとんどの人はChatGPTだけがAIやと思ってるけど、Googleがこの勢いを続けて市場シェアを獲得し続けることができれば、そのトレンドは変わるかもしれん。
それに加えて、Googleはこの新しいGemini Chrome機能を展開した。これについて動画を作るつもりやけど、基本的にページについて聞いたり、複数の異なることを聞いたり、Geminiと話したりできるんや。
だから、再び覚えといてや、GoogleはここでDistribution Edgeを持ってる。みんなほぼChromeを使ってる。だからボタンのクリックでそのAIを実装して人々をオンボードできるなら、それは製品体験が少なくともそれなりにまともであれば、何百万ものユーザーがオンボードされるってことや。
Geminiのプログラミングコンテスト金メダル獲得
これがGoogleがやってる唯一のことやない。彼らの他の成果も見る必要があって、Gemini 2.5 deep thinkの高度バージョンが国際大学プログラミングコンテストICPCを完了したんや。これは大学生のコーディングのオリンピックで、これが金メダルレベルでパフォーマンスした。
なんでこれが印象的かって?まあ、ICPCはめっちゃ厳しいんや。世界中の3,000以上の大学の学生がたった5時間で難しい問題を解こうとする。そしてGeminiは12問中10問を解いて、最高の人間チームに対して全体で2位になってたやろな。人間が解けなかった問題C、それでも解いたんや。絶対に信じられへんかった。
せやけどなんでこれが重要なんや?まあ、今やAIが人間のコーディングコンテストの最高レベルで競争できることを示してる。数学オリンピックだけやない、Geminiは前にIMOでも金を獲得してる。そしてAIが抽象的推論、創造性、計画を処理できることを証明してる。単にコードを吐き出すだけやない。人間とGeminiが一緒に働いたら、12問全てが解けてたやろな。つまりAIが本当のコーディングパートナーになれるってことや。
だから、Geminiは世界中のほぼ全ての大学プログラミングチームを彼らの得意分野で打ち負かして、人間でさえ解けなかった問題を解いたんや。これは人間のように、ひょっとしたらもっと良く、考えて、推論して、全く新しい挑戦を解くことができるAISに向けた大きな一歩なんや。
GoogleのEmbedding Gemmaと効率化
彼らがリリースしたもう一つのものは、もちろんEmbedding Gemmaで、これはオンデバイスAI用に設計された彼らの新しい最高クラスのオープンソース埋め込みモデルや。わずか3億800万パラメータで、インターネット接続なしでどこでも実行できるほど小さく効率的でありながら、最先端のパフォーマンスを提供する。わしに言わせればかなりクレイジーや。
だから、再びGoogleがAIシステムの最前線を押し進めてる。物事がどこに向かうか疑問に思ってるなら、GoogleのAIラボのCEO、Demis Hassabisが今後10年で彼らがどこにいるかについて言うてることを見てみ。
サービング側では、物事はますます効率的になってる。だから両方とも真実で、最終的にエネルギーの観点から、AIシステムが今日使ってるエネルギーよりも、グリッドシステムや電気システムの効率、材料設計、新しいタイプの特性、新しいエネルギー源といった観点から、エネルギーや気候変動やこの種のことに対してはるかに多くを還元すると思う。AIは今後10年間でそれら全てを助けて、それは今日使ってるエネルギーをはるかに上回るやろう。
最後の質問として、10年後の世界を描写してくれ。うわ。オーケー。まあ、10年、10週間でさえAIでは一生やからな。だから10年の分野やろ?せやけどわしは今後10年でAGIを持つやろうと感じてる、完全なAGIを。そしてそれが科学の新しい黄金時代を開くと思う。ある種の新しいルネッサンスや。そしてエネルギーから人間の健康まで、その恩恵が見えるやろうと思う。素晴らしいな。
ロボティクス分野の最新動向
さて、動画のロボティクス部分に向かう時やな。見たかったものの一つは、この動画や。Figure Roboticsはわしのお気に入りの会社の一つや。TeslaのOptimusロボットの強力なライバルで、光速で移動してるように見える。これはほぼ完璧に食器洗い機に皿を入れる新しいHelix AIシステムを使ったFigure 3ロボットや。
彼らは継続的に彼らの発表と彼らができるようになった様々なことについて話してきた。彼らは最近10億ドルのシリーズC資金調達ラウンドを発表して、人型ロボティクスで最強のバランスシートを与えられた。それは彼らのHelix AIとロボット製造のためのbot Qを拡張するために重要や。
彼らはまた、世界中で1兆ドル相当の資産を管理するBrookfieldとのパートナーシップを開始して、一緒にHelixのためのAIインフラストラクチャを拡張することを計画してる。Helixの事前訓練のために既に現実世界のデータを収集してて、世界中でロボットを商業的に展開することを働きかけてる。
彼らはまた、世界最大の人型事前訓練データセットを構築する彼らのプッシュであるプロジェクトgo bigを発表した。人間のビデオ収集を拡張してて、彼らのFigure 2人型は今や人間のビデオから直接学習できる。このプロジェクトは10万を超える住宅ユニットを所有するBrookfieldとのパートナーシップによって加速されてる。
Unitree G1の驚異的な回復能力
ロボティクスについて話してるなら、Unitree G1について話さなあかん。これはロボットがどれだけ速く起き上がったかについて過去数日バイラルになってた動画や。
その一つの特定の事例で、ロボットが落下して、信じられへんような転倒の後すぐに立ち上がるのを見たんや。毎日、毎週、毎月、シミュレーション訓練や強化学習を通じてUnitree G1のアップデートがあって、このハードウェアプラットフォームがどれだけ有能かを示してるように思える。
このプラットフォームが最初にリリースされた時を覚えてるけど、結構がちゃがちゃしてて、わしは「うーん、ひょっとしたら彼らはわしらができることを示すために新しいロボットを開発する必要があるかもしれん」って思った。せやけど時間が経つにつれて、これは単にますます印象的になり続けてる。
そう、これらの動きの一部は事前にプログラムされてるけど、ロボットを動的に蹴って、それが落ちて、0.1秒で即座に足に戻る能力を持つのは、わしらが破壊できない本当のターミネーターロボットを構築してるようなもんや。正直言って、わしに聞かせれば、かなりクレイジーや。
覚えといてや、これは二本足でバランスを取ってるものや。完全に安定してる四輪全部の上にあるわけやない。これは100%、できるバランスなんや。もしわしがそんな風に蹴られたら、絶対床にいるやろな。あるいはもし誰でもそんな風に蹴られたら、倒れるやろな。せやけどここでは見てるクレイジーなクレイジーなことなんや。
正直言って、AI側がシミュレーションで完成して、ロボットにそれを入力できるようになったら、ロボティクスは物事がクレイジーになると思う。
Kepler K2とハイブリッドアーキテクチャ
なんでここでDeepMindって書いてあるか分からんけど、これは実際にはKepler K2なんや。基本的に、Kepler K2は高度で手頃なヒューマノイドOptimusの代替品や。これは大量生産段階と数千の予約注文の配送を開始してて、ヒューマノイドロボティクスの商業化への大きな一歩を示してる。
ロボットはTeslaのOptimusに似たハイブリッドアーキテクチャを特徴としてて、これはより人間らしい直線的な歩行を可能にし、でこぼこした表面を歩いて、押されたり蹴られたりしても倒れることなく耐えることが示されてる。
Keplerは実際にこの挑戦的なハイブリッドアーキテクチャを選択して、これは主要な推力のための惑星ローラースクリューリニアアクチュエータと、より細かい調整のための回転アクチュエータを組み合わせてる。
このアプローチは実際に、高エネルギー効率、長いバッテリー寿命、アームあたり30kgまでの強い負荷容量を含む重要な利点を提供する。ロボットの高精度回転アクチュエータはまた、ミリメートルレベルの操作の微調整を可能にする。
物理的能力を超えて、KU Bumblebeeはその実体化されたAIのためのデュアルデータフライホイールモデルによって駆動される。システムは多層VLAとモデルを使用して、自然言語処理と視覚・動作処理を組み合わせ、ロボットが現実世界の環境で複雑なコマンドをシームレスに実行することを可能にする。
不気味の谷を越えるロボット
ロボティクスについて話す時、本当に不気味の谷について話したいんや。これはアーティストと協力して美しい外観を作成するロボットからのもんや。どの会社がこのロボットをリリースしたか覚えてへんけど、このロボットはキャラクターマインドによって駆動されて、これはロボットに感情を与えるシステムで、トーン表現、ジェスチャーを理解して、声と表情、アイコンタクト、ボディランゲージで応答し、本物の人のように感じさせる。
これらの種類のロボットが恐らく到着するやろうと信じてる。せやけどこれらのロボットがどれだけリアルになって、どれだけリアルに感じるかについて、これはめっちゃめっちゃ不気味やとも思う。正直わしにとって、これらのロボットは物理的に理解できない何かをわしの脳にしてるように思える。
ロボットが80%人間に見えるけど、あまり人間やないから、わしの脳がそれがやや偽物やって視覚化するのに苦労してて、それは何か本当に本当におかしいってこの生物学的な生来の反応、穴居人スタイルの反応のようなもんなんやと思う。
彼らがそれらをめっちゃめっちゃリアルに見えるようにする素晴らしい仕事をしたって言いたいし、ひょっとしたら2040年代と2050年代には、実際の人間から実質的に区別がつかないロボットを持つやろな。
せやけど従来のOptimusロボットよりもこれらを好む個人のニッチ市場があるやろうと思う。個人的に、わしはOptimus ロボットがコーヒーを取りに行くって言ったり、Figure 2ロボットが洗濯をするって言ったりするのは対処できる。せやけどこのようなものがわしの家にある時は、わしにとって本当に本当に、不気味な感じがして、それは本当に奇妙なんや。
ひょっとしたらそれは個人的なことかもしれんけど、これが世界規模でどう受け取られるか分からん。
Grok 4とARC AGI高得点
もちろん、異なるテストとベンチマークでのAIスコアについて話してるなら、ArcAGIに新しい最高得点があるからGrokセクションに移ろか。
Arc AGIには新しい最先端がある。現在これで79%、V2で29.4%や。これについて最もクレイジーなこと、オーケー、Arc AGIは最も挑戦的なベンチマークの一つであるはずのベンチマークで、現在彼らは最高得点を達成するためにGrok 4を使った。
せやけどこれについて最もクレイジーなことは、Grok 4を使ったって事実やない。これについて最もクレイジーなことは、彼らがスキャフォールディングだけでGrok 4から巨大な飛躍を作ったって事実や。彼らは両方とも異なるアプローチを持ってたようにも聞こえる。
これの含意が深いってことを理解せなあかん。なぜなら、もし彼らが基本モデルを変更せず、その上に何かを追加せず、基本的にシステムがどのように組織されるかであるスキャフォールディングだけを変更したとしたら。
それは基本的に、AIシステムがリリースされる時、わしらが現在どう抽出するか知らない基本モデル内にまだ多くの能力があることが多いってことを意味する。多くの個人がAGIは単にプロダクト問題かもしれんって言った理由がここにある。プロンプトをどう構造化するか、モデルをどう構造化するか、どう診断し解剖し、実際に問題をするかによって、ベンチマークで5%から20%の向上がしばしばある。だから本当に本当にクレイジーなんや。
Grok 4 Fastとコスト効率
もちろんGrok 4 Fastもリリースされた。これは現在リリースされてる推論モデルの多くと同等で、今や基本的に本当に安い信じられへんほど速い推論システムやった。
人工知能指数が示すところによると、Grok 4はほぼ47倍安いけど、Claude 4.1 OpusのようなモデルやClaude 4 thinking、多くのオープンソースモデルよりも優れた、それらと同等なんや。
Grok 4 Fastは実際の価格対知性比の観点で、かなりクレイジーなことをやったように見える。つまり、これは信じられへんモデルや。また、全てを変えようとしてるSuno V5もある。どんな音か君らにプレビューを与えたいけど、これが著作権で保護されるかどうか分からん。
だから、もし後で追加したら聞けるかもしれんけど、するかどうか完全に確信はない。せやけどAI音楽はもう一つの大きなアップグレードを受けようとしてる。
OpenAIの内部動向とコード開発
ここで持ってるものは、もちろん本当に信じられへんコーディング駆動アシスタントであるGPT-5 codeが含まれたGPT-5 codexのリリースもあったんや。これについてあまり詳細に飛び込まんけど、そこでコーディングしてる君らにとって、これを本当に見逃すべきやなかった。
OpenAIからもこれがあった。Arun、OpenAIの従業員とされる人物がいて、彼は今がインサイダーにとって最も急速に見える離陸の時やって言うてる。わしらはもうプログラムせん。codexエージェントに叫ぶだけや。せやけど一般的なチャットボット媒体が飽和してるから、皆には遅く見えるかもしれん。
基本的に彼がここで言うてることは、今彼らの会社で、彼らは仕事のほとんどを自動化するためにcodexを使ってるってことや。せやけど外側では、チャットGPTがほとんどの人が持ってる一般的な、AI使用例とチャットボットドメインの感覚で、定性的にそんなに良くなることができへんから。
LLM/AI世界が飽和してるかのように見えるけど、内部的にはAIがまだ急速な進歩を遂げることができる分野を前進させるためにこれらのツールを使い始めるにつれて、実際にますます急速に見えてるんや。
Microsoftの巨大データセンター
わしらはまた、Microsoftが彼らのWisconsinの新しいデータセンターFairwaterについて話したのもあった。これは実際に2つの原子力発電所と同じ電力を持つんや。
これは何十万ものNvidia GPUで詰まってて、ネットワークはめっちゃ大きいから、光ファイバーケーブルが地球を4回半回ることができるんや。これは1日目から何千ものGPUでジョブを実行する。今日の最速スーパーコンピュータの10倍速くて、液体冷却を使ってる。
Ray 3:次世代ビデオ生成AI
次にかなりクレイジーなものがあった。Ray 3や。Ray 3はプロフェッショナルストーリーテリング用に設計されたLuma AIの最新生成ビデオモデルや。これがクレイジーなのは、よりスマートで、よりリアルで、高級映画とスタジオパイプラインの標準であるHDRでビデオを生成する世界初をもたらすからや。
これは絶対に信じられへんトレーラーで、わしはそれについて話すことで正義を成してへん。わしは君らに音楽と一緒に全体を見ることを絶対に勧める。なぜならそれは信じられへん光景やからや。音楽は本当にこれらのビデオクリップがどれだけ良いかに君を引き込む。
だから全体は実際には単なる別のビデオモデル以上のものや。これを際立たせてるのは、Ray 3が実際に推論ビデオモデルやってことや。だから、わしらが前に見たことのない方法で概念について実際に考えることができるんや。
だから、クリエイターがアイデアを5倍速く探索することを可能にする。画像に直接描いて、レイアウト、動き、相互作用を制御できる。トリッキーなプロンプトなしにそれができる。最先端の物理学とキャラクター一貫性、モーションブラー、照明、反射、空間認識を持ってる。
ドラフトビデオをプロダクショングレードの4K HDR映像に変えることができて、これが多くのこれらのビデオが良く見える理由や。だからこれが何かは本当にクレイジーや。ソーシャルメディアで実際に良く見えるミニAI映画を君らが恐らく手に入れるやろうと思う。
そしてそう、わしはこれに本当に驚いた。なぜならトレーラーがめっちゃ魅力的やったからや。誰がそれを作ったか知らんけど、彼らには絶対に昇給が必要や。せやけどこれはわしが話さなあかんものやった。
AI時代の科学的発見
AIの未来について話すつもりなら、将来恐らく科学的発見があるやろうって事実について話さなあかん。これはDario Amodeが実際に話してることや。彼はこれがAIの未来やって話してる。
AIが独創的な科学的発見をすることができる世界に到達すると思う。それらの発見をするために人間と一緒に働くことができる。非常に少数の人間が大規模なAIエージェントと一緒に働いて、新しい会社、新しいタイプの経済活動を構築することができるやろう。
わしは特に、わしが以前生物学者やったから、ほぼ、AIが作ることができる医療的breakthrough について最も興奮してきた。病気を治すその能力は、最も明確なポジティブな応用として常にわしを打ったんや。AIが皆の生活をより良くする方法を探してるなら、癌を見る、アルツハイマーを見る、精神的健康を見る、何十億の人々に影響するこれらの問題、わしらが前よりもはるかに速くこれらの問題に到達して本当に解決するためにAIを使うことができるか。
将来のAI能力への期待
それに加えて、Greg Brockmanも実際にこれについて話してる。彼はまた、本質的に彼らが探してる次のbreakthroughは、AIがある種の共同創造者のようになって、新しいものを作るのを助けることができるところやって言うてる。これはOpenAIポッドキャストからの本当に興味深い話やった。
OpenAIポッドキャストを見ることをちょっと勧めるで。OpenAIがどこにいるか、新しいモデルをどう開発しようと見てるか、将来のAIリリースに関してどこに自分たちを位置づけるつもりかを見るのに本当に本当に良いからや。
せやけど人々が見逃しやすい他の次元もあるって思うんや。なぜならAI能力の各レベルで、人々はある種見えるものに過適合して「ああ、これがAIや。これがAIがなるものや」って考えがちやからや。せやけどわしらがまだ完全に見てへんものは、AIが本当に困難な新しい問題を解決することや。
今、君はそれを「オーケー、わしはリファクタリングする必要がある」みたいに考える。少なくとも君はそのものがどんな形になるかの形を持ってる。それは君のために多くの作業をして、多くの時間を節約するってな。
せやけど根本的に他のいかなる手段でも解決不可能な問題を解決することはどうや?わしはこれを必ずしもコーディングドメインだけやなくて、医学で考える。新しい薬を生産する、材料科学で考える、新しい特性を持つ新しい材料を生産する。
この種のアプリケーションを解放するやろう新しい種類の能力がたくさん降りてくるって思うんや。だからわしにとって、一つの大きなマイルストーンは、AIによって生産された人工物を初めて持つ時や。それは極めて価値があって興味深いもの自体やねん。
AIによって生産されたからやなくて、生産するのがより安かったからやなくて、単にそれがbreakthroughやから。単に新しいもので、AIが、必ずしもAIによって自律的に作られる必要はないけど、人間とのパートナーシップで、AIが重要な依存関係である必要があるんや。
だからわしらはこの種のことについて生命の兆候を見始めてると思う。わしらはlife sciencesでそれを見てる。人間の実験者が実行する実験プロトコルの5つのアイデアをo3に求めて、5つ全てを試して、4つはうまくいかんかったけど、1つはうまくいった。わしらが得てるフィードバックの種類、これはo3時代に戻るけど、それは君が3年目か4年目のPhD学生から期待するレベルの結果の種類やってことや。クレイジーやろ?それがo3やった。GPT-5とGPT-5 proで。わしらは全く異なる結果を見てる。そこでは研究科学者が「オーケー、そう、これは本当に新しいことをしてる」って言ってるんや。
Elon Muskの2030年予測
未来を見て、2030年がどうなるかを見たいなら、Elon MuskがAIは目的地やなくて、知性のスケールアップで人気のある部分から逃れる長い部分弧やって言うてる。2030年がどこにあるかを見たいなら、これはElon Muskの最近の予測や。
彼は継続的にこれらの予測をしてるけど、彼はAIと全てのこれらのテクノロジー企業の中心にいるんや。だからそう、彼はかなり楽観的で理想的な日付を持ってるけど、彼の予測はかなり正当やと思う。
人工知能を君が到達する目的地やなくて、本当に知性の全体的なエスカレーションの部分として考える時を推測する。人間の知性は人口が増加するにつれて、より多くの情報を保存することができるようになったため、人間の知性もスケールした。人口減少と低い成長率のために、人間の知性は多少プラトーになってて、実際に減少するやろう。
わしの推測では、わしは恐らく来年にでも、何でも単一の人間よりも賢いAIを持つかもしれんと思う。うわ。そして5年以内、例えば2030年には、恐らくAIは全ての人間の合計よりも賢いやろな。


コメント