この動画は、Googleが発表した世界シミュレーションモデル「Genie 3」について詳しく解説している。投稿者は、このモデルが持つ革新的な世界モデリング機能と、将来的なメタバースや仮想現実技術への応用可能性について語る。また、OpenAIのオープンソースモデル2つについても言及し、GPT-5への期待を表明している。AI技術の急激な進歩により、当初予想していた技術的な壁が存在しないことを認め、AGIの実現が予想以上に早く訪れる可能性について考察している。

GoogleのGenie 3がもたらす世界シミュレーション革命
今日は普通の退屈な火曜日やと思って起きたんやけど、特に何もエキサイティングなことはないやろうと思ってたんや。外は雨が降ってたから、外で何かするつもりもなかったし、やらなあかん仕事もあったし。それに、俺の制作チャンネル用のYouTube動画を作ってたんや。そのチャンネルもチェックしてくれよ。下の説明欄にリンク貼ってあるから。一人でAIビジネスモデルを作るっていう内容やから、説明欄を見てくれ。
そんで、その動画を作ってて、途中でMicro Centerに3Dプリンターを取りに行ったんや。Bamboo LabsのX1 Carbonを手に入れたんや。めっちゃ楽しみやで。その件についてもすぐに動画を作る予定やから、楽しみにしといてくれ。Micro Centerから帰る途中でX(Twitter)を開いたら、かなり大きなモデルのリリースが3つもあったんや。
もちろん、GoogleのGenie 3があって、OpenAIのオープンソースモデルが2つある。もうClosed AIじゃなくて、本当にOpen AIになったんやな。それから、Claude 4.1 Opusモデルも出た。ただ、このモデルにはそんなに興奮してへん。そんなに印象的やなかったし、大した改善でもなかった。俺はGPT-5の方に期待してるんや。木曜日に出ると思うんやけど。
でも、まあ、ドーパミンが大量に出てきて、今はその反動でクラッシュしてる感じや。Genieモデルを見た時のドーパミンラッシュから落ち込んでるねん。
Genie 3の衝撃的な世界モデリング能力
あのGenieモデルは本当にマインドブローイングやった。Machine Learning Street Talkの動画を見たし、他にもそれに関する動画を全部見たわ。話してる間に画面にいくつか表示するけど、実際かなり超現実的やった。俺がMicro Centerにいる間に、Googleがマトリックスを投下したみたいな感じやったからな。
もちろん、実際はそこまでやないけどな。まだまだ原始的やし、初期段階やから。でも、こういうデモを見てると、例えばこれなんかは、このニューラルネットが世界をシミュレートしてて、シーン間に連続性があるのが興味深いんや。
例えば、壁にペンキが塗られてて、視線を逸らして、また戻したら、同じペンキがまだ壁にある。この男が窓の外を見てて、周りを見回すと、木とか全部が動的に動いてる。全部がスムーズで継ぎ目がない。なかなか良い世界モデルやと思う。悪くないで。
そして全部が極めてリアルに見える。もちろん、この技術はまだ原始的な段階や。まだ大規模なオンライン仮想現実ゲームを作れるレベルじゃない。今のところはそこまでやないけど、いずれはそうなると思う。でも、マーク・ザッカーバーグがGoogleのこのプロジェクトに携わってたチーム全体を引き抜こうとしても驚かへんで。
驚かへんよ、だってメタバースを作ろうとしてるからな。でも、これはロボティクスにとって本当に役立つものになると思う。特に、デジタル世界と物理世界の間のフィードバックループがどんどん密接になっていく中で。Genieモデルを使ったシミュレーションはもっと良くなっていくと思う。
ロボティクスと現実世界への応用可能性
いつかGenie 4や5や6が出て、現実の物理法則とデジタルの物理法則のフィードバックループが非常に似たものになって、ロボットがこのデジタル領域で実際に素早く学習するようになるかもしれん。それは実際に起こりうると思う。これが俺がこのモデルで見てる大きなアンロックや。
もちろん、まだそういうことは得意やない。物理世界でロボットにやって欲しくないことを、シミュレーション世界で何かをやって完全に失敗させることで分かるようになる。「よし、これは絶対にやったらあかん」って言えるからな。だから、絶対にやったらあかんことを見つけるのは得意や。
でも、ファインチューニングや高速学習、反復に関してはまだ得意やない。でも、言うた通り、いずれはそこに到達すると思う。こういうイノベーションから人々が画期的な技術を構築する様子を見るのが楽しみや。将来的にシミュレーションやメタバースの形態に到達できるような。
これがその初期の原始的なもので、仮想現実がこういう技術によって非常に強力になることが簡単に想像できる。この2つの組み合わせが大きなポイントや。俺の意見では、この技術なしに仮想現実が大きくなることはなかったと思う。こういうワールドシミュレーションがなければ、仮想現実はそんなに遠くまで行かなかったと思う。
VRでそういうものを作るのはめっちゃ難しいからな。でも、もうここにあるし、来てるし、このワールドシミュレーションは本当に良くなっていく。いずれは、あの超SF的な「オルタード・カーボン」みたいな脳インターフェースのやつができると思う。椅子に横になって、プラグを挿して、デジタル領域に入るっていう。
OpenAIのオープンソースモデルとGPT-5への期待
それが来ると思う。嘘やない。実際、そんなに遠くないと思う。ある意味では遠いけど、別の意味では全然遠くない。もうすぐそこまで来てるっていう感じで、どう感じていいか分からん。でも、めっちゃ楽しみや。シートベルトを締めとけよ、ドロシー、カンザスはもうすぐバイバイやからな。
もちろん、OpenAIの2つのモデル、オープンソースモデルもある。1200億パラメータのモデルと200億パラメータのモデルや。ベンチマークを画面に表示するけど、なかなか印象的や。そんなにクレイジーってほどやないけど。もちろん、o3モデルやプロプライエタリモデルには勝てへん。
そんなことをしたら、かなり驚くやろうな。でも、これらが俺に教えてくれてるのは、GPT-5がかなりクレイジーになるってことや。これほど優秀なオープンソースモデルをリリースしてるなら、GPT-5は相当ヤバいことになる。200億パラメータのモデルは基本的にo3 miniみたいなもんで、これはちょっとクレイジーや。
1200億パラメータのモデルはo4 miniとo3の間くらいで、o4 miniに圧倒的に近い感じやけど、俺たちがここまで来てて、G5が木曜日に出るっていうのは、壁が見えてないってことや。最初は乗り越えなあかん壁があるかもしれんと思ってた。
いくつかあるかもしれんと思ってたけど、国際数学オリンピックモデルが検証困難なタスクで進歩を見せた時、俺が見てた唯一の壁は検証困難なタスクやった。でも、国際数学オリンピックモデルが検証困難なタスクで進歩してる。じゃあ、一体どこに壁があるんや?もう分からへん。あると思ってたんやけど。
AI加速論への転換と未来への期待
どうやら壁はないみたいや。だから、AI懐疑派の人たち、俺も部分的にはそうなりかけてたんやけど。完全にAIが何にもならへんとは思ってなかったけど、AGIがすぐそこまで来てるとは言わへん人間やった。絶対にそういう人間やった。
でも、今では、一部の人のAGIの定義やなくても、少なくとも俺のAGIの定義はすぐに解決されそうな気がしてきた。かなり超現実的や。これらのモデルは、少なくともちょっとの間はできへんと思ってた、本当に複雑なことができるようになる。
でも、今では来年には間違いなくそれができるようになるのが明らかで、俺にとってはクレイジーなことや。だから、これら全てが加速をさらに確信させてくれる。ディープラーニングで一つの扉が閉まったら、また別の扉が開くっていうことをさらに確信させてくれる。レイ・カーツワイルがいつも言ってた、加速する収益率というものは独自の意思を持ってるってことを再確認させてくれる。
一つのことが止まったら、別のことが引き継いで、そのことが止まったら、また別のことが引き継ぐ。資本主義は加速を起こさせる美しいエンジンや。資本主義がなかったら、利己的遺伝子の整合したインセンティブがなかったら、一つのパラダイムが終わったらすぐに次のが引き継ぐような指数関数的なグラフは絶対に手に入らへん。誰かが自分の個人的な利益、自分のインセンティブのためにその問題を解決しようとするからや。そんなことは絶対に起こらへん。
文字通り絶対に起こらへん。だから、俺たちが持ってるものは本当に美しいもので、全てが本当に素晴らしい。超楽しみや。俺たちは加速し続けるのは間違いない。この時点では明らかや。人々は長期的な賭けをしてる。今日、10年後まで全く実用的やないと思ってるものを作ってる人たちがいる。
でも、進歩の加速率のせいで、5年後や3年後には実用的になってるかもしれん。くそったれ、Genieモデルなんかは、こんなに早くこんなに良くなるとは思ってなかった。もうちょっと時間がかかると思ってたのに。
だから、もう何も分からへん。何を言っていいかも分からん。それでも、もし技術の応用方法を学ぶことに興味があったり、人工知能で一人ビジネスモデルを実際に構築する方法を学ぶことに興味があったら、俺の他のYouTubeチャンネルも登録してくれ。


コメント