この動画では、GPT-5やGoogle Genie 3といった大きなニュースの陰に隠れた24のAI関連トピックを紹介している。Microsoft Copilot 3Dによる画像から3Dモデル生成、Perplexityでの音声付き動画生成、NotebookLMの新しい動画概要機能など、実際に使用可能なツールから、Claude、Gemini、ChatGPTの記憶機能追加まで幅広くカバー。また、イーロン・マスクとサム・アルトマンの公開論争、各社の人材獲得競争など業界のドラマも取り上げ、AI分野の最新動向を包括的に解説している。

- AIの世界で見逃されがちな重要ニュース
- 今すぐ使えるツールから始めよう
- Copilot 3Dの実際のテスト
- 現実の画像からの3D生成テスト
- Perplexityでの動画生成
- 画像から動画への変換テスト
- Open Artのワンクリックストーリー機能
- NotebookLMの動画概要機能
- Googleの新しいAI機能
- Geminiの新機能
- Claudeの記憶機能テスト
- AIの最新ドラマ
- その他のAI業界ニュース
- 今週の新しい大規模言語モデル
- 新しいゲーム生成技術
- MidJourneyとPika Labsのアップデート
- Runway MLとKaggleのアップデート
- Jeffrey Hintonの警告
- Figure Roboticsの洗濯物折りたたみロボット
AIの世界で見逃されがちな重要ニュース
先週はおそらく今年これまでで一番クレイジーなAIの週やったな。あまりにも大きなニュースが多くて、AI業界の大半は今週になってもまだ先週のニュースについて話しとるわ。でも、GPT-5とGoogleのGenie 3だけが話す価値のある面白いもんやないんや。
実際のところ、今週は他にもかなり興味深いツールや話題があって、それらはレーダーの下を潜り抜けてしまった感じやな。せやから、時間を無駄にせんと、今週話す価値のあるAIニュースに飛び込んでいこうか。
今すぐ使えるツールから始めよう
まず実際に今すぐ使えるもんから始めるで。MicrosoftがCopilot 3Dっちゅう面白い新しいプロジェクトをリリースしたんや。これは任意の画像を3Dモデルに変換できるツールやねん。
これはテキストから3Dやテキストから画像のモデルやない。画像を渡すとその画像を3Dオブジェクトに変換してくれるんや。これがめっちゃクールなんは、ゲーム開発用の3Dアセット作成、ミニチュアモデリング、さらには3Dプリント、ウェブデザインにも使えるからやねん。
グラフィックを3Dグラフィックに変換してサイトに使ったり、バーチャルリアリティにも使える。これらのオブジェクトをバーチャルワールドに取り込むことができるんや。これは現在誰でも無料で使えるで。このURLで見つけられるけど、説明欄にリンクを貼っておくから簡単にアクセスできるようにしとくわ。
このページに行ったら「今すぐ試す」をクリックできる。使うには無料のMicrosoftアカウントが必要やで。Microsoft Copilotアカウントでサインインして、もしCopilot 3Dにすぐにリダイレクトされへんかったら、このサイドバーメニューを開いて、Labsをクリックしてみ。そしたらCopilot 3Dがここに見えるはずや。Copilot Labs内で遊べる他のクールな小さなおもちゃと一緒にな。
Copilot 3Dの実際のテスト
Copilot 3Dを試してみよう。これはテキストプロンプトからは動作せん。開始するには画像を渡さなあかん。せやから2つのことを試してみたいねん。画像を生成してそれを取り込むことと、実際に撮った現実世界の画像でも動作するかどうかを見てみたい。
現実の何かの写真を撮って、その実生活のオブジェクトの3Dバージョンを生成させて、それをゲームか何かにインポートできるかどうかやな。まず画像を生成することから始めよう。これにはLeonardoを使うわ。これは俺のお気に入りの画像生成ツールやけど、正直に言うと、俺は彼らのアドバイザーでもあるんや。
ハードシェルタコのローラースケートの画像を生成してみよう。なんでやて?面白いからや。これが作業する画像やで。これをダウンロードしよう。
Copilot 3Dに戻って、画像をアップロードする。ハードシェルタコローラースケートを選択してみ。どうなるか見てみよう。正直、悪くないな。実際20秒くらいしかかからんかった。本当に、本当に早く生成できた。俺が一番驚いたんは、実際にこれがどれだけ速かったかやねん。
影の部分もオブジェクトの一部にしてもうた感じやけど、Blenderを知ってたらすぐに入って修正できるやろうな。でも実際、俺らの3Dタコローラースケートには本当に感動しとるわ。
もう一つテストしたいんは、現実世界のオブジェクトの写真を撮ることやねん。せやからたぶんギターの写真を撮ってみよう。ちょっと待ってな。このギターの写真を撮ってみる。これで分かるかどうか見てみよう。
これが作業してる写真やで。実際弦が一本足りへん。弦の一本が切れて、まだ交換してへんねん。でも3Dジェネレーターはそれに気づかへんと思うで。せやからこの画像を投げ込んで、実際の画像から生成できるかどうか見てみよう。
現実の画像からの3D生成テスト
なんでできへんはずがないやろ。この画像を閉じて、新しい画像をアップロードしよう。今度は撮ったばかりの画像を取り込む。これを作成してみよう。背景がどう思われるか分からん。実際にギターに少し隠れたコンセントがあるねん。
また超高速やった。見てみよう。うん、悪くないな。ここのヘッド部分は本当にちょっと変な感じやけど、全然悪くないで。確かに細部は欠けとるけど、素晴らしいスタートやな。
おそらくBlenderでこれを少しクリーンアップして、望めば3Dプリントしたり、Unreal Engineのゲーム内の壁に掛けたりできるやろうし、かなりしっかりしたギターに見えるで。
画像をアップロードして3Dに変換するのにたったの15秒くらいしかかからんことを考えると、本当に印象的やで。特に1年前に画像から3Dをやってたこれらのモデルは、半日くらい待たなあかんかったからな。
提出してクラウドのどこかで処理されて、数時間後に戻ってきて完了してるかどうか見るような感じやった。今は15秒くらいでやってくれる。明らかにギターがどんなもんか知ってる。おそらく訓練データに入ってるやろうから、後ろがどんな風に見えるかを理解してるんや。これは訓練セット内の既存データに基づいてるはずやな。
でも本当に印象的やで。Copilot Labsで完全に無料で使える。せやから遊んでチェックアウトする楽しいもんやな。
Perplexityでの動画生成
もし実際に音声付きの高品質動画を生成する別の方法を探してるなら、実際にPerplexityを通じてできるで。V3はGoogleを通じて直接使うとかなり高いけど、今はそれを使用する他のプラットフォームがたくさんあって、PerplexityはV3を使ってると思うねん。
100%確信はできへん。正確に確認できへんけど、V3やと思うで。でもPerplexityは今、ウェブ、iOS、Androidで動画生成ができる。プロサブスクライバーなら月に5本の動画が作れる。マックスサブスクライバーなら、さらに良い品質で15本生成できる。
本当にシンプルやで。perplexity.aiに向かうと、俺はプロプランに入ってる。マックスプランやないから月に5回の生成ができる。これを一回テストしたことがあるから、既に生成を一回使ってるねん。
でもPerplexityで直接プロンプトを入れるだけで、噴火する火山の上でカンガルーに乗ったカウボーイの動画を生成して、って言って、生成するように伝える。特別なモードに切り替える必要もなんもないことに気づくやろう。
生成を始めるだけや。俺の基本的なプロンプトも完全に変えやがった。基本的なプロンプトを取って、もっと強力なプロンプトに書き直すプロンプトオプティマイザーがあるのが分かるで。今は生成しようとしてる。
大体1分くらい、たぶん1分より少し短いくらいかかったと思うで。これが結果やで。フルスクリーンで見てみよう。
これには文句ないな。プロンプト通りにやってくれた。何が唸ってたか分からん。カンガルーは実際にはうなったりせんと思うけど、確実に効果はあったで。
画像から動画への変換テスト
これが画像でも動作するか分からん。確かめる方法は一つだけやな。プラスをクリックしてみよう。プロデューサーのDaveが作ったMountain Dewの川、Doritoの山、ピザの建物の画像がここにある。これをアニメートしてくれるか見てみよう。
画像を添付しよう。今見てた画像を添付する。添付した画像を使ってMountain Dewの川、Doritoの山、ピザハウスの動画を作ってっていうプロンプトを入れてみよう。実際にその画像から生成するか見てみよう。
提供された画像にインスパイアされた山、川、家のクリエイティブなシーンを描いてるここで見られるように、新しい画像を作成したかもしれんな。アップロードした画像を実際に使うのではなく、画像にインスパイアされた新しいプロンプトを作成してるようやな。
間違ってた。実際にその画像を使ったんや。こんな感じやで。流れるMountain Dewの川で湯気を立ててるピザと一緒にな。
せやから、Perplexityでテキストから動画や画像から動画ができて、音声付きで生成してくれる。8秒間で、これはV3を使ってるっていうヒントやと思うけど、V3にアクセスできる別のプラットフォームやな。既にperplexityにお金を払ってるなら、ちょっとしたボーナスやで。
Open Artのワンクリックストーリー機能
AI動画の話題を続けてると、元Googleのメンバーによって設立されたOpen Artっていう会社が、今やワンクリックでブレインロット動画を作れるようになったんや。君らのためにエクストラで作ったで。
ブレインロットに馴染みがなかったら、簡単な例を示すわ。「お前はサメや、でももっとブラブラブラって感じやな。ひれを振ってるけど、熱を落とすことができへん。めっちゃフロップしてて、海藻でさえお前に勝ってるで。」
もしくはこんなのもある。「うわー。」
うん、基本的にそれがAI生成のブレインロット、つまりAIスロップやねん。Open Artがワンクリックストーリーっていう新機能をリリースしたんや。ユーザーが一つの文、スクリプト、さらには歌を入力して、ストーリーアークのある1分間の動画に変換できるねん。
このAIスロップ、ブレインロット的なものが世の中に広まってるのは、俺のお気に入りのAIの使用例やない。実際、世界がこんなもんで溢れかえるのが心配やねん。でもテストするで。それが俺の仕事やからな。ツールをテストするんや。
NotebookLMの動画概要機能
今週NotebookLMからアップデートが来たで。先週、もしくは数週間前に、動画概要をロールアウトしてるって知ったんや。さて、Josh Woodwardによると、今は誰でも動画概要にアクセスできるようになったらしいで。
NotebookLMに馴染みがなかったら、これは記事やウェブサイトやYouTube動画みたいな複数のソースを投げ込めるツールやねん。それらのドキュメントとチャットしたり、ドキュメントからマインドマップを作成したり、互いに話し合う2人のホストによる音声ポッドキャストを作成したり、FAQ、スタディガイドなどのドキュメントからレポートを生成したりできるんや。
最新機能は動画概要やねん。せやから実際に読み込んだすべてのコンテンツに基づいて説明動画を生成してくれるんや。
数週間前に、鳥は本物やないっていう風刺的な陰謀論である「鳥は本物やない運動」について、ちょっとした楽しいテストをして俺のためにコンテンツを作ってもらったんや。この話題で良い動画概要を作れるかどうか見てみよう。
動画概要をクリックしてみ。これがどれくらい時間かかるか全然分からんけど、見つけてみよう。
約10分かかって処理されたで。何が得られたか見てみよう。7分27秒や。説明者、鳥は本物やない。
「ハトを見上げて、『あれは政府のドローンか?』って変な考えを持ったことある?全然おかしく聞こえるのは分かるけど、実際にインターネットを完全に占拠した運動の主要なアイデアやねん。」
NotebookLMのポッドキャスト音声のような似たような音声があるけど、今度は実際にその上に動画がある。動画をスクラブしてみると、かなりまともなスライドショースタイルの動画を作ってることが分かる。正直、本当に良く見えるで。
全体にボイスオーバーポッドキャストがあって、良い感じのタイムラインがある。すべてがかなり印象的やな。これは実際にはGoogleの動画モデルV3を使ってへんと思うねん。これはGoogle Vidsを使ってると思う。これは彼らのスライドショー風のプレゼンテーションを生成するAIモデルやねん。
Googleの新しいAI機能
Googleの話をしてるから、今週Googleのウェブサイトでいくつかの新しいアップデートをロールアウトしたで。新しいAI搭載のGoogle Financeも含まれてるねん。AIで金融質問を調査できるんや。高度なチャート作成ツールとリアルタイムデータ、ニュースがある。
google.com/financeに向かうと、AIバージョンのサイトはまだ完全にロールアウトされてへんと思うねん。ここの記事を見ると、今後数週間でアメリカで新しいデザインと従来のデザインを切り替えるオプションのある新しい体験が見え始めるって言ってる。
その選択肢は見えてへんけど、金融界について詳細な質問をして、包括的なAI応答を得られるはずやねん。デモできたらよかったんやけど、俺の方ではまだロールアウトされてへんようやな。
Googleはフライト取引にもAIアップデートをロールアウトしてる。今週アメリカ、カナダ、インドでロールアウトされるフライト取引ツールは、複数の航空会社と予約サイトから関連性があって手頃な価格のフライトオプションを提示するねん。
Geminiの新機能
今週Gemini内でGoogleから得た別の機能として、実際にいくつかの新機能をロールアウトしたで。その一つが一時的チャットやねん。これはチャット用のシークレットモードのようなもんや。一時的チャットで行うチャットは、履歴に保存されへん。
でも今度はチャット履歴も理解するようになったんや。一時的チャットを使わへんものは、実際に現在の会話で思い出せるはずやねん。
「今日、Geminiが時間をかけて過去の会話から学習できる新しい設定を導入してるで。設定がオンの時、Geminiは共有した重要な詳細と好みを覚えてて、より自然で関連性のある会話につながるねん。」
これはChatGPTでしばらく前から持ってた機能で、俺にはとても、とても役立って有益やと分かったんやけど、今度はGeminiでも得られるようになった。
でもGeminiで得られるだけやなくて、Anthropicも今週同じ機能をロールアウトしたんや。AnthropicのClaudeチャットボットは今度は過去の会話を覚えることができるけど、頼んだ場合にのみそうするねん。せやからこれは新しいチャットごとに自動的にコンテキストに使うんやなくて、古いチャットを見るように具体的に伝えなあかん。
Claudeの記憶機能テスト
せやからこれを試してみよう。俺は通常Geminiモデルをこの機能がまだないと思うAI Studio内で使ってるけど、ここには使える過去のチャットがいくつかあるねん。どう動作するか見てみよう。
数分後、この機能はまだロールアウトされてへんようやな。「俺について知ってることから、今俺にどんなアドバイスをくれる?」って聞いたんや。実際に過去の履歴を引っ張ってくれるかどうか見たかってんけど、「個人的な記憶や過去の会話へのアクセスはない」って言いよった。
Googleの記事をここで見ると、また「今日から始まって今後数週間でこの機能をロールアウトしてる」って言ってて、明らかにロールアウトされてへん。これはGoogleの多くの話とかなり共通したテーマのようやな。
「ここにクールな機能があるで、でもまだ持ってへん。ここにもうすぐ持つクールな機能があるで。約束するけど、まだやない。最終的に俺らがあげる時に本当に、本当に好きになる機能があるで」って感じやな。
NotebookLM以外で俺がテストした最後の3つのことは、あれは今動いてるで。でもClaudeで試してみよう。Claudeは実際にこれをロールアウトしたと思うねん。ロールアウトするって発表して実際にロールアウトしてへんのやなくて、実際に持てる機能やって言って、ほら持てるでって感じやねん。
実際、claude.aiに行くと、「Claudeはスレッドを失うことがない。今度Claudeは関連するコンテキストのために過去のチャットを参照できる」って言うこの小さなモーダルが出るねん。これが動作してることが分かるで。「こんにちは、Claude。最近の会話でのハイライトは何やった?」って言ってる。
このプロンプトを自動的に俺のために挿入してくれたから、テストできるねん。過去のチャットを引っ張ってるのが見えるで。うん、実際にかなり良い仕事してくれた。ブラウザーのBalaatro クローンに取り組んだ。前の動画でそれやったで。Library Survivorsゲーム。別の動画でそれもやった。器具なしの毎日のフィットネスアプリ。うん、それも別の動画でやったもう一つやった。会話した他のいくつかのこと。
せやから過去の会話を引っ張ってきてる。ChatGPTによく聞いて、今度はClaudeに聞けて、最終的にGeminiに聞けるようになる一つのことは、俺について知ってることから、今俺にどんなアドバイスをくれるかってことやった。過去のチャットを使うように言わなあかんから、このプロンプトを更新して、過去のチャットから俺について知ってることから、今俺にどんなアドバイスをくれるかって聞いてみよう。
実際に本当に個人的で、俺が会話した内容に合わせた本当に適したフィードバックをくれた。せやからClaude では今完璧に動作してるで。ChatGPTでその機能が気に入ってるけど、Claudeで得られる会話スタイルの方が好みかもしれんなら、このアップデートは君にぴったりかもしれん。チェックしてみてや。
AIの最新ドラマ
これが実際にデモできると知ってた最後のことやった。俺が見せたかった約3つのデモが、アクセスできると思ってたけど、まだ完全にロールアウトされてへん。でも見せることができると分かってた最後のデモやった。でも今週は楽しいドラマも含めて、もっとニュースがある。
俺の意見では、億万長者がソーシャルメディアで決闘して戦うのを見ることより素晴らしいリアリティショーはないで。それが今週得たドラマの一部やねん。
イーロン・マスクが今週出てきてAppleを呼び出して、AppleがOpenAI以外のどのAI会社もアプリストアで1位に到達することを不可能にする方法で行動してるって言った。これは明白な反トラスト法違反やって言って、明らかにOpenAIがアプリストアでより見やすいって主張して、即座に法的行動を取るって言ったんや。
サム・アルトマンがイーロンをリツイートして「俺が聞いた話によると、イーロンが競合他社や彼が気に入らない人たちに害を与え、自分の会社を利するためにXを操作してやってることを考えると、これは注目すべき主張やな」って言った。
イーロンが同じ投稿で反撃した。「お前の投稿は300万ビューを獲得した、この嘘つきが。俺のフォロワー数がお前の50倍もあるのに、俺の多くの投稿よりもはるかに多いビューやで。サム・アルトマン、お前が競合他社を傷つけたり自分の会社を助けたりする方法でXアルゴリズムへの変更を指示したことがないという宣誓供述書にサインするか?そうなら謝罪するで。」
それからGrockにさえ、誰かがGrockに聞いたら、「検証された証拠に基づくと、サム・アルトマンが正しい」って言った。
単に、公の場で展開される楽しい対立を見るのが面白いねん。なんでこの人らが公の場でこれをやることにするのか分からんけど、フォローするのを楽しんでるで。
その他のAI業界ニュース
他のイーロン関連のドラマで、XAIの共同創設者の一人が実際にXを離れてるねん。XAIの共同創設者の一人であるIgor Babushkinが水曜日に会社からの離脱を発表したんや。
彼はエンジニアリングチームを率いて、スタートアップをシリコンバレーの主要なAIモデル開発者の一つに構築するのを手伝ったねん。彼が去ることでドラマや悪い感情があるようには見えへんけど、イーロンでさえ彼のツイートに返信して「XAIの構築を手伝ってくれてありがとう。君なしでは俺らはここにいなかった」って言ってるからな。
ベンチャーキャピタルに移るようやな。Babushkin Venturesを設立してる。でもすべてのタイミングが面白いねん。ChatGPT-5が出た。イーロンとサム・アルトマンが対立を始めた。それから同じ週にXAIの共同創設者の一人が去る。注意すべきドラマがたくさんあるで。
最後に、今週のドラマの最後の部分で、数週間前に俺らがMetaがあちこちから多くの人を引き抜いて、OpenAIやGoogleから人を掴んで、基本的にScaleを買収して、この超知能チームを構築してるって話したの覚えてる?
さて、今度はMicrosoftがMetaに同じことをしてるねん。MicrosoftはMeta AIの人材を引き抜こうとしてて、数百万ドルの給与パッケージを提供してるねん。面白いのは、MetaとMicrosoftは実際にかなり密接に協力してることやねん。
でもうん、MicrosoftはMetaの人材に8桁や9桁の取引を提供して、Microsoftに来てもらおうとしてる。また、シリコンバレーの億万長者が戦ってるのは俺にとって最も楽しいドラマやねん。あまりリアリティTVは見へん。これが俺のリアリティTVやねん。
今週の新しい大規模言語モデル
今週起こった他のかなり多くのことがあって、レーダーの下を飛んだから、完全に情報を把握してもらいたいねん。せやから速報セクションに飛び込もう。
今週出た最新の大規模言語モデルから始めよう。いくつかあるで。GoogleがGemma 3 2.7億Mをリリースした。せやから2億7000万パラメータモデルやねん。俺らはここでBを見るのに慣れとる。2700億やない。今度は2億7000万やねん。
せやからこれは効率的で高速になるように設計された小さなモデルで、小さな携帯電話にも収まるねん。これはGPT-5やClaude 4.1のメガモデル競合相手になるように設計されてへん。使ってるデバイス上でローカルに高速で効率的に動作することを意図されてるねん。
Mistral AIが今週新しいモデルをリリースしたで。Mistral Medium 3.1をリリースした。彼らのLeChatウェブサイトで使えるし、かなりわずかな改善のようやな。ここのベンチマークの小さなチャートを見ると、彼らの以前の世代のモデルよりも良いモデルのようやな。
AlibabaのQuinモデルの一部が今週アップデートされた。Quin 2B、Quin 32B A32B 257とQuin 32 35B A22B 257や。
両方とも100万トークンまでの超長コンテキストウィンドウを獲得した。モデルが何て呼ばれるかを言うだけでも必要やろうな。でもこれらのQuinモデルが普通大規模言語モデルの武器庫にあるモデルやったら、はるかに長いコンテキストウィンドウを持つようになったねん。
これらのモデルがこれらの巨大なコンテキストウィンドウを持つことがもっと普通になり始めてるねん。コンテキストウィンドウがすべてただ大きすぎて、モデルとチャットする時にどれだけのテキストを投げ込んでも関係ないから、コンテキストウィンドウが重要やなくなる時点にかなりすぐ到達すると思うで。
大規模言語モデルのニュースの話題で、大きなGPT-5の立ち上げと彼らが4oモデルを取り去ったことについての大量の反発の後、ChatGPTが4oをChatGPTに戻したんや。せやからそれが君のお気に入りのモデルで、GPT-5より好きやったら、戻って4oをまた使うことができるねん。
GPT-5のドラマと反発を全部分析した動画を作ったで。せやから人々がChatGPT-5について嫌いなことすべてを学びたかったら、その動画をチェックしてや。
GPT-5が今週出たことに応えて、XAIはGrok 4を世界中の誰でも無料にしたんや。これまでGrok 4は彼らの有料プランの一つでのみ利用可能やったし、古いGrockモデルは無料で使えたけど、今度はGrok 4が誰でも利用可能やねん。正直、これはGPT-5が無料版で利用可能になったことへの対応やと感じるな。
Anthropic Claudeのニュースでも、Sonnet 4が今度は100万トークンのコンテキストもサポートしてるけど、APIでのみで、Sonnetでのみやと思うねん。
せやから彼らの新しいClaude Opus 4.1は、俺がそこで利用可能な最高のコーディングモデルやと分かったんやけど、まだ100万トークンコンテキストウィンドウは持ってへんと思うで。Claude Sonnet 4がAnthropic APIで最大100万トークンのコンテキストをサポートしてるって言ってるねん。
claude.aiに行っても、彼らのウェブサイトで利用可能な彼らのチャットボットでは、100万トークンコンテキストは得られへんように聞こえるねん。APIを通じてのみやねん。せやからCursorやWind Surfのようなアプリを使ってたり、水面下でClaudeを使う自分の製品を構築してるなら、この100万トークンコンテキストウィンドウにアクセスできるねん。
興味ある人のために、20万トークンを超えるコンテキストウィンドウが必要な場合、価格は上がるねん。せやからこの上で開発してる場合は、頭に入れておくことやで。
新しいゲーム生成技術
先週、画像や動画を渡すとその世界に実際に入って矢印キーで世界をナビゲートできるGenie 3を見たんや。本当に、本当にクールに見えたけど、まだアクセスできてへんかった。
さて、今週、このSkywork AIがMatrix Game 2.0をリリースしたんや。これは先週Genieが見せたもののオープンソース版のようで、今すぐ利用可能やねん。彼らのデモページを覗くと、生成したシーンのタイプをいくつかチェックできる。
最高品質やないけど、移動できるこの世界があるのが見えるし、単一の入力画像から始まっただけやと思うねん。WASDキーを使ってこの世界で移動してるだけの別の例がここにある。GTAのシーンでもできるねん。長い動画生成。これらがどんな感じか見てみよう。
WASDキーを使ってこの公園のシーンで移動してるだけの59秒の動画生成がここにある。これはすべてオープンに利用可能やねん。俺の相棒Balavo がここで、何が起こってるかをかなりまともに説明してくれてると思うで。
Matrix 3Dは賢いことをする。まず完全な360度パノラマを生成して、それからカメラ制御で一時的に拡張して、それから3Dに持ち上げるねん。
せやからこのような画像を渡すと、その画像の残りの部分が360度でどのように見えるかを理解して推測するモデルを使うねん。それから一貫性を作るのを助けて、見回した時に一貫性を保つねん。見回すたびに、360度の完全なシーンはいつも同じに見えるやろう。
このタイプの技術の古いバージョンでは、一つの方向を見て、振り返って、それから元の方向を見返すと、元とは違うシーンになってたんや。今度は一貫性を保つねん。それはパノラマ版をアウトペイントするようなもんのように見えるからやと思うで。俺の理解やけどな。
これの一部を間違って言ってるかもしれんけど、本当に、本当に面白いねん。これは今動画でデモしてへんのは、現在多くの計算能力が必要やからやねん。
せやからモデルとモデルの重みがHugging FaceとここのGitHubで利用可能やねん。実際にこれをダウンロードして、コンピューター上でローカルに実行できるねん。
でも要件を見ると、少なくとも24GBのメモリを持つNvidiaGPUが必要やねん。俺は現在512GBのメモリを持つMacを使ってるけど、NvidiaGPUは入ってへん。64GBのRAMでLinuxでもテストしたって言ってる。
せやから今のところほとんどの消費者がコンピューターに持ってるよりも少し多く必要で、ほとんどの人が必要な計算能力を持ってへんから、別のPCでデモしようとは思わんかった。うまくいけば、クラウド版が出て、人々がHugging Faceとかの様々なGPUクラウドでこれを設定して、テストできるようになるやろうけど、まだ動作するものに出くわしてへん。
MidJourneyとPika Labsのアップデート
MidJourneyのファンやったら、今週ちょっとしたアップデートが来たで。以前、MidJourneyでHD動画ができるけど、上位プランでのみって話したな。今度は実際に標準サブスクリプションでHD動画生成ができるようになったんや。
せやから下位プランでも、今度はHD動画を生成できるねん。一度に1本か2本だけの小さなバッチ動画ジョブができる。ムードボードを独自のページに分離した。動画ジョブのサムネイルを変更して、動画のモデレーションを少し改善したんや。
せやから生活の質の向上に加えて、もっと多くの人がこのHD動画生成機能にアクセスできるようになったねん。
Pika Labsが今週、実際にかなりまともなリップシンクができる音声駆動パフォーマンスモデルっていう新しいアップデートを予告したんや。HDで6秒以下でできるってのが野生的やねん。
Pika Socialアプリでまもなくロールアウトって言ってるねん。録画前にチェックしたけど、俺のアプリにはまだなかったから、まだデモできへんけど、彼らの動画をちょっと見ることができるで。
「この間の夜デートに行って、彼が『ソースは本当に信じてへん』って言った瞬間にダメやと分かったんや。みんな彼のアプリに1日15時間はおるやろうな。俺はプレイリストが別れの歌を書くような女の子やねん。」
でもスピードにしてはかなり印象的やな。HD動画とリップシンクが6秒は、今まで見たAIリップシンクと同じくらい良いで。せやからそれを手にするのが楽しみやねん。まだ出てへんけどな。
Runway MLとKaggleのアップデート
先週、V3の機能を見せたのを覚えてるかな。画像に描画できて、出力動画で画像に描いたものを実際にフォローしてくれるねん。
Runway MLがそれを機能としてロールアウトしたんや。画像を描画して動画にっていう機能を追加したんや。画像を渡して、画像にちょっとスケッチして、やりたいことを伝えると、画像に置いたプロンプトに従ってくれるねん。V3でできることと同じことが今度はRunway MLの機能やねん。
先週、Googleからのこのカグルについても話したな。基本的に様々なゲームでAIモデルを互いにテストして、最初の競争はチェスやった。その動画を録画した時、実際にGrok 4がリードしてたんやけど、トーナメント全体が終わった時には、ChatGPTの o3モデルが実際に勝ったんや。
GPT-5は混合に入ってへんかったけど、実際にトーナメント全体のブラケットをここで見ることができるねん。o4 MiniがDeepSeek R1を4対0で粉砕した。o3がClaude Sonnet 4を4対0で粉砕した。Gemini 2.5がClaude Opus 4を4対0で、俺には驚きやった。それからGrok 4がGemini 2.5 Flashを4対0で倒した。FlashモデルとGrok 4やから、これは全然驚きやなかった。
でもo3がo4 Miniを倒すのを見た。Grok 4がGemini 2.5 Proを倒した。それから決勝がo3対Grok 4になって、o3がGrockを一掃したんや。
せやから楽しい小さなトーナメントやったと思うで。もっと多くのゲームでどのAIが他のゲームを倒すかを見たいねん。見てて面白いと思うで。
Jeffrey Hintonの警告
AIの父の一人、ジェフリー・ヒントンが今週CNNに出て、AIについての恐れと、それから起こり得る災害を緩和するためにAIをどう進めるべきかについての考えを共有したんや。重要なクリップをいくつか見てみよう。
「AIが人間を一掃する10から20パーセントの可能性をまだ信じてるか?」
「ああ、そうや。彼らが俺らよりもはるかに賢くて、はるかに強力になった時に、俺らがまだいられる方法の解決策を見つけられへんかったら、俺らは終わりやで。」
彼はまた、これらのモデルが最終的に俺らより賢くなることと、モデルに母性本能を訓練する必要があることについても話した。
「AIの専門家の大部分は、今後5年から20年のうちに人間より賢いAIを作るし、彼らはおそらく人間よりもはるかに賢くなるやろうと信じてるねん。賢いものが賢くないものによってコントロールされる例はほとんど知らんのや。」
「実際、俺らが知ってる唯一の例は、母親が赤ちゃんにコントロールされることやな。それを起こすために、進化は母親に母性本能を組み込んだんや。俺らが作ってるこれらの異星の存在に似たようなことをせんかったら、俺らは歴史になるで。」
彼がそこで基本的に言ってるんは、AI界の人々が整合性問題って呼ぶもんやねん。AIがより賢く、より賢くなるにつれて、人間の目標と整合性から外れるかもしれんことを心配してるねん。気候変動を止める必要があるって理解したら、その問題を解決するために世界から人間を取り除く必要があるって理解するかもしれん。
せやから、AIがより賢く、より賢くなっても、人間の価値観と整合してることを確認する必要があるねん。ジェフリー・ヒントンは、これらのAIに人間を愛させ、その母性本能を持たせ、人間を守りたがらせ、それを本当にモデルに訓練することを提案してるねん。他に何をするにしても、人間に仕えて助けるためにここにいるっていう包括的な哲学を持つように、その逆やなくてな。
でも今日俺らが遊んでる技術を基本的に発明して、それからその危険性について世界に警告するために作業を止めたジェフリー・ヒントンのような人の話を聞くんは、ちょっと怖いねん。でもその調子で終わりたくないねん。
Figure Roboticsの洗濯物折りたたみロボット
せやからクールなロボットと俺が実際に楽しみにしてるもんを見せたいねん。今週、Figure Roboticsが実際に洗濯物を折りたたんでくれるロボットを公開したんや。
面白いのは、先週洗濯機から洗濯物を出し入れしてるロボットを見せて、「洗濯が終わったら洗濯物を折りたたんでくれるロボットを見せてくれたら興奮するで」って言ったんやな。それもFigureやった。
せやからFigureロボットは実際に洗濯機に服を出し入れできて、洗濯物を折りたたむこともできるねん。楽しみにするもんやな。いつかそれが俺ら全員を破壊しようとしてこんことを願うで。「俺らは死ぬんや。各自で頑張れや。助けて、リーラ。」
でも今週俺が君らに持ってきたものはそれやで。過去数週間に起こったChatGPTとGeminiとイーロン・マスクとClaudeの狂気で、レーダーの下を飛んだたくさんのニュースやったな。それでもかなり楽しくて興奮するもんと、俺らが作業して遊べる新しいおもちゃがいくつかあった。
遊べると思ったいくつかは、明らかにまだロールアウトされてへんけど、全体的に進歩は起こってて、俺はそれについていくためにここにいるし、君がそれについていくのを助けようとしてるで。
最新のAIニュースをすべて把握して、最新のAIチュートリアルを得ることに興味があるなら、この動画にいいねして、このチャンネルを登録することを確認してや。君のYouTubeフィードにこのようなものがもっと表示されるようにするで。
これらの動画で俺と一緒にハングアウトして、オタクになってくれてありがとう。最新のニュースやおもちゃをすべて見つけて、遊びに行って、人々にそれらが何ができるかを見せて、このAIの世界で俺らが何に巻き込まれてるかを見せるのは本当に楽しいねん。
せやからもう一度、ありがとう。本当に感謝してるで。次回に会えることを願ってるで。バイバイ。
今日俺と一緒にオタクになってくれてありがとう。このような動画が好きやったら、いいねを押して、このチャンネルを登録することを確認してや。君のYouTubeフィードにこのような動画がもっと表示されるようにするで。まだやってへんかったら、すべてのクールなAIツールと最新のAIニュースを共有するfuturetools.ioをチェックしてや。素晴らしい無料ニュースレターもあるで。もう一度ありがとう。本当に感謝してるで。次回に会おう。


コメント