本動画は最新AI技術の動向を包括的に解説したものである。ChatGPTの新機能「Pulse」による能動的AI体験から始まり、アリババのQuen3-MaxやMetaのロボティクス技術、さらにはOpenAIとNvidiaの大規模投資計画「Stargate」まで、AI業界の重要な進展を網羅している。特に中国系AIモデルの急速な進歩と、AIが受動的存在から能動的パートナーへと変化している現状を浮き彫りにする内容となっている。

ChatGPTの革新的新機能「Pulse」が登場
最初のニュースやけど、ChatGPTから全く新しいプロダクトが出てきたんや。これ「Pulse」っちゅうやつで、AIがほとんど、いや完全に受動的やったのが、能動的になる大きな変化やな。
ChatGPT Pulseが君のためにしてくれることは、基本的に君が使ってない間の夜中に考えてくれるんや。君の会話履歴全部見て、君について持ってる記憶全部見て、君がもっと学びたいと思うかもしれへん事柄のリストを能動的に作ってくれるねん。
よっしゃ、ChatGPT開いたところやで。僕の場合はこんな感じに見えるわ。今日のPulseには、OpenAI、Nvidiaの大規模10ギガワットアライアンス、クリーンなGPUデータセンターオーバーレイ、人間の監視なしでAIエージェントが取引、こんなんが出とる。
クリックしてみると、やあMatt、君の役に立つことを表面化するためにここにおるで。毎日一回、毎日君が何が表示されるかを決めるんや。そして僕が読める色んな記事を出してくれ始めてる。
メールとカレンダーからインサイトを得る、これ許可してみよか。そうそう、見ての通り、何を残すか何を残さへんかを決められるねん。
「最新情報を教えて」をクリックしたら、実際に具体的にトピックを入力できるんや、これめっちゃええやん。それでこれらのトピック全部、明らかに僕が聞いてきたことばっかりや。
右下にちっちゃい「キュレート」ボタンがあるやん。これクリックしたら、また基本的に何でも言えるねん。株、天気、僕が興味ある話、こんなんの最新情報を教えてって。
多分メールの中に入って探り回って、毎朝最新情報くれるようお願いできるんちゃうかな。めっちゃクールな機能みたいやで。
OpenAIのブログ投稿によると、Pulseは新しい体験で、ChatGPTが能動的にリサーチして、君のチャット、フィードバック、カレンダーみたいな接続されたアプリに基づいてパーソナライズされた更新を届けてくれるねん。
何が役立つか役立たへんかをChatGPTに知らせることで、ChatGPTがリサーチすることをキュレートできるんや。こんな感じの例やね。
なんかPerplexityが自動でやってることみたいな感じやな。君が興味持ちそうなリサーチトピックや、トレンドになってることを表面化してくる。そしてChatGPTも同じことを君のためにやってくれるようになったんや。
モバイルでしか使えへんし、Proユーザーでしか使えへん。サム・アルトマンがもう示唆してたことやけど、今後数週間でリリースされる機能は計算集約的やから、そうなるって言うてたな。
LetterAIの「sleeptime compute」っちゅう研究論文覚えてるか?これなんかそんな感じやな。君が使ってへん時にAIがバックグラウンドで動いて、君のために計算してくれて、君が学びたいこと、やりたいことを見つけ出して、起きた時にそれを提示してくれる。待たなくてええっちゅうのは、AIからもっと多くを得るための素晴らしい戦略やで。
アリババの新モデルが次々登場
次や、アリババがNano Bananaより優秀なモデルをオープンソースで出したかもしれへん。それに加えて、今リリースされたばかりのQuen 2.2 Animateみたいなバリエーションもあるで。このオープンソースモデルで、信じられへんテキストから画像生成ができて、さらにアニメーション化もできるねん。
Quen 2.2 Animateで、君のキャラクターをこれまでにないくらい生き生きとさせることができるで。高忠実度キャラクターアニメーションと置き換えのための統合モデル、Quen 2.2 Animateを正式にローンチしてるんや。これめっちゃよくある、めっちゃ人気のユースケースやな。
まだ試したことないんやったら、絶対試してみ。キャラクター画像と参考動画を入れたら、ソースの表情と動きを正確に複製して君のキャラクターをアニメーション化してくれるねん。
アニメーション化されたキャラクターを元の動画シーンにシームレスに置き換えてくれる。照明と色調を自動でマッチさせて、完璧な環境統合をしてくれるんや。
試したかったらquenに行けばええで。Quen 2.5もあって、これはテキストから動画や。素晴らしいモデルたちやな。
内部でテストしてるけど、テキストから動画でもう一つ新しいモデルがKlingから出てる。これまた素晴らしいモデルやで。見てみ。
Kling AI 2.5 Turboビデオモデル、次世代クリエイティビティをターボチャージで紹介や。Kling AIからさらに安い価格でな。これ全部Klingからの動画やで。
また内部でテストしてるけど、めっちゃうまくいってる。明瞭さ、キャラクター一貫性、テキスト一貫性、全部優秀や。ターボやから、めっちゃ速いねん。
これ見てみ、特に印象的や。何かブラックホールみたいなとこを通ってる宇宙船があるように見える。アニメ、手描きのスキーヤー。これ信じられへんくらいリアルに見えるわ。
兵士の服装の細かいディテール一つ一つ、顔についた泥、ヘルメット、全部がリアルに見える。ほんまに感動するで。
Kling AI試してみ。
Windsurf IDE のスポンサー紹介
ちょっと今日の動画のスポンサー、Windsurfについて話させてもらうわ。Windsurfは今日最強のエージェンティックIDEで、開発者がソロプロジェクトからちっちゃな改造まで、何百万行のコードを持つ企業組織まで、最高の仕事をやってるとこや。
Windsurfは君を速く動かし続けるように作られてるけど、セキュリティを犠牲にすることはない。特にDevonの開発元のCognitionに買収された後はな。Windsurfチームはこれまで以上に速く出荷してるように見える。
Windsurfはより速くなった。見た目も新しくなったし、より信頼できるようになった。Deep WikiとVibeと置き換えみたいな機能も出荷してる。
WindsurfにはワンクリックのMCPストアと、ほんまに洗練されたメモリ機能も付いてくる。そしてDevonとの深い統合で、さらにパワフルになった。
このチャンネル見てくれてるんやったら、僕がWindsurfのファンやって知ってるやろ。絶対チェックしてみ。下にリンク貼っとくわ。Windsurfがこの動画をスポンサーしてくれて、また感謝やで。
アリババのQuen 3 Maxが登場
アリババからもう一つ。Quenの新バージョンがあるで。これQuen ImageEdit 25509で、また Nano Bananaに匹敵するねん。素晴らしいモデルたちや。
マルチ画像編集、単一画像一貫性、ControlNet内蔵、そしてオープンウェイト。Hugging Faceで見つけられるで。
ブログ投稿からいくつか例を見てみよか。女性がおって、男性がおって、伝統的な中国の服装で一緒にすることができる。そしてこっちはウェディング衣装で、また椅子があって、女性がおって、女性を椅子に座らせることができて、このちっちゃいコーヒーショップに入れることもできる。全部めっちゃ簡単で、めっちゃ一貫してる。
画像生成の間でキャラクターが同じに見える。めっちゃ印象的やで。もちろん、商品生成もできる。
LVのバッグがここにあるやん。この女性がおる。そしてもちろん、今彼女がバッグを持ってる。ここにちっちゃいLVのロゴが見えるやろ。元画像にあったのと同じやつや。
この美しい車がここにあって、この女性がおる。今彼女が車の隣に立ってる。キャラクターのポーズまでできる。
ここにポーズがあって、女性がおる。今彼女がそのポーズしてる。ここも同じや。同じことや。新しいポーズがあって、ほらこの通りや。
色彩化までできる。これ白黒やのに、色付きになった。めっちゃええ感じに見える。写真復元もできる。
見てみ、完全に破壊された写真が、ほぼ完璧に復元されてる。唯一ちょっと変かもって思うのは、右側のこの男の目が、破壊された画像ではカメラの方を見てるのに、新しく復元されたやつでは右下の方を見てることや。
でもそれ以外は素晴らしい。試してみ。君のマシンにダウンロードして、どう思うか教えてや。
Quenからもう一つ。Quen 3 Maxがあるで。コーディングとエージェンティックスキルを超強化してる。Quen 3 Max Instructは思考なしで、SUI Bench、ToW Bench、Super GPQA、Live CodeBench、AME 2025でトップモデルに匹敵してる。最大思考装備でツール使用とヘビーモードでデプロイされてる。
主要ベンチマークでほぼ完璧や。見てみよか。
Quen 3 Max InstructをQuen 3、Claude Opus 4非思考、DeepSeek v3.1非思考と比較してる。そうそう、Quen 3 Max Instructが圧倒してる。負けてるのはSwebenchだけや。そしてもちろん、非思考ではClaude Opusに負けてる。
Quen 3 Max思考ヘビーでPython使用は100点取った。めっちゃ印象的やな。でももちろん、Grok 4とGPT-4 Pro、両方ともPython使って、両方とも100点取ってる。
GPQAでは85.4点取ってて、GPT-4 Proの89.4点と比べてる。これ驚異的な結果やで。中国のモデルは完全に追いついたってことや。
Kimi Moonshotの新機能とGoogleロボティクス
Kimi Moonshotから「Okay Computer」っちゅう機能リリースがあった。君のAI製品とエンジニアリングチーム、オールインワンや。
チャットから、マルチページウェブサイト、モバイルファースト デザイン、最大100万行のデータから編集可能スライド。ツールでネイティブに訓練されたインタラクティブダッシュボードが手に入る。基本的に彼らのエージェントモードやな。
コンピューター使用ができる。独自の環境、Turbo K2とのチャットモードより多くのステップ、トークン、ツールがある。使うにはKimyに行って、「okay computer」ボタンがすぐそこにある。
Googleからは、ロボティクスモデル、Gemini Robotics ER1.5がある。現在、一連の体現された推論タスクで最先端で、Gemini APIやGoogle AI Studio経由で直接使える。
これロボット専用の高レベル推論モデルや。Google AI Studioで今日すぐ試せるで。
ロボット専用に作られたモデルの機能って何やろ?高速で強力な空間推論、高度なエージェンティック行動のオーケストレーション、柔軟な思考予算、改善された安全フィルターがある。
面白いことに、ロボットのベンチマークの一つは「ポインティングベンチマーク」って呼ばれてる。基本的に、何を指せって言われた後に、ロボットがその何かを指す能力や。Gemini Robotics ER1.5は50%以上のスコアを取ってる。
2Dポイントも生成できる。明らかに動画を取り込んで、見てるものにラベルを付けられるねん。ここに食器乾燥ラック、蛇口、食器洗剤、炊飯器がある。
プロンプトはめっちゃシンプルや。画像の以下のアイテムを指してください。食器洗剤、食器乾燥ラック、蛇口、炊飯器、などなど。
ここではロボットアームが物を動かしながらも、ラベルを維持してるのが実際に見える。ロボット作ってるか、ただ試してみたいだけかに関係なく、Google AI Studioでチェックしてみ。
xAIの政府向けサービスとAIスロップ検出技術
次、xAIがアメリカ政府で利用可能になった。政府向けxAIの拡張を発表して、業界をリードするフロンティアAIをアメリカ連邦政府ユーザーがアクセスできるようにした。
すべての連邦機関と部門が、僕らのフロンティアAIモデル、Grok 4、Grok 4 fastにアクセスできる。今日から18か月間、部門あたり42セントでや。
Grokエンジニアのチームを政府が僕らのAIを最大限活用できるよう支援することにコミットしてる。18か月で42セントって、めっちゃええ値段やと思うで。
次、創作やその他の文章にAIを使ったことがあるやつは、AIが段落やエッセイやツイートを書いた時にどんな感じになるか知ってるやろ。「AIスロップ」って呼ばれてるやつや。
ノースイースタン大学の新しい論文「テキストでのAIスロップの測定」によると、AIスロップを検出する方法があるらしい。
いくつかテキストの段落があって、人間の書き方の指標がある。「ドリブリング」人間の書き方の指標、クォートで囲まれた「救出された」。
もう一つ、「アダムのメディアチームはコメント要求にすぐには応答しなかった」。よっしゃ、スロップがどんな感じか見てみよか。
密度、冗長性、トーン、以前水たまりがあった地球と区域を満たした、言葉が多すぎる、修理されたハイドラントの周りでちょっと言葉が多い、都市史上最小の犯罪みたいに見せて、などなど。
そして人間の書き方の指標とスロップの指標がある。ちょっと両方混ざった感じや。そうそう、検出する方法を見つけたらしい。
検出できるんやったら、改善もできるやろ。AIスロップがもうちょっとで改善されることを本当に願ってる。創作に使いたいけど、AIが書いたってめっちゃ明らかすぎるからな。論文はここにあるで。
完全な分析してほしかったら、下のコメントで教えてや。
Metaの新しいコードワールドモデル
Metaから新しいモデルが出てきた。これはFAIRチーム、新しいアレクサンダー・ワンチームのTBDチームやない。ヤン・ルカンが率いる既存のFAIRチームや。
Meta FAIRからの新しいやつ、Code World Model、320億パラメーターのリサーチモデルで、ワールドモデルがコード生成とコードについての推論をどう変革できるかを探るために設計されてる。オープンウェイトモデルで、オープンソースでもある。
このモデルを違うものにしてるのは、既存のコードから学習してるんやなくて、実際にコードを生成して、コード実行から学習してることや。基本的にモデルがチェスをプレイする学習方法と同じや。チェスを何度も何度もプレイして、うまくいくものを見つけるねん。今度はコードでそれをやってる。
これはワールドを理解する方向により進んでて、与えられた言葉を理解するだけとはめっちゃ違う。これはヤン・ルカンのやり方そのものや。
彼は大規模言語モデルだけではAGIに到達するのに十分やないって言ってる。ワールドモデル、より良いワールド理解を持つことは、間違いなくヤン・ルカンの特徴や。チェックしてみ。下にリンク貼っとくわ。
Stargate計画の本格始動
次、新しいデータセンター建設のための5000億ドルっちゅう数字、みんなStargate計画を疑ってたけど、今実現してきてるように見える。
OpenAI、Oracle、SoftBankがStargateを5つの新しいAIデータセンターサイトで拡張してる。2025年末までに5000億、10ギガワットのコミットメントを確保するスケジュールを前倒しにしてる。
テキサス州アビリンにフラッグシップサイトがあって、テキサス州シャクルフォード郡、ニューメキシコ州ドニャアナ郡、中西部のサイト(まもなく発表予定)により多くのサイトが来る。
これらのサイトを合わせて、25,000以上の雇用を創出すると予想されてる。それだけやない。NvidiaがOpenAIに1000億ドル投入してる。Nvidiaがキングメーカーを演じてるように見える。
OpenAIとNvidiaは本日、少なくとも10ギガワットのNvidiaシステムを展開するための画期的な戦略的パートナーシップの意向書を発表した。信じられへん。信じられへん量の計算やで。
これがどうやって起こってるのか、ほんまに理解できへん。NvidiaがOpenAIにお金を渡して、OpenAIがNvidiaにチップ代を払って、両方とも収益のクレジットを得るのか、めっちゃ混乱するわ。
Oracle、OpenAI、Nvidia、CoreWeaveなどの間のこれらのラウンドトリップ支払いがどう機能するか説明するだけの分析動画を作ることを考えてる。
これらの企業全部がお互いに何度も何度も支払ってるように見える。なんか変やわ。
MetaのAI恋愛アシスタントとOpenAIの今後
次、Meta。Facebookが具体的にAI恋愛アシスタントゲームに参入してる。Facebook Datingがスワイプ疲れに対処する機能を追加してる。
デートアシスタントとMeet Cuteを導入してる。Facebook Datingの2つの新機能で、スワイプをスキップして、デートしたい人と繋がる新しい方法を提供してくれる。
デートの旅でパーソナライズされたヘルプを提供してくれる。興味と好みに基づいてより良いマッチを見つけるのを手伝ってくれて、洗練された検索とカスタムマッチ推奨を提供してくれる。
少なくともこれはAIガールフレンドやない。人々がロマンチックな繋がりを見つけるのを手伝ってくれるんやったら、素晴らしいことや。
次、サム・アルトマンが今後数週間で何が来るかについてヒントをくれた。覚えといて、今からちょうど2週間後がDev Dayや。
今後数週間で、新しい計算集約的なオファリングをローンチする予定や。関連するコストのため、一部の機能は最初はProサブスクライバーのみ利用可能になる。
分かった、テストしてみるわ。分析して、見せたるわ。僕らの意図は、サービスを広く利用可能にするため、知性のコストを可能な限り積極的に下げることや。
時間をかけてそこに到達することに自信を持ってる。でも今日のモデルコストに大量の計算を投入した時に何が可能かも学びたいねん。
一部の人はこれがSora 2が来ることを意味してると思ってる。多分彼らが持ってる最も計算集約的なモデルやからな。複数のエージェントが同時に動く、ある種の拡張GPT-4 Proバージョンかもしれへん。
まだ分からへんけど、分かり次第、君らが最初に知ることになるで。
今日はこれで終わりや。この動画楽しんでくれたら、ライクと登録を検討してくれ。


コメント