この動画では、最新のAI業界の動向について包括的に解説している。中国のAlibaba社によるQwen 3 Maxの発表、OpenAIの営利企業転換をめぐる複雑な状況、Claudeアプリの新機能、そしてサイレントスピーチ技術やゲーム変換技術など革新的な技術の登場について詳しく紹介する。また、Apple、Nvidia、Oracle、Salesforceなどの大手テック企業の最新発表や投資動向についても触れ、AI競争の激化と多様化する技術開発の現状を明らかにしている。

最新AI技術とサイレントスピーチ
この動画はSpotterの提供でお送りします。詳細は後ほど説明いたします。私は現在サンフランシスコにいるので、いつもと背景が違って、後ろに鳥がいますが、AIニュースが盛りだくさんです。さっそく始めましょう。
まず、まるで未来から来たかのような、ほぼテレパシー的なウェアラブルデバイスがあります。これは事実上、考えるだけでそれが何を考えているかを知ることができるものです。投稿によると、これは思考の速度での無音コミュニケーションを可能にします。
仕組みはこうです。この小さなデバイスを装着して、話すような動作をほぼ模倣しますが、実際には話しません。そしてそれがなぜか、あなたが言おうとしていたことを判断できるのです。仕組みは以下の通りです。Alter Egoは、言葉が実際に声に出される前に、脳が発話システムに送る下流の微細な信号を受動的に検出します。
それはあなたが言おうとしていることだけを捉えます。決してあなたの思考を読むことはなく、あなたがコミュニケーションしたいことだけを拾い上げます。私は最近、音声AIを人間とAIの間の主要な対話層として多く話してきましたが、これがこんなにすぐにやってくるとは知りませんでした。
すぐに完璧に動作するとは思いませんが、この種の技術が機能すると仮定すれば、これはタイピングのさらに良い代替手段になるでしょう。私は音声が本当に重要だと今でも思いますが、これが機能すれば、公共の場所にいるときには素晴らしいでしょう。この技術は通常サイレントスピーチと呼ばれますが、私たちはサイレントセンスと呼ばれるブレイクスルーを成し遂げました。
サイレントセンスは、単語の口の動きから話す意図の無動作まで、発話のスペクトラム全体を拾い上げます。これを試すのが待ちきれません。お楽しみに。試したらすぐに、レビューをお届けします。
ゲーム技術の革新とQwen 3 Max
次に、Deck ArtのOasis 1.0を覚えていますか?それはDiffusionを使ってゲームを異なるスタイルに変換するシステムでした。今度はOasis 2.0があります。こちらはスイスアルプスやバーニングマンでのMinecraftです。ゲームモッドを使ってこれらのゲーム世界を交換できます。これは本当にクールに見えます。試してみて、感想を教えてください。
次に、中国のモデルが席巻しており、これからさらにそれを目にすることになるでしょう。AlibabaがQwen 3 Maxをリリースしました。これは1兆パラメータを超える2番目に知的な非推論モデルです。これはAlibabaにとって最大のモデルですが、オープンソースではなく、オープンウェイトでもありません。
これが人工分析リーダーボードでの位置です。1位はまだGPT-5 Highで、ずっと下にQwen 3 Max Previewがあり、Grok Code Fastの真下、Qwen 3の235億の真上にあります。なので、かなり良いモデルですが、クローズドソースで、比較的安価なモデルでもあります。Alibabaのリリースにおめでとうございます。
次に、どうやらOpenAIが近々、Nano Bananaの競合をドロップするかもしれません。Bananaが最近、GPT image 0721 won mini alphaを発見しました。それはストロベリー対バナナ、果物の戦いです。もちろん、それ以上のことはわかりませんが、様子を見ましょう。そしてもちろん、人工知能の法則は、一つの会社が何かをするのを見たら、ほんの数週間後に本当に高品質な競合他社が登場するということです。
AppleとAI検索エンジンの動向
次に、どうやらAppleがPerplexityの競合を構築しているようです。これはAI搭載の検索エンジンです。今のところ、Appleから成功すると思わせるAI搭載の何かを一つも見たことがありません。しかし、繰り返しますが、彼らはAppleです。すべてのデバイスを持っています。数十億のユーザーを抱えています。夢に描けるすべての現金を持っています。そして、Appleが負けていると考えてはいけません。確実に遅れていますが、それを機能させるのに十分な現金を持っています。
何が起こるか見てみましょう。実際、より良い計画はPerplexityを買収することだと思います。
Hanが新しい画像モデルをリリースしました。私たちは正式にリリースし、オープンソース化したHunan 2.1、私たちの最新のテキストから画像へのモデルです。2.1の新機能として、高度なセマンティクスが最大1,000トークンまでの超長く複雑なプロンプトをサポートし、単一画像内の複数の被写体の生成を正確にコントロールします。
正確な中国語と英語のテキストレンダリング、豊富なスタイル、そして2Kでの高い美的、高品質な生成。しかし、それだけではありません。Bite DanceがSeeddreamをリリースしました。私のチームでは内部テストを行っていますが、これは現在画像モデルの金字塔であるNano Bananaとかなり匹敵するようです。
テストしてみるつもりです。完全なテストビデオを見たい場合は教えてください。
スポンサー紹介とビデオ作成プロセス
クリエイティブなAIの取り組みが好きなら、今日のビデオのスポンサーであるSpotterをチェックしてください。私のビデオ作成プロセスについてよく質問を受けるので、探求してきたことを共有したいと思います。
これがSpotter Studioです。どのようにテストしてきたかを見せたいと思います。プロセスはSpotter Studioから始まります。アイデアに行き詰まったときは、ideas for youフィードを使ってインスピレーションを得ることができ、それは私のチャンネルに合わせてカスタマイズされています。半分形になったアイデアがあっても、Spotter Studio内のAIブレインストームを使って、それを通してアイデア化することができます。
アイデアの強い候補ができたら、アイデアバンクに入れます。そこから、私の特定のトピックでトレンドになっているキーワードと、私のチャンネルで歴史的に良いパフォーマンスを示したキーワードを見せることで、優先順位をつけるのを助けてくれます。そして、タイトルの草案にタイトルスコアを与えて、どれが最もうまくいくかを理解するのを助けてくれます。
そこから、勝利のアイデアはプロジェクトに移り、AIを使ってサムネイルのアイデアを生成することができます。パッケージング、つまりビデオのタイトルとサムネイルに本当に焦点を当てることは非常に重要です。だからこそ、Spotterはアイデアにコミットする前に、それを視覚化するのを助けるのに本当に便利なのです。
現在、Spotterは期間限定のサマーディールを実施しています。Spotter Studioの年間メンバーシップを、元の価格の80%オフの99ドルで手に入れることができます。以下の説明にリンクを載せておきます。チェックしてみて、感想を教えてください。さあ、私のビデオに戻りましょう。
OpenAIの営利転換問題
次に、OpenAIは営利企業への転換にまだ苦労しています。彼らがそれをやめたと思っていました。実際、少し前にそれをやめると言うブログ投稿を出していたのですが、また戻ってきました。Wall Street Journalによると、OpenAIの幹部は営利再編を阻止するキャンペーンに動揺しています。
彼らはカリフォルニアを離れることについて話し合っています。これは狂気的なことで、サンフランシスコエリアの単一のビルに巨大なオフィスと非常に多くの人々を抱えているからです。そして、もし彼らが去れば、全員を移転させなければなりません。
OpenAIの幹部は、カリフォルニアでの政治的精査の増大が営利企業になる努力を妨げる可能性があることへの懸念を深めており、州から出る最後の手段について議論しています。カリフォルニア最大の慈善団体、非営利団体、労働組合のいくつかが力を合わせて、スタートアップの高リスク再編計画に反対しています。
覚えておいてください。なじみのない方のために説明すると、OpenAIは非営利として始まり、その後全世界で最も重要な企業の一つになりました。そして当然、彼らは投資家に返済し、従業員が懸命に、長時間働くインセンティブを与えるために営利になりたがっています。OpenAIは非営利によってコントロールされているため、彼らは州の司法長官に、新しく作る会社が州の慈善信託法に違反しないことを保証するよう求めています。
再編の失敗は、世界で最も価値のあるスタートアップにとって破滅的である可能性があり、将来の資金調達努力と潜在的な株式公開を危険にさらします。OpenAIの金融支援者は、新しい営利企業での株式受け取りを条件に、約190億ドルの資金調達、つまり過去1年間のスタートアップの総資金のほぼ半分を条件付けています。
非常に多くの動く部分、多くの利害関係者、非常に複雑です。彼らは営利になる方法を見つけようとしており、私たちはついていって何が起こるかを見守るしかありません。
OpenAIのビジネス動向と業界の変化
さらなるOpenAIビジネスニュースとして、The Informationによると、OpenAIは2029年まででビジネスで1150億ドルを燃やすと言っています。これは確実にバブルの兆候だと言う人もいるでしょうが、いいえ、そうではありません。
これはシリコンバレーでは当然のことです。企業は収益性のある経済学を見つけるまで大量のお金を燃やし、その後狂気的に収益性が高くなります。AmazonやMeta、支配への道で大量のVCドルを燃やしてきたUberなど、これらすべての企業を見てください。
OpenAIの収益成長は、彼らが予測したよりも速く加速しています。しかし同時に、コンピューティングコストも加速しています。OpenAIは今年から2029年までの現金燃焼が、以前の予想よりもさらに高くなり、総額1150億ドルになると予想しました。これは同社が以前期待していたよりも約800億ドル高い、大幅な増加です。
しかし、見てください。ChatGPTは消費者向け人工知能の面では依然として金字塔です。誰もがChatGPTを知っており、それが動詞です。「ChatGPTしてみて」と言うのです。だから私は会社に多くの希望を持っており、彼らは大丈夫だと確信しています。
ASMLとMistralの戦略的パートナーシップ
次に、思いがけないニュースとして、ASML社が現在Mistralの最大の外部株主になっています。ASML自身によると、今日、半導体製造GPU チップ製造において世界で最も重要な企業の一つである主要半導体装置メーカーASMLは、彼らとMistralが長期協力協定に基づく戦略的パートナーシップを結ぶと述べています。
さらに、ASMLはリード投資家として、Mistral AIのシリーズC資金調達ラウンドに13億ユーロを投資しています。私は競争があることを嬉しく思います。より多くの競争があれば、消費者はAI競争から全体的な知能とコストの両面でより多くの利益を得るからです。私たちはコストの低下を望んでいます。私たちは知能の向上を望んでいます。競争は両方を実現します。
GoogleのEmbedding Gemmaとステルスモデル
次に、GoogleがEmbedding Gemmaをリリースしました。これはオンデバイス人工知能用に設計された、全く新しい最先端の埋め込みモデルです。埋め込みモデルとは何かに馴染みがない場合、基本的には自然言語、非構造化データなどのデータを埋め込みに変換することを意味し、通常はベクターデータベースに入ります。
その後、人工知能によって簡単に検索可能になります。このプロセス全体はRAG(Retrieval Augmented Generation:検索拡張生成)としても知られています。Embedding GemmaはGemma 3Nなどのモデルと連携して、高度な生成AI体験とRAGパイプラインを強化できます。
このモデルは、MTEBリーダーボードで5億パラメータ未満のオープン多言語テキスト埋め込みモデルとして最高ランキングで、オフライン優先設計です。私は企業がコンピュートをエッジに押し出すことが大好きです。
こちらがMTEBリーダーボードです。こちらにEmbedding Gemmaが見えます。より詳細にこのベンチマークを自分で見ることができるよう、下にリンクを載せておきます。
次に、2つの新しいステルスモードモデルがOpen Routerに登場しました。Soma Dusk AlphaとSoma Sky Alphaです。コンテキスト:200万トークンで、これはGoogleモデルかもしれないと思わせますが、確実ではありません。
私は実際に自分でテストしていません。他の人がテストしてまあまあだったと言うのを聞きました。しかし、200万トークンがあれば、多くのことができます。そして、それは完全に無料です。試してみて、感想を教えてください。どのようにパフォーマンスしますか?すでに使った場合は、下にコメントを残してください。
CognitionとSwixの大型資金調達
次に、DevonとWindsurfを1ヶ月ほど前に買収したCognitionの会社が、巨額の新資金調達ラウンドを発表しました。私たちはAIコーディングエージェントの最前線を進歩させるために、ポストマネー評価102億ドルで4億ドル以上を調達しました。
ソーシャルメディアパーソナリティでボクサーのJake Paulが実際にラウンドに参加しており、それについて興味深い投稿をしています。AIコンテンツクリエイターでエンジニアで、素晴らしいAI会議を開催するSwixもCognitionにフルタイムで参加しています。素晴らしいことです。この大型調達におめでとうございます。
中国モデルのリーダーボード進出
さて、中国のモデルがリーダーボードに参入し始めていると言ったことを覚えていますか?これを見てください。これはAlla Marinaで、6位にQwen 3 Max PreviewがGPT-5 Chatの下にあります。Alla Marinaによると、Gemini 2.5 Proがまだ1位です。こちらがGPT-5 High、こちらがo3で、意外にもまだトップにいます。Claude Opus 4.1です。
しかし、これを見てください。ほんの数スポット下に、オープンウェイトモデルのKimmy K2があります。私はこれらすべてのオープンソースモデルがリーダーボードにいることをとても嬉しく思っています。
だから、これらの中国企業がこれらのオープンソースモデルを出してくれることを本当に感謝しています。私たちにはオープンソースが必要で、クローズドソースがあるのも良いですが、競合としてオープンソースも持つことが良いのです。
UnityとMicrosoftの戦略転換
次に、Unityが70億ドルのIPOを検討しています。馴染みがない場合、Unityはロボティクスのカッティングエッジにいる、信じられないヒューマノイドと犬型ロボットを手がける中国企業です。
OptifusのTesla、Boston Robotics、Figure Robotなどの企業を見ると、これらはすべてロボットを構築しているアメリカ企業です。これはよりはるかに安価なロボットを構築している中国企業です。どのように比較するかはわかりません。比較するベンチマークが本当にありませんが、また、競争は良いことです。
うまく資金を調達してくれることを願っています。
おそらく誰もが予想していたニュースとして、MicrosoftがAnthropicからAIを購入し始める予定です。MicrosoftとOpenAIの大きなデカップリングが続いています。Microsoftは約1週間前に自社内製のモデルをリリースし、今度はAnthropicからも購入する予定です。
これは本当に、Microsoftの会社のほぼ始まりからの戦略でした。誰とでもパートナーを組み、誰からでも購入し、誰とでも構築し、他の誰もがその上に構築するプラットフォームを提供する。彼らはドルよりも大きな忠誠心を持っていません。
The Informationによると、MicrosoftはOpenAIの人工知能への依存を軽減する最大のステップを踏み、スタートアップの辛辣なライバルであるAnthropicを受け入れて最も重要なソフトウェアビジネスを強化しています。
Microsoftは努力に関与する2人によると、Office 365アプリの一部のAI機能にAnthropicの技術を使用するために支払いをします。この動きは、Microsoftが長年Word、Excel、Outlook、PowerPointの新機能に主にOpenAIを使用してきた後、アプリでAnthropicとOpenAIの技術をブレンドすることになります。
これは素晴らしい決断です。なぜプラットフォームリスクを持つのでしょうか?特に地球上で最大の企業の一つである場合。これは交渉戦術としても見ることができます。また、MicrosoftはOpenAIの49%を所有しており、OpenAIは営利転換にMicrosoftの承認が必要だということを覚えておいてください。もちろん、なぜそうするのでしょうか?そうすればMicrosoftを切り出し始めるからです。
だから、これらすべては狂気的な交渉戦術とビジネス戦略で、見ていて非常に楽しいです。引き続き報告していきますので、お楽しみに。
Claudeのアップデートと新機能
さて、次は簡単な話です。電話のClaudeアプリが異なるアプリに接続できるようになりました。Claudeのブログ投稿によると、あなたの許可があれば、Claudeは近くのスポットを見つけ、カレンダーをチェックし、イベントをスケジュールすることができ、すべてアプリを離れることなく行えます。
ここにあります。位置情報アクセスを与えると、マップを使用できます。カレンダーなどにも入り込むことができます。前述の通り、クールな機能アップデートです。とても良いです。
また、Claudeは現在ファイルの作成と編集ができます。これはコンピューター上ですが、会話をExcelスプレッドシート、文書、PowerPointスライドデッキ、PDFに直接変換します。
これらのAIアプリケーションがコンピューターに触手を伸ばすほど、より価値のあるものになります。そしてもちろん、一日中毎日行くプライマリアプリケーションにより多くなります。だから、Claudeからのもう一つの迅速なアップデートです。
Appleの新製品発表とAI機能
さて、Appleが今週大きなイベントを開催しました。新しいiPhone、iPhone 17 Air、iPhone 17 Max、そして新しいAirPodsを発表しました。
少し前から言っていることですが、AirPodsはおそらくAppleが人工知能を支配する最良のチャンスだと思います。非常にパーソナルです。音声AIに優れています。明らかに、SiriをアップデートするかChatGPT Voiceのような他のものを導入する必要がありますが、完璧なフォームファクターです。耳に入れます。何時間でも問題なく着用できます。
一日中持続します。そして今は、リアルタイム音声翻訳も付いています。他の言語で誰かと話すだけで、すぐにネイティブ言語でそれを聞き返すことができます。非常に印象的です。
多くの人がこれを見て「オーケー、それはクールだ」と言って、ライブ翻訳を得ることができるこの技術が本当にどれほど狂気的かを理解していない、奇妙な時代に私たちはいます。だから、Appleからのクールなアップデートです。それがAI関連で彼らが発表したことのすべてでしたが。
NvidiaとOracleの新展開
それからNvidiaが大きな発表をしました。NvidiaはReuben CPXを発表しました。これは大規模コンテキスト推論用に設計された新しいクラスのGPUです。これは大きなコンテキストウィンドウ用に作られたGPUで、非常に重要です。
Nvidia Reuben CPXGPU は、100万トークンのコーディングと生成ビデオアプリケーションを処理するために特別に構築されています。単一のラックに8エクサFLOPSのAIパフォーマンスと100テラバイトの高速メモリを詰め込んでいます。彼らはモデルのROIについても話しており、企業は1億投資するごとに50億ドルのトークン収益で前例のない規模でマネタイズできます。
彼らがそのように宣伝しているのはやや狂気的です。
次に、Oracleの株が急騰しました。私のビンゴカードにはこれがありませんでした。どうやら、Oracleが大量のAI推論を動力供給しているようです。この件については私は不意を突かれたと思います、少なくとも私は気づいていませんでした。
Oracle Corp の株は、同社がクラウドビジネスに対して積極的な見通しを示した後、1992年以来最大の上昇を示しました。これは非常に古い会社で、人工知能コンピューティングの需要をサポートする競争におけるソフトウェアメーカーの地位を固めました。
株価は最大43%急騰し、市場評価をほぼ1兆にまで押し上げました。また、Oracleはどこから来たのでしょうか?そして、それは創設者のLarry Ellisonを世界で最も裕福な人にしました。
Salesforceの新モデル発表
そしてSalesforceが独自のモデルをリリースしました。そして、どうやら非常に良いようです。これを見てください。SFR Deep Researchに会いましょう。これは、深い研究タスクを通じて推論し、検索し、コーディングできる私たちの強化学習で訓練された自律エージェントです。
SFRD 20Bは、人類の最後の試験テキストのみで28.7を達成しており、これは本当に良いです。SFRDエージェントは、事前定義されたマルチエージェントワークフローなしで独立して動作するよう訓練されています。エンドツーエンドの強化学習で訓練されており、独自のメモリを管理するよう訓練されています。
ここにあります。見てください。人類の最後の試験でKimmy Researcher o4 MiniとDeep Research with o3を上回っています。また、Salesforceがカッティングエッジのフロンティアモデルをドロップするとは思っていなかったので、また驚きの話です。
終わりに
そして再び、このビデオのスポンサーであるSpotterに感謝します。チェックしてみてください。すべてのリンクを下の説明に載せておきます。私が送ったと教えてください。
今日は以上です。ビデオを楽しんでいただけた場合は、いいねと登録をお願いします。次回お会いしましょう。


コメント