Google I/Oがリーク!Geminiデスクトップアプリ、Veo 4、Qwen 3.7、Composer 2.5、Mythosが間もなく登場、ほか!AIニュース

Anthropic・Claude・ダリオアモデイ
この記事は約12分で読めます。

Google I/Oの直前リーク情報をはじめ、Alibabaの最新マルチモーダルモデルQwen 3.7、Cursorの大型アップデートとなるComposer 2.5、Anthropicの未発表モデルClaude Mythosの動向など、AI業界の最新ニュースを網羅的に解説する動画である。さらに、超低コストで訓練可能な10億パラメータの推論モデルHRMや、Boston Dynamicsの人型ロボットAtlasによる最新のデモについても紹介している。

Google I/O LEAKED! Gemini Desktop App, Veo 4, Qwen 3.7, Composer 2.5, Mythos Soon, & More! AI NEWS
🚨 Google I/O leaks are HERE and things are getting absolutely insane in the AI world right now.In this video, we break d...

激動のAI業界とGoogle I/Oのリーク情報

AI業界のこの1週間は、本当に信じられないほど激しい動きを見せています。特にGoogle I/Oの開発者カンファレンスがあと数時間後に迫っている今はなおさらです。Gemini 3.5 Flashや複数の新しいGeminiのチェックポイントが、LMSYS Chatbot Arenaをはじめ、アンチグラビティやGeminiアプリといった他のプラットフォームでも急速にテストされており、リークされたベンチマークでは大幅なパフォーマンスの向上が示されています。

また、Googleは本日Veo 4をリリースする予定であり、これは私たちがこれまでに見た中で最高のAI動画生成モデルになる可能性があります。その一方で、AlibabaがQwen 3.7を引っ提げて再び戻ってきました。これはGPT 5.5やGemini 3.1 Pro、その他多くのシステムと直接競合すると報じられている新しいマルチモーダルモデルです。さらにCursorもComposer 2.5をリリースしました。これは長期にわたるコーディングタスクに焦点を当てたメジャーアップグレードであり、より強力になっています。推論能力が向上し、指示に従う能力も以前より大幅に改善されています。

そしてAnthropic側に関しては、Google Cloud ConsoleでClaude Mythosのプレビューが最近発見され、もう一つのクラウドモデルのリリースがかなり近づいていることを示唆しています。カバーすべき内容がたくさんありますので、さっそくすべての中に飛び込んでいきましょう。もし誰よりも早く最高のAIツールやワークフロー、最新リリース情報が欲しい方は、下の概要欄にあるリンクから私の無料のニュースレターに登録してください。完全に無料です。

驚異的な進化を遂げるGemini 3.5 Flashと最新機能

まずはGoogle I/Oのリーク情報から始めましょう。数時間以内に新しいモデルがリリースされることは確実視されています。本日リリースされる可能性が最も高いのは、Gemini 3.5 FlashかProのいずれかです。そしてこれは、彼らが今年リリースに向けて取り組んでいる真の最先端モデルの一つになりつつあります。正直なところ、私が最も興味を惹かれているのはGemini 3.5 Flashです。私たちは基本底に、驚異的なスピードと効率性でProレベルに近い知性を手に入れようとしており、これは日常的なAIの利用において大きなゲームチェンジャーになる可能性があります。

例えば、私のテストの一つでは、現在Arenaやアンチグラビティ、そしてGeminiアプリに登場しているGeminiのチェックポイントを使用しました。そして、単一のプロンプトから、完全なコアデスクトップ機能、アプリ、ウィンドウ管理などを備えた、本格的なWindowsスタイルのWeb OSを一発で生成することができました。

このモデルについて現在までに分かっていることは、これが信じられないほど高速なFlashのバリアントであり、約1分間で2,000行のコードを書き出すことができるということです。つまり、手頃な価格で多くの作業をより速くこなせるようになるということです。知識のカットオフは2025年1月となっています。また、処理速度は予想よりも大幅に速いと見積もられており、現在のFlashのピーク速度の3倍から9倍にあたる毎秒900トークン以上に達していると報じられています。これまでのところ、すべての世代を通じて機能がかなり向上しているようです。

しかし、さらにクレイジーなのは、これほどのスピードの跳ね上がりがあるにもかかわらず、コーディングテストにおいてこのモデルが非常に優れたパフォーマンスを維持している点です。この新しいバリアントで完全に生成されたシューティングゲームのように、並外れた成果物を生み出すことができます。

AIエージェントプラットフォームへと変貌するGemini

これまでのGoogle I/Oのリークから分かっているのは、GoogleがGeminiを真のAIエージェントプラットフォームに変えようとしているということです。彼らはAnthropicのcomputer useに似た、Geminiのデスクトップアプリの開発に取り組んでいます。報道によると、通常のチャットモードと、ローカル環境での長期的なエージェントワークフローに特化した専用のSparkモードに分かれているとのことです。Sparkは、ローカルフォルダーへの接続、コードベースの検査、スクリプトの実行、ファイルの整理、そしてGoogle ドライブへのワークフローの直接同期が可能なようです。

また、リークされた機能としてstream to cursorというものもあります。これは、ユーザーのカーソルがリアルタイムでホバーしているアプリやUIの文脈をGeminiが理解できるというもので、間違いなくゲームチェンジャーになるでしょう。画面上に浮かぶGeminiのオーバーレイは、画面、ウィンドウ、カメラを即座に共有できます。そして、これがGeminiに提供されるコンテキストとなります。これは、Gemini 3 FlashやGemini 3.1 Proといったモデル間を急速に切り替えながら行われます。

さらにGoogleは、ユーザーがカスタムスクリプトやツールをGeminiのワークフローパイプラインに直接注入できる、ローカルスキルのサポートも準備しています。そして最後に、Gemini Liveは新しいアプリ全体で常駐型の音声オーバーレイへと進化しているように見えますが、これまでのリークを見る限り、内部的にはまだ未完成のようです。

現時点では100%確定していませんが、最近リークされたOmniモデルであるVeoモデルが本日ローンチされるのを目にするかもしれません。これはVeo 4である可能性があり、一部のユーザー向けにGeminiアプリを通じて展開が始まっています。この新しいVeoモデルは本日ローンチされる予定のようで、多くのユーザーのGeminiアプリで再登場しており、このようなポップアップが表示され始めています。本質的に、これまでにリークされた機能には、画像と動画を組み合わせる機能、ネイティブな動画編集ワークフロー、そしてAIアバター生成のサポートが含まれています。

Anthropicの次手Claude MythosとAlibabaの躍進

次に、Anthropicが現在取り組んでいることへと移りましょう。Claude Mythosが現在、Google Cloud Console内に表示され始めています。興味深いことに、このモデルのスラグからプレビューのラベルが消えました。興味深いのは、ほんの数日前までモデルのスラグにはプレビューと記載されていたのですが、現在は完全に消えている点です。また注目すべきは、Opus 4.7も一般公開される前に、最初にGoogle Cloud Consoleに登場していたという事実です。現在の内部的な説明によると、最新のClaude Mythosプレビューは限られた一部のクラウドユーザーに提供されており、glassingプロジェクトの一部であるとされています。そのため、これは間違いなくAnthropicが予想よりも早く、公へのMythosのリリースを準備していることを暗示している可能性があります。

Alibabaもまた、絶対的にとんでもないペースで動き続けています。なぜなら彼らは本日、Qwen 3.7プレビューをローンチしたばかりだからです。これにはQwen 3.7 MaxプレビューとQwen 3.7 Plusプレビューの2つのモデルが含まれており、現在ArenaやQwenのチャットを通じて急速に姿を現しています。正直なところ、Alibabaは静かに世界で最も強力なAI研究所の一つになりつつあります。彼らは現在、GPT 5.5やGemini、Opus 4.7といったモデルと比較して、テキスト生成の総合ランキングで6位前後に位置しています。Arenaのビジョン部門では5位にランクインしており、彼らがOpenAI、Google、Anthropicにどれほど速く追いついてきているかを考えると、これはちょっと異常なことです。

新しいQwenモデルの興味深い点は、単純なチャットボットのやり取りよりも、長いコンテキストの推論、コーディング、そしてエージェントのワークフローに向けて大幅に最適化されていることです。いくつかのユースケースでは、指示への追従、ツールの利用、リポジトリレベルのコーディング、および持続的なステップバイステップの推論タスクにおける改善が示されています。また、このモデルは思考モードと非思考モードのハイブリッドを持ち、より強力なツール呼び出し機能、そして特定のバリアントでは大規模なコンテキストウィンドウを備えています。

Cursorの圧倒的な進化とXAI・SpaceXの背景

先へと進みましょう、Cursorが現在完全に市場を圧倒しています。彼らが新しくリリースしたComposer 2.5は、Opus 4.7のようなモデルと同等のパフォーマンスを発揮しながら、最大10倍もコスト効率が良いと報じられており、これはちょっと信じられないレベルです。初期のテストから、Composer 2.5は持続的な長期のコーディングタスクにおいて大幅に優れた性能を示し、複雑な指示に対してもより信頼性が高く、以前のバージョンと比較して全体的に遥かにインテリジェントになっているようです。Cursorはさらに、導入が非常に好調であるため、来週にかけてComposer 2.5の利用制限を2倍に引き上げると発表しました。

しかし本当に興味深いのは、Cursorが現在稼働しているスケールにあります。人々はこれがもはや単なるコーディングアシスタントの会社ではないことに気づき始めています。CursorはXAIに買収された後、パフォーマンスとコンピューティングの両面において、フロンティアレベルに近いスケールで稼働しています。そしてこれは、言うまでもなくSpaceXのおかげです。

いくつかの見積もりによると、もしCursor 2.5の予算をすべて事前訓練に振り向けた場合、MOEモデルで約6.3兆パラメータを期待できるとのことです。これは、約56兆トークンで訓練された、約2,000億の有効パラメータに相当します。これは本当に狂っています。そして、もしCursor 3が最終的にその予算の半分でも事前訓練に割り当てれば、予測は純粋なフロンティアレベルの領域に入り始めます。総パラメータ数は約15兆、有効パラメータ数は500億に達し、訓練トークン数は100兆を大きく超える見積もりとなります。正直なところ、Cursor 2からCursor 2.5への進歩は真剣に素晴らしいものです。

ただ、これを見ていると今すぐCursorを使いたくなりますね。実際に動いている様子を見てみましょう。ここではOpus 4.7レベルの知性を驚異的なスピードで得ることができます。プレビューでタスクに対してライブで取り組んでおり、現在リアルタイムで確認できますが、Composer 2.5を使用してCursor内でコーディングを行っています。そして、基本的には高速でありながらOpus 4.7と同じ品質を保ち、新しいフロンティアレベルで機能しているように純粋に感じられます。

オープンソースUIデザインツールと1000ドルの推論モデル

最近、私はOpen Designと呼ばれるツールを取り上げました。これはAnthropicからリリースされた新しいClaude Designのオープンソース版です。そして今回、彼らはOpen Designに新機能をリリースし、それがCodex内で直接動作するようになりました。AIデザインにおける最大の難関は、明らかに適切なUIを生成できないことでしたから、Codexと直接Open Designを使用する上で、これは間違いなく大きな前進です。しかし、今ではコーディングエージェント内で直接それを行うことができます。Codexがデザインキャンバス自体と直接連動できるようになり、より良いワークフロー、より良いデザイン、そしてCodex内での直接のコーディングが可能になったからです。それがこの新しいアップデートの美しさです。

そして最後に、今週最も魅力的なリリースの一つがHRMでした。これは、従来のフロンティアモデルよりも劇的に少ない計算量と訓練データで強力な一般知性を達成することに焦点を当てた、極めて無駄のない10億パラメータの推論モデルです。しかし、これを特にクレイジーにさせているのは、この新しいモデルがわずか400億の構造化トークンだけで訓練されたと報じられている点です。それにもかかわらず、同等のシステムの約1,000分の一の訓練データを使用しながら、競争力のある推論パフォーマンスを達成しています。

しかし、ここでの最大の詳細はコストです。Sappia Intelligenceによると、モデル全体の訓練は、1,000ドルという単一の予算で、およそ1日で完了するとのことです。ええ、聞き間違いではありません、1,000ドルです。もしこれらの結果が維持され続けるなら、これはAI開発における完全に異なる時代の扉を開く可能性があります。小規模なチーム、独立した研究者、そしてスタートアップが、フロンティア規模のインフラを必要とすることなく、本格的な推論アーキテクチャを実験できるようになるのです。正直なところ、これは今後数年間で信じられないほど重要になる可能性を秘めた研究の方向性です。

Boston DynamicsのAtlasが見せる驚異の身体制御

そして最後に、本日紹介する本当にクールなものはBoston Dynamicsからのものです。人々はいつも自分に飲み物を持ってきてくれるロボットを欲しがるとジョークを言いますが、Boston Dynamicsのロボットの一つであるAtlasは、今や飲み物がある場所を指し示す代わりに、冷蔵庫を丸ごと持ってきてくれる段階に達しています。Boston Dynamicsは、AtlasがAI駆動の行動を利用して重い物体を運び、操作しながら、全身をリアルタイムでダイナミックにコーディネートする面白いデモを投稿したばかりですが、これはちょっと常軌を逸しています。これを今目の当たりにしているという事実自体が、ただただ驚くばかりです。

特に印象的なのは、ロボットがこの冷蔵庫のバランスの重さや配分、そして複雑な接触ポイントをどのように管理しているかであり、これが驚くほど正確で信頼性があります。これはもはや単に事前にプログラミングされた動きではありません。私たちは、人型ロボットが高度な物理制御と、ますます能力を高めるAIシステムを組み合わせ始めているのを目にしています。そして正直なところ、これまでの進歩はBoston Dynamicsからの一言に尽き、本当に素晴らしいものです。

もしこの動画が気に入って、チャンネルをサポートしたいと思ってくださるなら、下のスーパーサンクス機能を通じてチャンネルに寄付することを検討していただければ幸いです。あるいは、私たちのプライベートなDiscordへの参加を検討してください。そこでは、毎月無料でさまざまなAIツールの複数のサブスクリプションにアクセスできるほか、日々のAIニュースや限定コンテンツなど、さらに多くの特典を受けることができます。

ですが、本日のAIニュース動画についてはこれくらいにしておきます。今日のGoogle I/Oを間違いなく楽しみにしていますし、両方のチャンネルで皆さんへ随時情報をお届けしていきます。私のチームと私は懸命に取り組むつもりです。ですので、ぜひセカンドチャンネルを登録して、本日起こるすべてのことに遅れずについてきてください。また、こちらのニュースレターに参加していただければ、ここでもすべてのインサイトを受け取ることができます。ライブのアップデートについては、私たちのDiscordやTwitterにも参加してください。そして最後に、チャンネル登録、通知ベルのオン、この動画への高評価をお願いします。また、本日の最新AIニュースをすべて把握するために、ぜひ過去の動画もご覧ください。それでは皆さん、ご視聴いただき本当にありがとうございました。ポジティブな素晴らしい一日をお過ごしください。それではまたすぐに会いましょう。

コメント

タイトルとURLをコピーしました