Gemini Omni、Gemini 3.2 Flash、1200万コンテキストウィンドウモデル、Claudeがアナリストを代替、など! AIニュース

Google・DeepMind・Alphabet
この記事は約13分で読めます。

Google I/Oを目前に控え、Gemini 3.2 Flashのリーク情報やGemini Omniの噂など、AI業界の最新動向を解説する。1200万トークンを処理するSubQの新アーキテクチャ、OpenAIのGPT 5.5 Instantの展開、金融アナリスト業務を代替するAnthropicのClaudeエージェントに加え、GoogleのGemma 4やAI Studioの進化、Perplexityの金融分野への進出など、多岐にわたる重要なアップデートを網羅している。

Gemini Omni, Gemini 3.2 Flash, a 12M Context Window Model, Claude Replaces Analysts, & More! AI NEWS
Try your own Zapier workflow today and see how much time you can save — click the link, start automating, and make your ...

AI業界の激動とGoogle I/Oへの期待

先週のAI業界は本当に信じられないほどの展開を見せており、そのすべてが間近に迫ったGoogle IOでの大規模な新発表に向けて動き出しています。現在ABテスト中と噂されているGemini 3.2 Flashの初期の兆候が見え始めており、カンファレンス前にリリースされる可能性が非常に高いです。これは、Gemini 3.5やGemini 4.0シリーズといった、さらに大規模なフラッグシップモデルの発表に向けた布石となっています。

しかし、それだけではありません。大規模AIの分野でも大きなブレイクスルーがあり、SubQという企業が完全にサブクアドラティックなスパースアテンションアーキテクチャに基づいて構築された最初のモデルを発表しました。これは基本的に、1200万トークンのコンテキストウィンドウを処理できるフロンティアモデルを目の当たりにしていることを意味します。推論とメモリのスケールが全く異なるレベルに達しています。

OpenAI側では、GPT 5.5 Instantをリリースしました。これは、高い知能を維持しつつリアルタイム使用に最適化された、フラッグシップモデルのより高速で効率的なバージョンです。一方、Anthropicはエンタープライズ分野に力を入れており、エントリーレベルのアナリストのワークフローの多くを現実的に置き換える可能性のある、金融に特化した新機能を展開しています。

もちろん、Googleも絶え間なく新機能を提供しており、Gemma 4を大幅に高速化し、Google AI Studioをアップデートし、Gemini Omniを拡張し、さらにNotebook LMを改良して多くの新機能を追加するなど、盛りだくさんです。カバーすべき内容がたくさんあるので、さっそく本題に入りましょう。

Zapierを活用した業務の完全自動化

本題に入る前に、今日の動画のスポンサーであるZapierを紹介させてください。Zapierのエージェントは、あなたが本当に重要なことに集中している間に、9000以上のアプリにまたがる作業を処理してくれるAI搭載のチームメイトのようなものです。私が今一番気に入っているエージェントの一つがアウトリーチエージェントです。Notionのデータベースから条件に合うリードを自動的に見つけ出し、LinkedInのデータで情報を充実させ、パーソナライズされたメールを送信してくれます。私が指一本動かす必要はありません。

コピー&ペーストやタブの切り替えはもう必要ありません。エンドツーエンドですべてを処理してくれます。さらにすごいのは、私がコードを一切書いていないということです。あらかじめ用意されたエージェントのテンプレートを使っただけです。Zapierにはそうしたテンプレートのカタログ全体が用意されています。セールスコールの分析エージェントやバイラルコンテンツ作成エージェント、サポートチケットの処理など、すべてがプラグアンドプレイで簡単に利用できます。

私にとって、カレンダーがしっかり管理され、準備が整っていることを、指一本動かさずに確認できる安心感は代えがたいものです。これこそがZapierの最大の魅力です。ワークフローに溶け込み、これなしでは仕事が考えられなくなるほどです。試してみたいですか。下の概要欄にZapierのウェブサイトへのリンクを貼っておきますので、完全に無料で独自のAI搭載ドリームチームを構築してみてください。

Gemini 3.2 Flashのテストと最新リーク情報

まず初めに、私は最近Arenaでテストされている新しいGemini Flashのバリアントについての動画を作りました。それは正直なところかなり印象的なものでした。しかしそれ以来、事態はかなり急速にエスカレートしています。Google IOカンファレンスが近づくにつれて、Googleはもはや1つのモデルだけをテストしているわけではありません。彼らは複数の新しいバリアントをテストしています。そして、そのうちのいくつかは、私が以前に紹介したものよりもさらに優れていると報告されています。

現在4つの新しいチェックポイントがあります。Ajax、Hercules、Hector、そしてOrpheusです。これらはすべて現在、anti-gravity arenaやGoogle AI Studio、さらにはGeminiアプリを通じて積極的にABテストされています。そして本当に興味深いのは、私のXでの投稿を見たことがあるかもしれませんが、そこで私はGemini 3.1またはGemini 3.2のアップデートがGoogle IOカンファレンスの前にリリースされる可能性があると話しました。数人のGoogleのプロダクトリーダーが私のツイートにいいねを押したことで、そのアイデアは実際により重みを増しました。これは明らかに、そのようなことが起きているというかなり強いシグナルです。

それだけでなく、一部のユーザー向けにiOSのGeminiアプリ内でGemini 3.2 Flashが実際に発見されており、早期の展開がすでに進んでいることをさらに示唆しています。したがって、これらのリーク情報、ABテスト、内部シグナル、そしてアプリでの初期の目撃情報をすべて組み合わせると、Googleはメインイベントの場だけでなく、その前に何かを出荷する準備をしているように本当に見えます。

さて、この次期Gemini 3.2 Flashは大きな一歩のようです。なぜなら、Flashレベルの速度とGemini 3.1 Proに近い推論を組み合わせた、オールラウンドなモデルとして位置付けられているからです。これは大きな変化です。また、知識のカットオフは2026年1月であると報告されており、価格に関する多くのリーク情報もあります。100万入力トークンあたり25セント、100万出力トークンあたり2ドルと言われており、グラウンディングと検索機能が向上して、より信頼性の高い回答が得られるようになっています。

タイミングとしては、Google IOカンファレンスであれ、私が話したように数週間前であれ、すべてが5月の展開を指し示しています。そして言わなければならないのは、その知能が本当に素晴らしいということです。私たちはFlashの速度でProレベルの知能を手に入れようとしています。

動画生成に対応するGemini Omniの噂

次に、Google IOカンファレンスに向けて、もう一つ大きなリーク情報があります。これは、動画生成のためにGemini内でテストされていると報告されている新しいOmniモデルについてです。UIから流出したある一文には、アイデアから始めるか、Omniを活用したテンプレートを試してみてくださいと書かれています。Omniは、VOを搭載したGoogleの現在の動画システムに関連する内部コードネームであるToucanと密接に結びついているようであり、これは興味深いです。

もしこれが事実であれば、Googleはネイティブな動画出力を備えた完全なマルチモーダルなOmniモデルを立ち上げる準備をしており、VO 3.1のような現在のシステムを上回る可能性があることを意味します。もちろん、これはすべて推測に過ぎませんが、もし実現すれば、Geminiはネイティブに動画を生成できる最初のトップクラスのOmniモデルになる可能性があります。ええ、それはとてつもなく大きな出来事になるでしょう。もしあなたが最高のAIツールやワークフロー、そして最新のリリース情報を誰よりも早く手に入れたいなら、下の概要欄にあるリンクから無料のニュースレターに登録してください。完全に無料です。

Project Marinerの進化

Googleの話題についてですが、もう少し目立たないものの重要な出来事が起きました。それは、昨年のGoogle IOで披露されたウェブブラウジングAIエージェントであるProject Marinerを、彼らが静かに終了させたということです。しかし、これは後退ではありません。なぜなら、GoogleはGeminiアプリ内での24時間365日稼働するAIパーソナルエージェントへと、フォーカスを前進させているように見えるからです。はるかに強力で継続的なものへと向かっています。つまり、彼らは単にそれを終わらせたのではなく、実際には再進化させているのです。

1200万コンテキストウィンドウを実現するSubQの革新

次は、SubQによる大規模言語モデルのアーキテクチャにおける大規模なブレイクスルーです。彼らは、完全にサブクアドラティックなスパースアテンションアーキテクチャに基づいて構築された最初のモデルを、1200万トークンという非常識なコンテキストウィンドウと共に導入しました。ええ、聞き間違いではありません。従来のTransformerのように可能なすべての単語の関係を処理する代わりに、1200万トークンのコンテキストウィンドウを備えています。

これは、実際に重要となる関係にのみ焦点を当てた新しいモデルであり、膨大な量の無駄な計算を削減するとともに、不要なデータを取り除いています。その結果、100万トークンにおいてFlash Attentionアーキテクチャよりも最大52倍高速になっています。Claude Opusのようなモデルのコストの5パーセントを上回ります。計算量はほぼ1000分の一になります。これは単なる漸進的なアップグレードではありません。大規模モデルをスケールさせるための全く新しい方法なのです。私は彼らのスポンサーではありませんが、もしアクセスを希望する場合は、彼らのウェブサイトから早期アクセスをリクエストすることができます。

GPT 5.5 Instantの展開

次にOpenAI側ですが、GPT 5.5 Instantが現在ChatGPTで展開され始めており、これはかなり大規模な新しいアップグレードです。よりスマートで明確、そしてよりパーソナライズされた回答を、はるかに自然なトーンで提供します。より重要なのは、アクセシビリティが高く描写可能であり、事実の正確性が強力に改善されていることです。

医療、法律、金融といった様々な重要分野において特に高い性能を発揮します。また、画像の分析からSTEM分野の質問への回答、実際に必要なときのウェブ検索の活用まで、日常的なタスクにおいてもより優れた性能を発揮します。ですので全体として、単に高速になっただけでなく、はるかに信頼性の高いオールラウンドなモデルになっています。

金融業界を変革するClaudeエージェント

Anthropic側では、金融業界にとって事態が非常に現実味を帯びてきました。彼らは基本的にすべての銀行における1年目のアナリストの役割を自動化してしまいました。なぜなら、ピッチビルダー、会議の準備、収益のレビュー、モデル構築、市場調査、バリュエーションのレビューなど、多岐にわたるClaudeのエージェントテンプレートのフルスイートをリリースしたからです。これらはすべてClaudeのコードを通じてインストールされるか、本番環境でマネージドエージェントとしてデプロイされます。

したがって、アナリストがスプレッドシートやプレゼン資料と格闘する代わりに、これらのワークフローをエンドツーエンドで完全に自動化できるようになりました。しかし、これについて驚くべきことは、これがAnthropicのパッケージングシステムを備えた、本格的なデジタルワークフォースとしてのAIだということです。これらのテンプレートを使用することで、金融アナリストとしての反復的で構造化された作業の層全体を実質的に置き換えることができます。

これらは、ウォール街や他の多くの銀行でジュニア人材向けに伝統的に訓練されてきたのと同じタスクであり、それが今や大規模に即座に実行され、Claudeのコードのようなシステムを通じて24時間365日稼働できるのです。したがって、本当のインパクトは単なる効率化ではなく、金融チームの運営方法の完全な再構築なのです。

Gemma 4とGoogle AI Studioのアップデート

Gemma 4を覚えていますか。Googleが新しいアップグレードを発表したため、さらに高速になりました。ここではマルチトークン予測ドラフターというものが導入されています。これにより、基本的にモデルは推論中に一度に複数のトークンを生成するようになります。そしてこれは最大3倍の高速化につながります。出力の品質低下はゼロです。

さて、注目すべきなのは、このモデルが依然としてApache 2.0ライセンスの下にありながら、はるかに高速であり、途方もない結果を提供しているということです。もしGemma 4に関する私の動画をまだ見ていないなら、強くお勧めします。なぜなら、このモデルは本当に驚異的だからです。

Google AI Studioは現在、カスタム画像アセットを自動生成するためにNano Bananaを統合しています。そしてこれは、アプリの構築中に追加できる機能です。それに加えて、彼らは編集ツールを再設計し、完全な視覚的コントロールを提供することで、コンポーネントの更新、アプリへの注釈付け、そしてアセットの交換をリアルタイムで行えるようにしました。もはやコーディングファーストではなくなりました。なぜなら、完全に視覚的なAIを活用した開発環境になりつつあるからです。

Notebook LMとPompiの新機能

なんと、またGoogleのアップデートです。これはNotebook LMのマインドマップに関するもので、大幅な改良、あるいはアップデートが行われています。特定のプロンプトでマップを誘導できるカスタマイズ機能が含まれています。マップの名前を変更したり共有したりすることで、簡単に整理することができます。また、ノート間のシームレスな移行により、ナビゲーションもよりスムーズになっています。

したがって、マインドマップ機能により、これはアイデアを考え、計画し、探求するためのよりインタラクティブな方法へと進化しています。もう一つの興味深いアップデートは、Pompiと呼ばれる別のGoogleツールからのものです。ここではカタログ機能が導入されました。商品やサービスをアップロードすると、あなたのブランドに合わせた高品質なAIによる写真撮影とともに、パーソナライズされたマーケティングキャンペーンを自動的に生成することができます。そして最もクレイジーな部分は、これがまだ完全に無料で世界中で利用できるツールだということです。

Perplexityの金融エージェント

最後に、PerplexityはClaudeのお株を奪おうとしています。彼らはPerplexity Computerの金融エージェントの立ち上げにより、金融分野への本格的な進出を図っています。この新しいコンピューターエージェントを使用すると、基本的にMorning StarやPitchbookなどのプロバイダーからのライセンスデータに接続することができます。Carbon Arcやその他多くのプロバイダーもあります。

全体として、これは本物の高品質な金融データをあなたのAIワークフローに直接もたらすことになります。さらに、アナリストが毎週行う反復タスクをカバーする35の専用金融ワークフローも追加されました。つまり、これは単なる別のAIツールではありません。彼らはこれを、Perplexity Computerを搭載した金融オペレーティングシステムのような別の機能にしようとしているのです。明らかにこれは単にClaudeと競争しようとしているように聞こえますが、どうやら常にClaudeの方がPerplexityよりも優位に立つことになりそうです。

ボストン・ダイナミクスのロボットと今後の展望

そしてちょっとしたお楽しみとして、私を含め、ほとんどの人間よりも上手に踊るBoston Dynamicsの新しいロボットの動画を紹介します。嘘はつけません、このロボットは間違いなく私よりもずっとうまく踊ります。もしこの動画を気に入って、チャンネルをサポートしたいと思っていただけるなら、下にあるスーパーサンクスのオプションから私のチャンネルへの寄付を検討していただけます。

あるいは、私たちのプライベートDiscordへの参加を検討していただくこともできます。そこでは、様々なAIツールの複数のサブスクリプションに月額無料でアクセスできるほか、毎日のAIニュースや限定コンテンツなど、盛りだくさんの内容を利用できます。さて皆さん、AIの世界で起きているあらゆることについての今日の動画は以上になります。おそらく5月後半には、新しいモデルのリリースが見られるはずです。もちろんGoogle IOカンファレンスが近づく頃です。

もしかしたら、カンファレンスよりも前にGemini 3.2 Flashを目にするかもしれません。そして、Geminiの新しいフラッグシップモデルが見られることを本当に本当に期待しています。ということで皆さん、今日の動画を楽しんでいただき、何かしらの価値を得ていただけたなら幸いです。これらのリンクはすべて下の概要欄に残しておきます。ぜひ私たちのセカンドチャンネルもチェックしていただき、ニュースレターやDiscordに参加し、Twitterで私をフォローしてください。

そして最後に、チャンネル登録、通知ベルのオン、この動画への高評価をお願いします。また、最新のAIニュースに遅れないように、過去の動画もぜひご覧ください。それでは皆さん、素晴らしい一日を過ごし、ポジティブな気持ちを広めてください。またすぐにお会いしましょう。彼は苦しんでいます。

コメント

タイトルとURLをコピーしました