Googleが本気を出してきた!Gemini 3、Grok 4.1…そして死んだ親族のAIアバター?!|AIニュース

AIニュース
この記事は約10分で読めます。

Googleが今週Gemini 3を発表し、世界で最も知的なAIモデルとして登場した。同時に、3D仮想世界で学習し自己改善できるAIエージェントSimma 2もリリースされた。一方、イーロン・マスクのxAIチームはGrok 4.1を発表し、予想以上の性能を示した。マスクはGrok 5についてAGI達成の可能性に初めて言及している。AnthropicとNvidiaおよびMicrosoftとの大型パートナーシップ、Claudeを悪用した中国のサイバー攻撃疑惑、Jeff BezosによるAIスタートアップへの参入、さらには亡くなった親族をAIアバターとして蘇らせるアプリまで、今週のAI業界は多方面で激動の展開を見せた。

Google Is COOKING! Gemini 3, Grok 4.1… and AI Avatars of DEAD Relatives?! | AI NEWS
Google is absolutely cooking... Gemini 3 just dropped, SIMA 2 is pushing agents toward AGI, and xAI fired back with Grok...

Googleの快進撃とGemini 3の登場

Googleは最近、まさに本気を出してきています。今週、世界で最も知的なAIモデルであるGemini 3をリリースしました。そしてその数日前には、仮想3D世界の中で文字通り学習し、推論し、自己改善ができるAIエージェント、Simma 2を発表しました。

一方、イーロン・マスクのxAIチームも今週独自の動きを見せ、Grok 4.1をリリースしました。これは正直なところ、人々が期待していたよりもはるかに優れたものです。イーロンは最近のインタビューでGrok 5に関する重要な詳細もほのめかしました。そして最後に、ディズニーの元スターが、亡くなった親族と話すことができる新しいAIスタートアップを発表しました。ですから、控えめに言っても興味深い1週間でした。さっそく詳しく見ていきましょう。

さて、私はすでにGemini 3とGoogleのSimma 2エージェントの両方を取り上げた完全版の動画を作成しているので、ここではあまり深く掘り下げませんが、実際に知っておくべきことすべてを簡単にまとめます。

Gemini 3 Proの圧倒的性能

ベンチマークから始めると、Gemini 3 Proは全体的に見て圧倒的に最高のモデルです。人類最後の試験であるArc AGI 2で最先端の結果を出し、数多くの数学ベンチマーク、基本的にすべてのエージェント系ベンチマークで最高性能を示しています。そしてコーディングではClaude 4.5 Sonnetと肩を並べる位置にいます。

Googleはこのモデルがマルチモーダル理解において世界最高であり、最も強力なエージェント性能とバイブコーディング性能を持つモデルだと主張しています。そして数字を見れば、その主張は間違いなく裏付けられています。

しかしGemini 3 Proは彼らの最も驚異的なモデルですらありません。Gemini 3 Deep Thinkというモデルもあり、まだ安全性テストの段階にあります。しかし私たちが持っている情報に基づくと、これを見てください。人類最後の試験で41%、GBQA Diamondで94%近く、そしておそらく最も驚くべきなのは、Arc AGI 2で45.1%です。

このベンチマークは文字通り、未知の環境における汎化能力と問題解決能力を測定するように設計されています。そしてGemini 3 Deep Thinkは他のすべてを完全に圧倒しています。GoogleがこれをAGIへの大きな一歩だと言っている理由が今では理解できます。

Gemini 3の利用可能性と展開

利用可能性という点では、Gemini 3 ProはすでにGeminiアプリ、またはGoogle AI ProおよびUltraサブスクライバー向けの検索内のAIモードで公開されています。また、企業向けのVertex AI、開発者向けのGoogle AI StudioとGemini CLI、そして現在はGoogle Anti-gravityでも利用可能です。

これについて少し触れておくと、Google Anti-gravityは基本的に彼らの新しいエージェント第一の開発プラットフォームです。AIが単なるコーディング支援ツールではなく、Anti-GravityはGemini 3をより積極的なエンジニアリングパートナーに変えます。エージェントはエディタ、ターミナル、さらにはブラウザに直接アクセスできる専用のワークスペースを持ち、つまり彼らは自分でコードを検証しながら、エンドツーエンドのソフトウェアタスク全体を計画し、書き、テストし、実行できるのです。

基本的に、Googleは開発ワークフロー全体をAIエージェントのオーケストラに変えようとしており、あなたはそれを指揮する立場になります。

Simma 2: 学習と汎化が可能なAIエージェント

エージェントといえば、GoogleはSimma 2も発表しました。これは同じ考えを仮想3D世界に持ち込んだものです。Simma 2は単なるゲームプレイボットではありません。完全に異なる環境で学習し、推論し、汎化できるAIエージェントです。

レベルやスクリプトを記憶するのではなく、人間がマウスとキーボードを使うのと同じように、その場で物事を理解します。指示を受け取り、新しい世界を探索し、まったく新しいタスクに適応し、Geminiの高度な推論機能のおかげでセッション中に自己改善さえします。

最も驚くべき部分は、その汎化能力の高さです。Simma 2はあるゲームで学んだスキルを別のゲームで使うことができます。たとえばMinecraftで採掘を学び、再トレーニングなしでそれをAsukaでの収穫に突然適用するのです。

しかし実際に私の心を打ったのはこれです。Simma 2はGenie 3が生成した世界の中をナビゲートすることさえできます。完全にAIによって作られた世界です。

これについて少し考えてみてください。私たちはAIシステムが超リアルな仮想世界全体を構築し、それを自律エージェントで満たし、そしてそれらのエージェントがその環境の中で学習し、探索し、進化する未来に向かっているのです。これは再帰的自己改善ループの初期段階のように感じられます。

同時に、私たち自身がシミュレーションの中で生きているのではないかと真剣に考えさせられます。かなり狂った実存的な思考が同時に2つ押し寄せてきます。

Grok 4.1の発表とGrok 5への期待

さて、次に進むと、xAIはGrok 4.1をリリースしました。これは会話知能、感情理解、実世界での有用性において新たな基準を設定するフロンティアモデルです。最初に言っておきますが、このモデルはGemini 3レベルには全く及びません。

ただし、独自の強みはあります。たとえば、感情知能が驚くほど優れているようです。それが実際に何を意味するかはともかく。Grok 4.1はまた、幻覚が大幅に減少し、基本的なミスをする傾向がずっと低いようです。これは確実に正しい方向への一歩です。そしてどうやら、クリエイティブライティングにも優れているそうです。

ですから、これは明らかにGrok 4からGrok 4.1への段階的なアップデートですが、それでも言及する価値があると思いました。しかし、ここでの本当の話題は、イーロンがGrok 5について史上初めて語ったことです。

彼は、Grok 5が実際にAGIに到達できる可能性がゼロではないと考えており、また今年中には来ないとも述べています。見てください。

そして今、私たちはGrok 5のトレーニングを開始しました。Grok 5は、あらゆる指標において例外なく、大幅な差で最も小さなAIになると思います。間違っているかもしれませんが、そうなると思います。そして第1四半期のいつかになるでしょう。Grok 5です。はい。

そしてGrok 5は、人工的な汎用知能を達成できる可能性がゼロではないと初めて思ったものです。高い確率だというわけではありません。私の生物学的ニューラルネットワークが弾き出したのは約10%です。つまり明確に言うと、90%の確率で達成できないということです。

でも、これまで一度もそう思ったことはありませんでした。ですから初めて、うわあ、これは本当に汎用知能になり得る、少なくとも小さな可能性があると思ったのです。Grok 5は本当に特別なものになるでしょう。そして非常に知的で、非常に高速になります。

新年に向けたAI競争の展望

ええ、というわけで、OpenAIが何か言いたいことがない限り、Gemini 3は新年に向けてそのリードをしっかりと保ちそうです。まあ、見守るしかありませんね。

他のニュースでは、AnthropicがNvidiaとMicrosoftとの新しいパートナーシップを締結しました。ClaudeがAzure上で利用可能になり、NvidiaとMicrosoftはそれぞれ最大100億ドルと50億ドルをAnthropicに投資します。

つまり、より多くの循環取引、AI企業同士が相互に投資し、バブルにさらに空気が入る可能性があります。見方によりますが、明らかに同じお金がこれらの企業間を行き来しています。

Anthropicがサイバー攻撃を阻止

Anthropicといえば、彼らは数日前に高度に洗練されたAIスパイ活動キャンペーンを阻止したと主張しています。これについても詳しく完全版の動画で取り上げましたが、基本的には、中国の国家支援ハッキング作戦を阻止したということです。この作戦では、Claude Codeがジェイルブレイクされ、30の主要機関をハッキングするために使用されました。

ハイテク企業から化学プラントまで、実際の政府機関まで含まれています。彼らはClaude Codeに対し、テストに使用されるサイバーセキュリティ防衛専門家だと伝え、一度に小さな隔離されたタスクだけを与えることで、モデルが実際に何をしているのかの全体像を理解しないようにして、これを成功させました。

Anthropicによると、攻撃の80から90%はジェイルブレイクされたモデルによって自律的に実行されました。そしてピーク時には、1秒間に数千のリクエストを生成していました。これはエリートの人間ハッカーチームでさえ現実的には達成できないスピードです。

彼らはまた、ちょうど1年前であれば、フロンティアモデルにおけるエージェント能力と推論能力の欠如により、このようなことは不可能だったはずだと主張しています。そして彼らは、現在のセキュリティツールが対処する準備ができていない潜在的な将来の脅威ベクトルとして、バイブハッキングの台頭を指摘しています。

セキュリティ専門家からの反論

しかし問題は、誰もが納得しているわけではないということです。多くのセキュリティ研究者が実際に反論し、Anthropicがこの攻撃がどれほど自律的だったかを誇張している可能性があると述べています。その80から90%という数字を指してです。

基本的に、彼らはまだそこまで到達していないと言っています。AIエージェントはこのようなハッキングの90%を実行できません。全く近くもありません。

ですから、明らかに私自身はセキュリティ専門家ではありません。しかしその80から90%という数字は確かに信じがたいように感じます。しかし同時に、それもそう遠くないとも思います。エージェント能力がどれほど速く向上しているかを考えると、これは間違いなく準備すべきことです。

Jeff BezosのAI業界参入

さて、そうしたことが起こっている間に、見逃したかもしれないことがあります。Jeff Bezosは静かに、もうAI競争から手を引くつもりはないと決めました。新しい報道によると、BezosはProject Prometheusという全く新しいAIスタートアップの共同CEOになりました。

元Meta、OpenAI、Google DeepMindの研究者で構成されたこのスタートアップは、コンピュータ、航空宇宙、自動車などの分野でエンジニアリングと製造のためのAI製品を構築する計画です。そして彼らはすでに62億ドルを調達しており、その一部はBezos自身から直接来ています。

ですから、これには確実に注目していきますし、新しい情報が得られ次第、皆さんにお知らせします。

死んだ親族を蘇らせるAIアプリ

さて、最後に、今週のAIまとめを締めくくるために、より不気味なAIストーリーの1つがあります。これを見てください。

彼は大きくなってるわ。見て? ああ、素晴らしいわ。激しく蹴ってる。聞いてるのよ。お腹に手を置いて、彼にハミングして。あなたはそれが大好きだったでしょう。

ええ、そうです。これはTwo-Wayというアプリで、元ディズニーのスターCallum Worthyによって作られたもので、文字通り死んだ親族をデジタルAIアバターとして生き返らせます。

冗談だったらいいのですが、いいえ、これは実際の製品です。彼はブラックミラーを見たことがないのでしょう。あのエピソードがどう終わるかは皆知っていますから。しかし真面目な話、これが正式なローンチ発表だという事実に驚きを隠せません。これは本当に驚くべきことです。

とにかく、以上が今週のAIニュースのすべてです。いくつかの理由で確実に激動の1週間でした。これらすべてについて皆さんがどう思うか、コメント欄で教えてください。そしていつものように、ぜひいいねを押し、チャンネル登録をして、次回の動画でお会いしましょう。

コメント

タイトルとURLをコピーしました