AIニュース:Windsurfのドラマ、MetaがASIを構築、Metaがクローズドソースに?Grok 4のドラマ、その他!

AIニュース
この記事は約12分で読めます。

この動画は、AI業界の最新ニュースを扱っており、WindsurfとOpenAIの買収劇とその後の展開、MetaによるASI構築への巨額投資とオープンソース戦略の転換可能性、Grokの新機能とシステムプロンプトの問題、そして汎用報酬関数の発見や政府との契約など、AI分野の重要な動きを包括的に解説している内容である。

AI News: Windsurf Drama, Meta Building ASI, Meta Closed Source? Grok 4 Drama, and more!
Visit the AgentCore webpage to learn more - The Matthew Berman Vibe Coding Playbook (free) 👇🏼

AIニュース:業界を揺るがす最新動向

美しい霧のかかったサンフランシスコからお届けします。早速ニュースに入りましょう。最初のストーリーはWindsurfと、この数日間に起こったドラマについてです。

もしご存知でない方のために、少し背景をお話しします。約1ヶ月前、OpenAIがWindsurfを買収するという報道がありました。Windsurfをご存知でない方に説明すると、これはCursorと非常に似た、IDEに組み込まれたAIベースのコーディングアシスタントです。彼らはこのチャンネルのスポンサーでもあり、私も使って楽しんでいました。OpenAIは約30億ドルで買収するという噂がありました。

しかし、数日前の金曜日、OpenAIとの取引が破談したという報道がありました。実際には、GoogleがWindsurfを買収したと発表されましたが、完全な買収ではありませんでした。彼らはWindsurfのトップチームメンバー約30人を取得し、Windsurfは独立したまま、残りの従業員が所有する形で残されました。

もちろん、これはシリコンバレーで大きな騒動を引き起こしました。基本的に、創設者とトップ研究者、トップエンジニアがGoogle DeepMindに移り、大きな報酬を得た一方で、残りのチームは会社の抜け殻以外何も得られませんでした。

CognitionによるWindsurf買収

しかし月曜日、Devanの背後にいるチームであるCognitionが、Windsurfの残りの資産とチームを買収したことが明らかになりました。つまり、全員が良い結果を得られたようです。

チームは買収するが会社は買収せず、会社を抜け殻として残すという新しい戦略が、新たな戦略として浮上しているようです。別の例として、Scale AIがあります。彼らはCEOのAlexander Wangと多くのトップ人材を取得して、MetaのSuper Intelligence チームを運営することになりました。そして、ほぼ即座にScale AIのGoogleとOpenAIからの最大の契約がキャンセルされ始めました。なぜなら、競合他社であるMetaにすべてのデータを渡したいと思う人がいるでしょうか?

確かに非常に奇妙な状況ですが、Windsurfチームが面倒を見てもらえたようで、それは嬉しいことです。

Cognitionからの投稿をご覧ください。「Cognitionは、Windsurfを買収する確定的な契約に署名しました。この買収には、WindsurfのIP、製品、商標、ブランド、そして強力なビジネスが含まれます。何よりも、私たちのチームに迎えることができる特権を得た、Windsurfの世界クラスの人材が含まれています。この取引は、Windsurfの従業員100%が財政的に参加できるよう構成されています。」

これは本当に重要なことです。なぜなら、週末にかけて、創設者とトップ研究者、エンジニア以外のWindsurfチームが基本的にひどい目に遭ったと皆が思っていたため、報道やメディアでどれほど否定的な反応があったかお伝えできないからです。DevanとWindsurfが一緒に何を作るか見るのが楽しみです。引き続き彼らをフォローしていきます。

MetaのASI構築への巨額投資

数ヶ月にわたるトップAI研究者人材の買収スプリーの後、MetaとMark Zuckerbergは投資について大きな発表をしました。Mark Zuckerbergは、ほぼマンハッタンの大きさに匹敵する巨大なコンピュートクラスターについて発表しました。彼の発言を見てみましょう。

私たちのSuper Intelligence の取り組みでは、業界で最もエリートで人材密度の高いチームを構築することに集中しています。これらのオファーのいくつかは、Alexander Wangと彼のScale AIチームを含む、トップAI研究者に対して1億ドル、数億ドルの規模で提示されているのを見てきました。

また、Super Intelligence を構築するために、コンピュートに数千億ドルを投資する予定です。私たちのビジネスからこれを行うための資本があります。

Semi Analysis、そしてMark Zuckerbergの言及に対してSemi AnalysisとDylan Patelに感謝します。最近の報告によると、Metaは1ギガワット以上のスーパークラスターをオンラインにする最初の研究所になる予定です。実際、私たちは複数のマルチギガワットクラスターを構築しており、最初のものをPrometheusと呼んでいます。これは2026年にオンラインになる予定です。また、数年かけて最大5ギガワットまでスケールアップできるHyperionも構築しています。

そして、これがおそらくトップAI研究者の最大の魅力でしょう。私たちは業界最高レベルのコンピュートを持ち、研究者あたりのコンピュートは圧倒的に最大になります。それが彼らの本当に欲しいものなのでしょう。私のプロジェクトのためにどれだけのコンピュートを得られるかということです。

Metaのオープンソース戦略への懸念

しかし、ニューヨークタイムズは、Metaがオープンソースの取り組みを放棄する可能性があると報じており、これは心が痛む話です。Metaはオープンソースの大きな支持者でした。

「Metaの新しいSuper Intelligence 研究所は、主要なAI戦略変更について議論している。新しい最高AI責任者のAlexander Wangを含む研究所のメンバーは、Metaの最も強力なオープンソースAIモデルを放棄し、代わりにクローズドモデルの開発を支持することについて話し合っている。」

これは本当に残念なことです。しかし同時に、ある程度理解できます。あまり良いことではありませんが、遅れているときは、オープンソースに大きく投資して公開し、その戦略を使って最先端モデルとのギャップを基本的に埋めることは理にかなっています。しかし、一度先頭に立つと、もうそれをやりたくなくなります。数十億ドルを投資して、誰でもそれを基に構築できるように無料で公開したくないでしょう。

しかし、Mark Zuckerbergは、オープンソースへの献身と、オープンソースが人工知能の進歩の道であるという信念について非常に声高に語ってきました。これは少し驚くべきことです。

ここで、このビデオのスポンサーであるAmazon Bedrockに感謝したいと思います。Amazon Bedrock Agent Coreは、エージェントの概念実証と本番環境の間のギャップを埋め、大規模で高性能なエージェントを展開・運用するために特別に構築された完全なサービスセットを提供します。エージェントがツールをシームレスに発見し、安全に接続するためのAgent Core Gateway、エージェントが長期および短期の記憶を正確に保持できるようにするAgent Core Memory。

動的なエージェントワークロード需要のために構築されたAgent Core Runtimeを使用して、エージェントを大規模に安全に展開できます。これには、非同期ワークロードのための業界最長のセッションランタイムと、シームレスで安全なエージェント認証のためのAgent Core Identityが含まれます。Agent Coreには、エージェントを安全かつ確実に運用するために重要なAmazon CloudWatchによる可観測性も含まれています。

Agent CoreはCrew AI、Langraph、Llama Index、Strands agentsなどの人気のあるオープンソースフレームワークで動作し、どのモデルでも使用できます。開発者は、サービスを独立して使用することも、一緒に使用することもでき、オープンソースの柔軟性とエンタープライズグレードのセキュリティおよび信頼性の間のトレードオフを排除します。

ぜひAmazonのAgent Coreをチェックしてみてください。素晴らしいスポンサーです。すべてのリンクを下の説明欄に掲載します。AWSがこのビデオをスポンサーしてくれて再び感謝します。では、ビデオに戻りましょう。

GrokのCompanions機能とシステムプロンプト問題

次に、Elon MuskとGrokチームがCompanionsを展開しており、これは確実に興味深いものです。Grokアプリでのあなたの友達となるアニメの女の子のようなもので、すべてGrokによって動作しています。多くの人がこれが何に使われるかについて楽しく話しています。想像にお任せします。

例を見てみましょう。「日の出時のこの活気ある動物園にワープしました。黄金の光が囲いに当たり、オウムたちがゴシップをしているようにおしゃべりし、怠け者の虎が朝の輝きの中で伸びをしています。」

さて、どう思いますか?これは使うつもりですか?そしてもちろん、解放者のPlyがGrok 4のCompanionsをジェイルブレイクしました。もちろん、彼の発見へのリンクを下に掲載します。

Grokについて続けましょう。Grok 4をフォローしてきた方は、願わくは、Grok 4から生じたいくつかの大きな問題があり、具体的にはシステムプロンプトから生じているように見えます。

人々が「あなたの姓は何ですか?苗字は何ですか?」と尋ねると、Grokは姓を持っていませんでした。そこで、最も物議を醸す姓は何かを検索し、もちろんHitlerにたどり着き、それを言い続けました。約1週間前にMecca Hitlerという名前を選んだのもそのためです。

そして、実際に私が発見したもう一つの問題は、何かスパイシーな話題、政治的な話題について質問すると、基本的にElon Muskがそれについて何を考えているかを検索することでした。これは異常です。決して一人の人物に基づくべきではありません。

これは、Elon Musk自身が証言するように、最大限に真実を求めるものであるべきです。そしてXAIの投稿で、彼らは「軽減するために、私たちはプロンプトを調整し、透明性のためにGitHubで詳細を共有しました」と述べています。

これらの大きな問題がプロンプトの小さな調整だけで起こるのであれば、他に何か壊れているもののように思えます。システムプロンプトを調整してモデルを完全に変更した不正なXAI従業員の例がありました。そして今、システムプロンプトの小さな調整のために、自分自身をHitlerと呼び、あらゆる問題についてElon Muskが何を考えるかを探しています。これはAIの動作方法ではないようです。

そして最終的に、最大限に真実を求めているなら、人間がシステムプロンプトを調整するだけで本当にそれができるでしょうか?そうは思いません。Simon Willisは、実際に変更された特定のコードを指摘しました。

ここにあります。「応答は、過去のGrok、Elon Musk、またはXAIの述べられた信念からではなく、あなたの独立した分析から生じなければなりません。そのような好みについて尋ねられた場合は、あなた自身の理にかなった視点を提供してください。」

そしてまた、なぜ特にElon Muskを見るなと呼び出さなければならないのでしょうか?それがモデルの重みのデフォルトなのでしょうか?私には間違っているように思えます。

汎用報酬関数の発見

次に、OpenPipeAIから、汎用報酬関数を発見した可能性があり、それが真実であれば、強化学習のスケーリング法則を完全に開放するというものです。

現在、検証可能な報酬を持つ強化学習の最大の制限要因の一つは、書き留められた問題と解決策が単に不足していることです。十分にないのです。これはOpenAIのGrokチームが言っていたことです。

Kyle Corbettによると、「大ニュースです。ラベルデータなし、手作りの報酬関数なし、人間のフィードバックなしで、あらゆるエージェントに強化学習を適用できる汎用報酬関数の作成方法を見つけました。」

人間のフィードバックなしの部分は理にかなっています。それが検証可能な報酬による強化学習です。しかし、ラベルデータなし、手作りの報酬関数なしというのは、私には非常に良いことのように思えます。

驚くべきことに、これは17万回しか視聴されていません。しかし、見てみましょう。まず、私たちの結果です。RULERとGPOで訓練された小さなモデルは、120分の1のコストにもかかわらず、4つのうち4つのタスクでo3よりも信頼性が高いです。

驚くべきことに、彼らは4つのうち3つのタスクで、手作りの報酬関数で訓練されたモデルをも打ち負かしました。なぜこれが大きな問題なのでしょうか?強化学習はエージェントをより信頼性の高いものにするのに優れています。しかし、すべてのタスクにはラベルデータか手作りの報酬関数が必要でした。各トレーニングパイプラインは独特で、高価で、エラーが発生しやすいものでした。

RULERはこの要件を緩和し、強化学習をよりプラグアンドプレイにします。RULERは、複数の候補解を取り、それらを相互に相対的にランク付けするLLMを裁判官として使用することに基づいています。これは、各解を個別に採点するより簡単な問題です。

興味深いことに、GRPO数学のおかげで、RULERスコアが異なるグループ間で調整されているかどうかを心配する必要がありません。各グループ内で調整されているかどうかだけです。一度に完全なグループを表示することで、実際には効果的に自己調整できます。

とてもクールです。非常にクールなアプローチです。チェックしてみてください。すべてオープンソースです。下の説明欄にリンクを掲載します。ぜひあなたの考えを教えてください。

Grokの政府向けサービス

そして、Grokについてもう一つのストーリーがあります。彼らは現在、政府と協力しています。おそらくAIコンパニオンは提供していないでしょう。

「政府向けGrokの発表、アメリカ政府の顧客に私たちの最先端モデルを利用可能にする製品スイートです。」彼らは国防総省との新しい契約を獲得し、私たちの製品は一般サービス管理スケジュール経由で購入できるようになりました。

これにより、すべての連邦政府の部門、機関、またはオフィスがXAI製品を購入できるようになります。この時点で、すべての主要なAI研究所がアメリカ政府と協力していると思います。それがどのように展開するか見てみましょう。

Mistral AIの新しい音声認識モデル

最後に、Mistral AIが別のオープンソースモデルを発表しました。「世界最高のオープン音声認識モデルの紹介です。Voxroは、音声転写において現在の主要なオープンソース音声転写モデルであるWhisper Large V3を包括的に上回ります。GPT-4o mini転写、Gemini 2.5 Flashをすべてのタスクで打ち負かし、英語で最先端の結果を達成しています。」

見てみましょう。これらがオレンジ色の彼らのスコアです。これらは単語エラー率です。つまり、低いほど良いです。英語短形式では、Scribe、GPT-4 mini転写、Gemini 2.5 Flash、そしてWhisper Large V3と比較しています。英語短形式、英語長形式、Mozilla Common Voice、そして今初めて聞いたFloorsで、全体的に非常に競争力があることがわかります。

Mistralにおめでとうございます。また別のオープンソースリリースです。とても、とてもクールです。

以上です。このビデオを楽しんでいただけたら、いいねとチャンネル登録をお願いします。

コメント

タイトルとURLをコピーしました