
7,811 文字

どうやらOpenAIはX(旧Twitter)スタイルの独自ソーシャルメディアネットワークを開発中で、すでに内部プロトタイプが存在するとのことです。このプロトタイプは「ChatGPTの画像生成機能にソーシャルフィード機能を加えたもの」と説明されています。一方、Googleは文字通り動物と会話しています。彼らは新しい基盤モデル「Dolphin Gemma」を発表しました。このモデルはイルカの音声構造を解読し、イルカのような音を生成するよう訓練されています。最後に、Kling AIが最新のAIビデオモデル「Kling 2.0」をリリースし、業界全体に衝撃を与えています。これらのクリップの一部は信じられないほどリアルで、もはやAIと現実の区別がつかなくなってきています。詳しく見ていきましょう。
まずOpenAIについてですが、今週は彼らにとって大きな動きがありました。彼らはGPT-4.1をリリースしました。これは開発者向けに特化した3つのモデルのファミリーで、最大100万トークンをサポートしています。これはOpenAIがこれまでにリリースした中で最大のコンテキストウィンドウです。また、これらのモデルは非常にコスト効率が高く、大半のベンチマークでGPT-4.5をも上回るパフォーマンスを発揮します。その数日後には、O3とO4 Miniという最新の推論モデルもリリースしました。これらはコーディングや数学、指示への従順さ、さらにはマルチモーダル推論まで、ほぼすべての分野で最先端の性能を達成しています。また、これらは道具の使用やエージェント機能が最初から組み込まれた新世代のAIモデルでもあります。
これらのリリースについては今週の別の動画ですでに詳しく取り上げたので、ここではこれ以上深く掘り下げませんが、あまり注目されなかった発表が一つあります。OpenAIが独自のソーシャルメディアプラットフォームを構築する計画があるというものです。そういえば、Sam Altmanは最近このことについてツイートしていましたね。Metaが独自のAIアプリをリリースしてOpenAIのChatGPTと競合するという報道に対して、Altmanは「わかった、じゃあ私たちもソーシャルアプリを作るかも」と述べていました。そして彼は冗談を言っていたわけではなかったようです。
ご覧のとおり、OpenAIはXに似たソーシャルメディアネットワークを開発中です。The Vergeの報道によると、詳細はあまりわかっていませんが、ChatGPTの画像生成機能にソーシャルフィードを組み合わせた内部プロトタイプが存在することは確認されています。これが独立したアプリケーションになるのか、それともChatGPTに直接統合されるのかはまだ不明です。また、この動きはAltmanとElon Muskの間の緊張関係をさらに高める可能性があるとも述べられています。ご存知のとおり、二人は過去に大きな対立があり、今日に至るまでその関係は続いています。
実際、Muskは2018年に退社して以来、OpenAIが営利企業に再編されることを積極的に阻止しようとしてきました。彼はわずか2ヶ月前にOpenAIの非営利部門を970億ドルで買収しようとさえしました。これに対してAltmanは「いいえ結構です。もしよろしければ、こちらからXを97.4億ドルで買いましょうか」と返答し、Muskはさらに「詐欺師め」と返しました。明らかに二人はお互いに良い感情を持っていませんが、法的には、Muskによる営利企業への再編を阻止する試み、またはOpenAIが言うところの「OpenAIを減速させようとするMuskの最新の試み」は、本質的に裁判所によって却下されています。
ただし最近、つい1週間前には、一部のOpenAI従業員がMuskのOpenAIに対する訴訟を支持しているという事実が明らかになりました。ロイターによると、元OpenAI従業員の約12人が4月11日金曜日に法的文書を提出し、OpenAIの非営利ステータスを維持することを目的としたMuskの訴訟を支持したとのことです。
あまり詳しく立ち入りませんが、これが最後の話題ではないことは明らかです。Sam AltmanとElon Muskの確執だけでなく、OpenAIが非営利の「オープン」な歴史から離れていくという考え自体も議論を呼んでいます。彼らの名前は文字通り「オープンAI」なのに、彼らは基本的にオープンソースモデルをリリースしていない唯一の大手AI企業となっています。
特に今、Muskの訴訟を支持するOpenAI従業員が十数人いるという報道が出ている中で、Altmanに対するプレッシャーがかかっているようです。彼の最近のインタビューでは、トーンが変わり、フロンティアオープンソースモデルをリリースする新しい計画を強調していました。こんな風に言っています:
「オープンソースには重要な役割があると思います。実は昨晩、オープンソースモデルのパラメータを決定し、どのような形にしたいかを決めるための最初のコミュニティセッションを開催したばかりです。私たちは非常に強力なオープンソースモデルを作ろうとしています。これは重要なことだと思います。フロンティアに近い、現在存在するどのオープンソースモデルよりも優れたものになるでしょう。これですべてが解決するわけではなく、この部屋にいる人々の中には、あなたや私が好まない方法でこれを使用する人もいるでしょう。しかし、ここでのコンステレーションの一部として、オープンソースモデルには重要な役割があります。私たちはこの点で行動が遅かったかもしれませんが、これからは本当にうまくやっていきます。」
OpenAIがMetaやMistralなど他のどの企業がこれまでにリリースしたものよりも優れたオープンソースモデルをリリースするとしたら、非常に興味深いことになるでしょう。DeepSeek 2よりも優れたものなら、間違いなくAI業界に衝撃を与えるでしょう。
さて、OpenAIのソーシャルメディアネットワークの報道に戻りましょう。もし「なぜOpenAIがソーシャルメディアネットワークを構築したいのか?彼らはXやMetaと競争しようとしているのか?」と疑問に思われるかもしれませんが、その答えは「はい」です。彼らはMetaやX、Googleなど、あらゆるテクノロジー/AI企業と競争しようとしています。しかし、データという側面もあります。
考えてみてください。MetaやXAIがソーシャルメディアプラットフォームのおかげでアクセスできる個人データの量は、OpenAIが望むことができるものをはるかに超えています。確かにOpenAIも、特に最新のメモリアップデートでChatGPTがすべての過去の会話を記憶できるようになるなど、自社の個人データの「堀」を構築し始めています。しかし、例えばMetaがInstagramやFacebookでアクセスできる高品質で個人的なデータの量は、これらのAIシステムがよりパーソナライズされ、よりパーソナライズされた文脈を理解するAIシステムの需要が高まるにつれて、大きなアドバンテージになるでしょう。
つまり、OpenAIはチェスをしているようなもので、動きを作り、動きを作ろうとしています。彼らがこれを実行したとしても私は驚きません。
さて、これはOpenAIの最大の競合他社、彼らが始まった時から打ち倒そうとしている巨人、そしてますますAIに焦点を当てるようになっている巨人について考えさせられます。もう明らかだと思いますが、私はGoogleについて話しています。
Googleは最近、AIゲームを本気で取り組み始めました。先週、Agent Space、Agent Development Kit、Agent-to-Agent Protocolなど、多くのものをリリースしました。そして先月はGemini 2.5 Proをリリースしました。Gemini 2.5 Proは、おそらく現在利用可能な最高のコーディングモデルですが、OpenAIは最近リリースした新しいO3およびO4 Miniモデルでそれに反論するかもしれません。ベンチマークに基づくとより優れているようです。
しかし、これらのモデルに対する人々の実際の感覚を把握できるLM Arenaのリーダーボードを見ると、Gemini 2.5 Proは依然として快適にトップに座っています。リリース以来まったく動いていません。カテゴリをより詳しく見ると、すべてのカテゴリで1位になっていることがわかります。
もちろん、これらは変わる可能性があります。最新のO3とO4 Miniはとても新しいのでまだこのチャートに載っていませんが、それでもこのモデルは冗談ではなく、GoogleがAIゲームを真剣に取り組み始めていることは明らかです。現在、彼らがリードしていると言えるでしょう。私の現在のランキングは、おそらくGoogleが1位、次にOpenAI、そしてAnthropicでしょう。しかしそれは変わる可能性があり、その後はXAI、おそらくMistralでしょうか。その後はかなりわかりにくくなります。
ちなみに、このランキングに同意しますか?もし同意しないなら、あなたのランキングとその理由が気になります。コメントで教えてください。
また、驚くべきことにGemini 2.5 Proは完全に無料で使用できます。Googleの膨大なリソースのおかげでできることの良い例です。Googleしかできないもう一つの良い例が、動物との会話です。良い移行でしたね。Googleは最近、AIを使ってイルカの言語を解読する継続中のプロジェクトについて、さらなる洞察を提供してくれました。この信じられないような動画をご覧ください:
「Dolphin Gemmaはイルカの言語を理解しようとする最初のLLMです。Dolphin Gemmaはイルカが口笛のような発声を始めると音を入力し、その終わりを完成させることができます。Googleで検索するときのように、文章を完成させるのです。Dolphin GemmaにはDeniseのデータが入力され、彼女の知識や経験の多くが組み込まれていますが、十分に小さいので、データが増えるにつれて訓練できます。モデルを継続的に微調整し、イルカが発する音をより良く理解できるようになることを望んでいます。動物に言葉があるかどうかはわかりません。イルカは鏡で自分を認識でき、道具も使うので賢いですが、言語はまだ最後の障壁です。Dolphin Gemmaのようなモデルにイルカの音を入力することで、人間が見分けられないパターンや微妙な点があるかどうかを実際に確認できます。イルカに言語があれば、おそらく文化もあります。彼らの優先事項や話題を理解できるようになるでしょう。目標は、いつかイルカ語を話すことです。私たちは本当にそのコードを解読しようとしています。」
これはかなり凄いですね。もし彼らが実際にこれをできるなら、犬や猫、あるいは他の動物と話せるようになるまでどれくらいかかるでしょうか?少し特殊な話題かもしれませんが、リアルタイムで動物を分析し、その体の言語や伝えようとしていることを理解し、さらにはリアルタイム翻訳で話し返すことができるAIメガネを想像してみてください。これが可能になるかどうか、そしてもしそうなった場合、特に水中に住む他の種と文字通りコミュニケーションできることで何が明らかになるのか、本当に不思議です。
さて、Googleに関するニュースに戻りましょう。彼らはAIビデオモデル「V2」をGemini Advancedユーザーに展開しています。これはGemini内に直接統合されます。OpenAIも同様に、ビデオモデル「Sora」をChatGPTに直接統合する計画を立てていることは知っていますが、Googleがこの点で彼らを上回ったようです。正直なところ、GoogleはAIリリースに関して、彼らが受けるべき評価や注目を受けていないと感じることがあります。
しかし、忘れてはならないのは、Googleは実際にこのAIブームを始めた企業だということです。彼らのAIシステム「AlphaGo」は2016年に世界最高の囲碁プレイヤーを打ち負かし、それが本当にこのAI時代の幕開けとなりました。もし彼らが2016年にAlphaGoを持っていたなら、他にどんなすごいものを持っているか想像してみてください。OpenAIがモデル能力の点で彼らを追い越したように見えるか、少なくとも彼らのレベルにあるとしても、彼らは閉ざされた扉の後ろで何か信じられないようなことをしているに違いありません。
そういえば、GoogleのAlphaGoチームで働いていた主任研究科学者のDavid Silverが最近、Googleの閉ざされた扉の後ろで何が起きているのか、あるいは何が起きてきたのかについて、かなり驚くべき洞察を共有しました。こちらをご覧ください:
「AIは自分自身の強化学習アルゴリズムを設計できるでしょうか?面白いことに、私たちはこの分野で実際に少し作業をしていました。数年前に行った作業ですが、今になって公開されつつあります。私たちが行ったのは、試行錯誤、つまり強化学習自体を通じて、強化学習に最適なアルゴリズムを見つけ出すシステムを構築することでした。それは文字通り一段階メタに進み、自分自身の強化学習システムを構築する方法を学びました。そして信じられないことに、実際に私たち人間が過去の長年にわたって考え出したすべての強化学習アルゴリズムを上回るパフォーマンスを発揮しました。」
どうやら私たちはすでに自己改善型AIを持っており、それを何年も前から持っていたようです。そして明らかにそれが今、公開されつつあるようです。正直なところ、Googleの他の誰もこれについて話しているのを聞いたことがありませんが、この話が何なのかすぐに分かるでしょう。
さて、OpenAIとその競合他社、そしてGoogleがAI企業としての地位を固めるためにどのように取り組んでいるかについて話しましたので、AI業界で他に何が起きているかについて話しましょう。
まずはMetaからです。彼らはあまり調子が良くないようです。このFortuneの記事によると「Metaの AI研究ラボはゆっくりと死にかけている」と一部の内部関係者は言っており、Metaはそれを「新たな始まり」と呼ぶことを好むそうです。
Metaのなぜ死にかけていると言われるかの簡単な要約をすると、基本的に彼らの最新リリースであるLlama 4がレベルに達していなかったのです。本当にレベルに達していなかったのです。彼らはベンチマークで悲惨なパフォーマンスを示し、さらに論争に巻き込まれました。人間の好みに特別に微調整されたLlama 4の別バージョンをリリースした後のことです。先ほど見たリーダーボードのあるLM Arenaでの話です。
このアリーナは純粋に人間の好みに基づいており、文字通り誰でもこのサイトに行き、モデル間で一日中選択することができます。どのモデルが最高のプロンプトを生成したと思うかを選ぶのです。そこでシステムをある意味で騙すために、Metaは人間を引き付けるために特別に設計されたモデルをリリースし、それを実際のLlama 4として通そうとしました。しかし明らかにそれは違いました。実際のLlama 4のパフォーマンスははるかに悪いのです。
また、この記事ではこのことが原因で多くの従業員が去っていることや、基本的にそこの状況があまり良くないことについても触れています。とはいえ、彼らはまだソーシャルメディアプラットフォーム、膨大な量のデータ、そして狡猾なトカゲのMark Zuckerbergを持っているので、彼らのことをまだ侮ることはできないでしょう。
次に、今週は極めて静かだったAnthropicからの小さなニュースがあります。彼らはClaude Researchを新しいGoogle Workspaceの統合と共に立ち上げました。基本的に、これはAnthropicの独自のディープリサーチエージェントで、ウェブ上で自律的に研究を行うことができます。彼らが述べたように、Googleとも協力してこれをWorkspaceに統合し、GmailやGoogleカレンダー、Docsなどのアプリと連携できるようにしました。これ以外は、Anthropicにとって非常に静かな一週間でした。
最後に、Kling 2.0について話さなければなりません。まだKlingについて聞いたことがない方のために言うと、彼らはAIビデオ生成における最大の名前の一つです。彼らは長い間、可能性の限界を押し広げてきており、最新リリースのKling 2.0は物事を全く新しいレベルに引き上げています。
これらのクリップの一部に見られる詳細のレベルと超リアリズムを見てください。私たちは「リアルに見えるか?」という疑問を通り越して、「これが本当にAIなのか?」と尋ねています。動きは流暢で、照明は完璧、そして肌から反射まであらゆるテクスチャが信じられないほどです。
信じられないほどのリアリズムと、これらの生成がいかに素晴らしく見えるかという点とは別に、彼らはマルチエレメントエディタや画像リスタイリングなど、いくつかの新しいコントロールツールも導入しましたが、全体的に見て、これらの生成の品質と信頼性が、このリリースを非常に素晴らしいものにしていると思います。
皆さん、私は過剰反応しているのでしょうか?それとも、これが本当に大きな飛躍のように感じるのでしょうか?
とにかく、この動画はすでにとても長くなっていて、もう一つのクリップをお見せしたいと思います。これからお見せするクリップはかなり野性的なものです。これがどれほど信頼できるものかはわかりませんが、Xで見つけたので皆さんにお見せします。こちらをご覧ください:
「例えば、エージェントを構築している多くの人々が独立して『睡眠』を発見しました。エージェントは眠る必要があります。なぜなら彼らは記憶を圧縮し、実際に長期記憶にそれらを変える深いREM様のことをしなければならないからです。私たちと同じように、コンピュータエージェントもそれをしなければならないのです。これはかなりすごいことです。冗談ではありません。『エージェントのための睡眠』について調べてみてください。」
繰り返しますが、これがどれほど信頼できるものかはわかりませんが、もし本当なら驚くべきことです。人間の睡眠がどのように機能するかさえまだほとんど理解していないので、かなり野性的に聞こえるとはいえ、これを簡単に却下するべきではないでしょう。
今日のAIニュースは以上です。視聴していただきありがとうございます。動画を楽しんでいただけたなら、ぜひ「いいね」を押してください。


コメント