Microsoftが初の真の自己改善AI を発表(AIのルールを破った)

本動画では、2025年10月末時点における主要なAI関連の技術発表とビジネス動向を包括的に解説している。Microsoftが発表した強化学習フレームワーク「Agent Lightning」は、AIエージェントが経験から自律的に学習し改善する仕組みを提供し、既存システムを大幅に改修することなく継続的な性能向上を実現する。OpenAIは安全性重視のオープンウェイトモデルを公開し、有害コンテンツ検出における透明性と説明可能性を強化した。Telegramの創設者パーヴェル・ドゥーロフは、TONブロックチェーン上で稼働する分散型AI計算ネットワーク「Cocoon」を発表し、プライバシーを保護しながらGPU資源を共有する新しいエコシステムの構築を目指している。Elon MuskはxAIモデルを活用したAI駆動型百科事典「Grokipedia」を立ち上げ、人間の編集バイアスを最小化した知識プラットフォームの実現を図っている。Adobe Max 2025では、静止画像のアニメーション化、音声編集、照明変更、動画編集など、クリエイティブワークフローを革新する実験的AI機能が多数披露された。YouTubeは低解像度動画の自動AI高画質化を開始し、IBMはエッジデバイスで動作する小型高性能モデル「Granite 4.0 Nano」シリーズをリリースした。NVIDIAは史上初の時価総額5兆ドル企業となり、AI時代におけるGPU需要の爆発的増加とその市場支配力を証明している。これらの動向は、AI技術が自己改善、安全性、分散化、クリエイティビティ、エッジコンピューティングという多様な方向へ同時並行で進化している現状を示している。

Microsoft Just Launched the First True Self-Improving AI (Broke the Rules of AI)

Microsoft just launched Agent Lightning — a full reinforcement learning framework that lets AI agents actually learn fro...

Microsoftの強化学習革命とOpenAIの安全性へのアプローチ
OpenAIの安全性モデルとTelegramの分散型AI構想
カザフスタンとの連携、そしてElon MuskのGrokipedia
Adobe Max 2025の革新的なクリエイティブツール
YouTubeのAI高画質化とIBMの小型高性能モデル
NVIDIAの歴史的な時価総額達成

Microsoftの強化学習革命とOpenAIの安全性へのアプローチ

Microsoftがまったく新しい強化学習フレームワークを発表しました。OpenAIは安全性重視のモデルを展開しました。Telegramのパーヴェル・ドゥーロフがTONブロックチェーン上で分散型AIネットワークを発表しました。Elon MuskがGrokipediaと呼ばれるものを立ち上げました。AdobeはMaxイベントで新しいクリエイティブツールを大々的に発表しました。

YouTubeは静かに全ユーザーの動画をAIでアップグレードしています。IBMはエッジ向けの小型だが強力なGraniteモデルをリリースしました。そしてNVIDIAが正式に時価総額5兆ドルに到達しました。今週は大きなアップデートがたくさんありましたので、それについて話していきましょう。

さて、Microsoftがちょうど発表したのがAgent Lightningです。これは基本的に、すべてを壊すことなく、賢いAIシステムが経験から学習できるようにする方法です。

これまでは、AIエージェントにその仕事をより上手にやらせたい場合、訓練するためだけにシステムの半分を再構築しなければなりませんでした。今やAgent Lightningは、AIが実際に何をするか、どんな質問を受け取るか、どう応答するか、何がうまくいくか、何が失敗するかを監視し、そしてそれらの経験からどう改善するかを教えます。これは、AIに自身の失敗と成功の記憶を与えて、時間とともにより賢く自分自身を訓練できるようにするようなものです。

素晴らしい点は、すでに使っているツールやアプリをいじることなくこれを実現することです。裏側で訓練を処理するLightningサーバーと、AIの近くに留まって現実世界でのパフォーマンスに関する情報を収集するLightningクライアントがあります。エージェントが答えを出すたび、ツールを使うたび、フィードバックを受けるたびに、そのデータがサーバーに送り返されて、次回は少し鋭くなります。

ブラウザ、チャットボット、ワークフローを普段通り使えます。Agent Lightningはただ静かにバックグラウンドで学習しているだけです。Microsoftはこれを3つのかなり異なる分野でテストしました。まず、質問をデータベース検索に変換するAIを作りました。基本的には、Spiderと呼ばれる10,000以上の質問を含むデータセットを使って、テキストをSQLクエリに変換します。

次に、21百万のドキュメントを持つWikipediaサイズのデータを掘り下げて正確な答えを見つけて要約する検索システムで試しました。最後に、数学の問題を与えて計算機に接続し、段階的に答えを出せるようにしました。すべてのケースで、AIは訓練するほど目に見えて良くなりました。

自動中間報酬と呼ばれる賢いフィードバックシステムも組み込まれています。これは、合格か不合格かを最後に伝えるだけでなく、途中で小さなヒントを与えるようなものです。これにより訓練がよりスムーズで速くなります。そしてオープンソースなので、開発者は自分のプロジェクトにプラグインして、すぐにAIエージェントの改善を始められます。

要するに、Microsoftは任意のAIがその仕事をより良く、より速く、より独立して学習する方法を遥かに簡単にしたのです。

OpenAIの安全性モデルとTelegramの分散型AI構想

さて、Microsoftが強化学習の側面を推進している一方で、OpenAIは今週まったく異なる方向に進みました。オンラインの安全性です。彼らは2つのモデル、GPT-4o Safeguard 120BとGPT-4o Safeguard 20Bをリリースしました。これらは有害または偽のオンラインコンテンツを検出するために特別に構築されています。

しかしこれらは典型的なオープンソースモデルではありません。オープンウェイトモデルです。開発者はパラメータを見て、システムがどのように決定を下すかを検査できますが、基礎となるコードを変更することはできません。そうすることで、研究者はセキュリティリスクなしに透明性を得られます。モデルは何かがフラグを立てられた理由を説明し、単に安全でないとラベル付けするのではなく、推論プロセスを強調します。

これらはROOST、つまりRobust Open Online Safety Tools initiativeで構築され、DiscordやSafety Kitのようなパートナーとテストされました。両モデルは現在Hugging Faceで研究用に利用可能で、OpenAIはより広い安全性コミュニティにストレステストを行うよう呼びかけています。これは、AIモデレーションにおける測定可能な説明責任への一歩です。政府が求めていましたが、実際に提供したところはほとんどありませんでした。

一方、ドバイでは、Telegramの創設者であるパーヴェル・ドゥーロフが、これまで見た中で最も大胆なブロックチェーンとAIの出会いプロジェクトの1つを発表しました。Cocoonと呼ばれ、Confidential Compute Open Networkの略で、完全にTONブロックチェーン上で動作します。目標は、ユーザーデータをプライベートに保ちながら、GPUを所有する人々と計算能力を必要とする開発者を接続する分散型AIネットワークを構築することです。

GPU所有者は自分のリグをネットワークにプラグインし、AIタスクを処理し、Toncoinで報酬を得ます。開発者は同じトークンで支払い、システムを計算のピアツーピアマーケットプレイスに変えます。Cocoonが際立っているのはプライバシーです。すべてのタスクは暗号化された形式で処理されるため、GPUプロバイダーでさえ作業しているデータを見ることができません。

ドゥーロフは、世界は過去20年間デジタルの自由を失ってきており、Cocoonはそれを逆転させる試みだと述べました。Telegramは最初の主要な顧客となり、2025年11月から多くのアプリとボットエコシステムにCocoonを統合します。10億人以上のユーザーを持つTelegramの関与により、分散型AIが急速に主流の使用に押し上げられる可能性があります。

彼らはCocoonを、メッセージの要約や下書き作成など、通常はOpenAIやGoogleのような集中型プロバイダーにユーザーデータを送信する必要があるAIタスクに使用します。ネットワークの両側ですでにアプリケーションが開始されています。GPUプロバイダーはスペック、モデルタイプ、メモリ、稼働時間をリストし、開発者はDeepSeekやQwenなど実行する予定のモデルと、必要な計算量を指定します。

発表直後、NASDAQ上場企業であるAlphon Capitalが、Cocoonを動かすためのGPUインフラストラクチャへの大規模投資を約束し、世界中に高性能GPUを展開しました。CEOのBrittany Kaiserはこれを、ブロックチェーン、データ保護、AIを結びつける重要な瞬間と呼びました。また会長のEnzo Villaniは、Cocoonが大規模なプライバシーとセキュリティというAIの最大の市場ギャップの1つを解決すると述べました。

カザフスタンとの連携、そしてElon MuskのGrokipedia

さらにあります。Cocoonはカザフスタンの成長するAI努力と接続しています。10月初旬、ドゥーロフはカシム・ジョマルト・トカエフ大統領と会談し、カザフスタンのスーパーコンピューターを使用したTelegram AIラボを計画しました。Toncoinの価格は素早く反応し、約2.20ドルで時価総額56億ドル、わずかに1.5%下落しましたが、取引量は3.4%高く、トレーダーが注目していることを示しました。

TONエコシステムはすでに決済、ミニアプリ、NFTで拡大しています。今やCocoonがAI計算をミックスに加え、AWSやAzureに直接挑戦しています。大きな問題は、競争力を持たせるために十分なGPUと開発者を引き付けられるかどうかです。しかしドゥーロフのプライバシー第一のテクノロジーを構築してきた評判が、プロジェクトに深刻な信頼性を与えています。

技術界の大物が物事を揺るがすといえば、Elon Muskがちょうど、彼のxAIモデル上に構築されたAI駆動型百科事典、Grokipediaを立ち上げました。これはWikipediaに対抗するものですが、ボランティア編集者の代わりに、エントリーはAIによって書かれ維持されて、人間のバイアスを最小化します。Muskの目標は、自律的に更新する偏りのない知識プラットフォームで、Wikipediaの最も古い批判の1つである編集者のバイアスと一貫性のない正確性に対処することです。

GrokipediaはxAIを使用してデータを自律的に処理し検証し、プロジェクトは即座にWikipediaとの比較を引き起こしました。主な違いは哲学的です。Grokipediaはアルゴリズム的客観性を信頼し、Wikipediaはコミュニティの合意に依存しています。反応はまちまちです。支持者はこれを事実の正確性の未来と呼びます。

批評家は、AIは人間の編集者ができる方法でニュアンスや文脈を完全に理解することはできないと言います。いずれにせよ、これはAIが情報システムにどれだけ深く押し進んでいるかの証拠です。投資家や技術アナリストが注目しているのは、Grokipediaが機能すれば、オンライン情報がキュレーションされ検証される方法を再定義できる可能性があるからです。たとえ機能しなくても、これはMuskがAIが人間の知識エコシステムで何を置き換えられるかの境界をテストしているもう1つの例です。

Adobe Max 2025の革新的なクリエイティブツール

そしてAdobeがあります。これは基本的にロサンゼルスで開催されたAdobe Max 2025のsneaksイベントでみんなの心を吹き飛ばしました。Adobe Researchのオスカーナイトのように考えてください。彼らは10以上の実験的ツールを披露し、それぞれが魔法のように見えました。最初の大きなものは、Project Motion Mapで、テキストプロンプトを使用して静的なIllustratorデザインにアニメーションを追加します。

ライブデモでは、ハンバーガーの静止画像が生き生きとし、システムが自動的に検出して分離したため、各レイヤーが個別にアニメーション化されました。次はProject Clean Takeで、トランスクリプトから直接音声を編集できるオーディオツールです。ビデオトランスクリプト内の単語を強調表示し、トーンを変更したり、別の単語に交換したりでき、音声が自然に更新されます。

また、背景音を別々のトラックに分離して調整またはミュートでき、背景音楽をAI生成のロイヤリティフリーバージョンに置き換えることもできます。Project Light Touchはもう1つの大人気でした。写真を撮った後に照明を変更できます。デモでは、仮想ランプをオンとオフに切り替えると、数秒でシャドウレイアウト全体が変わりました。

そして最後に、project frame forwardで、1つのフレームを編集するだけでフルビデオを編集できます。プレゼンターはクリップから削除されたパドルボーダーと、背景から消された結婚式のゲストを見せました。すべてPhotoshopで1つのフレームを修正することで行われ、AIが他のすべてのフレームに変更を自動的に適用します。これらのデモは、Adobeの研究部門が生成AIをクリエイティブプロセスにどれだけ深く押し進めているかを示しており、視覚的および時間的推論を融合させて、編集がほぼ会話的になるようにしています。

YouTubeのAI高画質化とIBMの小型高性能モデル

YouTube側では、プラットフォームがAIで動画を高画質化し始めました。1080p未満の低解像度アップロードは、自動的にHDにアップグレードされ、まもなく4Kになります。ただし今のところテレビのみです。アクティブになると、ビデオ品質オプションの下に超解像度が表示されます。クリエイターはオプトアウトできますが、デフォルトの体験は遥かに鮮明になります。

YouTubeはまた、サムネイル制限を2メガバイトから50メガバイトに拡大し、真の4Kサムネイルが登場することを意味します。テレビでチャンネルをめくるための没入型プレビューを追加し、動画を一気見可能なコレクションにまとめる新しいショーレイアウト、視聴しているチャンネルからの結果を優先するコンテキスト検索、さらには動画で言及されている商品ページに直接リンクするQRコードまで追加しています。

テレビはYouTubeの最も急速に成長している画面であり、これらのアップデートにより、単なる動画サイトというより、インタラクティブなストリーミングハブのように感じられます。

小型デバイスの最適化といえば、IBMがちょうどGranite 4.0 Nanoと呼ばれるものを発表しました。これは基本的に、深刻なAIパワーを、データセンターもクラウド請求書もなく、自分のデバイス上で直接実行できる小さなモデルに絞り込む方法です。

これらはおもちゃではありません。約3億5000万から10億パラメータの範囲の8つがあり、IBMの最大のモデルと同じ巨大な15兆トークンのデータセットでトレーニングされています。ですから、小さくても同じ脳力を持っています。

素晴らしいのは、それらがどのように構築されているかです。ハイブリッドバージョンは2つの異なるAI設計を混合しているため、完全なトランスフォーマーモデルの賢さを失うことなく、遥かに少ないメモリを使用します。つまり、ラップトップ、電話、またはVLM、Llama.cpp、MLXなどのツールを介してブラウザ内でも実際に実行できます。IBMはまた、すべてが開かれていて透明であることを確認しました。

完全にオープンソースで、ISO 42001の認証を受け、暗号署名までされているので、本物をダウンロードしていることがわかります。IBMがこれらの小さなものをQwen、Gemma、Liquid AI LFMなどの競合他社と比較したとき、実際に先を行きました。一般的な推論だけでなく、ほとんどの小型モデルが苦労する数学、コーディング、さらにはツール使用タスクでも優れていました。

ですから、Granite Nanoは小さいかもしれませんが、そのクラスを遥かに超えるパンチを持っています。

NVIDIAの歴史的な時価総額達成

そしてNVIDIAがあります。時価総額5兆ドルのラインを越えて歴史を作った最初の企業です。株価は274ドルで終了し、約3%上昇し、その評価額はIMFデータによると、インド、日本、英国などの国のGDPを上回りました。わずか3か月前の7月には4兆を通過していました。この種の成長は、GPUの需要がどれだけ大きくなったかを示しています。チャットボットから画像生成まで、すべてのAIモデルがそれらに依存しています。かつてゲーム用に設計されたNVIDIAのチップは、現在、地球上のほぼすべての主要なAI展開を動かしています。

CEOのJensen Huangは最近、5000億ドル相当の新しいチップ注文、6G開発のためのNokiaへの10億ドルの投資、自動運転タクシーを構築するためのUberとのパートナーシップを明らかにしました。彼らはまた、7つのAIスーパーコンピューターを構築するために米国エネルギー省と提携しています。先月、彼らは将来のチャットボットモデル専用のデータセンターのためにOpenAIに1000億ドルを投資しました。

政治的に、Huangはトランプ政権とさえ調整しており、譲歩と引き換えに中国へのチップ販売に関するいくつかの輸出規制を解除しました。トランプは彼を素晴らしい男と呼び、APECで習近平とチップ取引について議論する予定です。イングランド銀行とIMFから過熱したAI株式市場についての懸念がありますが、Huangはこれがバブルではないと主張しています。

彼は、チャットボットが目新しいものから本当の利益エンジンへと進化したと言い、ハードウェアの需要がそれを裏付けています。市場が後で修正するかどうかにかかわらず、NVIDIAの支配は今のところ揺るぎないように見えます。

そして、それが今の状況です。ご視聴ありがとうございました。コメント欄にあなたの考えを残してください。チャンネル登録といいねボタンを押すのを忘れないでください。次の動画でお会いしましょう。