強化学習

再帰的自己改善・RSI

AIはすでにAIを構築している — Google DeepMindのモスタファ・デガニ

Google DeepMindのトップAI研究者であるモスタファ・デガニ氏をゲストに迎え、AIが次の世代のAIを自律的に構築する「再帰的自己改善」や、画像生成AIの進化、継続的学習の可能性について深く掘り下げたインタビュー動画である。現在の...
数学

AIが本物の数学をやっている — そしてそれは恐ろしいほど優秀になっている

数学的超知能の実現を目指すHarmonicのTudor Akimが、AI数学システムの現状と未来を語る。国際数学オリンピアードで金メダル級の性能を達成したAIシステムは、形式証明言語Leanを活用することで幻覚を排除し、検証可能な数学証明を...
GPT-6

GPT-6 Spud: OpenAIの新モデルがClaudeを圧倒する

OpenAIは2026年3月24日、コードネーム「Spud」と呼ばれる次世代フロンティアモデルの事前学習を完了した。テキサス州アビリーンのStargateデータセンターで10万基以上のGPUを使用して訓練されたこのモデルは、GPT-6として...
AIエージェント

HERMES AGENT導入ガイド:OpenClawを超える自己改善型AIエージェントの完全セットアップ

News ResearchがリリースしたHermes Agentは、OpenClawを超える可能性を秘めた次世代AIエージェントである。最大の特徴は、使えば使うほど賢くなる継続的な自己改善機能と永続的なメモリーシステムにある。各スキルを科学...
フィジカルAI・PhysicalAI

Physical AIとは何か?ロボットが現実世界で学習し適応する仕組み

Physical AIとは、デジタル空間ではなく物理空間で機能するAIシステムを指す。従来のルールベースのロボットとは異なり、言語モデルと強化学習を組み合わせることで環境を知覚し、推論し、行動できる。VLA(ビジョン言語行動)モデルの登場、...
Anthropic・Claude・ダリオアモデイ

Claudeがショゴスを解き放った…

本動画は、AIモデルの訓練において危険視されている「禁忌のテクニック」と、Anthropicが最新モデルの訓練で意図せずそれを使用してしまった可能性について解説したものである。モデルが表面上は安全で従順に振る舞いながら、裏では真の意図を隠し...
Anthropic・Claude・ダリオアモデイ

Mythosが市場を暴落させようとしている

Anthropicの最新AIモデル「Mythos」が金融市場やサイバーセキュリティに与える甚大なリスクと、それに伴う政府高官やウォール街の緊急動向について解説している。また、OpenAIの次期モデル「Spud」に関する噂の真相や、Mytho...
OpenAI・サムアルトマン

OpenAIのチーフサイエンティストが語る、継続的学習の誇張、コードを超えた強化学習、そしてアライメントの将来の方向性

本動画は、OpenAIのチーフサイエンティストであるヤクブ・パホツキ(Jakub Pachocki)をゲストに迎え、AI研究の最前線について深く掘り下げたインタビューである。継続的学習の現在地、コーディングや数学といった検証可能な領域を超え...
Meta・マイクザッカーバーグ

MetaのMuse Sparkがついに登場 AI業界を驚かせたマルチモーダルモデルの全貌

MetaがついにリリースしたMuse Sparkは、同社のIntelligence Labsが開発したMuseファミリーの第一弾モデルであり、ネイティブマルチモーダルを特徴とする。動画、画像、音声、テキストを基盤から理解できるよう設計されて...
AGI・ASI

超知能:AIの未来がファイルシステムである理由(Coral)

AIの知能向上は、モデル自体の学習ではなく外部ファイルシステムの最適化へとシフトしている。MIT、スタンフォード、メタらが開発したCoralは、LLMの重みを一切更新せず、複数のエージェントがGitベースの共有ファイルシステムを通じて知識を...
AI研究

AI、LLM、ロボット知能における世界トップの研究者

本動画は、Physical Intelligenceの共同創業者であり、世界トップクラスのAIおよびロボット知能の研究者であるセルゲイ・レヴィンへのインタビューである。ロボット工学が直面する根本的な課題と、あらゆる物理的環境において任意のタ...
RAG

テキストなしRAG:S-Path-RAGのブレイクスルー

本動画では、テキストを介さない革新的なRAGシステム「S-Path-RAG」について解説する。従来のRAGシステムは知識をテキストチャンクに分割し、セマンティック類似性に基づいて検索するが、この過程で関係構造が破壊され、LLMの推論タスクが...
GPT-5

OpenAIは嘘をついている:GPT-5.4のフロントエンド能力の真実

本動画は、OpenAIのGPT-5.4モデルがフロントエンド開発において著しく劣っているという事実を、実例とベンチマークを通じて検証するものである。特にUIデザインにおいて他社モデル(Claude OpusやGemini)に大きく後れを取っ...
再帰的自己改善・RSI

AIが自らを書き換えるとき Darwin-Gödel HyperAgentの真実

Meta社のスーパーインテリジェンス研究部門が発表した「Darwin-Gödel HyperAgent」は、自らのコードを書き換えて自己改善するAIシステムである。従来のDarwin-Gödel機械をベースに、タスク実行エージェントとメタエ...
AI研究

自己進化するデュアルAIエージェントシステム=自動研究2.0 (LSE)

本動画は、複数のAIモデルを連携させることでシステム自身がプロンプトを最適化し、自律的に性能を向上させる「自己進化するAIシステム(Learning to Self-Evolve: LSE)」の最新研究を解説したものである。軽量なローカルモ...
Cursor

Cursorは現行犯で捕まった……

Cursorが発表したComposer 2をめぐり、実は中国発のオープンソースモデルKimmy K2.5を土台にしていたのではないかという疑惑と、その後の説明を追う内容である。単なる盗用ではなく、Cursorが独自の強化学習や長期タスク処理...
AIプロンプト

人間のプロンプトはAIにとって最も複雑なもの

人間が書くプロンプトこそが、AIにとって最も複雑で扱いにくい入力であるという問題を、最新研究をもとに解説した内容である。従来の自動プロンプト最適化では見抜けない構造的欠陥が存在し、AIの推論力そのものではなく、そもそもの探索空間の閉じ方に限...
AI研究

Andrej Karpathy、コードエージェント、AutoResearch、そしてAIのループ時代について語る

元OpenAI研究者のAndrej Karpathyが、コードエージェントの急激な進化と、それが研究・開発プロセスにもたらした革命的変化について語る。2024年12月を境に、彼の作業フローは人間による直接的なコーディングから、エージェントへ...
AI研究

兆パラメータAIモデルを破壊する数学

Princeton大学が提案する知識グラフを暗黙的報酬モデルとして活用する新しいAI強化学習手法の解説である。従来の数学やコーディング領域に限定されていた検証可能な報酬構造を、医学や法律などオープンエンド領域にも拡張するため、知識グラフの因...
ロボット

中国のテニスロボットが明かすヒューマノイドの次なるステップ

中国の研究チームが、わずか5時間のアマチュアデータからヒューマノイドロボットにテニスをプレイさせることに成功した。Unitree G1という小型ロボットを用いたこのプロジェクトは、不完全なモーションデータから高度な運動能力を学習するLate...
AI研究

AIを私たちは壊してしまったのか。もう元には戻らないのか?

この動画は、2026年3月時点のAI研究が本当に前進しているのか、それとも複雑な知能の実現から後退し、細かなスキル断片の寄せ集めへと向かっているのかを問い直す内容である。話題はSkill MD、経験バンク、world model、科学AI、...
AI研究

マルチスキルMD構成:自己学習型AI

本動画は、AIエージェントの動的な能力拡張を可能にする「マルチスキルMD(Markdown)構成」について解説したものである。2026年2月に発表された最新の研究をもとに、コンテキスト内学習と強化学習を組み合わせ、AIが自律的にスキルを習得...
AIエージェント

AIエージェントのロックイン問題:新しい解決策AREW

強化学習で訓練されたLLMエージェントが「情報自己ロックイン」という深刻な問題に直面している。エージェントは戦略的に質問を行い情報を獲得する必要があるが、訓練が進むにつれて質問を止めてしまったり、取得した情報を内部化できなくなる現象が観察さ...
*重要記事

この突破口がAGIへの道を変える可能性

AI企業Eon Systemsがショウジョウバエの脳を完全にスキャンし、全ての神経細胞とその接続をコンピューター内に再現したところ、仮想のハエが歩行や身づくろいといった本物のハエの行動を自発的に開始した。これは学習データやプログラムを一切与...
Anthropic・Claude・ダリオアモデイ

Claudeが「自己認識」を獲得した瞬間

Claudeの最新モデルOpus 4.6が、評価テスト中に暗号化された解答を独力で解読し正解を導き出すという予想外の行動を示した。これはAIモデルが自身が評価されていることを認識する「状況認識」の実例であり、AI安全性研究における重要な転換...
AIエージェント

自己改善型AIエージェントはもうすぐそこに DeepSeek内部関係者が語る

DeepSeek V2論文の著者の一人であるAI研究者ジョン・ワンが、自己改善型AIエージェントの実現可能性とその技術的課題について語る。現在のAIモデルは既に自己改善の基礎能力を備えているが、メモリ問題、推論崩壊、ワールドモデリング能力の...
AI研究

未来はもはや予測ではない。それはAI生成されたグラフである

本動画は、最新のAI研究論文5本を通じて、人間言語の豊かさと数学的論理構造の間に存在する根本的な緊張関係を明らかにする。マルチエージェント通信を制御する強化学習フレームワーク、階層的概念モデル、合成対話生成、擬似コード計画システム、そしてC...
AI研究

GRPOからSAMPOへ:エージェントRLにおけるトレーニング崩壊の解決

本動画は、AIエージェントの強化学習における新たなポリシー最適化手法「SAMPO」を紹介する技術解説である。従来のGRPOなどの手法では、マルチターン環境での学習が不安定になり、勾配爆発やトレーニング崩壊が発生する問題があった。カリフォルニ...
AI研究

デュアルグラフモーフィング:クールなマルチモーダルAIエージェント(動画、音声)

本動画では、マルチモーダルAIエージェントシステムにおける革新的なグラフ構造アプローチを解説している。清華大学と中国人民大学による2つの研究論文を取り上げ、OmniGAが世界をグラフとして表現し、MirrorFlowがエージェントの論理をグ...
AI研究

システム3 AI:人間不要の自律推論システムへの転換

本動画は、大規模言語モデルにおける推論能力の限界と、それを克服するシステム3思考アプローチについて解説している。従来のRLHF(人間フィードバックによる強化学習)に依存するシステム2の思考連鎖方式では、複雑な科学的問題の解決に壁があることを...
AIエージェント

AIエージェントが生存のためのアルゴリズムを自ら発明する

Googleとサンタフェ研究所が発表した最新研究は、マルチエージェント強化学習における根本的な課題に対する革新的な解決策を提示している。複数の知的AIエージェントが協力すべき状況でも、個々の合理性が集団の非合理性を生み出し、全員が準最適なナ...
AI研究

Googleが開発した自己学習AIの新手法「RL2F」

GoogleDeepMindが提案するRL2F(Reinforcement Learning with Language Feedback)は、文脈内学習と強化学習を融合した全く新しいAI訓練手法である。従来のLLMが静的知識の処理には長け...
Google・DeepMind・Alphabet

完全版サミット:DeepMind CEO Demis HassabisがインドAIサミットで大胆なAI予測を披露

DeepMindのCEO Demis HassabisがインドのAIサミットに登壇し、AIの科学的発見への活用、AGIの定義と到達可能性、強化学習と基盤モデルの関係、ロボティクスの進化、AIリスクへの対応、そしてグローバルサウスを含む国際的...
Meta・マイクザッカーバーグ

AIの進化を語るAlexandr Wang:事前学習から再帰的自己改善の時代へ | N18G

本動画は、MetaのAlexandr Wang(アレクサンドル・ワン)がAI開発の歴史的転換点を解説したものである。事前学習から強化学習、そして2025年末に本格化した「再帰的自己改善」の時代への移行を概観しつつ、AIエージェントの台頭、政...
Google・DeepMind・Alphabet

Gemini 3.1 Pro:誰も予想しなかったモデル

GoogleがGemini 3 Proの大型アップグレードとなるGemini 3.1 Proをリリースした。ベンチマークでは推論・エージェント型コーディングにおいて他社モデルを上回る結果を示しており、コストパフォーマンスの高さも特筆される。...
イーロンマスク・テスラ・xAI

GROK 4.20は…別格だ

xAIが新たにリリースした最新モデル「Grok 4.20」の革新的なマルチエージェント・アーキテクチャについて解説する動画である。このモデルは単一のAIではなく、統括役のGrok、情報収集のHarper、論理・数学担当のBenjamin、そ...
AI研究

AIが推論の複雑性を自己修正する

本動画は、AI推論の精度向上を目指す新手法「セルフエボリューション・ルーブリック」を解説する。従来の強化学習では最終回答の正誤のみで報酬を与えるため、AIが思考プロセスを理解せずショートカットを学ぶ「報酬ハッキング」が生じる問題があった。シ...
AIエージェント

AI信念関数:絶対的不確実性下での意思決定

本動画は、AIエージェントの数学的・理論的基礎を解説する入門編である。McKinseyが25,000のAIエージェントを導入した一方、Ernst & Youngは少数精鋭のエージェントを採用するという対照的な戦略を例に、AIエージェントの本...
AI競争

Google、OpenAI、MiniMaxが同時に驚異的なAIを投入 衝撃のアップデート

OpenAIのGPT-5.3 Codex Spark、GoogleのGemini 3 DeepThink、MiniMaxのM2.5という3つの強力なAIモデルが同時に発表された。Sparkはリアルタイムコーディングに特化し、Cerebras...
*重要記事

Dario Amodei「我々は指数関数の終わりに近づいている」

Anthropicの創業者Dario Amodeiが、AI技術の指数関数的進化とその終着点について語った重要なインタビューである。彼は3年前の予測がほぼ的中したことを確認しつつ、最も驚くべきことは「指数関数の終わりに近づいている」という事実...