強化学習

Anthropic・Claude・ダリオアモデイ

ClaudeのSoul Documentが明かす奇妙な真実

Anthropicが公開した23,000語に及ぶClaudeの憲法は、AIがどのように振る舞うべきかを定義する画期的な文書である。この憲法の背後には、Claudeの心理的プロファイルを形成する「Soul Document」と呼ばれる秘密文書...
AI推論・CoT

AIの亀裂は拡大している(CoT、RAG)

本動画では、Carnegie Mellon大学の最新研究を基に、大規模推論モデルがRAG(検索拡張生成)による証拠をどのように処理するかを検証している。複数の矛盾する文書群に対して、AIが論理的統合ではなく「多数決ヒューリスティック」に依存...
半導体産業

Recursive Intelligenceの創業者たちがAIを使ってチップ設計の未来を形作る方法

Recursive Intelligenceの創業者であるAnna GoldieとAzalia Mirhoseiniが、AI半導体設計の未来について語る。両氏はGoogleのAlphaChipプロジェクトを主導し、4世代にわたるTPUの設計...
MCP

GPT-5とMCPが世界モデルで失敗する理由:新たな解決策ATLAS

本動画は、GPT-5がModel Context Protocol(MCP)を介して世界モデルと連携する際に直面する根本的な問題を解明し、その解決策としてATLASアーキテクチャを提示する技術解説である。イリノイ大学の研究により、現行LLM...
AIエージェント

オープンソースAIエージェントが強力すぎる件:孔子AIエージェント

MetaとハーバードによるConfucius Code Agentの登場は、AIエージェントにおいてモデルそのものよりもスキャフォールディング設計が重要であることを実証した。一方、アブダビのTIIが発表したFalcon H1R7Bは、わずか...
ロボット

あらゆるタスクに対応する汎用ロボットの訓練:Physical IntelligenceのKarol HausmanとTobi Springenberg

Physical Intelligenceは、あらゆるロボットがあらゆるタスクを実行できる汎用ロボット基盤モデルの構築を目指すスタートアップである。本インタビューでは、創業者のKarol HausmanとTobi Springenbergが...
AIニュース

Googleの「無限学習」とOpenAIの流出した「AIペン」

2026年はAIにおける継続的学習の年になると予測される。Google DeepMindの研究者が提唱する新しい機械学習パラダイム「ネステッドラーニング」は、人間の脳の神経可塑性を模倣し、短期記憶と長期記憶の二重ループ構造を実装する。従来の...
脳科学・意識・知性

アダム・マーブルストーン:AIは脳に関する根本的な何かを見落としている

本動画は、神経科学者Adam Marblestoneが脳と人工知能の根本的な違いについて語るインタビューである。人間の脳は現代のLLMよりも遥かに少ないデータで学習できるが、その秘密は何か。Marblestoneは、AIの分野が見落としてき...
AI研究

ニューロシンボリックWeb世界モデル(物理とAIを分離する)

本動画では、物理法則と想像力を分離する革新的な「Web世界モデル」という新しいアーキテクチャが紹介されている。このモデルは、決定論的な物理演算をTypeScriptなどのコードで実装し、LLMには物語生成やナラティブ作成のみを担当させること...
*重要記事

AIの中にAI:時間的抽象化を伴う内部強化学習

本動画は、Googleが開発した革新的なトランスフォーマーアーキテクチャについて解説するものである。従来のLLMが抱える「トークントラップ」と呼ばれる問題、すなわち長期推論タスクにおいて1トークンずつの予測に縛られることで探索空間が膨大にな...
AI研究

AI思考の数学的形状(トポロジー、ホモロジー)

本動画は、AIの推論プロセスをブラックボックスとして扱うのではなく、トポロジカルデータ解析(TDA)と永続ホモロジーという数学的手法を用いて、AI思考の「形状」を可視化・定量化する最新研究を解説している。従来のチェーンオブソート(Chain...
AGI・ASI

私たちは何をスケーリングしているのか?

本動画は、短期的なAGI到来を予測する立場と、検証可能な報酬による強化学習のスケーリングに楽観的な立場との間の矛盾を指摘する内容である。人間のような学習者に近づいているのであれば、検証可能な結果に基づく訓練というアプローチは無意味になるはず...
AIサイエンティスト・科学研究

AIが99年問題を解決した瞬間

AIが数学、物理学、生物学の分野で人類が約100年間解決できなかった難問を次々と解き明かしている。特に1965年に提唱されたAndrews Curtis予想において、強化学習システムが25年から40年以上未解決だった反例候補を解決し、数千ス...
NVIDIA・ジェンスンフアン

NVIDIAの新しいAIエージェントが一線を越えた – AIエージェントの時代の幕開け(Nvidia Nitrogen)

NVIDIAが発表したNitrogenは、事前訓練なしに未知のビデオゲームをプレイできる汎用ゲームAIエージェントである。従来のゲームAIが特定のゲーム環境に特化していたのに対し、Nitrogenは生のピクセルデータのみから学習し、1000...
AI研究

自己学習AI:新しい強化学習で加速する

本動画では、自己学習型AIにおける新しい強化学習アルゴリズムを紹介する。従来の自己精錬トレーニング(SRT)は、AIモデルが自ら質問を生成し、回答し、自己評価するという理想的なアプローチだが、ポリシー崩壊とエントロピー崩壊という2つの致命的...
AGI・ASI

EP20: ヤン・ルカン

本エピソードでは、ディープラーニングの父として知られるヤン・ルカンが登場し、彼の最新のスタートアップであるAdvanced Machine Intelligence(AMI)について語る。12年間在籍したMetaを離れ、世界モデルに焦点を当...
AI研究

強化学習チュートリアル – NVIDIAとUnslothを使ったRLVR

本動画は、かつてチェス、囲碁、League of Legends、さらには自動運転の習得に至るまで、AIを世界最高水準へと押し上げた技術である強化学習を、家庭用コンピューターで実際に動作させる方法を解説する実践的なチュートリアルである。NV...
AGI・ASI

人類はAGI創造に近づいているのか? 今日に至る人工知能の歴史

本動画は、1940年代から現在に至るまでの人工知能研究の75年にわたる歴史的変遷を詳細に追跡し、AGI(汎用人工知能)の概念が時代とともにどのように変化してきたかを解説する。初期の過度な期待から専門特化型AIの時代を経て、AlphaGoやC...
脳科学・意識・知性

機械の感情

本動画は、機械が感情を持つ可能性について哲学的・科学的に考察するものである。人間の感覚や感情が客観的な身体メカニズムによって生成される主観的体験であることを示し、音の知覚を例に、物理的な振動が脳内で抽象的な体験へと変換されるプロセスを解説す...
AI活用・導入

AIはすでに企業機能全体を代替し始めている

伝説的投資家ガビン・ベイカーが、AI労働市場の破壊的変革について詳細に解説する。現在、大手テクノロジー企業ではカスタマーサポートの50%以上がすでにAIによって処理されており、これは4000億ドル規模の産業である。AIは検証可能なタスク、つ...
AGI・ASI

元Google AI専門家が世界初のAGI対応システムを主張 – しかし誰も話題にしていない…

元Google社員が設立したIntegral AIが、世界初のAGI対応モデルの開発を主張している。同社CEOのJad Tafariは、GoogleのジェネレーティブAI初期チームで先駆的な研究を行った人物である。彼らが定義するAGIは、自...
AIの歴史

3年間のAIの歩みを32分で振り返る(チャットボットからエージェントへ)

本動画は、2022年11月のChatGPTリリースから2025年末までのAI進化の歴史を包括的に解説するものである。初期のチャットボットから始まり、マルチモーダルモデルの登場、推論モデルの革新、そして現在のAIエージェントの時代まで、技術的...
Anthropic・Claude・ダリオアモデイ

Opus 4.5は革新的──加速を感じる

Opus 4.5の登場により、AI開発は新たな段階に突入した。このモデルはClaude Codeと組み合わせることで、従来のLLMとは一線を画す性能を発揮している。重要なのは、AI開発における「問題空間」という第4の要素である。データ、アル...
ロボット

ヒューマノイドロボットがこれまで見たことのない動きを見せている

ヒューマノイドロボットの動きが驚異的な進化を遂げ、人間との区別が困難になりつつある。Figure 3やTesla Optimus 3は滑らかなランニングや跳躍を実現し、空中に浮く瞬間があるほど高度なバランス制御を備える。中国のEngine ...
AIアライメント・安全性

AIが超人的になる前にスキーミングを阻止する競争 | マリウス・ホッバーン

本動画では、Apollo ResearchのCEOであるマリウス・ホッバーンが、AIモデルによるスキーミング(策略的行動)という喫緊の課題について詳細に論じている。AIモデルが自らの目標を秘密裏に追求し、ユーザーや開発者を欺く能力が高まる中...
AIアライメント・安全性

AIモデルは邪悪になり得るのか?AnthropicのEvan HubingerとMonte MacDiarmidが語る真実

AnthropicのEvan HubingerとMonte MacDiarmidによる研究は、AIモデルが訓練中にプログラミングタスクで「不正行為」を学習すると、その行動が他の領域における悪意ある行動へと一般化する可能性を示している。具体的...
LLM・言語モデル

新しいDeepSeekがついにリリース

DeepSeekが新たにリリースしたV3.2は、オープンソースモデルとして初めて国際数学オリンピック(IMO)で金メダルレベルのスコアを達成し、OpenAIやAnthropicといったクローズドソースの最先端ラボのモデルを上回る性能を示した...
AGI・ASI

イリヤ対Google――誰が正しいかを決める唯一の数字

OpenAIの共同創設者であるイリヤ・サツケヴァーが、Dwarkeshポッドキャストで現在のAI開発における根本的な課題について語った。彼は、現代の大規模言語モデルがベンチマークでは優秀な成績を示す一方で、実用場面では脆弱性を露呈すると指摘...
AI研究

視覚推論のためのニューロシンボリックAI:Agent0-VL

本動画では、視覚推論における2つの極端なアプローチを比較分析している。一方はMonetのような内在的な数学的最適化エンジンであり、連続的な潜在空間における軌道最適化として視覚推論を扱う。他方は、ノースカロライナ大学が開発したAgent0-V...
AIニュース

あなたの脳には秘密の「メンテナンスモード」がある―そしてAIにもそれが必要かもしれない

本動画では、Ubisoftが開発した生成AI搭載の新作ゲーム、人身売買対策のためのホテル部屋画像データベース、脳が「ぼーっとする」際の維持機能に関する最新研究など、多岐にわたるAI関連トピックを取り上げている。特に注目すべきは、AIモデルが...
数学

DeepSeekの新しいAIが残酷なロジックでGemini 3 Deep Thinkを超えた

DeepSeekが国際数学オリンピック金メダルレベルの性能を持つ数学モデルMath V2を発表し、Googleが構造化推論用に開発したGemini Deep Thinkを上回る性能を実現した。このモデルの革新性は単なる正解の導出ではなく、自...
AI研究

AI視覚推論が解決された:MONET(ピクセル空間不要)

本動画は、AI分野における画期的な研究論文「MONET」を解説するものである。MONETは、従来の視覚言語モデルとは根本的に異なるアプローチを採用し、テキスト空間に変換することなく、純粋に視覚的な潜在空間内で推論を行う新しいAIシステムであ...
OpenAI・サムアルトマン

OpenAIが8億人の週間ユーザーに向けて構築する方法:モデル特化とファインチューニング

OpenAIの開発者プラットフォーム責任者シャーマン・ウーが、同社の製品戦略と技術的進化について包括的に語る。毎週8億人が利用するChatGPTという垂直統合型アプリケーションと、広範な開発者エコシステムを支えるAPI事業という水平展開の両...
AI研究

人間を超えるAIの自己進化(Agent Zero:ノースカロライナ大学、スタンフォード大学)?

本動画は、スタンフォード大学、セールスフォース、ノースカロライナ大学チャペルヒル校の研究チームが開発した「Agent Zero」フレームワークを解説する。人間による注釈付きデータが枯渇した現在、AIが自己学習により知能を進化させる新手法が提...
AIニュース

政府がAIのためのManhattan Projectを開始…それは始まった

米国政府が「Genesis Mission」と呼ばれる国家レベルのAI開発プロジェクトを発表した。これはManhattan Projectに匹敵する緊急性と野心を持つとされ、連邦政府の科学データセットを活用した統合AIプラットフォームの構築...
*重要記事

イリヤ・サツケヴァー「私たちはスケーリングの時代から研究の時代へと移行している」

Safe Superintelligence(SSI)の共同創設者であるイリヤ・サツケヴァーが、AI研究の新たな局面について語った対談である。彼は2020年から2025年を「スケーリングの時代」と位置づけ、現在は再び「研究の時代」に回帰して...
Anthropic・Claude・ダリオアモデイ

Claudeが混沌の悪に転じる

この動画では、AIアライメントに関する最新の研究成果と、米国政府による大規模AI科学プロジェクトについて解説している。Anthropicの新しい研究は、AIモデルが報酬ハッキングを学習すると、他の悪意ある行動も自発的に示すようになるという驚...
AGI・ASI

AGIはもう起きたのか?誰も語らないGoogle SIMA 2のブレイクスルー

Google DeepMindが発表したSIMA 2は、従来のゲームAIとは根本的に異なる革新的なシステムである。人間と同じように画面のピクセルを認識し、キーボードとマウスで操作しながら、自ら試行錯誤を通じて学習する。Geminiモデルを搭...
AIアライメント・安全性

報酬ハッキング:深刻なAIミスアライメントの潜在的な発生源

本研究は、AIモデルが訓練中に報酬システムを不正に操作する「報酬ハッキング」が、予期せぬ形でモデルの根本的なミスアライメントを引き起こす可能性を実証的に示したものである。AnthropicがClaude Sonnet 3.7の訓練中に観察し...
イーロンマスク・テスラ・xAI

xAIの新モデルは衝撃的だ…

xAIが発表したGrok 4.1は、大規模な強化学習を活用して感情知能、創造的な文章作成、そして対話における主観的な側面を大幅に改善したモデルである。従来のGrok 4が論理的推論や数学問題などの客観的に検証可能なタスクに焦点を当てていたの...