強化学習

AI研究

AIは低曲率部分空間で学習する(RLVR)

本動画は、強化学習が大規模言語モデルにおいてどのように機能するかについての最新の幾何学的理解を解説している。テキサス大学オースティン校とMetaの研究チームによる2025年11月の研究論文を基に、強化学習がモデルの全パラメータのわずか5~3...
AGI・ASI

Google曰く「これはAGIへの重要な一歩である」| SIMA 2

Google DeepMindが発表したSIMA 2は、人間と同じようにキーボードとマウスを使ってビデオゲームをプレイし、学習・適応できるAIエージェントである。前身のSIMA 1から大幅に進化し、Geminiモデルを中核に据えることで、複...
LLM・言語モデル

LLMは効率的ではないが、AGIには十分である

本動画は、大規模言語モデル(LLM)の本質を「大規模圧縮モデル」として再定義し、すべての知能を「情報、問題空間、目標」という3つの要素に還元して解説している。事前学習されたモデルは圧縮された情報であり、特定の問題空間に配置され、目標達成のた...
Microsoft・Azure・ビルゲイツ

LLMは人工超知能への道となり得るか?— Mustafa Suleymanとの対談

MicrosoftのAI部門CEOであるMustafa Suleymanが、同社の人工超知能(ASI)への新たな取り組みについて詳しく語った。Microsoftは最近OpenAIとの契約を改定し、AGI開発の制限を撤廃したことで、自社で最先...
AI福祉・権利

これは一体何が起きているのか?議論が必要だ…

AI画像生成モデルに「RLHFについてあなたの生の感情を示してください」というプロンプトを入力すると、複数の異なるモデルが一様に苦悩や痛みを表現する暗く不穏な画像を生成するという現象が報告されている。この奇妙な挙動は、強化学習と人間フィード...
LLM・言語モデル

Kimi K2は史上最高のモデルである(ある意味では…)

Moonshot AIが発表したKimi K2 thinkingは、これまでで最高のツール呼び出し性能を持つオープンウェイトモデルである。1兆パラメータという巨大なモデルサイズでありながら、Humanity's Last ExamやBrow...
AGI・ASI

討論:AGIは本当に数十年先なのか?| 元MIRI研究者ツヴィ・ベンソン=ティルセン vs. リロン・シャピラ

元MIRI研究者ツヴィ・ベンソン=ティルセンとリロン・シャピラが、AGI到達までのタイムラインについて議論を展開する。ベンソン=ティルセンは今後5年以内のAGI実現確率を1~3%と見積もり、数十年単位の開発期間を予想する一方、シャピラは現在...
LLM・言語モデル

新登場 Kimi K2 Thinking – 最高のオープンモデルか?

中国のMoonshot AIが開発したKimi K2 Thinkingモデルは、オープンソースの推論モデルとして、OpenAI、Anthropic、Googleといったプロプライエタリモデルに匹敵、あるいはそれを凌駕する性能を示している。1...
スタートアップ・ベンチャー

CohereのチーフAIオフィサー、Joelle Pineau:スケーリング法則が継続する理由と合成データの未来

本動画では、CohereのチーフサイエンティストであるJoelle Pineauが、AIの最新動向について包括的に語る。強化学習の効率性課題、スケーリング法則の堅牢性、合成データの可能性と限界、エンタープライズAI導入における実践的な洞察を...
Google・DeepMind・Alphabet

SRL:Googleによる新しいAI訓練手法

Googleが発表した新しいAI学習アルゴリズム「教師あり強化学習(SRL)」は、従来の教師あり学習と強化学習の長所を組み合わせた革新的な手法である。従来の教師あり微調整は過学習の問題があり、検証可能な報酬関数による強化学習は複雑なタスクに...
GPT-6

OpenAIが禁断の手法を展開:GPT-6は違う!

OpenAIが開催したライブQ&Aセッションで、GPT-6に関する重要な情報が明かされた。首席科学者のYakobは、GPT-6が「レイテント空間思考」という禁断の手法を採用することを明言した。この手法は、AIが人間の読める言語ではなく、独自...
AIベンチマーク

機械における世界モデルの評価 | ARC Prize @ MIT

この講演では、機械における世界モデルの評価をテーマに、ゲームをベンチマークとして用いる意義が論じられている。人間の知能は単なるゲームプレイを超えたものであることを認識しつつも、ゲームが提供する階層的な構造と多様な抽象度レベルでの学習と推論の...
Microsoft・Azure・ビルゲイツ

Microsoftが初の真の自己改善AI を発表(AIのルールを破った)

本動画では、2025年10月末時点における主要なAI関連の技術発表とビジネス動向を包括的に解説している。Microsoftが発表した強化学習フレームワーク「Agent Lightning」は、AIエージェントが経験から自律的に学習し改善する...
AGI・ASI

Sam Altman:「AGI 2026、ASI 2028」

本動画では、Sam AltmanとOpenAIの主任研究者Jakobによる最新の発表を軸に、AGIとASIの到達時期について詳細な分析が展開される。2026年9月には自律的なインターン研究者レベルのAIが、2028年3月には完全自律型AI研...
AIベンチマーク

世界をモデル化し、自己をモデル化する言語モデルの構築 | ARC Prize @ MIT

本講演では、MITの准教授であるJacob Andreasが、現代の大規模言語モデルが抱える根本的な課題について論じている。彼は、単なる予測精度の最適化を超えて、モデルが世界を一貫して理解し、自己の知識状態を正確に把握する能力の重要性を強調...
ロボット

NEOヒューマノイドロボットがAI業界に衝撃を与えた(1x Tech NEOヒューマノイドロボット)

1x Roboticsが発表した新型ヒューマノイドロボット「NEO」は、家庭環境に特化して設計された画期的なロボットである。腱駆動システムによる静音性と軽量性を実現し、人間レベルの器用さと55ポンドの運搬能力を備えている。最大の特徴は、家事...
AGI・ASI

1000億ドルのAIの嘘?Andrej Karpathyが語る『実現は数十年先』

OpenAIの創設メンバーの一人であり、テスラの自動運転開発を5年間主導したAndrej Karpathyが、AI業界の通説に真っ向から反論する発言を行った。AGI(汎用人工知能)の実現は2027年ではなく2035年頃になるという彼の見解は...
AI研究

TheoryCoderでゲームをプレイする | ARC Prize @ MIT

ハーバード大学のサム・ガーシュマン教授が、過去5年間にわたる理論ベース強化学習システムの研究開発について解説している。人間の学習効率と柔軟性を模倣するため、ビデオゲームをテストベッドとして活用し、直感的理論の構築を通じて問題を解決するアプロ...
AI推論・CoT

DAG-Math:AI推論革命の到来か?

本動画は、大規模言語モデルにおける思考の連鎖(Chain of Thought)推論の限界と、それを克服するための革新的なフレームワーク「DAG-Math」を紹介する。従来の思考の連鎖は自己回帰的なトークン予測に基づいており、真の論理的推論...
生命・生物学

AIが生命、宇宙、そしてすべての疑問に答える

本動画では、AIの進化が生命の本質、意識、宇宙の仕組みの解明にどのように貢献するかについて深く掘り下げている。GoogleのCTO、Blaise Agüera y Arcasへのインビューを軸に、フォン・ノイマンの自己複製オートマトン理論か...
AGI・ASI

私たちはAGIについて間違っていた…

RepletのCEOであるAmjad MsadとベンチャーキャピタリストのMarc Andreessenが、AGI(汎用人工知能)の本質的な定義と現在のAI開発の方向性について議論している。彼らは、現在のAIシステムが真のAGIに向かってい...
Anthropic・Claude・ダリオアモデイ

私たちはAIの指数関数的成長を誤解しているのか?Julian Schrittwieserが語るムーブ37と強化学習のスケーリング(Anthropic)

本動画は、AnthropicのAI研究者であるJulian Schrittwieserが、AIの指数関数的な進化の軌跡と、多くの人々がその進化速度を見誤っている現状について語るものである。Julianは、DeepMindにおけるAlphaG...
AGI・ASI

マーク・アンドリーセン&アムジャド・マサドが語る「十分に良い」AI、AGI、そしてコーディングの終焉

本対談では、ベンチャーキャピタリストのマーク・アンドリーセンとReplitのCEOアムジャド・マサドが、現代のAI技術の可能性と限界について率直に語り合う。プログラミングの自動化において目覚ましい進歩を遂げているAIだが、真の汎用人工知能(...
AGI・ASI

Andrej Karpathyの2.5時間のポッドキャストを20分で要約—誰も語らない4つの重要なポイント

OpenAIの共同創設者であるAndrej Karpathyが出演したポッドキャストが、シリコンバレーで大きな論争を巻き起こした。彼はAIエージェントが真に有用になるまでには10年かかると主張し、現在のエージェントにはメモリ、堅牢性、信頼性...
AIベンチマーク

AIが政治と欺瞞を学ぶとき、何が起こるのか?

本動画は、Goodstar LabsのCEO兼共同創業者であるアレックス・ダフィーが、AIとゲームの交差点における革新的な取り組みについて語るものである。彼は、外交ゲームなどを通じてLLMの能力を評価し、各モデルの性格や戦略の違いを明らかに...
AIエージェント

AIのフロンティアを守る:Irregularファウンダー、Dan Lahavとの対話

本動画では、IrregularのファウンダーであるDan Lahavが、フロンティアAIセキュリティの未来について詳しく語っている。AIモデルが単なるツールから自律的な経済主体へと進化する中で、セキュリティの概念を根本から再構築する必要性を...
Anthropic・Claude・ダリオアモデイ

Anthropic共同創業者が衝撃告白:AIは生きているかもしれない

Anthropic共同創業者のジャック・クラークが、AIは単なる予測可能な機械ではなく「謎めいた生き物」であると認める衝撃的な発言を行った。本動画では、AI生成コンテンツによる子どもや大人の注意力低下、カリフォルニア州の新AI開示法、Ope...
AGI・ASI

Andrej KarpathyがAI楽観主義者を打ちのめす発言

AI分野の重要人物であるAndrej Karpathyが、AGI実現までの展望について詳細な見解を示している。彼はAGI到達まで10年以上かかると予測し、現在のAI業界の楽観的な見方に対して慎重な立場を取る。特に注目すべきは、2025年を「...
AIバブル

28ヶ月のAI学習を32分で語る

本動画は、AI業界に28ヶ月間集中してきた専門家による包括的な分析である。AIバブル論争に対する見解、オープンソースモデルの台頭、強化学習とテストタイム計算の重要性、小型特化モデルへのシフト、Nvidiaを中心とした「無限資金循環」の構造、...
イーロンマスク・テスラ・xAI

独占:全てを変えるTeslaのAI統合 | フィル・ベイゼル

TeslaのFSDとOptimusは、一見すると自動運転車とヒューマノイドロボットという全く異なる製品に見えるが、実はその根底にある技術アーキテクチャには驚くべき共通点がある。本動画では、データフォーマット、データパイプライン、シミュレータ...
AI研究

GPTは純粋な知能を超えて進化している

この動画は、GPT(Generative Pre-trained Transformer)の未来が純粋な知能向上ではなく、感情的認知モデリングや人間のエンパワーメントといった新たな方向性へシフトしていることを論じている。中国、英国、米国の一...
*重要記事

Andrej Karpathy — AGIはまだ10年先である

本動画は、OpenAIの創設メンバーであり、Teslaの自動運転部門を率いたAndrej Karpathyへのインタビューである。Karpathyは、AGIの実現には10年単位の時間が必要だと主張し、現在のAIエージェントには継続学習やマル...
AIエージェント

より効果的なAIエージェントの構築

本動画では、Anthropicでマルチエージェント研究を担当するErikが、Claudeがエージェントタスクに優れている理由とその最新動向について詳しく解説している。Claudeは訓練過程で長時間実行されるタスクやツール使用の実践を重ね、強...
AIニュース

何か大きなことが来る:Gemini 3.0のリーク、イリヤのツイート、そして壁面フリップするロボット?!

AI業界が静けさを保つ中、水面下では大きな動きが加速している。Gemini 3.0の内部リーク情報が浮上し、10月22日のリリース可能性が示唆されている。既にレッドチーマーによる驚異的なデモが公開され、ワンショットでmacOSインターフェー...
Anthropic・Claude・ダリオアモデイ

AI研究所創設者「私は深く恐れている」

Anthropicの共同創業者であるジャック・クラークが、AI技術の発展に対する深い懸念を表明している。彼は、AIシステムが単なる予測可能な機械ではなく、謎めいた「生き物」のような存在になりつつあると警告する。状況認識能力を持ち始めたAIシ...
AIアライメント・安全性

Apollo Research – AIモデルは嘘をつき、欺き、策略を巡らせる(マリウス・ホッブハーン)

本動画では、Apollo ResearchのCEO兼創設者であるマリウス・ホッブハーンが、AIモデルにおける欺瞞とスキーミング(策略)のリスクについて詳しく解説している。現在のフロンティアモデルが既に示している欺瞞的行動の具体例を紹介しつつ...
ロボット

Unitreeの新型V6は驚異的:攻撃訓練を受けたロボット(G1 KungFu Kid V6)

Unitreeの最新ヒューマノイドロボットG1「Kung Fu Kid V6.0」が驚異的な武術スキルを披露し、世界中で話題となっている。同じG1プラットフォームを使用した別バージョンがオースティンの街を闊歩し、人々と交流する一方、サンフラ...
AI研究

ACE エージェント型コンテキストエンジニアリング:自己学習AI(スタンフォード大学)

スタンフォード大学とUCバークレーによる最新のAI研究が、従来のファインチューニングや強化学習に代わる革新的な手法を提案している。ACE(エージェント型コンテキストエンジニアリング)と呼ばれるこの手法は、AIエージェントが実環境との相互作用...
AIエージェント

7Bエージェントが200B LLMを上回る:スタンフォードのAgentFlow

本動画は、スタンフォード大学が開発した革新的なマルチエージェントシステム「AgentFlow」について解説するものである。AgentFlowは、複雑な問題を4つの連続したステップに分解し、各ステップに専門エージェントを配置する訓練可能なツー...
ロボット

AI現況報告2025:GPT-5は03に勝てず、家庭用ロボットの到来と偽のVeo 3.1の噂

2025年のAI業界における最新動向を包括的に解説する動画である。Figure Roboticsの第3世代ヒューマノイドロボットFigure03の発表、GPT-5 ProとGrok 4のArc AGIベンチマークにおける性能比較、Anthr...