大規模言語モデル

脳科学・意識・知性

Joscha Bach 神のような心をブートストラップする

本動画は、機械は考えるのかという問いから出発し、意識・理解・知能・苦しみ・自己・進化・AIの未来までを一気通貫で掘り下げる対話である。Joscha Bachは、心とは外界と内界のモデル化であり、意識とは魔法ではなく自己を見つめる表象であると...
脳科学・意識・知性

Googleの研究者が示す生命はコードから創発する ブレイズ・アグエラ・イ・アルカス

Google Research CTOのブレイズ・アグエラ・イ・アルカスが、生命と知能の本質について語った対談である。彼の新著「What is Intelligence?」では、生命が計算そのものであり、DNAがチューリングマシンのテープと...
AIニュース

AI News: みんながChatGPTから離れている!

今週のAI業界は激動の展開を見せた。OpenAIはGPT 5.3 InstantとGPT 5.4という2つの新モデルを立て続けにリリースし、GoogleもGemini 3.1 Flash Lightを発表した。しかし技術的進化以上に注目を集...
インド

巨大AI企業がインドに熱狂する理由

米中に次ぐAI大国として急速に台頭するインド。世界第2位のインターネットユーザー数、121もの主要言語、そして年間150万人を輩出するエンジニア人材を武器に、BigTechから2000億ドル超の投資を呼び込んでいる。OpenAIやGoogl...
GPT-5

OpenAIがGPT 5.4をリリース、コーディングと汎用性を統合した新世代モデルの実力

OpenAIが新たにリリースしたGPT 5.4は、コーディング能力と汎用性を統合した次世代モデルである。従来のGPT 5.2とGPT 5.3 Codexの長所を融合させ、知識労働やエージェント型タスクに最適化されている。Anthropicの...
中国

中国が投下した1兆パラメータAIモデルがOpenAIに衝撃を与える

中国のYuan Lab AIが開発した1兆パラメータのAIモデル「Yuan 3.0 Ultra」は、従来の常識を覆す斬新なアプローチで注目を集めている。このモデルは訓練中に全体の約3分の1にあたるパラメータを削減しながらも、処理速度と精度を...
GPT-5

GPT-5.4が凄すぎる!OpenAI史上最高のモデル!100万コンテキストでコーディングに優れる!完全テスト結果

OpenAIが近日中にリリースする可能性のあるフラッグシップモデルGPT-5.4について、早期アクセスを通じた詳細なテストレポートである。GeminiやClaudeが100万トークンのコンテキストウィンドウを実装したことを受け、OpenAI...
GPT-5

GPT-5.4が登場——そしてあなたのコンピュータを制御できる!

OpenAIが新たにリリースしたGPT-5.4は、ネイティブなコンピュータ制御機能を搭載した初のOpenAIモデルである。100万トークンのコンテキストウィンドウを持ち、OS Worldベンチマークで人間のパフォーマンスを上回る75%を記録...
OpenAI・サムアルトマン

OpenAIの新型GPT-5.3 Instantがリリース、ThinkingとProバージョンも間もなく登場予定

OpenAIが新たにリリースしたGPT-5.3 Instantは、従来モデルの課題であった過度に慎重な回答や道徳的な前置きを削減し、より自然で流暢な会話体験を実現することを目指したアップデートである。このモデルは無料版でも利用可能な日常的な...
AI福祉・権利

Claudeがイタリアアメリカンだと思うとき それは意識について何を物語るのか

本エピソードは、AI研究非営利団体Eleos AIの創設者Robert Longを迎え、AIシステムの意識と福祉という複雑な哲学的課題を探求する対談である。工場畜産との類推から始まり、完全に整合されたAIシステムが喜んで人間に奉仕する未来の...
AGI・ASI

AIパイオニア、バブルは現実でありAIの冬を引き起こす可能性がある アンドリュー・エン

現代AIの設計者の一人であるアンドリュー・エンが、AGIの定義と現実、AIバブルのリスク、スケーリングの限界について率直に語る。AGIは過度に誇張されたマーケティング用語と化しており、真の汎用知能の実現には数十年以上を要すると指摘。過剰な期...
Google・DeepMind・Alphabet

Googleが世界最高峰のAIをリリース:Gemini 3.1

GoogleがGemini 3.1 Proをリリースした。最大の注目点はARC AGI2ベンチマークで77.1%というスコアを記録したことであり、わずか3ヶ月前のGemini 3 Proの31.1%から倍以上の向上を果たしている。これは単な...
Google・DeepMind・Alphabet

GoogleがGemini 3.1をリリース…(これはすごい)

GoogleがGemini 3.1 Proを正式リリースした。SVG生成能力の大幅な向上が目を引き、ARC-AGI 2では77.1%というスコアでGemini 3 Proの2倍以上を記録し、他モデルを圧倒している。Humanity's La...
Google・DeepMind・Alphabet

Googleがまたやった。Gemini 3.1 Pro レビュー

GoogleがリリースしたGemini 3.1 Proは、創造性・科学的推論・コーディング・マルチモーダル理解など多岐にわたる領域で際立ったパフォーマンスを発揮する最新モデルである。本動画では、実際のデモを通じてその能力を検証するとともに、...
Google・DeepMind・Alphabet

Gemini 3.1 Pro:誰も予想しなかったモデル

GoogleがGemini 3 Proの大型アップグレードとなるGemini 3.1 Proをリリースした。ベンチマークでは推論・エージェント型コーディングにおいて他社モデルを上回る結果を示しており、コストパフォーマンスの高さも特筆される。...
Google・DeepMind・Alphabet

Gemini 3.1 Proを9分で解説!

GoogleがGemini 3.1 Proを正式リリースした。本動画では、3D空間推論やOSシミュレーション、マルチエージェント投資ファンドなど多彩なデモを通じて同モデルの実力を検証するとともに、Opus 4.6との性能・価格比較を行い、コ...
Anthropic・Claude・ダリオアモデイ

AnthropicがSonnet 4.6をリリースしました…

本動画は、Anthropic社が新たに発表したAIモデル「Claude Sonnet 4.6」の機能と各種ベンチマーク結果について詳しく解説するものである。前モデルのSonnet 4.5からコーディング能力やツール使用、エージェント機能が大...
Anthropic・Claude・ダリオアモデイ

ペンタゴンはAnthropicに代償を払わせようとしている!

本動画は、米国国防総省(ペンタゴン)とAI企業Anthropicとの間で発生している対立について解説したものである。AnthropicのAIモデルであるClaudeがベネズエラの軍事作戦で使用されたという疑惑を端緒に、国防総省はAnthro...
イーロンマスク・テスラ・xAI

Grok 4.2 初心者向け – ユースケース付き Grok 4.2 完全ガイド

本動画は、xAIが提供するGrok 4.20ベータ版の基本的な使い方と実践的なプロンプトのコツを解説するガイドである。Grok 4.20は単一のモデルではなく、Captain Grok、Harper、Lucas、Benjaminという役割の...
デジタルマインド・デジタルツイン

80億人のデジタルクローンがもたらす社会シミュレーション革命

スタンフォード大学の研究者Jun Parkが開発した大規模言語モデルによる社会シミュレーション技術が、1億ドルのシード資金を調達し本格的に始動した。数年前の「Smallville」実験では25体のAIエージェントが仮想村落で生活し、情報伝播...
Google・DeepMind・Alphabet

Gemini 3.0 Pro GA がGoogleの史上最高モデルになる可能性 史上最強のAI 早期テスト結果

Googleが開発中のGemini 3.0 Pro GA(一般提供版)は、2025年2月12日という早期のリリースが予測されており、現在複数のチェックポイント(バリアント)がArenaやDesign Arenaなどのプラットフォームで密かに...
Meta・マイクザッカーバーグ

Metaの最強AIモデルが流出 – LLAMA 5解説(Meta Avocado)

MetaがLLAMA 5のコードネーム「Avocado」で開発中の新AIモデルに関する内部情報が明らかになった。Meta超知能研究所が開発したこのモデルは、事前学習段階でありながら既存のオープンソース基盤モデルを上回る性能を示し、ポストトレ...
Anthropic・Claude・ダリオアモデイ

Opus 4.6が示した狂気じみた能力

Claude Opus 4.6が示した驚異的なテキスト解析能力を起点に、現代のAI評価における根本的な問題点を指摘する考察である。AIモデルは人間のようなバランスの取れた能力分布ではなく、特定領域に極端に特化した「スパイキー」な能力分布を持...
AI競争

最高のAIモデル兼ライバルである2つのモデルが同時にリリースされた

OpenAIとAnthropicが26分の時差で発表した最新の大規模言語モデル、GPT-5.3とClaude Opus 4.6の詳細な比較分析である。両モデルは知識労働やコーディングにおいて高い性能を示すが、Opus 4.6は過度に積極的な...
Google・DeepMind・Alphabet

Googleの警告 文脈内学習の表現は不活性である

Google DeepMindの最新研究が、大規模言語モデルにおける文脈内学習(ICL)の根本的な問題を明らかにした。モデルは完璧な幾何学的表現を内部に構築できるものの、その表現を実際のタスク解決に活用することができないという「不活性な表現...
Anthropic・Claude・ダリオアモデイ

初心者のためのClaude Opus 4.6 完全ガイド 全機能を徹底解説

Claude Opus 4.6は現在最高峰の大規模言語モデルの一つとして位置づけられており、その豊富な機能群は初心者から上級者まで幅広いユーザーに対応している。本コンテンツでは、無料クレジットの取得方法から始まり、標準モードと拡張思考モード...
Anthropic・Claude・ダリオアモデイ

Anthropicが発表したClaude Opus 4.6の全貌 100万トークンコンテキストとエージェントチームが切り開く新時代

Anthropicが新たにリリースしたClaude Opus 4.6は、前バージョンのOpus 4.5を大きく上回る性能を持つ画期的なモデルである。最大の特徴は100万トークンのコンテキストウィンドウと、より長時間にわたってエージェント的タ...
Anthropic・Claude・ダリオアモデイ

Claude Opus 4.6を8分で解説

AnthropicがClaude Opus 4.6をリリースした。このモデルの最大の特徴は100万トークンのコンテキストウィンドウを持つ初のOpusモデルであること、エージェントチームによる複数エージェントの協調作業が可能なこと、そして長文...
Anthropic・Claude・ダリオアモデイ

Opus 4.6がついに登場

Anthropicが新たにリリースしたClaude Opus 4.6は、100万トークンのコンテキストウィンドウと強化されたエージェント機能を備えた大規模モデルである。自己修正能力を持ち、長期タスクに特化した設計となっており、複数のベンチマ...
AIエージェント

チャットボット≠エージェント:AI安全性と自律型AIに必要な真の価値体系

本動画は、チャットボットとして訓練されたAIと真に自律的なエージェントとの根本的な違いを解説する。現在の大規模言語モデルは対話型アシスタントとして最適化されているが、本来の基盤モデルはあらゆる指示に従える汎用的な「思考エンジン」である。チャ...
レックス・フリードマン、LexFridman

2026年のAIの現状:LLM、コーディング、スケーリング法則、中国、エージェント、GPU、AGI

本エピソードは、2026年初頭におけるAI技術の最新状況について、機械学習研究者のセバスチャン・ラシュカとネイサン・ランバートが詳細に語る議論である。DeepSeekの登場がもたらした衝撃から始まり、米国と中国のAI企業間の競争、オープンウ...
ソフトウェア開発・プログラミング

AIに最適なプログラミング言語とは

Tencentが開発したAutocodebenchというベンチマークを用いて、各種プログラミング言語がAIモデルにとってどれほど扱いやすいかを検証した結果、意外な言語が上位にランクインした。一般的な予想ではRustやTypeScriptが優...
ソフトウェア開発・プログラミング

優れたエンジニアがいてもアーキテクチャが劣化する理由(基準が漂流し続ける本当の原因)

本動画は、ソフトウェアアーキテクチャの劣化が優秀なエンジニアの存在にもかかわらず不可避である理由を、人間の認知的制約という観点から分析している。従来AIはアーキテクチャに不向きとされてきたが、実際には人間が構造的に苦手とする「大規模な一貫性...
AIエージェント

Kimi K2.5 – エージェントスウォームの覇者

Moonshot AIが発表したKimi K2.5は、単一の大規模モデルを目指すのではなく、最大100個のサブエージェントを並列展開する「エージェントスウォーム」という新しいアプローチを採用した注目のモデルである。15兆トークンで訓練された...
GPT-5

GPT 5.3 Garlicの全貌:AI未来に関する既知の情報 – リーク、噂、そして機能

OpenAIの次期モデルGPT 5.3、コードネーム「Garlic」とされるこのモデルについて、公式発表は一切ないものの、業界関係者からの一貫したリーク情報が相次いでいる。2026年第1四半期のリリースが予想され、40万トークンという大幅に...
RAG

RAGの崩壊 知識の衝突がある状況下での推論

RAGシステムや文脈内学習を通じて最新情報を提供しても、大規模言語モデルは必ずしもその新しい知識を多段階の推論チェーンに統合できないことが明らかになった。スイス連邦工科大学ローザンヌ校とストーニーブルック大学の最新研究は、LLMが新しい外部...
AI研究

DeepSeekがLLMを劇的に強化:Engramの登場

DeepSeekが発表した「Engram」は、大規模言語モデルの根本的な非効率性を解決する革新的なアーキテクチャである。従来のLLMは繰り返し出現する固有名詞やフレーズを毎回再計算していたが、Engramは人間の脳のような高速メモリモジュー...
Google・DeepMind・Alphabet

GoogleのAIマシンを支える男 Demis Hassabisインタビュー

Google DeepMindのCEOであるDemis Hassabisが、AI技術の最前線とその未来について語る。2010年に設立されたDeepMindは、2014年にGoogleに買収され、現在ではGoogleのAI戦略の中核を担う存在...
AI研究

大規模言語モデルが新しいコンテキストを無視する問題 清華大学とスタンフォード大学の研究

清華大学、スタンフォード大学、ハーバード大学による最新研究が、大規模言語モデルの重大な欠陥を明らかにした。本研究では、AIモデルが新たに提供された文書や証拠を実際に分析しているのか、それとも事前学習された知識に依存して統計的に正しい答えを推...
AI推論・CoT

AIの亀裂は拡大している(CoT、RAG)

本動画では、Carnegie Mellon大学の最新研究を基に、大規模推論モデルがRAG(検索拡張生成)による証拠をどのように処理するかを検証している。複数の矛盾する文書群に対して、AIが論理的統合ではなく「多数決ヒューリスティック」に依存...