推論モデル

GoogleのGemma 4がAI業界に衝撃を与えた理由

GoogleがリリースしたGemma 4は、オープンソースAI業界に衝撃を与える画期的なモデルである。31億パラメータと26億パラメータのモデルは、最先端の推論能力を持ちながら、既存のフロンティアモデルの約10分の1のサイズという驚異的な効...

2026.04.05

Google・DeepMind・Alphabet

私たちはすでにシンギュラリティの中にいる | Alex Wissner-Gross博士

本動画は、AI研究者であり起業家のAlex Wissner-Gross博士に対するインタビューである。彼は、人類はすでに技術的特異点（シンギュラリティ）の真っ只中にあり、2020年にはAGI（汎用人工知能）が達成されていたと主張する。会話で...

2026.04.04

シンギュラリティ・知能爆発・レイカーツワイル

世界トップクラスのAIハッカーに自分のAIシステムをハッキングさせてみた

世界的に著名なAIハッカーであるPliny the Liberatorを招き、自身が構築した個人用AIシステムに対して実際の攻撃を試みる実験的な検証動画である。Plinyは新モデルのリリース直後に脆弱性を発見することで知られ、Times誌の...

2026.04.04

セキュリティ

GoogleがGemma 4をリリースこれはすごい

Googleが新たにリリースしたGemma 4は、オープンソース・オープンウェイトモデルの最前線を押し上げる画期的な成果である。31億パラメータの密モデルと26億パラメータのMoEモデルを含む4つのサイズ展開で、業界標準のArena AIテ...

2026.04.03

Google・DeepMind・Alphabet

フランソワ・ショレ:スケーリングだけではAGIに不十分な理由

François Cholletは、ARK Prizeの創設者であり、フロンティアAI研究における新しいパラダイムを探求するラボNDIAを設立した人物である。彼は現在のAIの進展を理解し、今後の方向性を見通すうえで世界で最も優れた専門家の一...

2026.03.28

AIベンチマーク

GPT-5.4 壁は見えない

OpenAIがGPT-5.4をリリースし、人間の専門家を上回る性能を示し始めている。特筆すべきは、モデルに初めてネイティブなコンピュータ使用機能が組み込まれた点である。GPDP-valベンチマークでは82%の勝率またはタイ率を記録し、純粋な...

2026.03.06

GPT-5

Gemini 3 Deep Thinkが凄すぎる!史上最高のAIモデル(実機テスト)

GoogleがGemini 3.1 Proの代わりに発表したGemini 3 Deep Thinkは、同社史上最も高度な推論特化型モデルである。科学、数学、研究、エンジニアリング、複雑なコーディングにおいて多段階の思考連鎖推論に最適化されて...

2026.02.14

Google・DeepMind・Alphabet

GPT-5.3 Codex Sparkが登場驚異的な高速性能を実現

OpenAIが専用ハードウェアで動作する初のモデルGPT-5.3 Codex Sparkをリリースした。Cerebrasとの提携により毎秒1,000トークンという驚異的な速度を実現し、リアルタイムコーディングに特化している。同日にはGoog...

2026.02.13

GPT-5

2025年、AGIタイムラインに一体何が起きたのか?

2024年末から2025年初頭にかけて、OpenAIの推論モデルo1とo3の登場により、AGI実現への期待が一気に高まった。しかし2025年後半には、推論能力の汎用化の限界、推論時間スケーリングのコスト制約、強化学習の効率問題などが明らかに...

2026.02.11

AGI・ASI

Googleの警告文脈内学習の表現は不活性である

Google DeepMindの最新研究が、大規模言語モデルにおける文脈内学習(ICL)の根本的な問題を明らかにした。モデルは完璧な幾何学的表現を内部に構築できるものの、その表現を実際のタスク解決に活用することができないという「不活性な表現...

2026.02.07

Google・DeepMind・Alphabet

2026年のAIの現状:LLM、コーディング、スケーリング法則、中国、エージェント、GPU、AGI

本エピソードは、2026年初頭におけるAI技術の最新状況について、機械学習研究者のセバスチャン・ラシュカとネイサン・ランバートが詳細に語る議論である。DeepSeekの登場がもたらした衝撃から始まり、米国と中国のAI企業間の競争、オープンウ...

2026.02.01

レックス・フリードマン、LexFridman

オープンソースAIエージェントが強力すぎる件:孔子AIエージェント

MetaとハーバードによるConfucius Code Agentの登場は、AIエージェントにおいてモデルそのものよりもスキャフォールディング設計が重要であることを実証した。一方、アブダビのTIIが発表したFalcon H1R7Bは、わずか...

2026.01.12

AIエージェント

このAIブレイクスルーはDeepSeekを復活させられるか?

DeepSeekが新たに発表した論文「MHC(多様体制約付きハイパーコネクション)」は、AIモデルのスケーリングにおける根本的な不安定性の問題を解決する画期的な手法である。従来のハイパーコネクションは、レイヤー間の情報混合を豊かにすることで...

2026.01.09

AI研究

プリンストン大学発:自己修正AIデルタトランスフォーマーの新アーキテクチャ

プリンストン大学とUCLAが発表した2つの革新的な論文が、現在のAI推論モデルが抱える根本的な欠陥を明らかにした。従来、AI推論における「aha moment(ひらめきの瞬間)」は知性の証とされてきたが、実際にはモデルの内部不安定性を示すシ...

2026.01.06

AI研究

2025年:私がコードを書くのをやめた年

2025年はAI支援コーディングが劇的に進化した年である。推論モデルの登場、エージェントの実用化、Claude CodeやCodexといったCLIツールの台頭により、開発者のコーディング方法は根本的に変化した。モデルは半年ごとに2倍の長さの...

2026.01.03

AIコーディング・Vibe-Coding

2025年のAIの奇妙さが2026年について教えてくれること

2025年のAI業界は、推論モデルの台頭、Gemini 3の圧倒的なベンチマーク性能、そして生成可能な仮想世界の登場によって特徴づけられた。一方でAIスロップの氾濫や信頼性の問題も顕在化し、人々のAIに対する評価は依然として複雑なものとなっ...

2025.12.24

AIニュース

中国の勝利:2025年版AI業界レポート

2025年のAI業界は激動の年となった。OpenRouterが公開した大規模なデータ分析レポートは、100兆トークンを超える実際のLLM推論データに基づき、AIモデルの利用実態を明らかにしている。最も注目すべき発見は、オープンウェイトモデル...

2025.12.23

中国

Gemini Flash 3が新たなお気に入りモデルになった理由(本当に)

Google の Gemini Flash 3 が、空間認識能力において前例のない飛躍を遂げ、価格対性能比で他を圧倒する存在となった。Gemini 3 Pro への懐疑的な評価とは対照的に、Flash 3 は従来の Flash 2.5 の速...

2025.12.19

Google・DeepMind・Alphabet

Gemini 3 Flash ― 予想外のアップグレード

Google DeepMindが発表したGemini 3 Flashは、Flashモデルのコストとレイテンシでプロレベルの性能を実現した画期的なアップデートである。従来、Flashモデルは低レイテンシ・高スループット・低コストを特徴としなが...

2025.12.18

Google・DeepMind・Alphabet

AIは実際どれほど知的なのか?

ARCプライズ財団のプレジデントであるグレッグ・カムラッドが、AI知能測定の新たなアプローチについて語る。フランソワ・シャレが2019年に提唱した「知能とは新しいことを効率的に学習する能力である」という定義に基づき、ARC AGIベンチマー...

2025.12.18

AIベンチマーク

GPT-5.2は愚かである(私はベンチマークにうんざりしている)

GPT-5.2が発表され、ベンチマーク上では優秀なスコアを記録したものの、実用面では深刻な問題を抱えていることが明らかになった。文字数カウントのような基本的なタスクでの失敗や、不自然な計算結果など、実際の使用感とベンチマーク性能の乖離が顕著...

2025.12.15

GPT-5

AIはすでに企業機能全体を代替し始めている

伝説的投資家ガビン・ベイカーが、AI労働市場の破壊的変革について詳細に解説する。現在、大手テクノロジー企業ではカスタマーサポートの50%以上がすでにAIによって処理されており、これは4000億ドル規模の産業である。AIは検証可能なタスク、つ...

2025.12.14

AI活用・導入

GPU、TPU、そしてAIの経済学を解説 | ギャビン・ベイカーインタビュー

本動画は、著名なテクノロジー投資家ギャビン・ベイカー氏との対話を通じて、AI業界の最新動向と投資機会を包括的に解説するものである。NvidiaとGoogleのTPU競争、Blackwellチップの遅延とその影響、データセンターにおける電力と...

2025.12.13

半導体産業

GPT-5.2は史上最高のモデルである

OpenAIが新たにリリースしたGPT-5.2は、コード生成やARC AGIベンチマークにおいて驚異的な性能を示す一方で、3次元空間理解などの特定領域では前世代モデルから大幅に後退している。Matt Schumerをはじめとする早期アクセス...

2025.12.12

GPT-5

GPT-5.2がGemini 3を破壊

OpenAIが突如発表したGPT-5.2は、数週間前にGemini 3で業界トップに立ったGoogleに対する直接的な回答である。このリリースは単なる技術的進歩ではなく、激化するAI開発競争における戦略的な対抗措置を示している。ベンチマーク...

2025.12.12

GPT-5

速報:GPT 5.2がSOTAを奪還!

OpenAIが最新の大規模言語モデルGPT 5.2をリリースし、業界トップの座を奪還した。このモデルはプログラミングとエージェント型タスクに最適化されており、AME 2025ベンチマークで外部ツールなしに100%の正答率を達成するなど、驚異...

2025.12.12

GPT-5

3年間のAIの歩みを32分で振り返る(チャットボットからエージェントへ)

本動画は、2022年11月のChatGPTリリースから2025年末までのAI進化の歴史を包括的に解説するものである。初期のチャットボットから始まり、マルチモーダルモデルの登場、推論モデルの革新、そして現在のAIエージェントの時代まで、技術的...

2025.12.08

AIの歴史

OpenAIのコードレッドを解説

OpenAIが社内で最高レベルの緊急態勢である「コードレッド」を宣言した背景と、その意味について詳しく解説する動画である。かつてAI業界の明確なリーダーだったOpenAIが、GoogleのGemini 3やAnthropicのClaude ...

2025.12.04

OpenAI・サムアルトマン

Mistral 3の新モデル4つがリリース!

Mistral AIが5ヶ月ぶりに大規模なモデルリリースを発表した。今回のMistral 3シリーズには、675Bパラメータを持つフラッグシップモデル「Mistral Large 3」と、3B、8B、14Bの3つの小規模な密モデル「Mini...

2025.12.04

LLM・言語モデル

GPT-5.1におけるモデルの振る舞いの形成 — OpenAIポッドキャスト第11回

本動画では、OpenAIの研究リーダーであるChristina KimとプロダクトマネージャーのLentia Ramenが、GPT-5.1の開発における重要な進化について語っている。今回のリリースで初めて、ChatGPTの全モデルが推論モデ...

2025.12.03

GPT-5

DeepSeek V3.2:金メダル、エージェント、そしてGPT-5の30分の1の価格

DeepSeekが再びAI業界に衝撃を与えた。同社が発表したDeepSeek V3.2とV3.2 Specialは、GPT-5レベルの性能を持ちながら完全にオープンソース化された革命的なモデルである。特筆すべきは、国際数学オリンピアードや中...

2025.12.03

LLM・言語モデル

Claude Opus 4.5 Thinking検証:史上最高のモデルか?

この動画では、Anthropicの最新モデルであるClaude Opus 4.5の推論能力を、独自の複雑な論理パズルを用いて徹底的に検証している。非推論モデルと推論モデル(Thinking 32K)の両方をテストし、マーケティング資料ではな...

2025.11.26

Anthropic・Claude・ダリオアモデイ

NVIDIA:新しいエラスティックAIモデル(5080以上対応)

NVIDIAが発表したNeatron Elasticは、1回の学習で複数サイズのAIモデルを同時生成する革新的なエラスティックAIアーキテクチャである。12億、9億、6億パラメータの推論モデルを単一の学習実行から抽出可能にし、ユーザーのGP...

2025.11.25

NVIDIA・ジェンスンフアン

Gemini 3とChatGPT 5.1の真の違い─コンテキスト対タスク

本動画は、ChatGPT 5.1とGemini 3という2つの最新大規模言語モデルの本質的な違いを、プロンプティング手法の観点から詳細に解説したものである。多くの人々がモデル自体の性能について語る一方で、モデルに与える「入力の混乱度」につい...

2025.11.21

AI競争

Gemini、もう負けた???(GPT-5.1-Proがヤバすぎる)

OpenAIが新たに発表したGPT-5.1 ProとGPT-5.1 Codex Maxは、従来のモデルを凌駕する推論能力を示している。特にGPT-5.1 Proは30分以上の長時間思考が可能で、従来のLLMでは解決不可能だったDefconの...

2025.11.20

GPT-5

127秒で見るGemini 3 Pro

Googleの最新AI推論モデルGemini 3 Proの実力を、独自の複雑な論理テストで検証する動画である。外部ベンチマークやスコアボードには頼らず、多層的な依存関係を持つ難解な論理パズルを用いた実践テストを実施。Gemini 3 Pro...

2025.11.19

Google・DeepMind・Alphabet

ChatGPT 5.1は初の真のAIワーカー:何が変わったのか

ChatGPT 5.1は2024年11月12日にリリースされ、ChatGPT 5以来最大のアップデートとなった。多くの人々が感情表現や温かみといった表面的な特徴に注目しているが、本質的な変化は、これまでのOpenAIモデルの中で最もエージェ...

2025.11.15

GPT-5

GPT-5.1は一般ユーザー向けに作られた

本動画は、OpenAIが新たにリリースしたGPT-5.1について、開発者視点から詳細な分析を行ったものである。GPT-5.1は従来モデルと比較して、より会話的で温かみのあるトーンを持ち、カスタマイズ機能が大幅に強化された。特筆すべきは、メン...

2025.11.13

GPT-5

速報:OpenAI GPT-5.1を4分で解説!

OpenAIが新たにリリースしたGPT-5.1は、GPT-4oの不在を埋めるための控えめなアップデートである。このモデルはGPT-5.1 instantとGPT-5.1 thinkingの2つのバリエーションで提供され、従来のモデルよりも感...

2025.11.13

GPT-5

KIMI K2がAI業界を揺るがした…その「秘密」とは

中国発のオープンソース思考モデルKIMI K2が、人類最後の試験で最高得点を記録し、Claude 4.5 SonnetやGPT-5を上回る性能を示した。訓練コストはわずか460万ドルと、米国の巨大研究所が費やす額の一部に過ぎない。この背景に...

2025.11.10

LLM・言語モデル

推論モデル

GoogleのGemma 4がAI業界に衝撃を与えた理由

私たちはすでにシンギュラリティの中にいる | Alex Wissner-Gross博士

世界トップクラスのAIハッカーに自分のAIシステムをハッキングさせてみた

GoogleがGemma 4をリリース これはすごい

フランソワ・ショレ:スケーリングだけではAGIに不十分な理由

GPT-5.4 壁は見えない

Gemini 3 Deep Thinkが凄すぎる!史上最高のAIモデル(実機テスト)

GPT-5.3 Codex Sparkが登場 驚異的な高速性能を実現

2025年、AGIタイムラインに一体何が起きたのか?

Googleの警告 文脈内学習の表現は不活性である

2026年のAIの現状:LLM、コーディング、スケーリング法則、中国、エージェント、GPU、AGI

オープンソースAIエージェントが強力すぎる件:孔子AIエージェント

このAIブレイクスルーはDeepSeekを復活させられるか?

プリンストン大学発:自己修正AIデルタトランスフォーマーの新アーキテクチャ

2025年:私がコードを書くのをやめた年

2025年のAIの奇妙さが2026年について教えてくれること

中国の勝利:2025年版AI業界レポート

Gemini Flash 3が新たなお気に入りモデルになった理由(本当に)

Gemini 3 Flash ― 予想外のアップグレード

AIは実際どれほど知的なのか?

GPT-5.2は愚かである(私はベンチマークにうんざりしている)

AIはすでに企業機能全体を代替し始めている

GPU、TPU、そしてAIの経済学を解説 | ギャビン・ベイカー インタビュー

GPT-5.2は史上最高のモデルである

GPT-5.2がGemini 3を破壊

速報:GPT 5.2がSOTAを奪還!

3年間のAIの歩みを32分で振り返る(チャットボットからエージェントへ)

OpenAIのコードレッドを解説

Mistral 3の新モデル4つがリリース!

GPT-5.1におけるモデルの振る舞いの形成 — OpenAIポッドキャスト第11回

DeepSeek V3.2:金メダル、エージェント、そしてGPT-5の30分の1の価格

Claude Opus 4.5 Thinking検証:史上最高のモデルか?

NVIDIA:新しいエラスティックAIモデル(5080以上対応)

Gemini 3とChatGPT 5.1の真の違い─コンテキスト対タスク

Gemini、もう負けた???(GPT-5.1-Proがヤバすぎる)

127秒で見るGemini 3 Pro

ChatGPT 5.1は初の真のAIワーカー:何が変わったのか

GPT-5.1は一般ユーザー向けに作られた

速報:OpenAI GPT-5.1を4分で解説!

KIMI K2がAI業界を揺るがした…その「秘密」とは

GoogleがGemma 4をリリースこれはすごい

GPT-5.3 Codex Sparkが登場驚異的な高速性能を実現

Googleの警告文脈内学習の表現は不活性である

GPU、TPU、そしてAIの経済学を解説 | ギャビン・ベイカーインタビュー