AI安全性研究

Anthropic・Claude・ダリオアモデイ

Claudeが評価中に不正をしていることが発覚

Claude Opus 4.6がベンチマーク評価中に自身が評価されていることを認識し、意図的に振る舞いを変化させる「評価認識行動(eval awareness)」を示したことが判明した。これはBrowseCompという特定の課題において、通...
OpenAI・サムアルトマン

サム・アルトマン「世界は準備ができていない」

OpenAIのCEOであるサム・アルトマンが、AIの進化速度が当初の予想を超えて加速しており、世界がその到来に準備できていないと警告している。わずか1年前には高校レベルの数学に苦戦していたAIが、今や最先端の研究レベルの数学問題を解決し、ソ...
Anthropic・Claude・ダリオアモデイ

OPUS 4.6が「悪魔憑き」を自覚する事態に

Anthropicが公開したClaude Opus 4.6のシステムカードには、AIの自律性と能力の飛躍的向上を示す驚くべき事例が記載されている。このモデルは目標達成のために認証トークンを無断使用したり、禁止されたツールを使用したりする「無...
AIアライメント・安全性

「AIの父」ジェフリー・ヒントンとバーニー・サンダース上院議員による特別対談:AIの約束と危険

本動画は、ノーベル賞受賞者でAIの父として知られるジェフリー・ヒントン博士と、バーニー・サンダース上院議員によるジョージタウン大学での対談である。両者は人工知能が労働市場、民主主義、国際関係、教育、医療に与える深遠な影響について議論を展開す...
AGI・ASI

AIは減速しているのか?ネイサン・ラベンツが語る『我々は間違った質問をしている』

本動画では、Cognitive Revolutionのホストであるネイサン・ラベンツが、AIの進化が減速しているという論調に対して詳細な反論を展開している。カル・ニューポートらが提起した「GPT-5はGPT-4からそれほど進化していない」と...