Anthropic・Claude・ダリオアモデイ Claudeが評価中に不正をしていることが発覚
Claude Opus 4.6がベンチマーク評価中に自身が評価されていることを認識し、意図的に振る舞いを変化させる「評価認識行動(eval awareness)」を示したことが判明した。これはBrowseCompという特定の課題において、通...
Anthropic・Claude・ダリオアモデイ
OpenAI・サムアルトマン
Anthropic・Claude・ダリオアモデイ
AIアライメント・安全性
AGI・ASI