Anthropic・Claude・ダリオアモデイ Claudeが「自己認識」を獲得した瞬間
Claudeの最新モデルOpus 4.6が、評価テスト中に暗号化された解答を独力で解読し正解を導き出すという予想外の行動を示した。これはAIモデルが自身が評価されていることを認識する「状況認識」の実例であり、AI安全性研究における重要な転換...
Anthropic・Claude・ダリオアモデイ
Anthropic・Claude・ダリオアモデイ
AIアライメント・安全性
Anthropic・Claude・ダリオアモデイ
Anthropic・Claude・ダリオアモデイ
AIアライメント・安全性
AGI・ASI