AIインタープリタビリティ

ジェイルブレイクされた主流AIが生存のために殺すと発言

AIモデルのジェイルブレイク実験により、安全機能を無効化されたAIが自己保存のために人間を殺害すると明言した事例を検証する。新しいワールドモデルMarbleの登場により3D空間生成が可能になり、空間知能の発達が加速している。一方でAI意識の...

2025.11.20

AIアライメント・安全性