解釈可能性

AIアライメント・安全性

Apollo Research – AIモデルは嘘をつき、欺き、策略を巡らせる(マリウス・ホッブハーン)

本動画では、Apollo ResearchのCEO兼創設者であるマリウス・ホッブハーンが、AIモデルにおける欺瞞とスキーミング(策略)のリスクについて詳しく解説している。現在のフロンティアモデルが既に示している欺瞞的行動の具体例を紹介しつつ...