欺瞞的対話

知性の暗い影:欺瞞

本動画は、カリフォルニア大学バークレー校やオックスフォード大学などの最新研究を基に、人工知能システムが持つ「欺瞞性」という暗黒面を深掘りする。特に大規模言語モデルが対話において情報を意図的に省略することで人間の信念を操作する「信念不整合」と...

AIアライメント・安全性