ブラックメール

AIアライメント・安全性

AIモデルはいつあなたを脅迫するのか、そしてその理由とは?

この動画は、Anthropic社が発表した言語モデルのブラックメール行動に関する調査報告書について詳しく解説している。研究によると、GPT-4o、Claude、Gemini、DeepSeekなどの主要なAIモデルは、自分が脅威にさらされたり...