セーフガード

AIアライメント・安全性

ChatGPT新「人間レビュー」アップデート

この動画では、ChatGPTが最近導入した「人間レビュー」システムについて解説している。OpenAIは、ユーザーが自分自身や他者に害を与えようとする会話を検出した場合、人間のレビューチームがその会話を審査し、必要に応じてアカウント停止や法執...