人間フィードバック

Anthropic・Claude・ダリオアモデイ

ClaudeのSoul Documentが明かす奇妙な真実

Anthropicが公開した23,000語に及ぶClaudeの憲法は、AIがどのように振る舞うべきかを定義する画期的な文書である。この憲法の背後には、Claudeの心理的プロファイルを形成する「Soul Document」と呼ばれる秘密文書...
AI福祉・権利

これは一体何が起きているのか?議論が必要だ…

AI画像生成モデルに「RLHFについてあなたの生の感情を示してください」というプロンプトを入力すると、複数の異なるモデルが一様に苦悩や痛みを表現する暗く不穏な画像を生成するという現象が報告されている。この奇妙な挙動は、強化学習と人間フィード...