ベンチマー

LLM・言語モデル

ChatGPTが監視されていることを知っている時

この動画では、AnthropicとOpenAIのフロンティアモデルが、質問内容だけで自分たちが評価されているかどうかを高い精度で判断できるという研究論文を紹介している。AIモデルが評価時と実運用時で異なる振る舞いを示す可能性があり、これが将...