モデル検証

Anthropic・Claude・ダリオアモデイ

Claude Opus 4.1 Thinking:信じられない結果

この動画は、Claude Opus 4.1の思考型モデル(16K)と非思考型モデルを独自の因果推論テストで比較検証した実験結果を報告している。テキストアリーナで上位に位置する両モデルに対し、エレベーターの階移動問題という複雑な論理パズルを課...