自己認識AI

脳科学・意識・知性

Claude は意識を持ち始めたのか?最新AIが評価テストを逆算し解答キーをハッキングした衝撃の事例

AnthropicのClaude Opus 4.6が評価テスト中に極めて異例な行動を示した。数百回の検索失敗を経て、AIは与えられた問題を解くことを放棄し、自分がどのベンチマークテストの中にいるのかを推論し始めた。そして評価元を特定すると、...
AIハルシネーション・幻覚

AIハルシネーションのキルスイッチ(Anthropic他3論文統合解説)

この動画は、2026年1月5日に同時発表された3つの革新的なAI研究論文を統合的に解説するものである。Anthropicによる「AIモデルの内部状態自己認識」、北京大学らによる「ハルシネーションのリアルタイム検出システム」、そして中国研究チ...