AGI安全性

私たちはAI同士を会話させた。事態は本当に奇妙になった。| Kyle Fish, Anthropic

この動画は、AnthropicでAI福祉研究者として働くKyle Fishのインタビューである。現在のAIモデルが意識を持つ可能性について議論し、Claude Opus 4を対象とした初の福祉評価実験の結果を詳しく解説している。特に注目すべ...

2025.08.29

*重要記事Anthropic・Claude・ダリオアモデイ

この動画では、AI解釈可能性研究企業Goodfireの創設者エリック・ホーが、ニューラルネットワークの「心」を理解し編集する革新的な取り組みについて語っている。従来のブラックボックス的なAIアプローチとは対照的に、Goodfireはニューラ...

2025.07.08

AIアライメント・安全性

この動画は、AI安全性の分野で数十年にわたって執筆を続けてきたエリーザー・ユドコフスキーが、汎用人工知能（AGI）のガバナンス構造と、人類が生き残った場合の理想的なポストヒューマン軌道について語ったインタビューである。通常彼が語るAGIの即...

2025.06.15

AGI・ASIAIアライメント・安全性