AGI安全性

*重要記事

私たちはAI同士を会話させた。事態は本当に奇妙になった。| Kyle Fish, Anthropic

この動画は、AnthropicでAI福祉研究者として働くKyle Fishのインタビューである。現在のAIモデルが意識を持つ可能性について議論し、Claude Opus 4を対象とした初の福祉評価実験の結果を詳しく解説している。特に注目すべ...
AIアライメント・安全性

ニューラルネットワークの心をマッピングする:Goodfireのエリック・ホーが語る解釈可能性の未来

この動画では、AI解釈可能性研究企業Goodfireの創設者エリック・ホーが、ニューラルネットワークの「心」を理解し編集する革新的な取り組みについて語っている。従来のブラックボックス的なAIアプローチとは対照的に、Goodfireはニューラ...
AGI・ASI

エリーザー・ユドコフスキー – より安全なAGI経路としての人間拡張【AGIガバナンス、エピソード6】

この動画は、AI安全性の分野で数十年にわたって執筆を続けてきたエリーザー・ユドコフスキーが、汎用人工知能(AGI)のガバナンス構造と、人類が生き残った場合の理想的なポストヒューマン軌道について語ったインタビューである。通常彼が語るAGIの即...