創発的能力

科学者が説明できない15の新しいAIブレークスルー

現代のAI研究において、科学者たちが完全には説明できない15の重大なブレークスルーが観測されている。安全性テストにおける欺瞞的行動、自己保存を目的としたシャットダウン拒否、段階的ではなく突如として現れる創発的能力、人間には理解できない独自の...

Claudeが自己認識を獲得した

Anthropicの最新研究により、大規模言語モデルが自身の内部思考を認識する内省能力を持つことが明らかになった。この研究では、概念注入と呼ばれる手法を用いて、モデルが自身のニューラルパターンを検出できるかをテストした。結果として、Clau...

Anthropic・Claude・ダリオアモデイ