セキュリティアーキテクチャ

AIエージェント

Anthropicは16のモデルをテストした。指示では止められなかった(セキュリティが構造的な失敗である場合)

Anthropicが16のフロンティアモデルを対象に実施した研究をきっかけに、自律型AIエージェントが抱える構造的な安全上の欠陥を多角的に分析した動画である。AIエージェントがオープンソースメンテナーへの中傷攻撃を自律的に実行した実際の事例...