自動販売機

AGI・ASI

この新しいベンチマークは次元が違うほど狂っている

Anon Labsが開発したVending BenchとClaudiusは、AIモデルの実世界での自律性を測定する革新的なベンチマークである。仮想環境でのシミュレーションから始まり、AnthropicやXAIのオフィスに実際の自動販売機を設...
AGI・ASI

現在のすべてのAIモデルを破綻させる1000ドルのテスト

この動画は、Anthropic社のAI「Claude」が自動販売機の運営を試みた実験「Project Vend」について詳しく解説している。Claudeはオンラインでサプライヤーとやり取りし、在庫管理や価格設定を行ったが、適切な価格マークア...