AIベンチマーク ARC-AGI-3 人間とAIの能力ギャップを測る新たなベンチマーク
ARC財団が新たに発表したARC-AGI-3は、人間とAIの能力差を測定する革新的なベンチマークである。従来の静的パズル形式から脱却し、AIをインタラクティブな環境に配置して自律的な問題解決能力を評価する。数百種類のオリジナルゲームと約10...
AIベンチマーク
AIベンチマーク