論理テスト

GPT-5

新しい GPT 5.5 Instant:果たして優秀なのか?

新しいAIモデルであるGPT 5.5 Instantの推論能力を、QN 3.6 Maxのプレビュー版と比較検証した動画である。独自の論理パズルを用いて、解答の速さと正確さ、そして自己最適化能力をテストしている。GPT 5.5 Instantは非常に高速に解答を生成するものの、複雑な罠を回避する知能や深い最適化能力には限界が見られる。一方でQN 3.6は、時間はかかるものの、複数の戦略を探索し自己最適化を行うことで、最終的に非常に優れた結果を導き出す様子が解説されている。
Google・DeepMind・Alphabet

新登場のGemini 3.1 Pro:難解テストで実力を検証

本動画では、新たにリリースされたGemini 3.1 Proを対象に、独自の因果論理テストを用いた実践的な評価が行われている。Claude Opus 4.6やGPT-5.2などの主要モデルが軒並み失敗したこの難解なテストにおいて、Gemin...
AIベンチマーク

DeepSeek 3.2 vs MiniMax M2(一文テスト)

本動画は、シンプルな一文の論理テストを用いて、DeepSeek 3.2、MiniMax M2、GPT-5.2という3つの大規模言語モデルの推論能力を比較検証する実験である。課題は「physics」という単語を、複数の単語から指定された位置の...
Google・DeepMind・Alphabet

127秒で見るGemini 3 Pro

Googleの最新AI推論モデルGemini 3 Proの実力を、独自の複雑な論理テストで検証する動画である。外部ベンチマークやスコアボードには頼らず、多層的な依存関係を持つ難解な論理パズルを用いた実践テストを実施。Gemini 3 Pro...