Chat GPT 5.4の包括的なテストレビューである。新たに実装されたウェブサイト生成機能、スプレッドシート・ドキュメント・スライド作成機能、MCPサーバー連携によるチェス対戦などを実際に検証し、モックアップから忠実にウェブサイトを再現する能力や政治家給与データの分析能力を評価している。Gemini、Claude、Antigravityとの比較も含め、GPT-5.4の実用性と限界を明らかにする詳細な検証動画である。

Chat GPT 5.4の新機能をフルテスト
さあ、皆さん、こちらをご覧ください。AIがここで駒を動かしました。ナイトから始めたんです。左側がChat GPTが生成した画像で、右側が人工知能が作成したウェブサイトです。ブラジル全土の政治家の給与リストを作ってもらいました。
皆さん、このテストを作るのに時間がかかったことにお気づきでしょう。でもそれは、あまりにも多くの新機能があって、彼らが発表した内容を具体的にテストしたかったんです。それが本当に機能しているのか、正直な意見を述べるためにね。特に、このモデルを気に入らない人たちもいて、あまり良くないというコメントも出始めていますから。
今回は少し違ったテストをします。彼らが発表した機能に焦点を当てつつ、いつもの定番テストも見ていきましょう。では、何が起きているのか理解していきましょう。一緒に見ていきましょう。
テスト開始前の感謝とセットアップ
さあ、皆さん。いつも「いいね」を押してくれる皆さん、チャンネル登録してくれた皆さんに感謝します。そして、このAIチャンネルをスポンサーしてくれている全てのチャンネルメンバーに特別な感謝を。彼らは限定動画や先行公開動画にアクセスできます。
GPT-5.4がリリースされました。私は動画を作りました。ここをクリックすれば見られます。全ての機能、新機能、このモデルで起きた全てのことを網羅した完全版です。そして今、あの動画で紹介した全ての機能に基づいてテストを行います。では実践的に、どんどん進めていきましょう。
モックアップからウェブサイト作成テスト
最初にテストしたかったのは、彼らが説明していた機能です。つまり、AIに画像を渡すと、その画像からウェブサイトを作ってくれるというものです。
まず重要なことを言っておかなければなりません。私がここでテストしているバージョンは、Plusサブスクリプションを使っていて、Proサブスクリプションではありません。Pro版はさらに賢いのですが、私は持っていません。料金が高いので。ですから、私がここでテストしている全てのことについて、さらに高いレベルがあって、もっと良い結果が得られる可能性があることを明確にしておきます。
何をしたかというと、Chat GPTにこう指示しました。「ブラジルで最も裕福な人々について語るウェブサイトのモックアップ画像を作成してください。ログインボタンが必要です。裕福な人々が見たいと思うようなサイトの外観で、彼らの興味に基づいたリンクやアイデア、例えば彼らのストーリーを知ることや投資などを含めてください」と。
するとAIがこの画像を生成しました。「ブラジルの億万長者、ブラジルで最も裕福な人々」。億万長者を知ろうというコンテンツで、ここに何人かの画像を配置しました。架空の裕福な人々です。ジョアン・シルヴァ、マリア・ソウザ、カルロス・ペレイラといった名前を作りました。
この画像を詳しく見ると、ポルトガル語の誤りがいくつか見つかります。例えば、ここです。「登録」「開始」と書いてありますが、何が書いてあるのか理解できません。全体的におかしなテキストです。「億万長者」にはアクセントがありません。誤りだらけですね。「投資のヒント」の綴りが間違っています。文字が抜けていて、最後にも間違った文字があります。
これが元の画像です。いくつか誤りがありますが、かなり完成されています。架空の人物がいて、ここに金額があります。何十億ドルとか。マリア・ソウザがいて、面白いことに、ここにいる3人は上の3人と同じ人物です。
さて、皆さん。左側がChat GPTが生成した画像で、右側がAIが作成したウェブサイトです。彼らが説明していた機能、つまり画像を送るとすぐに完成したウェブサイトが届くというものです。AIが画像を見て、サイトを見て、また画像を見て、サイトを見てという魔法が起きるんです。
MCP Serverセットアップと実装プロセス
AIにこの魔法を実行させる方法、つまりサイトを見て修正して、また見てというピンポンを続けさせる方法について説明します。主なポイントは、Codexをインストールすることです。MCP Serversに行って、MicrosoftのこのPlaywrightをインストールします。その説明はまさにこれです。「デザイン実装とユーザーインターフェーステストのためのブラウザ自動化統合」。
この部分は少し難しく、やや高度なステップです。コンピューターにNode.jsをインストールする必要があります。Playwrightもインストールする必要があります。これは自動化をテストするための特定のブラウザで、最も楽しいことの一つです。
全てインストールしたら、AIにこう言います。「MCPを使ってPlaywrightを開いて、画面に何があるか見て」。ここで最初のコメントをします。私がテストした限りでは、AIが迷子になって、何かがブロックされているとか、何かが間違っていると言い始めるのは普通のことです。実際には何も間違っていないのに。
このコマンドを渡すと、AIはPlaywrightのブラウザを開いて、でたらめを言い始めました。それで私は言いました。「画面に何があるか見るだけで、できなければ教えて」。するとAIはまた何かをしようとして、私はまた言いました。「画面に何があるか見るだけで、できなければ教えて」。そしてAIは諦めて言いました。「わかりました。今Playwrightには新しいタブのChromeページがあります。表示されているようです。Googleの何かがあります」。そして「完璧です」と言いました。
この時点で、AIがPlaywrightにアクセスできて、視覚化できていることがわかりました。ここから先は、何が起ころうと、私が全て手動でやります。サイトを読み込んだり、何でも準備して、全て整えます。AIはただ見て、良いか悪いかを判断するだけでいいんです。なぜなら、それだけができればいいからです。F5を押して画面を更新して、何が表示されているか見るだけです。わかりますか?
AIは必要なものについてたくさん話し始めますが、必要ありません。より高度なテストや何か特別なことをさせたい場合を除いて。
ウェブサイト生成の実行と結果
そして今、魔法のプロンプトを送りました。「この画像からウェブサイトを作成してください」。あの画像を送りました。「サイトは全く同じである必要があります。ボタンのテキストを写真と全く同じように配置してください。単にHTMLに写真を入れるだけではダメです」。なぜならAIはそうすることもできるからです。写真を取って、添付して、「終わり」と言うこともできます。でも私はそれを望んでいません。はっきりさせておきました。「画像のようにサイトを作ってください」と。
そして説明します。「Playwrightを使ってサイトのバージョンを画像と比較して、正しいか確認してください。サイトが完成したら教えてください。Playwrightで権限の問題があったら、私と話して助けを求めてください。自分で解決しようとしないでください」。
わかりますか? AIがPlaywrightで迷子になって、必要のないことをしようとすることがわかっているので、はっきりさせました。Playwrightでは何もしないでください。必要なことがあれば私に聞いてください。
そして、案の定です。「私が続けないように頼まれたタイプのブロックに遭遇しました」とAIが説明します。その時に何が起きたかというと、Playwrightのウィンドウが空白ページで開いていましたが、AIはすでにサイトのコードを作成していました。
それで私はコードを手動で配置して言いました。「見て、今私がサイトを手動で読み込みました。問題が解決したか見てください」。
そして皆さん、ここから先は簡単でした。この段階が終わったら、ただ「続けて、どんどん作って」と言うだけでした。7分間、かなりの部分を作り続けました。ある時点で止まったので、「続けて」と言いました。するとさらに12分間作業して、完成したと言いました。それから2つの小さな変更を頼みました。さらに15分かかって、サイトが完成しました。感謝を伝えると、「どういたしまして」と返事がありました。
これが最終結果です。左側が送った全ての写真で、右側がAIが作成したサイトです。いくつか重要な詳細をお話しします。
例えば、この「億万長者」という単語です。見えますか? これは画像で、ロゴがあって、ここに特定のものがたくさんあります。AIは何をしたかというと、これを画像に変換したので、ここは「億万長者」になりました。これは興味深い判断でした。なぜなら、このロゴを取得するのは問題だったでしょう。ロゴだけを画像として取得して、テキストを再作成する方が良かったかもしれません。
サイトの項目はかなり正確です。見てください。「ホーム」「億万長者リスト」「投資」「ライフスタイル」。両方とも正しいです。ボタンにはここに表示されていないスタイルがいくつかあります。
画像について、皆さん、よく見てください。プライベートジェットがあって、3人の人物がいますが、この写真では彼らが笑っていて、こちらの写真ではあまり笑っていません。歯がこちらではより多く見えていて、こちらでは見えていないことでわかります。
なぜこうなったのでしょうか? 生成の途中段階で気づくと思いますが、飛行機の切り抜きと3人の切り抜きがあります。何が起きたかというと、テキストの後ろに画像があったので、見える部分を切り取りましたが、テキストの後ろは黒い背景になっています。なぜでしょうか? 切り取られているからです。テキストの後ろにあった画像を取得できませんでした。
これが起きていることに気づいたとき、Chat GPTに戻って背景画像を別に作成するよう頼みました。ですから、最初のヒントはこれです。ウェブサイトを作成してもらうときに、そのサイトに画像がある場合、モックアップがあったとしても、最初から画像を送ってください。画面から切り取って間違いを犯さないように。
でも同時に、生成されたこの画像は上の縁が高く、下の縁も高いです。別の種類の問題を引き起こします。これから見えるでしょう。
例えば、画像は女性の肘のところで切れていますが、最終生成を見ると、画像はかなり長くなっています。実際、この画像の終わりは下の画像の始まりと一致しています。
ボート、グラフ、車の画像も切れています。なぜでしょうか? AIがそれらの部分をコピー&ペーストして、間違ってコピーしたからです。
一方で、AIにアプローチしたとき、全て誤りも含めてコピーしていたので、誤りを修正するよう頼みました。
投資のヒントは今は正しくなっています。でもストーリーはまだ間違っていますね。今気づきました。ストーリーはまだ間違っています。「歴史」であるべきですが、「登録」は今は正しいです。最初のバージョンでは100%間違っていたものです。
下の部分も同じです。人物の画像は切れて表示されましたが、正しい画像です。でもアクセントがあった「資産」は「資産」になり、全て正確です。
評価と改善点
では、私の感想は? とても興味深いと思いました。AIが交互に変更していくのを見ました。フォントを変更して、大きくして、小さくして。これを何度も繰り返しました。長時間かけて解決しようとしても解決できないとき、こう言いました。「私ができる最善を尽くしました。続けたいですか、それともここで止めますか?」 それで、続けるか続けないかを選べました。
本気でやるサイトなら、この時点からAIが作成したサイトを取って、モックアップは忘れて、新しいサイトに100%の努力を集中します。ミッション1は完了です。
下にコメントしてください、どう思ったか。繰り返しますが、Pro版は使っていません。Pro版ではこのサイトがさらに良くなるかもしれませんが、0から10の点数をつけるなら、8点をつけます。
不足していると思うこと、例えば「ブラジルで最も裕福な人々」というテキストで、「do」が小さいサイズになっていますが、ここでは全て同じになっています。このフォントには微妙な影があり、ここには表示されませんが、許容範囲です。ウェブサイトでは、インターネットでは物事が異なります。テキストエディタの話ではなく、フォントとサイズは100%同じではありません。
いくつかの詳細があります。例えば、ライフスタイルボタンはもう少しスタイリングが良くてもよかったです。切れた写真、一部のスペーシング、表示されなかった区切り線などもあります。でも大部分は正確でした。大部分はまさにあるべき通りでした。
下にコメントしてください。知りたいです。
スプレッドシート・ドキュメント・プレゼンテーション機能テスト
もう一つ彼らが言及したのは、スプレッドシート、ドキュメント、プレゼンテーションを作成できるということです。それでこのテストのために、ブラジル全体に関わる数字を大量に扱うタスクを与えることにしました。ブラジル全土の政治家の給与リストを作ってもらいました。
プロンプトはこれです。「州別に分けられたブラジルの政治家の総数とそれぞれの給与を調査してください」。そして全員を含めました。大統領、知事、市長、上院議員、連邦下院議員、州議会議員、市議会議員です。
皆さん、AIは一流のスプレッドシートバージョンを作りました。正直、何が起きたのか理解できませんでした。このものがあまりにも良くて、あまりにも良くて、AIらしくもありません。ここはウェブプレビューだと説明しています。OpenAIのサイト自体で開いているので、表示に問題があるかもしれませんが、すでにここで要約を始めて、いくつかのデータを提示しています。
例えば、大統領は月に46,000レアルを稼いでいます。ここにいくつか注記を入れています。全ての州タブで繰り返される国家職位、同じですね。給与の出典を示しています。GoovBR、公務員、PTBR、観察所など、そのサイトを訪問して、この値が正しいか間違っているか確認できるようにしています。なぜなら、はっきりさせておきたいのですが、皆さん、AIが作成したものは幻覚の可能性があり、間違っている可能性があります。ですから、そのデータを求めると同時に、確認する必要があります。
でも例えば、知事については27人いると続けます。ここに州ごとに値が異なると書いています。「各タブを見てください」と。この時点で気づいていないかもしれませんが、ここにアクレ、アラゴアス、アマパ、アマゾナス、バイア、セアラ、連邦直轄区、エスピリトサントのタブがあります。全ての州がタブで分けられています。
市長について、同じことを言っていて、給与は自治体の規模によって異なります。上院議員は大統領と同じ給与を受け取っており、各州に3人の上院議員がいます。下院議員も大統領と同じ給与を受け取ります。AIによれば、全員が46,336レアルを受け取っています。
このデータに同意するかどうか、下にコメントしてください。でも例えば、上院議員のこのリンクを確認すると、サイトに入ったとき、回答は2023年に答えられていますが、この日付は意味がありません。なぜならリンク自体に2025年のニュースがあって、2025年2月1日から46,336.19レアルだと書いてあります。そしてここに転載された値は2022年の官報に公表されたものです。
ですから、政府のためにすでにAIが働いているようですね、皆さん。2023年のニュースが2022年から取られていて、2025年の情報がここにあります。上院にタイムマシンがない限り、これは意味をなさないようです。
ですから皆さん、すでに幻覚を起こすAIがあって、すでに少しおかしい、少し不気味なサイトと一致するクロス情報があるので、この場合評価すべきことは、このデータが本当か偽かではなく、まずAIがあらゆる場所からデータを取得し、間違ったデータの可能性があることに気づくことです。でも一方で、このスプレッドシートは美しい、美しいです。
人口層別の市議会議員の推定最大計算も示しています。市議会議員は市の代表なので、理論的には市議会議員が私たちに最も近い人であるべきです。ですから10,000人以下の自治体では、最高月額給与は6,900レアル、10,000から50,000人では10,400レアル、50,000から100,000人では13,900レアルです。市議会議員の給与範囲は都市の規模によって変わることがわかります。
一方で、AIはここに方法論のタブを入れました。ここで全てが説明されています。自治体の人口をどこから取得したか、連邦下院議員、上院議員、州・連邦直轄区議会議員、知事、市長、市議会議員、連邦直轄区で何が行われたか、そして解釈です。作業したソースのリンクを配置し、考慮したいくつかのことを説明しています。
州については、同じ小さなテーブルを作りました。大統領は常に繰り返されます。同じです。でも例えば、AIによれば、アクレ州知事はこの値で、実際ではないかもしれませんが、42,265レアルです。
州を変えると、この値はおそらく変わります。アラゴアスでは30,800レアル、アマゾナスでは34,070レアル、バイアでは36,890レアルです。知事の給与は全ての場所で同じではありません。
この住民ごとの市議会議員の計算だけは全ての人に同じで、大統領も全ての人に同じですが、一般的に残りの値はかなり変動します。連邦直轄区は例外で、市長も市議会議員もいません。ここの数字はかなりおかしいですが、連邦直轄区には3人の上院議員がいます。面白いですね? 連邦直轄区に3人の上院議員がいます。
いずれにせよ、かなり完全なテーブルになりました。これらのデータが本物かどうか確認するのにかなりの時間を費やす必要がありますが、スプレッドシート自体の品質、Chat GPTの効果については、私はこれを気に入りました。とても良かったです。
政治改革プラン作成
そしてこの回答の後、私はこう言いました。「受け取ったデータに基づいて、見た値の分析を行い、州のコストに関わる改革の政府計画を含む文書を書いてください。値が不必要に高い場所はどこですか? より高くてもよい場所はどこで、なぜですか? 州ごとに合理的と思われる政治家の理想的な数は何人ですか? 必要であれば、州と自治体ごとの人口の表を作成してください」。
そして皆さん、この時点でAIは27分間考えました。27分後、「続けますか?」と聞きました。「続けてください」と言いました。するとさらに26分間作業して、最終的にこの文書を送ってくれました。これです。「ブラジルの州および地方政治コスト」という7ページの評価を作成しました。あまり長い評価ではありません。
AIによれば、政治家の給与は160億レアルです。ここに住民一人当たりの地方コストを6レアルと記載しています。ですからAIによれば、ブラジルの全ての政治家に160億レアルの給与を支払うために、平均して約6レアル支払っています。この値は変動するので平均です。
ここで20億レアルの節約ができると説明していて、どのようにするか説明します。地方職を17%削減することで、AIの意見では11,450人少なくなります。たくさんの値を持ってきています。トカンチンスでは値が少し高いと言い、一連の基準と制限の情報を持ってきて、説明を始めます。
データを持ってきて、いくつかのテーブルを持ってきます。ここで不必要に高い値について議論しています。例えば、給与ではなく市議会の過剰な数です。小さな町がたくさんあって、議席数が増え、給与が増えていると説明しています。そしてトカンチンス、ピアウイ、リオグランデドスル、パライバ、ゴイアス、ミナスジェライスのように小さな町がたくさんある州があり、小さな町がたくさんあるので政治家の数が増えると議論し、続けていきます。
例えば、サンパウロでは住民一人当たりの連邦下院議員の数が最も多いと述べています。つまり、サンパウロでは各下院議員の傘下にはるかに多くの人々がいるということです。そしてAIがいくつかの変更について説明し始めます。6ヶ月から48ヶ月までの政府改革計画も含めて、これらの結論にどのように至ったか、どこから結論が来たかの情報を配置しています。
プレゼンテーション作成とまとめ
その情報の山を見た後、「プレゼンテーションのスライドを作成してください」と言いました。結局、あの巨大な文書、あの情報の山で迷子になりたくありませんからね。そしてスライドを作成して説明しました。研究を行い、この研究は知事、市長、下院議員などを見て、住民について話しました。ブラジルには2億1300万人、27の連邦単位、そしてここに8つのスライドがあります。
スライド内にスライド数の情報まで入れました。少し変だと思いましたが、入れました。そしてここで、皆さん、はるかに要約されて表示されます。政治家に支払うための住民一人当たり6レアルという情報を覚えていますか? あの160億を覚えていますか? 今、理解しやすくなり始めました。ここに主要メッセージまで配置しています。
財政問題は孤立した職位に集中しているのではありません。主に多くの市議会、多くの議席、多くの小さな自治体が同様の構造を維持していることの組み合わせで現れます。ですから、はるかに要約された形で示し始めています。支出は市議会に集中しています。
そしてここで、コストの84%が市議会議員から来ていると述べています。市議会議員が私たちに最も近い人だと言ったのを覚えていますか? ですから、ブラジル全体では知事や市長などよりはるかに多くの市議会議員がいます。なぜなら、市議会議員は私たちと話し、私たちの言うことを聞くために最も近くにいる人であるべきという考えだからです。
大統領は最も遠い人で、最も論理的で最も近い道は市議会議員と話し、市議会議員が私たちの意見を上に持っていくことです。ですから例えば、市議会議員のコストは130億レアル、市長のコストは20億レアル、州議会議員のコストは4億4000万レアル、知事のコストは1000万レアルです。市議会議員のコストが最も高いことを明確にしています。
そしてここで、平均してブラジルの政治家一人当たり人あたり6レアル支払うと言ったのを覚えていますか? トカンチンス、ピアウイ、パライバが最も高い値だと言っています。トカンチンスでは、人口は政治家一人当たり17レアル支払い、ピアウイでは13レアル、パライバでは12レアルです。常に覚えておいてください、このデータは確認が必要で、そのまま信頼することはできません。私はただ、AIが全体的な分析を行ったこと、データが正しければこの方向だということをコメントしているだけです。
そして、大きな議会と小さな都市がある場合、不必要に高いように見える場所について説明します。わかりますか? より小さな州の議会で高い基本給がある場所。それほど小さくない州で、給与を高く設定した場合です。そして自治体の断片化、つまりたくさんの小さな町があり、市長でいっぱいのいくつかの州があるという考えです。
AIによれば、現在の67,000人の政治家から11,000人を削減できます。これは17%に相当します。そしてスライド形式で、例えばサンパウロの連邦下院議員は、マットグロッソの連邦下院議員よりも傘下に多くの人々がいると説明します。マットグロッソでは48万人で、サンパウロの下院議員はマットグロッソよりも多くの人々の面倒を見ていることを示しています。
そしてここでAIの意見による保守的な改革シナリオを作成します。最も節約できる場所はミナスジェライス、サンパウロ、バイアで、ミナスで3億7900万レアル、サンパウロで2億9400万レアル、バイアで2億5300万レアルを節約できます。そして2年から4年、つまりほぼ大統領の任期で、この移行を行い、この動きをするための4段階でここで終わります。
AIのこの分析についてどう思ったか、下にコメントしてください。これが今行われているのは、AIがスプレッドシートを生成し、ドキュメントを生成し、その後スライドも生成できるからだということを示しています。では、将来AIが国を管理するのでしょうか? すでにデータを分析できています。
今不足しているのは、確認できることと、言っていることについてより確実性を持つことです。そうすれば、到達している結論が意味をなすかどうか確信を持てます。
Codexを使ったチェス対戦
そして今、Codexを使ってAIと対戦でチェスをすることもできます。この興味深いプロジェクトを見てください。これはGeminiで作成したチェスゲームです。かなりシンプルで、ボードはとてもシンプルです。プレイヤーは今Codexの番です。私はすでにここでプレイして、ゲームの開始のためにシンプルな動きをしました。物事が始まるのを見るためだけに。
そしてこれが私のゲームの開始方法です。「PlaywrightのMCPを使って画面に何があるか見てください」。同じ方法です。なぜなら、このコミュニケーションがすでに機能していることを確認したいからです。エラーが出たら、解決しようとしないでください。エラーが出たことだけを知らせてください。なぜなら皆さん、これが機能しなければならないことはすでにわかっているからです。私が頼んで、ウィンドウを開いて、前回そこで話した通りに機能しなければなりません。
そして開いたとき、空白の画面のように空白が表示されました。それでGeminiのこのチェスゲームを読み込んで聞きました。「どうですか?」 すると答えます。「今、画面に『3Dチェス豪華版』が表示されます。プレイヤーCodexの番です。説明:クリックしてドラッグしてカメラを回転。スクロールしてズーム。駒をクリックして移動」。
そしてここからはこれです。「あなたの番なら、プレイしてください」。このコマンドを送ると、AIはプレイしようとします。私はGPT-5.4をエクストラハイバージョンで使っているので、少し多く考え、プレイするのに少し時間がかかりますが、原則としてプレイできます。
私が話している間、AIはここで言っています。「このボードが状態をどのように表すか特定します」。そして横で動きを実行します。ある時点で、ここからやりたいことを求め始めます。MCPサーバーで、最大のセキュリティが必要なら、1回だけ承認します。
または望むなら、このセッション全体に対して承認できます。AIがあなたとプレイし続けるので、ずっと承認を求め続けるからです。それで、1回だけ承認するか、このセッションの全ての回に対して承認するか決めます。
そして皆さん、AIはここでナイトを動かしました。ナイトで始めました。ここで説明しています。「NF6をプレイしました。ゲームは今D4 NF6になりました。画面はマノに移りました。あなたの番です」。
そして皆さん? ここから先はこれです。私が自分の動きをして「あなたの番」と送り、AIが再びボードを見て、ゲームが終わるまで無限にこのやり取りが続きます。一度、「動きをして10秒待ってから再びプレイして」と言いました。でもその10秒のせいで、ボードをフリーズさせるコマンドを実行して、うまくいきませんでした。
でももう一度プレイしました。すでにここでポーンを動かしました。ですから最も重要なことは、このGeminiのゲームである必要さえないということです。Playwrightのブラウザ経由であれば、インターネットの任意のサイトに入ることができ、会話しながら、プレイしながら、AIはPlaywrightのMCPを通じてコマンドを実行できます。
最も重要なことは、このMCPが他のAIにも使えることで、Codex専用ではないということです。ClaudeやAntigravityでこのMCPを設定しても同じになります。全てがこのツールを使用できるからです。
でもCodexで、言わば価値があるのは、彼らのビジョン機能です。これが今回のリリースの大きな宣伝で、より良い機能であり、したがってこのボードの視覚的な部分をより良く理解できます。
下にコメントしてください、AIにプレイさせることに興奮したかどうか。
定番テスト:ペットショップサイト
今、私たちがやらないわけにはいかない古典的な分析、私たちの愛するPatrixサイトです。ここにあります。標準的なペットショップの未来、Matrixの次元に入りました。
これまで作成した全てのPatrixサイトと比べてどうでしょうか? このサイトはかなり大きく、完全で、複数のページダウンのある巨大なページ、超クリーンなインターフェース、とても美しく、作るのがとても簡単で、使うのに優れています。これより良いのは、Gemini 2でエージェントを使った時だけです。そこでは異なることをします。あなたのサイトに応じた画像、作成された画像があるからです。
自転車に乗るペリカンは素晴らしくなりました。信じられないほどの品質ですが、いつもの基本的なエラーがあります。ペリカンの足がペダルに正しく乗っていません。1つだけです。実際、もう片方は自転車をブレーキしているように足で止めています。子供の頃、幸せだった人は、これをやったことがあるでしょう。
でも自転車が逆さまで、ハンドルバーに座って、サドルで運転しているように見えます。でも全体的に見ると、このペリカンはとても良いです、皆さん。カラフルさが私の注意を引きました。丸みを帯びた幾何学形状が注意を引きました。この小さなヘルメットはとても良くなりました。芝生があり、背景があり、雲があり、スピードがあります。
ですからこれはもう初心者のペリカンではなく、尊敬に値するペリカンです。でもまだGeminiのペリカンには負けます。GeminiはこのSVGアートで驚異的に皆の先を行っていますよね? 言うことはありません。
リオデジャネイロのSVGアート評価
「私はリオデジャネイロの声」。ここにとても良くなったものがいくつかあります。本当に良いです。クリエイティブなアートです。これまで見た様々なタイプのアートがあります。建物をとても良く作るものがあります。
これを見てください。ここに小さなケーブルカーがあります。ケーブルカーが動いています。ここの比率とサイズはとても良いですね? シュガーローフは本当に少し小さいです。私の注意を大いに引いたのは、ここのコルコバードの麓のテクスチャです。このようなグレーです。いくつかのレベルがあるような。とても興味深いテクスチャで、石のいくつかのレベルのようです。
そしてこのコルコバードのキリスト像、皆さん、少し芸術的になり始めました。キリスト自体、ただのT字だけではありません。十字架だけ。すでに少しテクスチャがあります。すでにキリストの服の少し、下に垂れ下がる襞があります。
ここの木を見てください。とてもかわいいです。それぞれ異なる色のいくつかの木があります。濃い緑、明るい緑、さらに明るい緑。ここの山は山の色をしています。山に木があります。ここにいくつかの建物か人がいます。正確には何かわかりませんが、技術的にはここはかわいいです。
とてもうまく機能しています。私はこのバージョンがとても気に入りました。間違いなく最高の中に入っていると思います。様々な色調のこのカラフルな森と、芸術作品に現れているこれらのテクスチャが私の注意を大いに引きました。
カーゲームのテスト評価
私たちの小さな車のゲームで。何が起きたか見てください、皆さん。この小さな列車を見てください。線路を見てください。これら全ての詳細を見てください。小さな列車は素晴らしいです。貨車は線路の上を正しく走っています。小さな車は超動物的な詳細です。小さな木があります。3階建てです。小さなコインがかわいいです。
気づいたかわかりませんが、見てください、爆発があります、全てがあります、小さな音があります。いつものように私も負けました。話している間に、結局負けてしまいました。確かにここのストライプは曲がっていますね? 向こうを向いていますね? でも道路の真ん中の白いストライプ。木にぶつかるか通り抜けるか見てみましょう。木を通り抜けます。
でも皆さん、このバージョンは素晴らしいです。大部分のバージョンより千倍良いです。ここで見ているこれらの詳細を持つこの線路。この詳細レベルの線路は珍しいです。転がる鉄の部分があり、支えを作る木の部分があります。小さな列車はもうドリフトしていません。そして小さな車の品質を見てください。そこのAIの小さな車が走っているのを見てください。
レベルが確実に上がりました、ね? このテストは飽きることがありません。このテストを行えば行うほど、より多くの新しいものを受け取ります。素晴らしいスピードメーター、サウンドトラック全体。全て正しいです。ここで音楽をつけましょう。小さな音楽が機能しています、全て正しいです。もちろん、あの3音の小さな音楽ですが。でもすでに小さな音楽があり、オフにできます、音響効果など全て。
マリオカートゲームの評価
そしてマリオカートはこのようになりました、皆さん。見てください。少し変だと思いましたが、これまで見たもの全てとはかなり異なっています。これらの効果を下げましょう、でなければ聞こえません。でも見てください。すでに誰かが投げた亀の甲羅があります。私はここを走っています。全て正しいです。スペシャルを押すことができました、全て正しいです。
ですから、少し変なゲームになりました。でも小さなマップはとても良いです。ゲームのどこにいるか、対戦相手がどこにいるかを示す横の小さなマップ。ここのトラックの真ん中のオブジェクトはすでに興味深いです。小さな車が私を追い抜きました、そこで轢かれました。すでにここにランプがあって、ランプできます。
すでにたくさんのものがあります、全て機能しています。私は正直、これがかなり楽しいと思っています。私の注意を引く興味深いことは、平均的にグラフィックスが他のゲームの他のグラフィックスとは大きく異なることです。通常は少し似ています。ですからこのゲームでは、ソースコードが私たちが見慣れているソースコードとは少し異なるように見えます。
正直、かなり興味深かったです。気に入りました。うまくいくまでいくつか調整しなければなりませんでした。この小さな車をもう少しきれいにしようとしましたが、できませんでした。このようになりました。ですから受け入れてください、痛みは少なくなります。でもゲーム全般はとても良いです。
3Dチェスボードの課題
Geminiのボードを使った理由を理解しようとしていたなら、そのためです、皆さん。ここでCodexで直接チェスゲームのボードを生成しようとしましたが、何が起きたかというと、駒を区別できませんでした。
ですからゲームは機能しますが、例えばポーンがビショップとあまり変わらず、キングとあまり変わらず、ナイトともあまり変わりません。ここは終わりのない混乱です。そして解決しようとしましたが、解決しませんでした。これらの駒を交換するよう頼みましたが、交換しませんでした。
そして詳細があります。とても遅かったです、本当に遅かったです。おそらく多くの人が同時にテストしていたからだと思います。あるいはこのモデルが本当に遅いのかもしれませんが、今は言えません。リリースに非常に近く、全員が同時に狂ったように使っているからです。
ですからテストに使うためにGeminiバージョンを使うことを好みました。では、このモデルがとても遅いと思っているかどうか、下にコメントしてください。
3D都市への建造物追加
そして私たちの3D都市で、皆さん、フォローしているなら、ここにいくつかの異なるAIからいくつかのモニュメントを配置しています。テストしたAIの一つで、テストを見なかったのは、ここのQwenです。
皆さん、見てください、あまりにもひどかったのでビデオを作ることさえできませんでした。ここのこの建物の前に何か非常に間違ったものがあると書くことさえできませんでした。建物の階を外の通りに配置しました。何度も言いました、これを直してください、Qwen。私たちのためにここで直してください。私たちはここに入りたいです。
このテキストを直してください、読めません。するといつも「直しに行きます、すぐに戻ります」と言いました。そして実際、Qwen 3.5 Maxが作ったのはこれです。でも読めません、何かわかりません。
でももう少し右に行けば、ブルジュ・ハリファがあります。ブルジュ・ハリファを作ったのは誰でしょうか? 私たちの最愛のGPT-5.4です。ここで見ているこの芸術作品の建設者です、皆さん。
ですからブルジュ・ハリファでは、階段を上ってここで遊ぶことができます。ここにいくつかの階がありますが、あります。中を歩きやすい作品でしょうか? いいえ、とても狭いからです。
ここのこれらのブロックのサイズを増やす必要があるかもしれません。でも窓から外で起きている全てを見ることができます。そしてここに私たちの美しいブルジュ・ハリファがあります。ヘリコプターを取れば、見てください、全ての作品が見えます。中国の図書館が見えます。Opus 4の作品が見えます。
自由の女神像が自由の女神像に見えません。そしてここに私たちのブルジュ・ハリファがあります、私たちの最新の建設がここに全て堂々としています。実際、かなり美しくなりました、ね? どう思いましたか? 美しさの点でこれは価値があったと思います。見てください、美しいです。都市で最も高い建物です、後ろのコルコバードのキリスト像よりも高いです。
そして美しさの2位は、中国の図書館が勝っていると思います。これまでで最も気に入らなかったのは自由の女神像です。何かわかりませんが、Minecraftのようです。自由の女神像はあまりうまくいっていません。超シンプルなここの私たちのコルコバードのキリスト像の方がうまくいっています。
このマップは進化するだけです。
総合評価と推奨
では、このモデルが価値があったと思ったかどうか、下にコメントしてください。私はいくつかのことを思いました。少し遅いと思いました。彼らがすでに言ったように、コードの品質は基本的に同じです。スプレッドシート生成がとても気に入りました。MCP統合がとても気に入りました。AIと対戦でき、そこでの相互作用もでき、見本を送って一人で作らせることでサイト作成もできますが、比較するなら、Claudeがまだ優れていると言います。
そして必須だと考えるサブスクリプションを推奨するなら、Geminiのサブスクリプションだと言います。なぜならGeminiで素晴らしいサブスクリプションを得られ、Antigravityにアクセスでき、Antigravity内でGeminiとClaudeの両方、Sonnetも含めて利用できるからです。
ですから、すでにChat GPTを持っていて、Codexに慣れているなら、どんどん進めてください、素晴らしいです、とてもうまくやっています。このブルジュ・ハリファはとても良くなりました。そしてどちらを選ぶか迷っているなら、お金がなければ、Geminiに行きます。そしてお金が余っているなら、Claudeに行きます。
下に何を考えているかコメントしてください。そしてこのようなビデオを見続けるためにチャンネルをサポートしたいなら、メンバーになってください。メンバーはインテリジェントエージェントの限定ビデオと先行公開ビデオにアクセスできます。
それでは、「いいね」を残してください。ありがとうございました。


コメント