GPT-5.4 Proは本当に凄いのか – 史上最高のモデルを実機で徹底検証

GPT-5
この記事は約31分で読めます。

GPT-5.4 Proモデルの徹底的な実機テストを通じて、その驚異的な能力と限界を探る検証レポートである。このモデルは従来の5.4 Thinkingモデルと並行してリリースされたものの、処理時間が1時間を超えることも珍しくなく、コストは通常モデルの12倍に達する。Wi-Fiアクセスポイントの3D可視化、C++スケートボードゲーム、ブラウザベースCADプログラム、海外ドラマの室内空間再現、3Dプリンターシミュレーション、フライトコンバットシミュレーターといった多様なタスクで性能を検証した結果、33,000行のコード生成や写真1枚からのバグ修正など驚くべき成果を示す一方、視覚的なレンダリングやレイアウトの正確性において予期せぬ不具合も確認された。高額なコストと長時間の処理を正当化するだけの性能を持つかどうか、実際の生成物を通じて詳細に評価する。

GPT-5.4 Pro Is INSANE – Hands-On With THE Smartest Model Yet!
Timestamps:00:00 - Intro00:45 - First Look01:55 - Technical Look03:00 - Model Testing Setup03:43 - WiFi Map Prompt Expla...

GPT-5.4 Proモデルの概要と初期設定

このゲームをSteamに出品します。2.99ドルで購入してプレイできます。33,000行のコードですよ。これは本当に最高のものです。

今日は新しく導入されたGPT-5.4 Proモデルをテストしていきます。このモデルは以前取り上げた5.4 Thinkingモデルと同時にリリースされました。ただし、このモデルは独自の動画を作る価値がある理由がいくつかあります。

1つ目は、とにかく非常に遅いということです。このモデルで生成される結果は1時間以上かかることも珍しくありません。動画を作ろうとしているときに、これはタイムリーに動画を公開する上でかなりの障害になります。

2つ目は、非常に高価だということです。ご覧のように、このモデルの入力と出力の価格は通常のモデルから期待されるものよりもかなり高額です。実際にここには、新しく更新されたGPT-5.4モデルとの入力と出力の価格比較が掲載されています。

100万トークンの入力で30ドル、GPT-5.4 Thinkingモデルは2.50ドルです。それに続いて出力も大幅に高くなっており、100万出力トークンあたり基本的に12倍のコストがかかります。かなり高価ですが、理論的にはパフォーマンスがその価格を正当化するはずです。

Proモデルは少なくとも私の用途では常に非常に印象的なパフォーマンスを発揮してきました。ですから今日の動画はGPT-5.4 Proモデルの専用テストになります。まずはこのモデルに関する重要な情報から始めますが、正直なところGPT-5.4の発表ブログ記事でも6回程度しか具体的に言及されていませんでした。

正直に言うと、多くの人はこのモデルが実際にどんな結果を出すのかを見ることに興味があると思います。ですから、ブログ情報などを見るよりも、実際の結果に重点を置いていきます。

モデルの仕様としては、コンテキストウィンドウは通常のGPT-5.4 Thinkingファミリーと同じで100万トークン強です。続いて出力トークンは128,000で、知識カットオフは2025年8月31日です。また、このモデルはウェブ検索が改善されているとも述べられています。

これを実際に有効にするかどうか迷っていますが、テストするプロンプトの一部では有効にして、他の一部では無効にして実行しようと思います。

幸いなことに、これは使用するのにかなり高価ですが、Proサブスクリプションを持っていればこのモデルを実際に使用できます。他のサブスクリプションでもProモデルにアクセスできるという話も聞きましたが、私個人としては月額200ドルのChatGPT Proサブスクリプションを通じてのみ使用してきたので、それについては個人的に語ることはできません。

では早速始めましょう。このモデルでの最初のテストを開始します。これは通常のテストスタイルとは少し異なるかもしれません。クールだけど必ずしもこのような遅くて集中的なモデルに値しないようなものではなく、より複雑で能力をテストするプロンプトでテストしたいと思います。

Wi-Fiアクセスポイント3D可視化テスト

ドロップダウンからProを選択します。これには選択可能な思考努力レベルもあります。ただし、通常の5.4で見られるものとは異なります。通常の5.4では4つの思考努力オプションがありますが、Proでは2つしかありません。標準か拡張かです。

これはこのモデル専用の動画なので、拡張思考を有効にしてすべてのテストを行うことにします。これにかかる時間についてはあまり心配していません。

ウェブ検索機能もここで有効にします。タスクを実行している間に、プロンプトの簡単な概要を見ていきましょう。これは数週間前に新しく更新されたGemini Deepthinkモデルで特別にテストしたものです。

これは本当に興味深い視覚的な結果で、基本的にここで起こることの集大成は、自分で決めたものを使って近くの無線アクセスポイントをスキャンし、空間的な観点からどれが近くにあるかを理解するための知的で賢い方法を考えようとするということです。

つまり、Wi-Fi信号強度は前方100フィート先でも後方100フィート先でも同じになる可能性があります。物理的に互いに近いアクセスポイントを特定するために強度だけに頼っていたら、そのような理由で必ずしもうまくいきません。

ですから、物理的に互いに近いアクセスポイントを特定するために、何らかの論理を実装しようとする方法も見ていきます。それ以外にも、見つけたものの視覚的表示がどれだけ良いかを見たいと思います。

Gemini Deepthinkの結果は、視覚的に提示される方法という点で非常に非常に印象的でした。これもそうなると予想しています。基本的には、3Dの美学はサイバーパンクやマトリックスからインスパイアされたもので、暗い背景、光るノード、目に見えない無線周波数空間を覗き込むような美学にできると伝えています。

技術的な注意事項も記載しました。なぜなら、コンピューターがネットワークをスキャンできるようにする方法などにおいて、特定のオペレーティングシステムなどを知っていると役立つからです。

91分1秒、つまり1時間31分1秒後に結果を受け取りました。最初に気づくことは、ここをスクロールすると、実際に応答を生成するプロセス中にモデルが実行していた多くのアクティビティを基本的に見ることができます。

これはProモデルをテストしているときに見た中で最も長いアクティビティペインや思考チェーンの1つです。今これをスクロールしていますが、ここで見ているものの一部は、物事が機能していることを確認するために、ほぼエージェント的な方法でスクリプトをテストしているだけです。

これは本当に非常に非常に大量の思考がこれに注がれています。まだ実際にはこれをまったく見ていませんが、実際のスクリプトや結果、答えなどと一緒に提供されたものについて簡単に話したいと思います。

Wi-Fi可視化結果の分析

まず最初に気づくのは、この結果で何が可能で何が不可能かという点で、現実に非常に根拠を置こうとしているように見えることです。ここでも何か言及しています。そのため、プログラムは最善を尽くします。

NMCLIをスキャナーとして保持し、可能な場合はキャッシュされたIWBM値で各スキャンを補強し、それ以外の場合は近似的な品質対デシベルミリワット曲線にフォールバックしようとします。

フォールバックは本質的に近似的です。なぜなら、パーセンテージ表示はツール固有で非線形であり、普遍的なRF単位ではないからです。基本的に私がここで言っていると見ているのは、このすべての論理を完全に理解するための教育の専門家ではないことを念頭に置いてください。

しかし、これらのツールの一部は信号強度が80%だと教えてくれるだけで、実際にはこの特定のタスクに関してそれほど理解していないと言っているのです。そして、普遍的なRF単位ではなく非線形だと言っています。これはここでキャッシュされたデシベルミリワット値、またはそこにある特定の小さなシンボルが指すものとして見られます。

測距に関しても言及しています。これはもちろん、空間的メトリックから実際に近くにあるアクセスポイントをマッピングしようとすることです。先ほど述べたように、信号だけでは、見つけた2つのアクセスポイントがどの方向にあるか、またはどれだけ近いかを実際には教えてくれません。

ですから、基本的にここで言っているのは、3D配置は意図的にリテラルなフロアパン解決ではなく、潜在的なWi-Fi空間埋め込みであるということです。1つの固定受信機では、放射状の制約は得られますが、真の角度は得られません。

したがって、コードは繰り返しの信号トレースからアクセスポイント間の近隣構造を推測し、レイアウトを時間とともに収束させます。同じ一般的な強度レベルで一緒に落ち込み、また一緒に上昇する信号は、ここで見られる視点から近くにあると推測できます。

繰り返しますが、これは私ができる限り説明しようとしているだけです。ここで最初に見ていることの1つは、実際にこのファイルをダウンロードする必要があるということです。とても良いです。

そして、このコマンドを実行する際、この特定のインターフェース名フラグを使用できません。なぜなら、これは私のコンピューター用のものではないからです。しかし、ここでも言及されているのは、それを省略すれば、見つけた最初のWi-Fiアダプターを使用するということです。このシステムには1つしかないので、うまくいくはずです。

これは従来のテストのようなものではありません。3Dプリンターテストをしていて、このようなものが出てきた場合、開発ツールをチェックしてください。おそらくエラーがあります。何かがロードされていません。まだスキャナーを起動していると表示されています。

これは、先ほどThinkingをテストしているときに受け取ったのとまったく同じエラーです。手動で修正します。なぜなら、この結果の実際の生成品質を実際に反映するエラーではないからです。

基本的にこれのビジュアル要素のための愚かなインポートエラーのようなものです。基本的にこれをレンダリングするものをどのように引っ張るかを理解するために、インポートマップが必要でした。これを無視できます。イライラしますが、これを完全に再実行してこれを修正させるほどの価値はありません。時間がかかりすぎますし、これは結果の実際の品質とは無関係なものです。おそらく数学的な観点からは。

時間が経つにつれて、これは変化するはずです。ご覧のように、スキャンした回数が増加しています。表示されているアクセスポイントも表示しています。これらは実際のアクセスポイントの実名を表示しないように設定されています。

これはセキュリティを意識したものですが、Deepthinkの動画では表示しました。正直に言うと、私は存在する唯一のBjamanなので、自分自身を隠そうとしているわけではないと言えます。

信号強度測定と3D表示の詳細

かなりクールだと思います。実際に測定値がここに表示されています。これらの特定のものにマウスを合わせると、特定の周波数も確認できます。5GHz帯と2.4GHzです。距離のプラスマイナス値という点で不確実性も見られます。

また、このアクセスポイントが私たちの特定のコンピューターからのおおよその距離も示しています。実際には、このSSD1とSSD2は今私のすぐ後ろにあるルーターである可能性が非常に高いです。これは8mと表示されています。つまり3フィート弱です。これは現実に非常に非常に近いです。

このコンピューターの特定のアダプターがどこにあるかはわかりません。おそらくアンテナは多くのラップトップがそうであるように、画面を通って走っているのでしょう。測定されているデシベルミリの信号も見られます。

ここでズームアウトしても、私はまだ言わなければなりませんが、これは私の理解の限界になるところです。なぜなら、Gemini Deepthinkの動画で見たように、これらがここで異なる配置で動き回ることが実際に可能かどうかわからないからです。

実際にしばらくスキャンを続けさせて、タイムラプスにして、これらのものが時間とともにどのように進化するかを見ていきましょう。

これで41または42回のスキャンを実行しました。表示されているアクセスポイントの数が各スキャンで変化していることがわかります。これはおそらくご存知でしょう。コンピューターでWi-Fiネットワークを選択しに行くと、追加のネットワークが表示されたり、少なくなったりすることがよくあります。少なくとも私がよく気づいていることです。

基本的に気づいているのは、これらを方向という点でまったくマッピングしようとしていないということです。ですから、ここで見られるこの特定のアクセスポイントが実際には私に対してずっと向こうにある場合、それを把握していません。互いにどれだけ近い可能性が高いかという点でマッピングしているだけです。

ここの直線は誤解を招く可能性があると思います。なぜなら、これは他のすべてのアクセスポイントがその方向にまっすぐ前方にあるか、その方向にまっすぐ後方にあるかのように見えるからです。そうではありません。

どれが互いに近いかを理解しようとする限界は、私に対してどの特定の角度にあるかを識別できないだけです。最初の応答でも言及されていました。リテラルなフロアパン解決ではなく、埋め込みだと。

1つの固定受信機では、放射状の制約はうまく得られますが、真の角度は得られません。したがって、コードは繰り返しの信号トレースからAPからAPの構造を推測し、レイアウトを時間とともに収束させます。これはどれが互いに近いかに関連しています。

たとえば、ここでもっとズームインすると、できないですね。オーケー、とても良いです。SSID 18があります。信号強度がここで読み取られています。不確実性と距離もあります。追加のスキャンを行うと、信号が変化するにつれて、これらは時間とともに変化しています。

しかし、これは基本的に、SSID3とSSID 13が、今は19と18に変わりましたが、見られる測定可能なメトリックに基づいて仮説的に近くにあると言っています。

繰り返しますが、これは説明して解析するのが難しいですが、とてもクールです。これは実行したかった最初のテストでした。本当に興味深いビジュアルです。プロンプトで概説されたスタイリスティックな描写に適切に従いました。

ゆっくりとパンする座標とグリッドのようなものが好きです。まるでレーダーのように円を描いて、更新されるといったものです。これは非常に科学的に制約された仕事をしました。

実際に可能なことと、ただ見た目を良くしようとするだけで、実際の現実的な能力をあまり気にせず、ほぼ幻覚ではないが不可能なものとの対比で、現実において非常に根拠を置いていました。興味深いです。

繰り返しますが、おそらく数学などについてあまり権威的に話したくはありませんが、これは人々に見てもらいたいものであり、これを見るだけで判断できるものだと思います。

C++スケートボードゲームの開発

次のテストでは、おそらく少し頭を使わないもの、最終的に生成された結果をプレイするのが楽しいものをやりたいと思います。これは自己完結型の完全なC++スケートボードゲームになります。

このテストを非常にハイエンドではないモデルで実行するのが好きです。なぜなら、結果は一般的にプレイするのが楽しいからです。しかし、これが実際のトリックロジックやモデルなどで大幅な能力向上があるかどうかの何らかの測定を与えてくれるものもやりたいです。

このプロンプトを通常使用するときからあまり修正したくありません。スケートボードに乗った人間の動き、これは少し違います。足で蹴って加速するような実際のポンプを表示するべきだと理解するのに十分なはずです。

これには拡張思考モードを維持します。これもウェブ検索なしでやりたいと思います。それなしでどのようなパフォーマンスを発揮するかを感じ取るためです。では、これを始めましょう。必然的に、正しいか間違っているか見てみましょう。これはおそらく78分かかると予想します。

44分8秒で、最初の推定では実際に間違っていましたが、大丈夫です。結果を生成しました。興味深いことに、最初に気づいたことは、環境で構築されたコンパイル済みのLinuxバイナリも含まれていたことです。

これは本当に興味深いです。通常、生成されたC++スクリプトをダウンロードして、このような類似のコマンドを使って構築します。興味深いですね。今すぐゲームを構築しましょう。完璧です。

何と呼ばれていたか思い出せれば、スケートゲーム。さて、確認しましょう。

最初に気づくことは、ビジュアルのアーティファクトは別として、腕の動き方は間違いなく独立して、これはシンプソンズのヒット&ランという2000年代初頭から中頃のビデオゲームを思い出させます。何人かの人々を倒すと、同じようにただ転がり回りました。

カメラがランプか何かに引っかかっているだけかもしれません。十分に動けば、もしかしたら。これは。これはプレイできません。

これはマルチモーダルだと思いますよね?画像を入力として受け取れます。そしてこれはProカードです。正直に言うと、私たちが経験していることの写真を渡して、それを修正するように伝えるつもりです。

スケートボードゲームのバグ修正

最初にアプリを開いたときに撮ったスクリーンショットを渡しました。正直に言うと、実際に動き始めたときの現実よりも良い状態に見えます。それにもかかわらず、写真を渡して問題の簡単な説明ができるのはクールだと思います。

私が受け取ったこのようなひどい結果に対する通常のフィードバックスタイルと比べると、おそらく少し軽い感じでしたが。それにもかかわらず、これに基づいて正確に何をするのか見るのに興味があります。

修正された結果があるとされ、約16分50秒かかりました。実際にここで何を修正しようとしたかを見るよりも、最終的な結果としては、カメラの動きとビジュアルのクリッピング問題を修正しただけだと思います。

名前を「fixed」に変更したようです。願わくば、最初から見たかったものが得られました。しかし、正直に言うと、まだ少し奇妙で、カメラを修正した方法によって、ランプなどと相互作用しないように遠くに留まっているため、実際にプレイヤーを見るのが難しくなっています。

とにかく、アニメーションを確認しましょう。Jはキックフリップです。悪くないですね。あのランプは完全に逆さまになっているようです。Kはヒールフリップです。QとEは回転です。それは機能します。

人物のモデルはかなりクールに見えます。しかし、正直に言うと、これを美化するつもりはありません。この結果には全体的に非常に失望しています。特に今日早く5.4 Thinkingモデルで受け取ったものがこれよりも大幅に良く、ワンショットだったからです。

大幅に良いと言うとき、人物、モデルははるかにシンプルでした。そして、これは全体的に実際にキャラクターを作ることや動き、トリックロジック、その背後にある数学などについて、より多くの思考を注いだ可能性が非常に高いです。

しかし、事実として残るのは、これは私が先ほど見た結果と比較して大幅な減少だということです。ですから全体的に、この結果には失望していますし、それを美化するつもりはありません。

CADプログラム開発テスト

次のテストを開始します。ウェブ検索を有効にすべきかどうかわかりません。有効にすると思います。そうですね、なぜしないのですか?この時点で、スケートボードのテストでは有効にしたくありませんでした。独自の知識に頼って何をするか見たかったからです。しかし、それは間違いだったかもしれません。

この特定のテストでは、自己完結型のCADプログラムを提供してもらいます。ほぼアプリケーションに入り込むことができ、使用する言語、実行方法、ウェブ上のものかどうかなど、アプリケーションを作成する方法について具体的に自由に決定できます。

線や形状を描いて押し出すことができるはずです。ほぼシンプルなCADプログラムを作り、最終的に形状をSTLにエクスポートして、現実的に3Dプリントできるようにします。

ユニットをミリメートルでスケーリングしてほしいです。Fusion 360のようなもので作業することに慣れているからです。このプロンプトの最終的な目標は、これを実行して、没入型で気を散らさないドラフティング環境に入り込み、カスタムパーツを素早くブロックアウトして、数分で完璧に寸法が正確なSTLを用意し、プリントファームに送る準備ができているということです。

ビジュアライゼーションに関しても全力を出すように言いました。ですから、CADプログラムを作成するだけの実際のロジックを超えて、使用する特定の言語に関してフロントエンドデザイン能力もテストすることになります。

シンプルなCAD結果は生成に42分弱かかりました。残念ながら、実行しようとしました。このUIがどのように見えるかを見るのが本当に楽しみだったからですが、実際に何もスケッチできないという問題がありました。

Chromeブラウザの開発者コンソールログをモデルに送り、基本的にエラーの一部のスニペットと問題の非常に非常にシンプルな説明を渡しました。そして約24分の思考の後、「あなたは正しかったです。それは本当のバグでした」と言っています。ええ、知っています。ありがとう。

問題は基本的に、スケッチを開始したり、そのための平面を選択したりできなかったことです。これを実際に見れば、今はもっと理解できます。バージョンのコピーも保存したようです。それは評価します。

CADプログラムの機能テスト

これを見てみましょう。そして、もしも、からかうつもりはありませんが、結果を見たいことはわかっていますが、ここで言ったことは興味深かったです。ダークモードのネオンUIにするつもりだと。それを覚えておいてください。

これがシンプルなCADプログラムです。最初に確認する必要があります。とても良いです。これは以前は機能していませんでした。スケッチをまったく開始できませんでした。実際にこれをどのように使うか把握する必要があります。

面を選択できるか見てみましょう。Fusion 360の使い方を知っているだけなので。まだソリッドはありません。XYでスケッチします。面を選択する必要があるかもしれません。

これはソリッドアイテムが実際に押し出された後だけだと思います。平面を選択するものと間違えていました。これにより、形状を描く平面を変更できます。今のところはそれを無視しましょう。

長方形を選択して、スナップします。これは理想的には10×10の長方形になるはずです。とても良いです。20×40にしましょう。ミリメートルでグリッドにスナップする実際の動作は非常にうまく機能していると言わなければなりません。それは良いです。

これを押し出せるはずです。できました。シンプルな形状を作りました。おっと、意図していませんでした。良いです。確認したかったことの1つは、形状があります。うっかり別のスケッチを描きましたが、そのスケッチをクリアすることで、これまでに持っている1つの形状につながった最初のスケッチが実際にクリアされないことを確認したかったです。

移動方法を把握させてください。面も選択でき、理論的にはその面に何かを描くことができます。理論的には今、ここで20ミリメートルの押し出しをした場合、この長方形の上部から実際に開始するはずです。つまり、理論的には高さ20から始まり、40まで行くはずです。

クールですね。実際に異なる面を選択すると、その平面を反映するようにグリッドが変更されました。それを見るのはかなりクールです。それでも、形状に何か追加して押し出すことに問題があります。押し出そうとするとエラーが出るだけです。

操作が無効なソリッドを生成しました。別のフィーチャーまたは異なる深さを試してください。カットは機能しました。今見たように、40に設定したからです。これは完全にカットしました。

機能はあります。ただ、これをその場で使うのは難しいです。良いです。それは機能します。以前にカットした場所から、そこからスケッチを描き、20で押し出して、形状全体を再結合しました。それを見るのはクールです。

ここで円をやってみましょう。これをもっと使うにつれて、これをよりうまく操作する方法を学んでいます。ちょうど中心に円を描いてみます。そして、しまった。カットできるか見てみます。いや、そこには複雑な残りがあるでしょう。

それらを結合してみたいです。できるかどうかわかりません。とにかく、これらをSTLとしてエクスポートして、実際にプリントできるか見てみましょう。

まず最初に、GPT-5.4 Proで作成したCADソフトウェアで作成できた2つの特定の長方形の形状を実際に3Dプリントしました。ここでご覧いただけます。かなり立方体的で長方形で、すべて実際に良好でした。

ですから全体的に、このテストから物理的に触れるものを実際に得たかっただけです。それが私の心の中でこのテストを完全にした感じがしたからです。これらをオークションに出品します。もし興味があれば。入札は約1,000から始めます。

Seinfeldアパートメント3Dモデリング

次のテストは、X フィードをランダムにスクロールしているときに見たものに触発されています。誰かがモデルに「フレンズ」という番組のアパートメントのモックアップを作るように頼んでいました。

代わりに、私はこれをSeinfeldという番組のJerry Seinfeldのアパートメントで試してみたいと思います。もちろん、参照写真とウェブ検索を行う能力の両方を与えています。

ここでのプロンプトは、このフロアプランイメージに基づいてJerryのアパートメントの正確な3JSモデルを作成してくださいと言っています。ニュアンスのある詳細、暖かい照明を含めてください。

机の上に実際には20周年記念のマッキントッシュがあったとか、そういう特定のものをウェブで検索してほしいです。だから私はそれを描こうとします。基本的に、これをどれだけうまくやるかを見たいです。

作成するアパートメントのモデルを移動できるようにする必要もあります。まだ具体的にこれを見ていませんが、36分4秒でビルドを開始し、プロジェクトシェルを設定しましたが、実際のシーンをまだ完成させていません。なぜか気になります。

これは実際にかなり興味深いです。これに対して怒り狂って「無能だ。ここでどれだけ悪い仕事をしたか1から10のスケールで評価して」と言おうとしていました。実際には、ここに述べられているように多くの参照を見つけたので停止しました。

「アパートメントのシーンは時間とともに大きく変化しました」と言っています。具体的に何をすべきかわかりません。もしよければ、ここから続けてインタラクティブなビルドを完成させることができます。

最も防御可能なターゲットは、1つの完璧に固定された正規のレイアウトを主張するのではなく、シリーズ後半/シーズン8にインスパイアされた複合的なものだと言っています。これを尊重しますし、良いと思います。

忠実なレプリカのために含めるべき最も強力な詳細のリストを提供してくれています。吊り下げられた緑の自転車を入れるかどうか興味がありました。それについても言及していました。

これで良いです。そして、それに怒鳴るのではなく、基本的にそれが言ったことができると言ったことを繰り返すだけです。必然的に、完成するのにかなり時間がかかるでしょう。しかし、特定のものについて決定してほしいと言ってくれたことを尊重します。この番組の進行過程でセットに多くの変動があったことを考えると。

基本的に追加で1時間後に、このタスクを完了しました。ここで思考の連鎖を見ると、私がそうだと最初に仮説を立てたことを進めるように伝えた後に気づきます。

多くの研究も行っていました。最初に私が与えたものではない参照写真も見られます。フロアプランの画像分析が行われています。まだこれを見ていません。初めて見るのと同時に見たいからです。

これがロードされることを願っています。ワオ。それは本当に良いです。大丈夫ですか?ちょっと待って。これを見る時間が必要です。この茶色と黄褐色の特定のカラーパレットは、見てきた5.4の結果の多くで非常に一般的だと気づいています。あまり好きではありません。

これは難しいです。なぜなら、これは別々の個々のアイテム、本棚、冷蔵庫、キッチン、そのようなものをモデリングする素晴らしい仕事をしたからです。問題は、これはJerryのアパートメントにはまったく似ていないということです。

待って。Jerryのアパートメントは技術的にキッチンがそこにあれば。これは。実際に見るためにクリックできるプリセットもあります。壁の緑の自転車も、これは。

モデリングの観点からどれを保存すべきか決めるのに苦労しています。これは本当に本当によくできています。これまで見てきたすべてのモデルテストで見た中で最高のインテリアレンダリングの結果の1つかもしれません。このスタイルのテストは通常行いませんが。

しかし、ここでのタスクの実際の評価から言うと、これはフロアプランなどに従って物事が正しくレイアウトされていないため、Jerryのアパートメントの適切なレプリカではありません。

それにもかかわらず、これを見て、そのアパートメントに存在するものの個々の要素をどれだけうまく捉えたかを見ると、素晴らしい仕事をしました。ソファ、自転車、本棚、冷蔵庫、ここのテーブルにあるヴィンテージMacとあそこにプリンターらしきものも。

壁のすべての絵画、色の調子。非常に目に見えます。すべて良く見えます。バスルームも描かれています。ベッドルームも描かれており、ベッドルームはあまり一般的には見られません。壁にポルシェのポスターまであります。

これは個々の要素を捉える素晴らしい仕事をしました。実際のアパートメントの配置を思い起こさせる方法でそれらを配置するのにひどい仕事をしただけです。

残念ながら、歩行機能は機能しないようです。ここのドアもハンドルと一緒に見てください。つまり、ワオ。これは本当に。これは本当に良いです。これは非常に良いです。

アイテムは本当に本当によく作られています。この美学が大好きです。このビジュアル形式で構成された世界に住みたいです。それをどう解釈するかはわかりませんが。

提供されたフロアプランの参照。ここで物事が少し崩れ始めることがわかります。ただし、UIはよくできています。コントロール、茶色と白のカラーパレットは嫌いですが、ベッドルーム、デスク、キッチン、リビング、バス、これはまだウォーキングモードです。

できますか?できます。これは良いです。シフトでスピードアップします。実際にメッシュコライダーがあります。どのように見えるかわかりません。マインド。これはワオ、印象的にイライラします。ローリング。メモ帳です。

必然的に、ここのテーブルにもあります。カールコード付きの電話だと思います。ニューヨークローリング。廊下のヒーター。バスルームに入るとピンクがかったタイルのようなものもあります。

この角度からここを見ると、これは実際にかなり良いです。

3Dプリンターシミュレーションテスト

次に、この特定のタスクではウェブ検索を無効にします。自分自身に頼らせたいだけです。これは、チャンネルを見ていればお馴染みかもしれない3Dプリンターシミュレーションテストです。

ただし、これはアップロードされたSTLをアップロード、スライス、印刷プロセスをエミュレートできる必要があるという特定のバージョンです。ここにリストされています。

これは、ここでリストされている印刷のこれらの特定の形状で一般的な3Dプリンターでどのようにするかを見たいだけでなく、アップロードされたSTL、このプリンター用の実際のSTLを実際に理解して印刷できるようにする必要があるというレベルをもう1つ深くします。

76分55秒で3Dプリンターシミュレーション結果を受け取りました。もちろん、STLをアップロードしてスライスし、印刷をシミュレートする機能付きです。このファイルをダウンロードして見てみましょう。どのように見えるか非常に楽しみです。

まず第一に、今スタジオライトが私を指していて、ここで使っているかなり安いラップトップ画面と相まって、見るのが難しくなっています。これはとても暗いです。実際にそこにあり、見えます。問題は霧が少し。

この結果で手動で霧を無効にします。実際に見られるようにしたいからです。そんなはずはありません。霧を自分で削除するためにファイルを開いただけです。33,000行のコードです。何ですって?

見てください。これを33,000行のコードでやりました。それは巨大です。ワオ。分かりました。霧のことは忘れましょう。今それを修正するのは私には任せないでください。忘れてください。

単一ファイルでそれだけの行数のコード。すごい。プリンターがここでシミュレートされています。中央に小さな立方体もあります。印刷を開始してみて、何をするか見てみます。

動きは本当に良く見えますが、プラスチックが見えますか?ここでプラスチックを描いています。ただ、プラスチックがベッドから浮いていて、おそらくベッドと同じ色なので、見るのが難しいです。

ここでの最大の問題は。見てください。形状を実際に見ることができません。このようにズームアウトしない限り。インフィル。これはとてもイライラします。繰り返しますが、別の半端な結果のようなものです。正直に言うと。

このモデルは少し時期尚早にリリースされたと思います。なぜなら、見ているものは潜在的に非常に非常に良いかもしれませんが、愚かなミスをしているだけだからです。これもその1つです。

見てください。実際にハニカムパターンのインフィルが見られます。これは見た中で最もリアルなインフィルスタイルです。実際に印刷する方法は、見た中で最もリアルです。断言します。

問題は、霧のようなもので、あまりにもズームインすると形状さえ見えないということです。その点でイライラします。そのスクリプトの巨大な長さのため、これを修正するように頼むことさえできませんでした。おそらくさらに1時間かかるでしょう。

最初に形状の周りにスカートを描いています。タイムラインをスクラブしました。ズームアウトすると実際に円が見られます。これは特定のポイントを超えてズームインすると消えます。

しかし、これは間違いなく実際のインフィルと印刷プロセスです。ここで見ている、部分的に見ることができるこの詳細と、インフィルのやり方、これは断然見た中で最もリアルな試みです。

トップを仕上げますか?仕上げます。これは完全に100%リアルなプリンターの動きを使っています。ブラウザベースのCADプログラムで作成したSDLをアップロードしてみます。

グリッチは、アップロードしたもののこの奇妙なボックスアウトラインを表示することです。これは思い出してください、実際に作成した特定の形状です。ここでタイムラインスクラブを行い、実際にこれらを構築しているか見るためにズームアウトする必要があります。

構築しています。そしてそれをする素晴らしい仕事をしています。これらを実際に手に持っていますが、これは文字通りこれらが3Dプリントされていた方法そのものです。この結果は信じられないほどクールです。

押出機に小さなファンまで配置しました。レンダリングの一部が少しずれているのが大きな問題です。トップレイヤーに到達したときの実際のやり方を見てください。

形状を閉じるとき、これはこのテストを行うときに通常見られないことです。含めているプリセット形状が実際に閉じられているのを見ることはありません。

STLスライシングでは少し異なります。このように上部を閉じることがわかる方法でスライスするからです。しかし、ここでプリセットされた選択オブジェクトがあったときも、まさにそれをやっていました。

複数の上部レイヤーも行っています。ガントリーは推測ですが、単に浮いているだけです。特定のものに実際に取り付けられているようには見えませんが、ガントリ上のノズルの動き方。そして側面にこの円があります。

これは、レンダリング方法という点で半端な結果であるという警告付きですが、非常に良いです。しかし、これは3Dプリンターが特定のオブジェクトをどのように印刷するかの断然最もリアルな描写です。STLファイルのアップロードとシミュレートされた印刷は最初の試みで機能しました。

フライトコンバットシミュレーター最終テスト

最終テストでは、拡張思考モードとウェブ検索を有効にして、これらのモデルでよくやるフライトコンバットシミュレーターテストを渡します。ただし、これは少し複雑にするために若干調整されています。

通常からの最初の変更は、3Dグラフィックスをボクセルスタイルにして、抽象的すぎるものではなく、リアルな飛行機モデルと地形を強調してほしいと具体的に伝えたことです。

GPT-5.xシリーズのモデルがこのプロンプトを受け取って奇妙な紙飛行機のようなものを作ることがあるのを見てきたからです。この特定のテストではそれを望みません。

さらに、飛行機を選択すると空中で開始して戦闘がすぐに始まる従来のプロンプトの代わりに、これは実際に空港から始まり、プレイヤーが最初に離陸し、その後戦闘機が空中に現れてドッグファイトや何らかの戦闘シミュレーションができるようになっています。

リアルな音響効果も欲しいと伝えました。前述のように離陸と着陸の能力も必要です。グラフィックスの見栄えや全体的な離陸と着陸、音響効果、基本的にここでのすべてについて、どのようにするか非常に興味があります。

1時間2分30秒で、フライトコンバットシミュレーター結果を受け取りました。これは従来この方法でモデルをテストする方法よりも改善されたバリエーションになることを念頭に置いてください。ファイルをダウンロードして見てみましょう。

滑走路が見えます。潜在的にかなり印象的な地形も見えています。ミッションを開始します。音響効果もあるはずです。スピーカーをオンにします。

これは本当に良いです。でもどうやって離陸するのですか?あれ。どうやってスロットルするのですか?シフトかコントロール?

必ずしも。これは最高のものです。ダメ、失速します。敵がいます。なんてことだ、これは信じられないです。これは。これはこのテストで見た中で最高の結果です。

プレイするのは難しいですが。管制塔の地図まで配置しました。このゲームをSteamに出品します。2.99ドルで購入してプレイできます。コードが何行か見る必要があります。

これは信じられないほどよくできています。ロジックは良いです。キルを取れるか見てみたいです。太陽か月を見てください。どちらか。おそらく太陽でしょう。

この飛行機を操縦するのは実際にかなり難しいです。マウスで撃つこともできます。それは助かります。さあ、さあ。音響効果も非常によくできています。

これは。これは本当に、本当に、本当に良いです。再び着陸できるとは思いません。よくできています。まだ試していなかった最後の飛行機を試してみましょう。

クールです。Warthogのようです。これは。これは素晴らしいです。これは。これは本当によくできています。フライトロジックのいくつかのため、ここで勝利を得ることはできないと思いますが、実際に降下し始めると、対気速度が増加し、対気速度の増加に相関する音も増加します。

これは本当にかなりクールです。ウェーブクリアされました。あれ。雲もクールに見えます。これはそれより速く進むはずです。ワオ。これが何行のコードか見る必要があります。

これは比較的何でもありません。これはわずか2,300行のコードです。これでこの非常に長いテストを終了します。これらの結果についてすぐに話しましょう。

テスト結果の総括

もちろんCADシミュレーションがありました。実際に機能するものを生成するのに2回の試行が必要でした。ただし、これの集大成は実際に3Dプリントされて作成された実際の形状でした。これを見るのは非常にクールでした。

特定のプロンプトを与えたときに想像したり期待したりしたほど複雑ではなかったかもしれませんが、完全なCADプログラムを作るのはおそらく難しいことを考えると、これはかなりまともだと想像します。

すべてのミリメータースナッピングと描画とスケッチと押し出しは非常にうまく機能しました。それを見るのはクールでした。古い形状ですか?いいえ、描いたものを押し出しているだけです。

33,000行のコードの3Dプリンターシミュレーションを忘れることはできません。これはこれまで見た中で最もイライラする結果だったと思います。なぜなら同時に、3Dプリンターが実際にどのように印刷するかのリアルな描写という点で、このテストで受け取った最高の結果だったからです。

インフィルなどのやり方、最大の問題は霧と、形状を見ようとしてあまりにも近くにズームインすると実際に消えてしまう方法でした。それは少しイライラしましたが、STLをアップロードしてスライスし、ご覧のように実際に印刷することができました。

タイムラインスクラブをスピードアップします。このテストをしたときに本当にクールだったことは、実際に形状の上部も閉じたことです。ほとんどの場合、このテストを行うとき、実際には上部のレイヤーを描いて閉じません。開いたままにしておきます。このように見えます。

繰り返しますが、このインフィルも非常に非常にリアルでした。これは3Dプリンターが実際にどのように印刷するかという点で、リアリズムへの最も忠実な再現でした。それを見るのは非常に非常にクールでした。

もちろんスケートボードゲームがありました。2回の試行が必要で、正直に言うと、この結果には満足していませんでした。特に最初は完全に壊れていたことを考えると。それでも、これは非常にバグが多く、よくまとまっていない結果です。

ここにいくらかの可能性はありますが、特により弱いモデルがこの特定のプロンプトでより良い結果を生成できたことを考えると、全体的にかなり失望しました。

もちろんJerryのアパートメントシミュレーションがありました。十分な時間を費やしたので、あまり詳しくは説明しませんが、これは実際にあるべき場所のように物事が適切にレイアウトされていなかったとしても、ここでの詳細と、カメラビューのための異なるプリセットがあったのは信じられませんでした。

そこに表示されるフロアプラン参照、ウォークに切り替えることさえできました。それは素晴らしかったです。

Wi-Fiスペースマッパーもありました。見るのが簡単だったので、再び開きません。リアルに可能なことに忠実であることに固執し、視覚的に非常に印象的なものを作ろうとするよりも、それは現実に根ざしていたので受け入れられます。

そして、そのプロンプトを実行するときにウェブ検索を有効にしたことがどれだけ寄与したのか疑問に思わずにはいられません。

そしてもちろん、見た中で最高の結果を忘れることはできません。正直に言うと、これはとても。実際にこの結果から自分を引き離して、この動画を編集する必要があります。それは最初に予想していたよりも実際には少し難しいかもしれません。

これは単に。ダメ。引き上げて。引き上げて。よし。それでは、これで締めくくります。質問があれば、私のDiscordで聞いてください。コメントを残したい場合は自由にどうぞ。視聴ありがとうございました。

コメント

タイトルとURLをコピーしました