ChatGPTのモデルの中でプログラミングに最適なのはどれ?新しいGPT 4.1をテストして比較

AGIに仕事を奪われたい
この記事は約16分で読めます。

9,191 文字

Qual o Melhor Modelo do ChatGPT da OpenAi Para Programação? NOVO GPT 4.1 Testado e Comparado
Aprenda Inteligência Artificial! ▸ Aprenda Agentes iA: ▸ Seja MEMBRO:

OpenAIがGPT 4.1をプラットフォームでリリースしました。このモデルは以前からAPIを通じて開発者に提供されていましたが、今は公式プラットフォームで誰でも利用できるようになりました。これはプログラミングに特化したモデルということです。今回はOpenAIの全モデルをプログラミングテストして、それぞれの違いや働きを理解し、プログラミングに最適なモデルを選べるようにしていきましょう。
それではVibe Codingへ行きましょう。いつもいいねをくれる皆さん、チャンネル登録者の皆さん、ありがとうございます。特に人工知能チャンネルをサポートしてくれるメンバーの皆さんに感謝します。メンバーは知的エージェントの独占動画、WhatsAppとの連携方法の完全なプレイリスト、そして先行公開動画にアクセスできることを忘れないでください。
本題に入りましょう。何が起きたかというと、「その他のモデル」を見ると、GPT 4.1があります。説明には「分析と高速プログラミングに最適」と書かれています。これはどういう意味かというと、日常的にプログラミングをしていて、ある程度の品質に慣れている人は、他のモデルが高速プログラミングのツールをうまく統合できていないことに気づくでしょう。
テストしてみましょう。GPT-4o、GPT-3.5、GPT-4o mini、GPT-4o mini high、GPT-4.5、GPT-4.1、GPT-4.1 miniをテストして結論を出します。まずは新しいGPT-4.1から始めて基準を作りましょう。
次のプロンプトを使います:「ThreeJSを使って、シンプルな3Dカーシミュレーターを単一のHTMLファイルで作成してください。テストや比較が簡単にできるように小さなファイルにしてください。雲、山、道路、木、そして走る列車を追加してください。矢印キーとWASDキーで車を制御できるようにしてください。カメラは車を三人称視点で追従し、集められるコインを配置し、対戦するAIも入れてください。先に10枚のコインを集めた方が勝ちで、コインが集められたら新しいコインが出現するようにしてください。衝突したら車が爆発して初期位置に戻るようにしてください。AIがコインを集めたら画面中央に表示し、スペースキーでゲームを開始・再開できるようにしてください。」
このプロンプトは完全で簡単です。全てのモデルで同じプロンプトを使い、何の変更もせずに分析します。キャンバスを有効にして、コードを片側に表示しながらチャットを小さなウィンドウに表示させることができます。
通常、こういったテストでは複数のモデルを使う場合、いくつかのルールを設けています。今回のルールは:ゲームが最初から動かない場合は、動作させるための修正を試み、場合によっては改良も加えた後で最終結果を議論します。
それでは、コードの動作を見てみましょう。文字が少し小さいかもしれませんが、メインのゲーム画面を見たいのでそのままにします。
興味深いことに、画面サイズを調整できます。基本的に手順はこうです。このウィンドウにコードが表示され始めます。コードが完成したら、何を作ったのか説明があります。右側の隅にプレビューが表示され、そこでゲームをプレイできます。
これが初めてのテスト、ChatGPTバージョン4.1です。「ファイルが大きすぎて切り捨てられました」という警告が出ました。このエラーは奇妙です。なぜこれが起きたのかわかりません。もう一度試してみます。
同じプロンプトをもう一度送信します。正直、300行程度のコードでエラーが出るのは非常に奇妙です。これは小さなバグだったのかを確認してみましょう。
現在、コードの長さを監視しています。200行ほど、300行ほど…問題なく通過しました。いや、また同じエラーです。「ドキュメントが最大拡張を超えています。ドキュメントが大きすぎて切り捨てられました。」おかしいですね。こんなことは初めてです。
「続ける」をクリックしてみましょう。続きました。コードを提供してくれましたが、ここには掲載されないと言っているので、手動で追加します。コードの終わりを手動で追加しました。
奇妙ですね。こんなことは見たことがありません。非常に奇妙ですが、進めましょう。プレビューしてみましょう。何が動作するか見てみます。プレビューできないと言っていますが、すでに何かが表示されています。スペースを押すとどうなるか見てみましょう。エラーが出ました。バグを修正します。
奇妙ですね。キャンバスを使わずに同じプロンプトをGPT-4.1に送信してみましょう。このプロンプトは、APIバージョンがリリースされたときにテストして完璧に動作しました。なぜ今、サイズが大きすぎると言われているのでしょうか?非常に奇妙です。
あなたもこの問題が発生しているか教えてください。これは本当に予想外で、実際にコードが途中で停止してしまいます。
今、キャンバスなしでやってみます。そうするとサイドウィンドウが開きません。コードは良さそうで、正しく機能しています。見てください、突然停止して「生成を続けますか?」と聞いてきました。はい、続けましょう。コードの終わりまで行きましょう。
どうやら、トークン出力の制限が小さく、最後まで生成できていないようです。しかし、うまくいきました。最後まで行きました。通常のプロンプトのように生成されました。
ではキャンバスで編集してみましょう。編集します。キャンバスが表示されます。プレビューしましょう。3、2、1、行きます。うまくいきました!何かが表示されました。良いですね。
スペースを押して開始します。スペースを押しました。動いています!ただし、コマンドが反転しています。左右は正しいですが、前進しているとき、車は後退しています。コインもとても遅いですね。列車はなく、山はあり、木があります。この画面サイズでは列車が見えるかどうかわかりません。
あのコインは私のものです。列車があります!列車は動いていません、停止しています。もし列車を修正して動くようにするよう頼んだら、少し変になるでしょう。
動作していることがわかります。すべて正しく、コインを集めると正確に反応し、ゲームは機能しています。主な問題はキャンバスにあります。キャンバスを閉じて次のように言います:「車がとても遅い、列車が動いていない、前進と後退のボタンが反転している」。
またファイルサイズの問題が出るか見てみましょう。非常に奇妙ですが、「続けて生成」をクリックすれば解決するので問題ないでしょう。コードを完成させるのにわずかな量のコードしか足りていません。
キャンバスに戻りましょう。プレビューします。3、2、1、行きます。スペースを押して開始します。押して始まりました。良いですね!もっとコインを追加するよう言うべきでした。列車が動いています!列車を見て!コインがあります!
あ、衝突しました。衝突しましたが再起動しませんでした。ただ停止しました。列車はまだ動いています。再起動するためにスペースを押しましたが、ゲームは再起動していません。
「同時に4つのコインを配置し、車が衝突したら初期位置に戻り、車を爆発させること」と修正をリクエストします。
それでは、他のバージョンを試してみましょう。GPT-4oのバージョンを作成します。キャンバスを有効にします。このコードはキャンバスに収まるはずです。次にGPT-3.5でも同じプロンプトを試します。キャンバスを有効にします。これも動くはずです。何度もこれをやったことがあるので、動かないとは信じられません。
GPT-4o miniを試し、GPT-4o mini highも試します。そしてGPT-4.1 miniでも試します。GPT-4.5も試してみるべきでしょうか?GPT-4.5はこういうことには向いていませんが、試してみましょう。
GPT-4.1に戻ります。「続けて生成」をクリックします。コードを完成させましょう。キャンバスを有効にします。GPT-4.1の最終バージョンです。3、2、1、行きます。スペースを押します。ゲームが始まり、コインが出ています。
列車が動いています!より多くのコインがあります。収集できます。衝突しました!再起動しました。完璧です!すべて修正され、動作しています。勝ちました!
木があり、山があり、AIの対戦相手がいて、列車があり、草があり、道路があり、すべてがあります。衝突すると、列車と衝突すると点滅して機能します。草の上には行けません。これは普通です。時々AIは草の上を走れるゲームを作りますが、今回はそうではありません。
この動作したバージョンを記憶しておいてください。GPT-4oのバージョンはファイルサイズからすでに何か問題があるのがわかります。とても小さいですね。プレビューしましょう。3、2、1、行きます。ゲームのようなものがありますが、スペースを押しても何も起こりません。
ファイルサイズだけでも何か非常に問題があることがわかります。GPT-4oにもう一度チャンスを与えましょう。GPT-4oはもっとうまくできるはずです。多くのプログラムを作ってきたので、GPT-4oがもっとうまくできることを知っています。
GPT-3.5ではどうでしょうか?GPT-3.5はより考え、より広く検索するモデルなので、すでに見えるでしょう。3、2、1、行きます。表示されました!バグがあるためプレビューできません。コンソールを表示します。何か問題があります。バグ修正中ですね。
GPT-4o miniを見てみましょう。3、2、1、行きます。GPT-4o miniがロード中…何も起こりません。画面が青くなって始まりません。奇妙ですね。どのモデルも最初から正しく動作していないのは奇妙です。
GPT-4o mini highを試します。これは動くはずです。3、2、1、行きます。バグ修正…どのモデルもこのプロンプトを最初から正しく実行できていません。ChatGPTがこれほど失敗するのを見たことがありません。
GPT-4.1 miniを試します。キャンバスを有効にするのを忘れていたので、「続けて生成」をクリックします。完了しました。しかし、キャンバスを有効にするオプションがないようです。HTMLで実行する必要があります。
GPT-4.5を見てみましょう。このモデルはプログラミング用ではなく、言語処理用ですが、試してみましょう。3、2、1、行きます。これもバグが出ました。バグを修正します。
これまでで最悪の実行結果です。このプロンプトはいつも皆にとって機能するものです。GPT-4oを再度試します。コードが短すぎるように見えました。3、2、1、行きます。少なくとも何かが表示されています。
車があります。左右に動きます。ある程度機能していますが、列車がなく、山がなく、車が回転していません。衝突するか見てみましょう。衝突しません。対戦相手もいません。奇妙ですね。同じプロンプトをGPT-4oで何度も使ったことがあり、機能しました。
列車、対戦相手、コイン、基本的にすべてが欠けています。「車と一緒に画面を回転させて」と依頼します。
現在、機能しているのはGPT-4.1だけです。GPT-4oはバグ修正中で、GPT-3.5はエラーを修正したようですが、実行されておらず、画面が白いままです。説明しましょう:「白い画面が表示され、スコアボード以外何も起こりません」。
GPT-4o miniを見てみましょう。3、2、1、行きます。ロードしました!動いています!コインがあります!初めて成功しました。コインを集めています。なぜか再起動しています。何にも衝突していないのに再起動されます。
スコアボードはどこですか?見えません。3つのメッセージがあります。何らかのエラーが発生しているようです。何らかの理由でゲームがリセットされています。
AIが衝突すると私のゲームも再起動しているのかもしれません。しかし、衝突していません。でも何らかの理由で再起動されます。
コーン形の木があり、山があり、列車があり、すべてがあります。これはGPT-4o miniです。興味深いですが、GPT-4.1の方が良いと思います。ただしこの3D地形は興味深いですね。「ゲームが理由もなく再起動します」と告げて修正してもらいましょう。
GPT-3.5を見てみましょう。GPT-3.5が動き始めました!3、2、1、行きます。始まりました!なんとか動いています。コインは遠くにありますね。列車があります。衝突しませんでした。コインがあります。AIは狂ったようにコインを追いかけています。
コインは1つだけでしょうか?それともコインが集まっているのでしょうか?1つのコインだけです。コインがどこにあるのか見つけるのが難しいです。通常、こういう場合、AIがどこに向かっているかを見ます。コインを探すのは難しいですが、AIがコインを検出しているのがわかります。
この場合、次のようにする必要があります:「より小さなマップを作り、一度に3つのコインを配置してください」。
それでは続けましょう。GPT-4.1は動作しています。GPT-4oを見てください。コマンドが反転していますが、少なくとも対戦相手とより多くのコインが表示されました。列車があります!列車がそこにあります!
コインも機能しています。AIはコインを集めています。すべて正しく動いています。AIが走っています。コマンドが反転していて、後退ボタンを押すと加速します。少し頭が混乱します。10コイン集めましたがゲームは終了しませんでした。
もう一つのバージョンが動作し始めました。「10コインを集めましたがゲームは終了しませんでした。後退キーが前進になり、前進キーが後退になっています」と修正をリクエストします。
修正後のGPT-3.5を試します。スペースを押して開始します。マップが小さくなり、一度に3つのコインが配置されるよう依頼しましたね。マップはまだ大きめです。コントロールは正しく動作しています。
今は3つのコインが見えますね。AIが追いかけているコインと、他に2つのコインがあります。実際には4つあります。もう1つはAIが向かっているところにあります。そして他に2つはここにあります。スコアボードもあります!1対1です!2対1で私のリードです。3対1です。3対2です。
AIの後を追うと便利です。AIはレーダーで検出しているからです。AIは不正をしていますね。コインがどこにあるかわかっているのは、検出して追いかけるようにプログラムされているからです。
あ、衝突のことを忘れていました。でもとにかく、ドーナツがあります。4つ取りました。ゲームがとても遅いので最後までプレイしません。
他のモデルも見てみましょう。GPT-4o miniはすでにプレイしました。GPT-4o mini highにはメッセージがあり、おそらくエラーです。「列車が定義されていません。バグを修正します」。GPT-4.1 miniはファイルで実行する必要があります。GPT-4.5にもメッセージがあります。「列車が定義されていません。バグを修正します」。
バグ修正を待つ間に、これをファイルに保存して何が起きたか見てみましょう。新しいファイルを作ります:GPT41mini.html。メモ帳で開きます。コードをコピーして保存します。ダブルクリックします。3、2、1、行きます。スペースを押しても何も起こりません。
F12キーでエラーを確認します。「列車オブジェクト」のエラーがあります。エラーを報告しましょう。「列車オブジェクトがありませんでした」。
GPT-4.1 miniは迅速に説明してくれました。変数がトップにないからだと説明しています。手動で修正しましょう。「let train」をコードの上部に移動させます。もう一度試してみましょう。F5を押します。
3、2、1、スペースを押しても反応なしです。今度は多くのエラーが表示されましたが、基本的に同じエラーが繰り返されています。このモデルはもう一度試してみるか、修正を試みましょう。
興味深いのは、GPT-4.1 miniではキャンバスが表示されないことです。なぜキャンバスが表示されないのか理解できません。GPT-4.1に切り替えるとキャンバスが表示されますが、GPT-4.1 miniに切り替えると3つの点が消えてしまいます。つまり、GPT-4.1 miniは日常的なタスク用であり、コーディングには向いていないということですね。
GPT-4.5を見てみましょう。プレビューします。修正したようですが、画面は白いままです。再度バグを修正しています。列車が見つからないと言っています。GPT-4.5はプログラミング用ではないので、これ以上時間をかけません。
GPT-4o mini highでは動作するはずですが、白い画面が表示されています。「開始すると白い画面だけが表示され、何も起こりません」。列車が見つからないと言っていますが、すでに解決したようです。
GPT-4.1が新しいバージョンを生成しました。古いバージョンを置き換えましょう。GPT-4.1 miniを保存します。シミュレーターに戻ります。3、2、1、再起動します。始まりました!動き始めました!車が回転していませんが、このバージョンはかなり良いですね。AIがすでに勝ちました。素早く勝ちました。
何が起きているのでしょうか?画面を回転させても車が回転していません。AIが勝ったという表示が出ます。コインを取るたびに再起動されます。スコアボードがリセットされていないからです。でもこのバージョンは良いですね。
「カメラは車と一緒に回転するべきで、プレイヤーが勝った時にスコアをリセットしてください」と依頼します。コード全体を送るか聞いてきたので、全体を送ってもらいます。
GPT-4o mini highが今回は動作するか見てみましょう。動き始めました!3、2、1、行きます。始まりました!動作しています。
操作性に非常に奇妙なことをしています。回転していくと、ある時点で回転が止まります。説明するのが難しいですが、私が回転していると突然車が回転し始め、画面の回転が止まります。こんなゲームは見たことがありません。
この方向を見ることができず、あちらの方向だけ見ることができます。AIは狂ったようにコインを集めています。考える暇もなく負けてしまいます。とても変なゲームです。どう修正すればいいのか説明するのも難しいです。
最後のGPT-4.1 miniバージョンを見てみましょう。更新したGPT-4.1 miniをロードします。F5を押します。3、2、1、行きます。より良くなったようです。衝突するかわかりませんが、AIが勝ちました。ゲームが再起動しました。
開始時に少し変なバグが出ますが、動作しています。AIがまた勝ちました。難しいですね。AIはすでにコイン位置を知っているので、すぐに集めて勝ってしまいます。ちゃんとプレイする時間がありません。
GPT-4.5を除くすべてのモデルがバージョンを作成できました。最も知能の低いモデルから最も知能の高いモデルまで順に確認してみましょう。
まずはGPT-4oです。GPT-4oが作成したゲームにはコイン、道路、列車、対戦相手があります。列車はどこですか?列車があります。列車、コイン、すべてが機能し、スコアボードも動作しています。プレイ可能で、問題なくAIに勝つことができます。道路は少し変ですが、問題ありません。
次はGPT-4.1 miniです。動作しています。コイン、すべて揃っています。衝突すると反応します。列車、木、山があります。しかしAIは狂気的で、私たちに簡単に勝ってしまいます。開始時に奇妙なバグがあり、衝突がなく、勝つのは非常に難しいです。
次はGPT-4.1です。これについては何も言う必要がないでしょう。これが間違いなく最高のバージョンでした。作成も説明も最も簡単でした。すべてが正しく機能し、対戦相手がいて、列車があり、競争力があり、AIと対戦できます。すべてが機能しています。最高のモデルを決めるのは簡単でした。
GPT-4.5はまったく動作しませんでしたが、問題ありません。GPT-4.5はコーディング用ではないので、難しいのは予想されていました。
GPT-4o miniのバージョンはこれです。興味深いですね。プレイ可能ですが…いや、ランダムに再起動されるのでプレイできません。なぜ再起動されるのかわかりません。見えない壁があるようです。見えない壁にぶつかるとすべてが後ろに再起動されます。
GPT-4o miniのバージョンでは動作し、すべて正しいですが、ぶつかると再起動する見えない壁があります。GPT-4o mini highでは機能し、AIが狂ったようにプレイし、回転の問題があり、列車が横向きに走るという奇妙なゲームになっています。
1位はGPT-4.1であることは明らかです。最高の画像、最高のプレイ性があり、すべてが正しく機能し、チャットで会話を続けることができ、変更も行っています。
コード生成時に一度にコード全体を生成できないという非常に奇妙な問題がありました。これが私だけで起きているのか、皆さんにも起きているのかわかりませんが、コメントで教えてください。
プログラミング、特にWebプログラミングにはGPT-4.1が非常に優れていることがわかります。GPT-3.5など、より知的なモデルを使用する場合も、それらも良いゲームを作成しました。ただし、どのモデルも衝突や爆発を実装していません。Gemini 2.5では、これらすべてを最初から簡単に実装できます。
あ、言ったそばから、衝突機能がありました!列車との衝突で爆発します。AIとの衝突では何も起こりません。
個人的には、Gemini 2.5がこれよりもまだ優れていると思います。GPT-4.1バージョンは良くなり始めています。皆さんもテストして、どう思うか教えてください。
このようなビデオを続けて見たいと思う方は、チャンネルをサポートしてメンバーになってください。メンバーはWhatsAppグループやアーリーアクセスビデオにアクセスできます。いいねもお願いします。ありがとう!

コメント

タイトルとURLをコピーしました