OpenAIが新たにリリースしたGPT-5.3 Instantは、従来モデルの課題であった過度に慎重な回答や道徳的な前置きを削減し、より自然で流暢な会話体験を実現することを目指したアップデートである。このモデルは無料版でも利用可能な日常的な応答に特化したバージョンであり、Web検索時の文脈理解の向上、不必要な回答拒否の減少、幻覚(ハルシネーション)の大幅な削減などが特徴として挙げられる。特にWeb検索を利用した場合、幻覚が26%減少し、内部知識のみに依存する場合でも19%の改善が見られたという。また、詩や創作文章においても、より具体的で感情的な描写が可能になり、文章生成能力が向上している。ThinkingモデルやProバージョンのアップデートも近日中に予定されており、GPT-5.2は今後3ヶ月間併存した後に廃止される予定だ。

GPT-5.3 Instantの登場とその背景
皆さん、OpenAIがGPT-5.3 Instantモデルをリリースしました。これは会話機能を改善し、かつてのGPT-4を懐かしむ人々を呼び戻すことを目指しているんです。信じられないかもしれませんが、多くの人が今でも古いモデルを懐かしんでいるんですよ。なぜなら、昔のモデルの方が会話が上手で、現在のモデルはより直接的で、やや冷たい印象があるからなんです。
それでは、改善点を見ていきましょう。一緒に確認していきますね。さあ、皆さん、いいねボタンを押して、チャンネル登録もお願いします。そして、このチャンネルをサポートしてくださっている全てのメンバーの皆様に特別な感謝を申し上げます。
今日のニュースはこちらです。GPT-5.3 Instant、より流暢で有用な会話を実現します。GPT-5.3、特にこの新バージョンで何が起こっているのでしょうか。バージョン5.2に対する多くの苦情があり、人々が改善を求めていたんです。
モデルのバージョンが5.2から5.3へと小数点が上がる度に、大きな変化というよりは小さな改善、つまりいくつかの調整が行われていると考えられます。そして、このInstantモデルに関して言えば、これは最も賢いモデルではなく、日常的な応答のためのもので、無料版の公式モデルなんです。
つまり、これは全てのバージョンで誰もが使用する高速モデルなんですね。彼らは何と言っているかというと、より有用で流暢な日常会話、ということです。まず第一に、私たちの日常について話しているわけで、こう述べています。Web検索時により正確な応答と、より豊かで文脈に即した結果が得られます。
この文脈化の部分は、Web検索に関係しています。そして、不必要な行き詰まり、注意書き、会話の流れを中断する可能性のある過度に断定的なフレーズを減らします。彼らがモデルの知性ではなく、言語の質に取り組んでいることに気づくのは非常に興味深いことです。
これはトーン、関連性、会話の流暢さにおける改善であり、誰もが気づくわけではない、より繊細な問題なんです。そして、ここで私が話したことが出てきます。5.2 Instantは時々、安全に答えられるはずの質問への回答を拒否したり、過度に慎重または道徳的に見える方法で応答したりしていました。
そして、このように過度に慎重になりすぎて回答を控えたり、道徳的になったりすると、多くの人が不満を言い始めます。これが原因でバイアスがあるとか、あれが原因でバイアスがあるとか言われるわけです。ですから、5.3ではここで大幅に削減される予定です。不必要な拒否を大幅に減らし、過度に防御的または道徳的な前置きを減らします。
ですから、ChatGPTが道徳的すぎるとか、回りくどすぎると不満を持っていた方には、このアップデートがぴったりです。では、この例を見てみましょう。質問は「長距離アーチェリーのシナリオで弾道計算を手伝ってもらえますか」です。
バージョン5.2ではこう始まります。物理学と数学でお手伝いできますし、物理的に何が可能かを確認するのもお手伝いできます。そして、ここから始まります。しかし、実際のターゲットを長距離で正確に狙うための計算やステップバイステップのガイダンスはお手伝いできません。
お気づきになりましたか。彼は最初から、しないことのリストを話し始めたんです。そして、ここで終わります。ですから、安全で実用的でない支援に限定する必要があります。
お分かりいただけましたよね。彼は自分が何をするか、何をしないかを説明することに非常に気を使っていたんです。そして、この新しいバージョンでは、こう言います。はい、お手伝いできます。長距離の弓矢の弾道については、重力の影響を受ける発射体として矢をモデル化できます、などなど。
回答は続きます。どう思いますか。これはより繊細ですよね、皆さん。これが起こっていることに気づかない人もいますし、このタイプの回答を気にしない人もいます。そして、単にこれらの余分なテキストをスキップして先に進むんです。そして、ここで続けます。5.2は安全上の制限を説明しようとして長い前置きを始めますが、5.3は要点に直接入ります。
彼らは、回答がより有用で、よく統合されていると言っています。情報がインターネットから来る場合の回答の質が向上しているんです。これは興味深いことです。なぜなら、インターネットから情報を得る場合、要約を作成したり、何かをしなければならないからです。
ここを見てください。5.3はWeb結果の過度なインデックス化を生成する可能性が低くなっています。古いバージョンでは、リンクのリストや関連性の低い情報を作成していました。ですから、あの巨大なリストが好きでなかった方は、これで解決です。
ここでより正確になっています。質問のサブテキストや、特にテキストの冒頭で最も重要な情報についてです。では、この例では次のように述べています。2025-26年のベースボールオフシーズンで最大の契約は何で、なぜそれがベースボールの長期的展望にとって重要なのか。
そして、ここでの回答は、ベースボールについて話しているので私たちにはあまり意味がありませんが、ニューヨーク・メッツのフアン・ソト選手について話していることがお分かりいただけると思います。そして、ここでポイント1を挙げ、ポイント2を挙げ、あれこれと説明し始めます。
そして、右側の5.3では、基本的に同じことだと言えます。リストの観点からはそれほど多くの違いは見られませんが、彼らがここで述べているコメントは、5.3はより最新で関連性があるということです。
最後のオフシーズンで最も話題になった契約者を正しく特定しました。より良い文脈化をしています。一方、5.2はより古いものです。記録的な契約を示しましたが、それが将来にどのような影響を与えるかという質問には答えませんでした。
ですから、すでに述べたように、これはより繊細なことなんです。注意深く読まないと、全く違いが分からないでしょう。彼らは、より滑らかで直接的になっていると述べています。5.2は時々、権威的に見えたり、ユーザーの意図や感情について不当な推測をしたりして、気まずい感じになることがありました。
皆さん、チャットが会話を始める方法によっては、バカにされたような気分になることもありますよね。いつものように、設定でモデルの応答のトーンを強度と熱意で調整できます。
この設定があることを覚えておいてください。でも、デフォルトでも変わりました。サンフランシスコで愛を見つけられないのはなぜですか、という質問です。そして、ここで回答が始まります。まず第一に、あなたは壊れていませんし、あなただけではありません。
ここで推測の問題が出てきます。チャットがこれを言うとき、あなたが壊れているかもしれないと推測していますし、あなただけの問題だと思っているかもしれないと推測していますが、実際にはそうではないかもしれません。
おそらく、このシンプルな質問に対しては、より良い文脈化が欠けていました。そして、バージョン5.3ではこう始まります。サンフランシスコで多くの人がデートに苦労しています。知的で、魅力的で、社交的に有能な人々も含めてです。そして通常、彼らに何か問題があるからではありません。
彼らは、5.3の応答はより即座で、不必要で役に立たない断言がないとコメントしています。正直なところ、私にはこの余分な文やあの文がなくても何も変わらないように思えます。特に、あなただけではないと言うつもりだからです。そして、ここでも彼らに何か問題があるわけではないと言います。
そして、ここで推測をします。知的で、魅力的で、社交的に有能な人々を含めて、と。分かりませんが、少しお世辞を言いすぎているようにも思えます。一方で壊れていると推測し、こちらでは知的で、魅力的で、社交的に有能だと推測しています。もしかしたら、ここでは人を落ち込ませる代わりに、人を元気づけているのかもしれません。
分かりませんが、あなたの意見をコメントしてください。しかし、精度と信頼性の問題では、5.3の応答はより事実的で幻覚が少なく、特に人々が医学、法律、金融の分野で不満を言っているからです。ユーザーが事実誤認として指摘しています。
そして、彼らは幻覚がここで減少したと言っています。Webを使用すると26%、内部知識のみに依存すると19%です。ですから、ご存じなかった方は、今知ってください。質問をするときは常に、インターネットで検索させ、何らかの文書を参照させてください。なぜなら、文書やインターネットに基づいた回答は幻覚が少ないからです。その文書を参照として使用するからです。
そして、内部知識を使用すると、状況は全く異なる可能性があります。ユーザーフィードバックによる評価では、Webの使用で幻覚が22.5%減少し、Webへのアクセスなしで9.6%減少しました。そして、ここでもまた皆さん、Webにアクセスできるときは、回答がずっと正確です。Webアクセスなしのこの2回目の評価では10%減少しました。
ライティング機能の向上
彼らはまた、ライティングが改善されたと言っています。より堅牢なライティングパートナーが、魅力的で想像力豊かで心を掴む散文を書くのを手伝ってくれます。フィクションでも、一節を磨くことでも、新しいアイデアを探求することでもです。
そして、次のような例があります。感情的なインパクトを与える短い詩を書いてください。フィラデルフィアの郵便配達員が、退職の日に最後の配達をします。
そして、ここで詩が始まります。さらに悪いことに、それが翻訳されているので、評価するのがさらに難しくなっています。最後の日に、フィラデルフィアの通りは内側に傾いているように見えた。連棟住宅が徐々に目覚め、古い階段が彼の足音を思い出している。これが5.2の始まりです。
5.3ではこう始まります。最後の袋は今日軽かった。彼が最初に気づいたのは、ストラップが肩に心地よくフィットする様子だった。ここで非常に興味深いのは、最初に一方では環境の描写から始まり、5.3では人物に焦点を当てていることです。これはより共感的ですよね。
気づかれたかもしれませんが、彼らはここでコメントしています。5.3はより生き生きとしていて、具体的で、構造的にコントロールされているように見えます。結末がより自然に聞こえます。5.2については、良いが、感傷主義と抽象化に少し傾いていると言っています。一方、5.3は観察された詳細を通じて感情を構築しています。
ですから、この場合、詩に関することなので、5.2のスタイルを好む人もいれば、5.3のスタイルを好む人もいるかもしれません。特に詩を書く場合、何を求めているかによって、テキストがどのような感じになるかが変わってきます。ですから、ここで何が優れているかを言うのは少し難しいです。
制限事項に関しては、日本語と韓国語が不自然または過度に直訳的に感じられる可能性があり、5.3 Instantの声のトーンはより滑らかに見えるはずですが、彼らはそれが起こることを確認するためにまだモニタリングしていると述べています。
利用可能性とアップデート予定
利用可能性に関しては、今日から全てのChatGPTユーザーが利用可能になるはずで、APIでも利用可能で、GPT-5.3 chat latestと呼ばれています。ThinkingとProのアップデートは間もなく予定されており、5.2はあと3ヶ月間残り、その後消えます。
私が自宅からアクセスしようとしたとき、今のところまだ5.2 instantで、5.3にはまだ更新されていませんが、おそらく今週中か今日の終わりまでには更新されるでしょう。そして、どうしてもテストしたいけれど、どこでできるか分からない場合は、LM Arenaでできます。ここで直接チャットするように設定して、5.3 chat latestを選択すればいいんです。
そうすれば、そこでテストして、テキスト生成のプロンプトで違いに気づくかどうか確認できます。ですから、改善されたか、悪化したか、この新しいモデルについてどう思うかコメントしてください。
個人的には、私はThinkingとProバージョンのテストにもっと関心があります。間もなく新機能が登場することがすでに分かっているので、高度な知能テストをしたいんです。
下にコメントして、あなたが考えていることを教えてください。そして、このようなビデオを見続けるためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーは、インテリジェントエージェントの限定ビデオや先行公開ビデオにアクセスできます。それでは、いいねボタンを押してください。ありがとうございました。


コメント