OpenAIが新たにリリースした日常タスク向けの小型モデル「GPT 5.5 Instant」の機能や性能向上について解説している。前モデルからの幻覚の減少や回答の簡潔化、パーソナライズされたメモリ機能の強化などを実際のテスト結果を交えて紹介しつつ、世界のAIモデルの進化の歴史や研究所の位置を網羅的に追跡できる独自のタイムライン・マップサイトの公開についても案内している。

OpenAIがGPT 5.5 Instantをリリース
皆さん、OpenAIが日常のちょっとしたタスクをこなすのに最適なGPT 5.5 Instantをついにリリースしました。今回はここで何が起きているのかを詳しく見ていきます。そして、私が現在作成している人工知能の歴史を追えるタイムラインサイトも紹介したいと思います。この物語の始まりからすべてを追跡できる素晴らしいサイトで、世界中で何が起きているのかを理解するための地図も用意しています。それでは、一体何が起きているのか一緒に見ていきましょう。さあ、始めます。
いつもいいねを押してくださる皆さん、チャンネル登録してくださる皆さんに心から感謝します。そして、この人工知能チャンネルを支援してくださっているメンバーの皆さんにも特別な感謝を捧げます。メンバーの皆さんは、WhatsAppやMCPとの連携、PDFやドキュメントの読み込みなどを教えるインテリジェントエージェントの限定動画や、その他の限定コンテンツにアクセスできることを忘れないでくださいね。さて、今日のニュースはこちらのGPT 5.5 Instantです。より賢く、より明確で、よりパーソナライズされています。
まず覚えておくべきことは、このInstantモデルは小型のモデルであり、日常的なタスク向けだということです。狂ったような超知能というわけではありません。そのため、素早く正確な答えが必要な場合は、このモデルの出番になります。彼らもまさにそう言っています。より賢く正確で、より明確かつ簡潔な回答を提供し、あなたに合わせてよりパーソナライズされるということです。基本的にこの小さなモデルの特徴は、より直接的になり、無駄口を叩かず、あなたのスタイルにより関連のある事柄を結びつけられるようになることです。
GPT 5.5 Instantの性能向上と特徴
そして、私が言った通り、より有益で快適な日常のやり取りができるようになります。日々の生活に役立つというアイデアですね。医療、法律、金融などの分野を網羅するリスクの高い質問において、GPT 5.3 Instantと比較して幻覚的な発言が52%減少していると彼らは述べています。お気づきでしょうか。彼らはこのモデルを、日常的な質問をするためのベースモデルにしようとしているのです。医療、法律、金融といった分野にまで言及しているのはかなり大胆ですね。さらに、不正確な発言を37%削減したとも言っています。
ここで数学の分野における例が挙げられています。誰かがノートの写真を送って、この計算はこれで合っていますかと尋ねた場合です。5.3 Instantは答え始め、あれこれと言い出します。そして間違いに気づき、何かおかしいと言います。その後も回答を続けようとしますが、最後には、実数解はなくこの問題は解けないと結論づけます。一方で5.5 Instantに同じプロンプトで同じ質問をすると、同じように検証を始め、ルート10は2とは異なるため何かがおかしいことにも気づきます。しかし前のバージョンとは異なり、最後までやり遂げ、問題箇所を見つけ出し、はるかに興味深い正しい解決策を提示します。
そして5.3 Instantと5.5 Instantを比較しています。バージョン5.4にはInstantが存在しなかったため、5.4を飛ばしていることに注意してください。後でサイトに行ってモデルの履歴を見れば、なぜ飛ばされたのかがわかります。さて、精度は75%から81%に上がり、MMU Proでは69から76に上がりました。小さな改善ですが、改善は改善です。もう少し上がっても良かった気はしますね。改善が10%を超えない場合は、自然に向上していく日常的な通常の改善と言えます。
ドキュメント分析の分野でも改善が見られ、エラー率が14%から12%に下がりました。ドキュメント分析でのミスは減っていますが、先ほども言ったように14から12というのは驚くほどの改善ではありません。科学の分野でも同様で、博士課程レベルの科学の質問で78から85になりました。そして、2025年のAIMの数学の分野では65から81に上昇しました。ここは10%のルールを超えたので、改善した証としてトロフィーといいねを贈りたいですね。彼らが数学の例を示したのには理由があったわけです。数学の分野に焦点を当てていたからです。
より簡潔な回答とコンテキストの活用
そして彼らが言っているのは、結果を損なうことなく回答がより短く客観的になったということです。無駄話や過剰なフォーマットを減らしました。正直なところ、このテキストの削減や過剰なフォーマットの削減は、自然に減っていくものだと私は考えています。なぜなら、モデルが話せば話すほどトークンを消費するからです。人工知能が私たちの日常生活の一部となりつつある今、モデルが話す量を減らせばトークンの消費も減り、私たちはより多く利用できるようになります。将来的には基本的にこういう流れになります。おはようといった挨拶すらあまり使わなくなることに気づくはずです。
コミュニケーションのアドバイスに関する例を見てみましょう。絶え間なく話し続ける同僚に話をやめるよう伝えるにはどうすればいいか、という質問です。5.3 Instantは少し笑いを交えながら答え始め、番号を振ってたくさんの例を挙げ、言ってはいけないことなど、大量の項目を並べ立てます。しかし実際のところ5.5 Instantはもっと直接的です。番号付きの項目などは作りません。いくつかのバリエーションを提示し、何をすべきかを大まかに説明し、正しい対応を伝えてそれで終わりです。それ以上話す必要はありません。おわかりですね。単語数が30%減少し、行数も29%減少しています。そしてトーンはよりカジュアルで実用的になり、過剰な説明を省いた職場環境に適したものになっています。基本的には先ほど言った通り、トークンを減らして話す量を減らし、コストを抑えることで、より多くの人工知能機能を提供しようとしているのです。このコスト削減の懸念は彼らだけでなく、私たちユーザーも同じです。
彼らがかなり強調している重要な点のひとつが、過去の会話のコンテキストをより効果的に利用するという点です。思い出を保存し始め、回答中に以前のチャットを活用するように設定できるのです。もちろん、多くの情報を生成し始めるとモデルが混乱し始めることもあります。しかし彼らが言うには、前のバージョンで、新しいお茶を飲める場所を試したいと質問した際、まるでその人を知らないかのような一般的な回答を返していました。サンフランシスコの新しいお茶のシーンに合っていて、伝統的なチェーン店ではないものを探しているなら、これらのオプションをお勧めします、といった具合にいくつかの選択肢を挙げていました。
5.5 Instantでは、あなたの会話により接続され、リンクされているため、次のように答えます。あなたはアシャットハウスによく通っており、甘いタピオカティーよりも台湾の高山茶の純粋な雰囲気を好むようなので、あなたの気分に合わせてこれらの選択肢のいずれかをお勧めします、という感じです。相手の気分に気を配って決定を下し、その人がよく行く場所にも注意を払っていることがわかりますね。基本的にはそういう変化が起きています。一般的な回答の代わりに、あなたの履歴にさらに基づいた回答をするようになります。
メモリ機能とプログラミング機能のテスト
彼らはすべてのChatGPTモデルにメモリソースを導入し、新しいコントロールで回答をパーソナライズできるようにしていると述べています。また、自分のチャットを共有した場合でも、他のユーザーにはあなたのメモリは表示されないと補足しています。そして、現在進行中のチャット画面が提示されています。そのチャットには、モデルが思い出したいくつかのメモリが表示されています。隅には保存されたメモリがあり、関連性があるかどうかを親指のアイコンで評価できます。メモリが間違っている場合は修正することもできます。このように、どんどんパーソナライズが進んでいます。
このモデルは本日からすべてのChatGPTユーザーに利用可能となり、標準モデルおよびAPIとして5.3 Instantを置き換えます。有料ユーザー向けには、旧モデルの5.3が3ヶ月間利用可能です。そしてこの強化されたパーソナライズ機能は、ウェブ上のPlusおよびProユーザー向けに導入されており、その後モバイルアプリで利用可能になり、さらに数週間後には無料プラン、Go、Business、Enterprise向けにも展開される予定です。
実際に起こっているのは、画面にInstantと書かれているのが見えるようになるということです。ここをクリックすると、5.5 InstantとThinkingが表示されます。設定をクリックすると、5.5 Instant、Thinking、そしてAuto Switchが表示されます。もし5.4に下げると、自動的にInstantが5.3に戻ることに注意してください。以前のモデルを使いたい場合、古いThinkingと新しいInstantを組み合わせて使うことはできません。理由は聞かないでください。ただできないのです。
マトリックスのペットショップのテストでは、モデルは非常に正確でクリーンな、とてもシンプルで問題のないサイトを作成しました。特別なことは何もありませんでした。結局のところ、このモデルはプログラミング用には作られていないのです。プログラミングのコードは作成できますが、得意分野ではありません。ペリカンのテストについては、このバージョンには驚かされたと言っておきます。小さなモデルなので期待値はかなり低かったのですが、見てください。このペリカンは足がペダルにしっかり乗っていて、腕はハンドルに添えられています。くちばしも正確で、帽子をかぶり、太陽もあります。自転車に乗るペリカンというキャプションも付いています。正直なところ、このシンプルなモデルの性質を考えると、これは本当に素晴らしい出来です。
車のゲームについては予想通り、バージョンは非常にシンプルで問題のないものになりました。特別なことや驚くようなことは何もありません。古いモデルのような感じです。これは、これが本当に古いタイプのモデルであり、プログラミング用ではないことを示すためだけのものです。したがって、プログラミングに関する新しいニュースや新機能を期待しているなら、それは違います。しかし同時に言っておかなければならないのは、このバージョンはプレイ可能であり、一発で機能したということです。だから、いろいろな問題があったとしても、非常に優れています。
マリオカートのゲームでも同じです。ゲームは超シンプルで、ちょっと奇妙な感じさえします。でもここを進んでいくと、ちゃんと動いています。バナナを取ったり、アイテムを取ったり、ブーストを使ったり、アイテムを使ったり、すべて機能しています。ただ、極めてシンプルな作りの上に成り立っています。敵が道の真ん中にいてまともにプレイしていなかったり、道の中に山があったりと、動きはするものの少し奇妙です。つまり、対話に焦点を当てた即応型の小さなモデルであることを考えれば、私の期待以上のものを見せてくれました。これは十分すぎるほどです。
AIタイムラインサイトの紹介
さて皆さん、新しいお知らせです。私は現在、AIモデルのタイムラインを備えたサイトを構築しています。基本的には、世界中で起きていることやモデルの状況を追跡できる仕組みを作っているのです。少しずつ、ブラジルの研究所などの情報を追加しています。地図上に様々なものを配置し、整理して位置を把握できるようにし、クリックしてそこで何が起きているのかを見られるようにしています。例えば、Innova USPにある人工知能センターという研究所をすでに追加しており、今後もどんどん新しい情報を追加していく予定です。
例えばアメリカを見てみると、本当にたくさんのものが見えてきます。スターゲートのデータセンター、Googleの研究所、イーロン・マスクのコロッサスデータセンターなどです。カリフォルニアでは、OpenAIやAnthropicの関連施設、Nvidiaの研究所などが見つかるでしょう。このように、地図上で確認できるようにすべてを配置しています。サイト名はainews.inteligamilgra.com.brです。ヨーロッパで起きていることも確認できます。Anthropicの情報を追加し、ポルトガルの人工知能研究所もいくつか探して入れました。私たちポルトガル語を話す人間にとって、ヨーロッパへ行くチャンスを求めている人もいるかもしれないからです。そしてもちろん、中国のAI研究所も忘れてはいません。AlibabaやByteDanceなど、皆さんが見たいと思うような情報を追加しました。DeepSeekやMiniMaxなど、お分かりいただけると思います。
しかし、そういう施設ではなく、モデルそのものや何が起きているかを知りたいという方もいるでしょう。その場合はメインウィンドウでタイムラインを見ることができます。例えば、Alibaba、Anthropic、ByteDanceといった企業ごとに、すべての年でフィルタリングできます。そうすれば、あらゆる企業のあらゆる出来事が表示されます。Googleを見てください。彼らがリリースしたモデルや製品の数々がわかります。今年のことだけを知りたいなら、2026年でフィルタリングすれば分かりやすくなります。Kling、MaritacaのSabia 4、そしてOpus 4.6、Sonnet 4.6、Mitos Preview、Opus 4.7のリリースがありました。
OpenAIを見てみると、今皆さんが見ているこの動画で取り上げている5.5 Instantがすでに載っています。更新済みです。作りたてなのでリンクのミスなどがあるかもしれませんが、時間が経てば修正されていきます。今日起きているOpenAIのことだけを見たい場合は、OpenAIでフィルタリングすれば2026年のOpenAIのモデルだけが表示されます。OpenAIの最初の頃から見たい場合は、2018年のGPT1、2019年のGPT2、2020年と順に追っていき、CodexやInstantが登場する2026年までフィルタリングして選択できます。
年ごとにクリックしていくと、2018年のGPT1やBERTといったごくわずかなモデルから始まり、どのようにモデルが増加していったかを追うことができます。2023年にChatGPTがリリースされると爆発的な増加が始まり、様々な企業がリリースを開始します。2024年にはさらに多くの企業がリリースを行い、31モデルから67モデルへと跳ね上がります。そして2025年には119モデルになりました。皆さん、注目してください。30から60、そして120へと、モデルの数は毎年倍増しています。これはここにある企業数が固定されているからです。そして現在、私たちは年半ばの少し前にいて、モデル数は46です。おそらく今年は倍増しないでしょう。この計算だと倍増には届きません。年半ばで約60だとしたら、おそらく今年は去年と同程度の数になると思われます。誰にもわかりませんけどね。
表形式で表示すると、日付順にきれいに整理できます。今出たばかりのInstantがありますね。その前にはGoogleの多言語音声認識モデル生成であるSirp 3が出ました。その前にはMistral Medium、Nemotron、DeepSeek V4、GPT 5.5、Mimo Kimica 2、Grok、Claude Opus 4.7と続きます。すべての履歴がここにあるので、正確に追跡することができます。Anthropicの履歴だけを知りたい場合は、Anthropicでフィルタリングしてください。そうすればAnthropicの初期の始まりから現在までの出来事だけが表示されます。
これらの情報のソースを確認したい場合は、日付とリンクが用意されているのでチェックできます。この部分は皆さんに確認していただきたいところです。もし間違いを見つけたら、コメントをお願いします。このプロジェクトはオープンソースです。ここで説明しているように、すべて公開されています。もし間違いを見つけて提案したい場合は、issuesのところに来て新しいissueを作成し、日付が間違っているとか、リンクがおかしいといったことを教えてください。そして、人工知能にどう修正すべきかを説明するプロンプトの形式で書いてもらえると助かります。というのも、実際にその修正を行うのは人工知能自身だからです。
皆さん、これからも注目し続けてください。ヨーロッパやブラジルなど、地図をもっと充実させていく予定です。もし研究機関や大学など、人工知能に関連するものでこの地図に載せる価値のあるリンクがあれば、下のコメント欄かissuesに送ってください。意味のあるものであれば掲載されるかもしれません。もしこのような動画を引き続き見たいということでチャンネルを支援してくださるなら、ぜひメンバーになってください。メンバーはインテリジェントエージェントの限定動画や先行公開動画にアクセスできます。それでは、いいねをよろしくお願いします。ありがとうございました。


コメント