GPT-5は誰もが予想していたものではない、そしてこれが全てを変える!

GPT-5、5.1、5.2
この記事は約12分で読めます。

この動画では、近日中にリリース予定のGPT-5について、単なるモデルルーターではなく、OpenAIの各シリーズの画期的技術を統合した真の次世代フロンティアモデルであることが明らかになった経緯を解説している。また、上海交通大学の研究チームが発表したAI研究自動化システム「ASI Architect」の実態と限界、そして最新のAI関連ニュースについても取り上げている。

GPT-5 isn't What Anyone Expected, and This Changes Everything!
GPT-5 might not be what we expected… or is it? In this video, we break down shocking new details about GPT-5's release, ...

GPT-5リリースが業界の分岐点となる

はい皆さん、ここまで来ましたわ。これは完全に分岐点やで。もしGPT-5が期待に応えられへんかったら、OpenAIにとって悪いニュースなだけやなくて、業界全体にとってショックなんや。このリリースがバブルを弾けさせるか、そもそもバブルなんて存在せえへんかったことを証明するかの違いなんやで。

せやけど問題は、これだけのことがかかっとるのに、OpenAIは準備できとるんかってことや。完全に答えを変えてしまう新しい詳細が出てきたんや。

上海交通大学の自動AI研究システムについて

次に、上海交通大学の研究者たちが、完全に自動化されたAI研究ループを導入した画期的な論文でヘッドラインを飾ったんや。このASI Architectは自律的に106の新しいニューラルネットワークアーキテクチャを考案したんやで。せやけどこの論文は、ヘッドラインが言うとるほどのもんやないんや。せやから、それについてもはっきりさせる必要があるで。

そして最後に、今日は驚くべきartificial jamセグメントがあるから、最後まで見といてや。さあ、やってみようか。

GPT-5の詳細と期待値

GPT-5は、皆さんご存知のとおり、おそらく史上最も期待されとる技術の一つや。汎用マルチモーダルAIモデルの次の大きなステップなんや。せやけど今、ついにこのモデルの性質とタイムラインについて新しい詳細が分かってきたんや。

噂によると、GPT-5は今後数週間以内にリリースされる予定やで。8月にGPT-5が出るって話もあるんや。このニュースは、OpenAIの従業員や早期アクセスを受けた他の会社からのもんらしいで。Sam Altmanも、Xで近々GPT-5をリリースするって言うとったし、人々はすでにMac OSアプリのモデルリストキャッシュの中にGPT-5 autoとGPT-5 reasoningを見つけとるんや。

せやからタイムラインはそんな感じや。めっちゃ近いことが分かっとるし、ほぼ確実に選ばれた企業や個人はもうアクセスを受けとるはずや。せやけど問題は、何を期待すべきかってことや。GPT-5はどんなもんなんか?モデルなんか?システムなんか?エージェントなんか?そして、なんで人々はGPT-5が大きな失望になって、業界の顔として業界全体をクラッシュさせるかもしれんって恐れとるんか?

システム統合への不安と新たな理解

恐れが始まったのは、Sam AltmanがXにこう投稿した時からや。「我々はO3を含む多くの技術を統合したシステムとしてGPT-5をリリースする」。私を含む多くの人が、これを単にモデルルーターを作っとるだけやって解釈したんや。

モデル選択リストを無くすのはええことやけど、GPT-5の期待に応えられるかどうか疑問やった。せやけど最近のOpenAIライブストリームで、違う絵が描かれたんや。モデルを統合するって意味を再定義したんやな。

「そしてもちろん、GPT-5については、Samが今年初めに我々のロードマップを予告しました。AIのこの変化の中で、モデル名がO3、O4 mini、GPT-4、4.1と、ついていくのがかなり複雑になったことを知っています。せやから我々は、単に新しい素晴らしいフロンティアモデルを作るだけやなくて、我々の2つのシリーズを統一することにワクワクしとるんです。Oシリーズの推論における画期的進歩と、GPTシリーズのマルチモダリティにおける画期的進歩が統一されて、それがGPT-5になるんです。そして私は、すぐにまた戻ってきて、もっと詳しく話せることを本当に望んでいます」

彼は、異なるモデルシリーズからの画期的進歩を統一するフロンティアモデルやって言うたんや。これは全く新しい絵やで。

一般ユーザーと専門ユーザーの違い

まず、この動画を見とる人は、平均的なユーザーやないってことを思い出してもらおう。皆さんはおそらく、これらの異なるモデル全てと、それぞれの領域でそれらを独特に有能にしとるもんについて詳しいはずや。

平均的なユーザーは、ChatGPTとClaudeの違いすら知らんし、ChatGPTがブランドでGPT-4oが基盤モデルやってことも知らんって言うても過言やないで。せやからこのリストは彼らにとってめっちゃ混乱するもんで、能力を一つのモデルに統一するのは大きなプラスなんや。

せやけどモデルルーターと、これらのモデルからの全ての画期的進歩を組み込んで、それらの領域でそれらより優れたフロンティアモデルの間には、大きな違いがあるんや。これがある意味での汎用性の定義なんや。コーディングでGPT-4.1より優れ、思考でO3より優れ、マルチモダリティでGPT-4oより優れた一つのモデル。これは前世代を引退させる画期的進歩や。そしてこれが、OpenAIが期待に応えるかどうかの違いやと思うで。

統合の実態

証拠は今、GPT-5がルーターよりも統合されとる可能性が高いことを示しとる。OpenAIの最高製品責任者Kevin Weilが、このコメントに返事したんや。「GPT-5では、GPTシリーズとOシリーズは裏でまだ別々のモデルで、あなたはモデルルーターを作っとるんですか?それとも、もっと実質的な方法で統一されるんですか?」。彼は「統一」って答えたんや。

せやからGPT-5がOpenAIの近年の最高のアイデアと画期的進歩の組み合わせやとすると、その能力について何が分かっとるんか?そして他の全てと比べてどうなんか?

早期アクセスを受けた人々と話したThe Informationから、もう一つの洞察があるで。

能力向上の具体例

「この記事のために話した情報源によると、GPT-5は多くの異なる領域でステップアップしとるそうです。それが自然科学でも、創作でも、一般知識でもですが、特に際立っとったのはコーディングの分野でした。これまでのところ、生成AIの最も有望で金になるアプリケーションやったからです」

「具体的に、GPT-5はより学術的で競技プログラミングのタスクで優れとるだけやなくて、開発者が日常生活でやりたがるような、より実用的なプログラミングタスクでも優れとると聞きました。例えば、古いレガシーコードがたくさん入った、非常に大きくて複雑なコードベースを扱うような仕事です」

Sam Altmanの評価

Sam Altman自身の見解がどれだけ価値があるか分からんけど、彼は明らかに中立的な声やないからな。せやけど彼も最近のTheoとのインタビューでGPT-5について何か発言しとったで。

「GPT-5は最も賢いもんです。GPT-5はほとんどあらゆる面で我々より賢いんです。せやけど我々はここにおるんです。せやから世界の働き方について何かがあるんです。これが永遠に真実やって意味やないですが、人間が今日できることについて何かがあって、それがAIとは非常に違うんです。人間が今日気にかけることについても何かがあって、それがAIとは非常に違うから、単純な考え方はうまくいかんと思います。もちろん、それが我々より100万倍賢くなる頃には誰にも分からんですけどね」

Sam Altmanは微妙な方法で物事を誇大宣伝する癖があるけど、彼はほとんどの約束を実現してきたんや。次のクリップは、Samが普段「今日のモデルは本当にアホです」って言うとるのに対して、非常にユニークなんや。せやけどXでバイラルになったこれは少し違うんや。

「今朝、新しいモデルをテストしとったんです。質問が送られてきて、よく理解できへん質問やったんです。それをモデル、このGPT-5に入れたら、完璧に答えてくれたんです。椅子にもたれかかって、『あー、ついに来たな』って瞬間やったんです。すぐに次のことで忙しくなったけど、これが我々が話しとる種類のもんやったんです。このことで、AIに対して自分が無力やと感じました。自分ができるはずやったのにできへんかった。めっちゃ難しかったのに、AIは簡単にやってのけたんです。変な感じでした」

これがGPT-5について今の時点で分かっとることや。私はもう少し楽観的やけど、率直に言うて期待があまりに高いから、OpenAIがそれを満たすことができたら驚くで。

上海交通大学のAI研究自動化の実態

上海交通大学がAIの研究プロセス全体を自動化することに成功したって主張してヘッドラインを飾ったんや。これはめっちゃ大きな主張で、率直に言うて誰もこの論文を必要な注意を払って扱わへんかったんや。

我々は今、知能爆発の真っ只中におるんか?それとも、もっと詳しく調べる必要があるんか?皆さんはおそらくこのチャートを見たことがあるやろう。研究の自動化こそが知能爆発を引き起こすもんなんや。そしてこの実験は、初めて人間の研究者を一貫して上回るAIシステムを実証しとるんや。

これらのアーキテクチャは単に優れとるだけやない。人間が考えることすらできへん設計決定やパターンを含んどるんや。せやからこれが、モデルアーキテクチャ発見におけるAlpha Go momentって呼ばれとるんや。チームは、システム自体だけやなく、AIが生成した106のアーキテクチャ全てもオープンソース化したから、真剣に受け取る理由があるんや。

さらに、世界最高の大学の一つから来とるもんや。これが知能爆発やない理由に入る前に、論文にある程度の評価を与えて、実際に何を達成したかを見てみよう。

線形アテンションアーキテクチャの開発

システムは106の最先端線形アテンションアーキテクチャを考案したんや。それって何やって?以前話したように、標準的なTransformerは品質の金字塔やけど、計算とメモリ管理の面ではめちゃくちゃ非効率なんや。

関係を計算する最も素朴やけど正確な方法やと考えることができるで。主な問題は、Transformerが各トークンと他の全てのトークンとの関係に注意を向けることや。せやから5つの単語があったら、5の2乗で25の関係がある。これはn×nの関係の表なんや。せやからトークンの数を増やすと、計算とメモリの要件が二次関数的に爆発して、訓練と推論の両方の能力を制限するんや。

今、線形アテンションアーキテクチャは、その問題を解決するために数学的なトリックを使うとるんや。各単語を他の全ての単語と比較する代わりに、まず全体のシーケンスの表現を計算するんや。全体のテキストや画像の数学的要約やと考えることができるで。それから全ての単語をこの要約と比較するんや。つまり、5つの単語があったら、5つの関係を得るってことや。

これは線形方程式で、はるかに少ない計算とメモリを必要として、簡単にスケールできるんや。せやったら、なんですぐに線形アテンションに切り替えへんのか?さっき言うたように、Transformerは品質の金字塔やからや。線形アテンションでは、要約を計算する過程で意味の一部が失われるんや。そして、最終的に出てくる単語への確率割り当ても、あまり決定的やない。

基本的に、次の単語として何が来る可能性があるかの確率分布が、標準的なアテンションと比べて滑らか過ぎるんや。線形アテンションアーキテクチャを設計するゲームは、線形設計の効率性をできるだけ犠牲にせずに、異なる数学的・アーキテクチャ的決定を使って、標準的なTransformerの品質に匹敵するか、それを上回ろうとすることなんや。

ASI Architectの限界

ASI Architectは人間が設計したものを上回る106のアーキテクチャを開発したって主張しとる。せやけど、エンド・ツー・エンドのAI研究者の主張には問題があるんや。

まず、スコアを見ると、全て結構明らかな範囲に収まっとる。大幅に優れた性能を持つ異常値はなくて、これは画期的なもんというより最適化マシンに近いんや。

次に、このシステム図では、ASI Architectが分野の最高のアイデアを探して、その上に構築することが明確に示されとる。人間もそうやけど、人間の貢献なしにシステムが改善し続けることができる理由はないんや。特に、さっき話した範囲を考えるとな。

そして最後に、おそらく最も明らかで最も重要な点や。現在のAIが、この線形アテンションアーキテクチャが収まる全体的な文脈を実際に理解することは不可能やってことを、我々は事実として知っとるんや。せいぜい、システムは研究者が決めた特定の関数を最適化することしかできへん。その研究者自身が結果を理解して、それがより広い文脈で何を意味するかを見る必要があるんや。

これは面白くて実際に有用なツールやけど、6ヶ月後にAI研究者の少しでもASI Architectに置き換わるとは、本当に疑問やで。

AI関連の興味深い話題

このセグメントでは、AI世界の最も興味深く、心を她かせ、そして最も変なもんのいくつかを駆け足で見ていくで。

WAN 2.2は中国発の最高のオープンソース動画モデルの一つで、物語を強力な方法で演出できる素晴らしい機能を持っとるんや。

これは信じられへんで。「掘り下げる(delve)」のような、ChatGPTが好む特定の単語の使用が2023年以降爆発的に増えて、その傾向が続いとるんや。この研究は、ChatGPTが人間の言語を再形成しとることを明確に示しとる。この研究には実際にもっと多くの例があって、これはおそらく自己強化のスパイラルで、次世代のAIモデルがこれらの単語をさらに好むようになって、我々にさらに影響を与えるんやろうな。

AIの変化は大きいだけやなくて、大規模なんや。DeepMindがAlpha Earthを導入して、地球全体の表面をインデックス化したんや。DeepMindは本当に成果を出し続けるのを止めへんな。

「これが我々の新しいAIモデル、Alpha Earth Foundationsが地球を解釈する方法です。この地図の異なる色は、世界の異なる部分が表面条件においてどれだけ似とるかを示しとります。せやから、似た色は砂漠同士、森林同士のような似たもんを意味します。モデルは、あらゆる生態系を区別するユニークなパターンを理解します。せやから、学習したパターンを使って、世界の他の場所で一致するパターンを素早く見つけることができるんです。これによって、例えばビーチの砂丘とサハラ砂漠の違いを見分けることができるんです」

「科学者が世界を正確にマップするのに、以前は数ヶ月から数年かかっとりました。せやけど我々のデータセットを使えば、数分でできるんです。GoogleSearchがウェブをインデックス化したように、Alpha Earth Foundationsで、我々は地球の表面をインデックス化したんです。そして2017年から2024年まで、Google Earth Engineを通じてこれを利用可能にしとります」

「科学者や研究者は、どこにどんな動物が住んどるのか?人間の開発の足跡はどんなもんか?といった質問に答えることができます。この技術は、山火事の予測、水供給の管理、絶滅危惧生態系の保護など、大きな課題に取り組むより良いツールを科学者が作るのに役立つ可能性があります」

「全てがはるかに速く、はるかに安くできるようになるんです」

ユートピア/ディストピア的未来の兆候

そして最後に、ユートピア/ディストピア的未来の最初の兆候があるで。YouTubeは、ユーザーが実際に18歳未満かどうかを検出するAIを米国で展開すると発表したんや。表明された年齢を無視して、十代やと疑うユーザーに制限を適用するんや。

これは良いことのように思えるけど、Minecraftを見過ぎて フラグを立てられる人々の結果がもう出とるんや。

「あなたのチャンネルは18歳かもしれへんけど、あなたが18歳やって意味やない。すまん、AIの支配者が決定を下したんや」

見てくれてありがとう。また次回会いましょう。

コメント

タイトルとURLをコピーしました