2024年8月のAI業界における重要な進展をまとめた包括的なレポートである。GPT-5の発表とその数学的発見能力、OpenAIによる長寿研究への応用、各社のAI開発競争の激化、中国のAI企業の台頭、そしてヒューマノイドロボットの実用化進展まで、AI分野のパラダイムシフトが本格化した月として位置づけられる内容となっている。

AIパラダイムシフトの始まり
私たちは技術を生産している。これらのモデルは人類が作り出した最も有用なツールなのだ。そしてそれらの基盤として、人類がこれまでに作り上げた最大の機械を構築している。2027年の終わりまでには、ほとんどの人がAI主導の重要な新発見があったことに同意するだろうと私は賭けてもいい。
私たちは独自のチップに取り組んでいる。チップ設計やレイアウト、そしてあらゆることを改善するためにAIを使わないなんて、私たちは狂っているだろう。つまり、大陸が存在し続けるという意味では、そうだ。しかし、その上の上部構造、社会的層に関しては、インターネット以前に存在していた機関で、インターネットを生き残る機関はほとんどないと思う。
さて、今月のAIへようこそ、または再びようこそ。AI分野における最大かつ最重要なストーリーの月次総括をお届けする番組だ。8月はパラダイムシフトが公式に始まった月のように感じられた。「これは起こっているのか」から「これは起こっている」へと線を越えたような気がする。
GPT-5が新しい数学を発見する可能性から、OpenAIが長寿分野で画期的進歩を遂げること、サム・アルトマンがAIバブルについて警告すること、そしてロボットが文字通り洗濯物を畳むことまで。今月はすべてが詰まっていた。早速見ていこう。
GPT-5の衝撃的な登場
まず最初に、GPT-5について話さなければならない。これは今月最大のリリースであり、最も期待されていたものでもあった。GPT-5は単一のモデルではない。統合システムなのだ。ほとんどの質問を処理するスマートで効率的なモデル、より困難なものに対してはGPT-5 thinkingと呼ばれるより深い推論モード、そしてどちらを使用するかを瞬時に自動で決定するリアルタイムルーターを備えている。つまり、本質的には推論モデルと従来のLLMが一体となって、いつ推論するかを自ら決定するのだ。
これを好む人もいるが、そうでない人もかなりいる。OpenAIは大きな反発を受けた。特にリアルタイムルーターがローンチ日に正常に動作していなかったようだからだが、文字通り他のすべてのモデルを廃止してGPTのみを利用可能にしたことも理由だった。GPT-4oへのアクセスを失った後、人々は文字通りRedditでパニックになり始めた。
その結果、OpenAIは実際にGPT-4oを、o3、4.1、o4 Miniとともにレガシーモデルとして復活させた。GPT-5について理解しなければならないのは、それが現実世界のタスクでより良いパフォーマンスを発揮するよう訓練されたということだ。これは幻覚がはるかに少なく、個性も少なく、指示への従順性が向上していることを意味する。例えば、実際にChatGPTの最も一般的な使用例の一つであるセラピストとしてモデルを使用している人々にとって、GPT-4oからGPT-5への移行は非常に異なって感じられ、おそらく良い意味ではないだろう。
GPT-5の現実世界での能力は、従来のベンチマークだけでなく、経済的に重要な知識労働タスクを測定するベンチマークでもトップを記録していることからも確実にベンチマークに表れている。それらは現実世界でも現れている。OpenAIの研究者セバスチャン・ブベックは今月、GPT-5が新しい数学的証明を発見したと主張するかなりバイラルになったツイートを投稿した。
実際、私はこの詳細について掘り下げた動画を完全に作った。今すぐ画面上にカードとして表示するだろう。しかし基本的に知っておくべきことは、GPT-5が文字通り人間がこれまでに発表したことのない全く新しい証明を思いついたということだ。これは機械学習の勾配降下問題に対してなされた。
確かに、大きな枠組みで見れば、それはかなり狭い専門的な問題だった。しかしキーポイントはこれだ。初めて、人間の訓練データに由来しない真に新しい発見をモデルが行うのを目にしているのだ。今日はそれほど重要に聞こえないかもしれないし、もしかすると重要に聞こえるかもしれないが、いずれにせよ、これは潜在的に巨大な何かの始まりなのだ。
生命科学での画期的進歩
GPT-5が数学分野で見出しを飾っている一方で、OpenAIは生命科学分野でも巨大な画期的進歩を明かした。Retrobiosciencesと協働して、彼らはタンパク質工学専用に訓練されたGPT-4o microと呼ばれるGPT-4oの小型特殊バージョンを作成した。そしてここが驚くべき部分だ。それは実際に山中因子の新しい強化バージョンを設計した。細胞を若返らせることができるノーベル賞受賞研究の背後にあるタンパク質だ。
実験室でのテストで、これらのAI設計タンパク質は天然バージョンと比較して細胞の再プログラミングにおいて50倍以上の向上を示し、さらに強力なDNA修復も見せた。言い換えれば、AIはもはやエッセイを書くだけではない。文字通り生命の構成要素を設計することを助け、老化を逆転させる可能性のある治療法に私たちを押し進めているのだ。
今月は本当に狂気的で、まだ始まったばかりなのだ。
OpenAIのオープンソース展開
OpenAIの他のニュースとして、彼らは今月、全く異なる何かをリリースして皆を驚かせた。GPT-OSと呼ばれるオープンソースモデルだ。これには2つのバージョンがある。ハイエンドコンピューター向けに設計されたより大きなモデルGPT-OSS120Bと、より小さなGPT-OSS 20Bだ。
ベンチマークに基づくと、オープンソースモデルとしては最先端であるか、少なくとも最先端のオープンソースモデルと同等に見える。つまり、ほぼo3レベルであり、これはかなり狂気的だ。OpenAIは本当にこれで原点回帰をし、将来彼らからもっと多くのこのようなものを見ることを確実に期待している。
GPT-6への展望とAIバブル論争
未来について言えば、OpenAIのCEOサム・アルトマンは今月GPT-6について語ることがあった。一つには、人々はメモリを求めているということ。また彼は、まだ決まったリリース日はないが、GPT-4とGPT-5の間のギャップよりも早く到着し、ユーザーに応答するだけでなく、彼らに適応し、人々が個人的な好みを反映するチャットボットを作成できるようになると明言した。
アルトマンは今月、未来について他のコメントをした後、再びニュースサイクルに巻き込まれたが、今度は潜在的なAIバブルに関してだった。その通り。彼は率直に言った。「バブルが起こるとき、賢い人々は真実の核について過度に興奮する。」そして投資家全体としてAIについて過度に興奮している段階にあるか?私の意見はイエスだ。AIは非常に長い間で起こった最も重要なことか?私の意見もまたイエスだ。
これらのコメントは、生成AIパイロットの95%が失敗すると主張したバイラルなMIT研究とともに、今月AIバブルについてこれほど多くの話を引き起こした原因だ。このような見出しが浮かび回っているのをおそらく見たことがあるだろう。あるいはポートフォリオでそれを感じたかもしれない。
しかし、このMIT研究は見かけ通りではないことが判明した。YouTuberのウェス・ロスがそれを論破する素晴らしい動画を作った。ぜひチェックすることを強く勧める。しかし本質的に、この研究は多かれ少なかれクリックベイトで、注意を引き見出しを作るために設計されており、実際にそうなった。
それでも不確実性は残る。Nvidiaが売上高467億ドル、昨年比56%増という記録的な売上成長を報告したにもかかわらず、ChatGPTが3月以来週間アクティブユーザーを5億人増加させ需要が絶対的に急上昇している今でも、一部の人々は依然としてバブル状態にあると考えている。
つまり、確かにAIへの投資は法外に大規模で、これまでに見たことのないスケールを超えているが、これまでに見たことのない技術について話していることも覚えておこう。文字通りすべてを変える潜在力を持つ技術だ。
イーロン・マスクとの応酬
そして、それだけでは足りないかのように、サム・アルトマンは今月Twitterでイーロン・マスクと再び応酬を繰り広げた。本当に彼にとって大きな月だった。見ての通り、イーロンはAppleがChatGPT以外のAIアプリがApp Storeで1位になることを不可能にしていると主張し、それは独占禁止法違反だと言っている。アルトマンは応答した。「これは、イーロンが自分自身と自分の会社に利益をもたらし、競合他社と気に入らない人々を害するためにXを操作するために行うと聞いたことを考えると、驚くべき主張だ。」
マスクはもちろん彼を嘘つき呼ばわりした。正直なところ、この争い全体は非常に子供じみていた。特にこれらの人々が文字通り今のテック世界を運営している億万長者であることを考えると。マスクはまた、それをさらに法的戦いにエスカレートさせることに決め、独占禁止法違反でAppleとOpenAI両方を訴えた。私の意見では、ちょっと馬鹿げている。
彼らの争いは時々面白いが、再び言うが、これらはTwitterで争う2人のランダムなインフルエンサーではない。彼らは文字通りAIの未来を形作っている億万長者なのだ。
Grokの進化
イーロンについて言えば、彼はまたGrok 5を宣伝し始めた。彼はそれを圧倒的に良いと呼び、モデルがAGIのように感じられると思った初めてのことだとさえ言った。これらは典型的な過度に野心的なイーロン・マスクの予測のように聞こえるが、Grok 4で見たこと、ArkAGI 2チャレンジなど多くのベンチマークでリーダーであることから、Grok 5が実際に圧倒的に良い、それが最終的に何を意味するにしても、ということに私は驚かないだろう。
私たちは今月、Grok imagineと呼ばれる新しいGrok image-to-videoモデルも手に入れた。速度と品質の面では、確実に他の最先端モデルと肩を並べている。しかし主な違いは、Grokのフィルターがはるかに寛大であることで、これは人々がすでにそれを使ってもっと疑わしいコンテンツを作成していることを意味している。お分かりの通りだ。
OpenAIとGoogleが大衆向けに洗練された安全なモデルを構築している一方で、マスクはクリエイターが境界を押し広げることができるレーンを切り開こうとしている。良くも悪くも。そしてそれは確実に彼らがアクティブユーザーで追いつくのを助けている。
Googleの技術革新
Googleに移ると、彼らも同じように忙しかった。今月、彼らはNano Bananaと呼ばれる新しい最先端の画像モデルをドロップした。Nano Bananaは実際にはGemini 2.5 Flash image previewのコードネームで、これはGoogleの最新の最先端画像編集モデルであり、最先端に近い画像生成モデルだ。
このモデルで際立つのは信じられないキャラクターの一貫性だ。同じ犬や同じ人を何十枚もの画像にわたって生成でき、実際にまとまりを保つ。他のほとんどのモデルのように毎回変わる代わりに、同じ顔、同じ服装、同じすべて。これは最初は大したことに聞こえないかもしれないが、アニメーション、コミック、商品撮影、または広告キャンペーンにとって、正直なところ巨大な画期的進歩だ。そしてこれがビデオに変換されると、ゲームオーバーになるだろう。
しかし、Nano Bananaは前菜に過ぎなかった。Googleは今月、彼らの新しい先進的世界モデルGenie 3も公開した。これは環境全体、エージェント、さらには文字通りプレイできるインタラクティブなゲーム世界をシミュレートできるものだ。720p品質で秒間24フレームで動作するが、見ているすべてがリアルタイムでAIによって生成されていることを心に留めておこう。
何も事前にコード化されたりキャッシュされたりしていない。すべて即座に生成されている。テキストでものを呼び出すこともできる。そして、これが今後数年でどこに向かうかは見えている。ある時点で、これは非常に良くなり、完全にインタラクティブな世界をオンデマンドで立ち上げることができるようになる。今日使用するゲームやVR環境と同じように豊かに見え、感じられる世界を。
ビデオゲームのプロトタイプ作成、科学実験の実行、または5分前には存在しなかった宇宙でAIエージェントを訓練することを想像してみよう。正直なところ、Genie 3のデモを見ると、AIが無から完全にプレイ可能な世界を生成できるなら、私たちがすでにその中にいないことを本当にどうやって知るのかと立ち止まって考えさせられる。もはや単なるSFの思考実験ではない。構成要素は文字通りここにある。私たちの目の前にある。
Anthropicの着実な進歩
Anthropicに移ると、彼らも今月かなり大きなリリースをした。Claude 4.1 Opus。このアップデートは最も華々しくはなかったが、推論とコーディングにおける段階的な前進だった。見ての通り、SWE verifiedで72.5%から74.5%になった。従来のベンチマークでは、o3やGemini 2.5 Proのような最先端モデルと多かれ少なかれ同等だ。確実に堅実な改善だ。
中国AI企業の躍進と挑戦
さて、中国の隣人たちをチェックしてみよう。彼らも速く動いているが、いくつかの問題も抱えている。今月中国から出た最も注目すべきリリースはおそらくDeepseek V3.1だった。これは実際にDeepseek R1よりもさらに速く推論できるハイブリッドモデルで、少なくともベンチマークに基づくと、GPT-5を含む最先端とほぼ同等に見える。そして忘れないでほしいが、それは完全にオープンソースでもある。
それからAlibabaのQuin image editがあった。最先端の画像編集モデルだ。これは中国のNano Bananaのようなものだ。キャラクターの一貫性は信じられないほどで、品質も本当に良い。
しかし、中国から本当に見たいのはDeepseek R2だ。残念ながら、おそらくNvidiaチップに対する米国の輸出規制のために、遅れ続けている。しかしDeepseek R1への反応を考えると、彼らがうまくやれば、もう一つのDeepseekモーメントの真のチャンスがある。
実際、今月中国が独自のチップ製造に3倍の投資をしていると報告された。正直に言うと、彼らがもう一つのNvidia、中国版を作ることに成功すれば、米国にとってはゲームオーバーかもしれない。
OpenAIの独自チップ開発計画
OpenAIでさえ今や独自のチップを作る計画を立てている。最近のMoonshots podcastエピソードで、OpenAIの最高製品責任者ケビン・ホワイルが公式発表した。OpenAIは常に独自のAIチップを作るアイデアで遊んでいたが、ホワイルによると、彼らは今やこれを積極的に追求しており、AIを使って彼らを助けることさえしている。これを見てほしい。
AIによって設計されたカスタムチップ設計で多くの作業が進行中だ。特定のことに。その周りの全体的な戦略はあるか?協働しているか?つまり、それはモデルに考えさせることができる分野の一つで、かなりよく制約された問題だ。しばしばシミュレーションがあり、山登りができ、テストを実行して、レイアウトが前のレイアウトより良いかどうか理解できる。モデルに考える時間を多く与えるほど、より多くの画期的進歩を作る。だから実際、私はあなたに同意する。私たちが見ようとしている分野の一つだと思う。つまり、すでに見ている本当のイノベーションだ。GoogleがTPUを設計し、AIで改善したことについて公表していると思う。
私たちも同様のことをやっている。ノーム・シェイザーや向こうの誰かと話せば、歴史的にTPUチームはこっちの遥か彼方にいて、アルゴリズムチームは向こうの遥か彼方にいて、アルゴリズムのアイデアをハードウェアの人々が理解できるものに翻訳しようとするのは悪夢だった。だから、それは非常に遅いプロセスだった。
しかし今や、AIがあなたのためにそれをやってくれるので、ソフトウェア設計から直接チップ設計をしてくれるからだ。それが大きなアンロックになるだろう。そしてそれが今月のようなものかどうか分からない。それは今月以上のものではない?ああ、すでに起こっていると思う。そう、すでに起こっていると思う。
具体的にそれをやっているチームがここにあるか?そう、私たちは独自のチップに取り組んでいる。チップ設計やレイアウト、すべてを改善するためにAIを使わないなんて、私たちは狂っているだろう。製造とファブもすべて把握したか?それは確実にパートナーと協働している。
しかし、よく指定された問題があるこの種の問題がある。この場合、設計するチップの速度だ。そして、よく指定された問題があるこのような問題では、反復に反復を重ね、任意の量のGPUを適用できる。だから今のところ、任意の量の改善が見られると思う。そう、完全に同意する。すごくエキサイティングだ。
だから、Nvidiaにとって前途平坦ではないかもしれない。AI企業がGoogleがTPUですでに行ったように独自のチップを作ることに成功すれば、確実に大きな方法で風景を変えることができる。これは私が確実に注目し続けることだ。
Microsoft Meta の動向
さて、要約に戻ろう。まだMicrosoftやMeta、他の大きなAIプレイヤー2社について話していない。MicrosoftはVibe Voiceと呼ばれるオープンソーステキスト音声変換モデルを今月実際にローンチした。これはかなりレーダーの下を飛んだが、人間の嗜好ベンチマークから見ての通り、文字通り11 Labsの11 V3 AlphaとSesame、そこにある最高のTTSモデルの2つを上回っている。
これがどのように聞こえるかだ。また君がやったなんて信じられない。2時間待った。2時間?電話一本もなし、テキスト一つもなし。一人でそこに座っているのがどんなに恥ずかしかったか分かるか?見て、分かってる。ごめん。仕事が完全に悪夢だった。上司が最後の瞬間に重要な締切を落としてきた。呼吸する暇さえなかった。ましてや携帯をチェックする暇もなかった。
かなりクレイジーだろう?90分までの音声を生成することもでき、基本的に完全なポッドキャストエピソードだ。
最後にMetaに移ると、彼らは再び大きな再構築を行っている。彼らが最後になることを望むものだ。彼らはAI努力を4つの新しい部門に統合し、すべて元Scale AI CEOのアレクサンダー・ワンに直接報告する。全体の努力は今やMeta Super Intelligence Labs、MSLという新しい旗の下で運営される。
中心となるのはTBD Labs、to be determined labsと呼ばれるグループで、ワン自身がMetaの研究と製品パイプラインを統一するために運営するとされる。だから、Metaは明らかに物事を整理する時間を取っている。彼らは採用の一時的な停止さえ行っており、これは今スケーリングよりも再編成に焦点を当てていることを示唆している。
今後6〜12ヶ月以内に、MSLが実際に約束を果たすか、そしてザッカーバーグの人材への大規模投資が実際に価値があったかどうかを見るだろう。
ヒューマノイドロボットの実用化進展
さて、ヒューマノイドロボットについて話さずにAI copium月次要約は成り立たない。今月は多くの段階的改善を見た。しかし、おそらく最も注目すべき達成の一つは、figuresロボットが自律的に洗濯物を畳むことができることだった。そして明確にするため、これは遠隔操作ではない。これは100%神経網で、Helixと呼ばれる彼らの内部AIシステムによって動力を得ている。
洗濯物を畳むのは単純に聞こえるかもしれないが、実際にはロボットにとって悪夢だ。異なる生地、異なる形、しわ、並ばない端。それは厄介で、予測不可能で、器用さと現実世界での推論の両方を必要とする。Figuresロボットがすでにこれを自律的にできるという事実は、私たちが汎用ロボティクスに近づいていることを示している。私たちが行うすべての退屈な日常タスクを処理できる機械だ。
そして、そこが真の破壊の始まりだ。これらは皆の家の中で雑用をするだけではない。皆の会社の中で彼らの仕事もするだろう。
意識的AIに関する議論
最後に、今月の要約を終えるため、MicrosoftのAI CEO、ムスタファ・スライマンがかなり印象的なタイトルで書いたブログ投稿がある。「見かけ上意識的なAIが来ている。私たちは人間のためのAIを構築しなければならない。人間であるためのAIではなく。」
その中で、彼はこれらのシステムがより強力になるにつれ、それが実際に人間の意識と同じものではないとしても、人間の意識が何であれ、意識のように見え感じられる行動を示し始めるだろうと論じている。そして狂気的な部分は、彼がこれを単にインタビューで言っているのではないということだ。公式のブログ投稿として発表している。
誇大広告、マーケティング、または早期警告と思うかどうかにかかわらず、AIと意識についてのこれらの質問がいかに主流になっているかを示している。パラダイムシフトは現実だ。
だから、GPT-5が新しい数学的発見を行うことから、いつの日か老化を逆転させるかもしれないAIタンパク質、洗濯物を畳むロボット、意識的AIについて公然と話す幹部まで。8月は私たちがパラダイムシフト、または知能爆発の始まり、何と呼ぼうと、を真に感じた月だった。
そして、これがたった1ヶ月だとしたら、6ヶ月後や1年後にどこにいるか想像してみよう。とにかく、いつものように、視聴していただき本当にありがとう。これから何か価値を得たなら、必ず登録し、いいねを押してほしい。そして次回また皆さんにお会いしよう。


コメント