OpenAIの社長が語るAGI実現への道のりとスーパーアプリの全貌

AGI・ASI
この記事は約16分で読めます。

OpenAIの社長Greg Brockmanが、AGIの実現が数年以内に迫っていると明言した。同社が開発中の「スーパーアプリ」は、チャット、コーディング、ブラウジング機能を統合し、あらゆる知的作業を処理できる個人用AGIアシスタントとなる。内部で訓練中の新モデル「Spud」は、AIがAIを改善する「テイクオフ段階」の一環であり、進歩の加速が続いている。企業による知識労働への導入が本格化し、AIは経済成長の主要ドライバーになりつつある。AGIは特定分野では既に超人的だが他分野では課題が残る「ジャグド(不均一)」な状態であり、Brockmanは現時点で70〜80%達成していると評価している。

This Isn’t Just ChatGPT Anymore…
OpenAI’s President just revealed their plan for an AI “super app”… and says we’re only a few years away from AGI.From th...

AGI実現が数年以内に迫る

OpenAIの社長であるGreg Brockmanが、AGIの実現が今後数年以内に到達すると明言しました。彼によれば、AGIはまだジャグド、つまり特定分野では優れているものの他分野では課題が残る不均一な状態になるものの、ほぼあらゆる知的作業においてコンピュータを使った仕事をこなせるようになるとのことです。

そうなんです。OpenAIの社長Greg Brockmanは基本的に、AGIがもうあと数年で実現すると言いました。ジャグドであることは変わらない、つまり得意な分野もあれば苦手な分野もあるという意味ですが、それでもほぼあらゆる知的作業をこなせるようになると。そして彼はOpenAIがこれを展開する計画も明らかにしました。それはAIスーパーアプリという形で提供され、すでに開発が始まっています。

では詳しく見ていきましょう。

OpenAIが開発するスーパーアプリとは

では、彼らが話しているスーパーアプリとは一体何なのでしょうか。私が説明するよりも、OpenAIの社長自身にビジョンを語ってもらいましょう。

このスーパーアプリとは何ですか。スーパーアプリについて私が考えているのは、コーディング、ブラウザ、そしてChatGPTを統合するものだということです。

その通りです。私たちが作りたいのは、AGIの力を本当に体験できるエンドポイントアプリケーションです。その汎用性について考えてみると、今日のチャットについて考えると、チャットは本当にあなたの個人アシスタント、あなたの個人的なAGIになっていくと思います。あなたのために働き、あなたのことをよく知っていて、あなたの目標に沿っていて、信頼でき、このデジタル世界であなたを代表するようなAIです。

現時点では、これはソフトウェアエンジニア向けに構築したツールですが、誰でも使えるCodexになりつつあります。Codecを使いたい人なら誰でも使えて、コンピュータに自分のやりたいことをやらせることができる。そしてもう実際のソフトウェアだけの話ではなくなっています。本当にコンピュータの使い方全般についてです。例えば私のノートパソコンの設定をするとき、ホットコーナーの設定方法を忘れてしまったら、Codecに頼んでやってもらう。そうすればすぐにやってくれます。コンピュータとは本来そういうものであるべきで、私がコンピュータに合わせるのではなく、コンピュータが人間に合わせるべきなんです。

だから、コンピュータにやらせたいことは何でも頼めるアプリケーションを想像してみてください。そこにはコンピュータ使用機能、ブラウジング機能が組み込まれていて、AIが実際にウェブブラウザを使えるようになっていて、AIが何をしているかを監督できる。そしてあなたのすべての会話が統合されます。チャット用であろうと、コード用であろうと、一般的な知識労働用であろうと、アプリケーションに関係なく、すべてが一つに統合され、AIがあなたのことを記憶し、知っている状態になります。

これが私たちが構築しているものです。でもこれは本当に氷山の一角なんです。それは先端部分であって、私にとって実際にもっと重要なのは技術的な統合です。基盤となるモデルのケースについても少し話しましたが、過去数年間で本当に変わったのは、もはやモデルだけの話ではないということです。ハーネスの話なんです。モデルはどうやってコンテキストを得るのか。世界とどうつながっているのか。どんなアクションを取れるのか。新しいコンテキストを得たとき、モデルとのインタラクションループはどう機能するのか。

これらすべてについて、私たちは複数の実装を持っていたり、少しずつ異なるものを持っていましたが、今それを収束させています。一つのバージョンにまとめようとしているんです。そして最終的には、このAIレイヤーを非常に薄い形で特定のアプリケーションに向けることができるようになります。小さなプラグイン、小さなスケール、小さなUIを構築できます。金融に特化したものが欲しい場合、法律に特化したものが欲しい場合でも、基本的にはその必要がなくなります。なぜなら、この一つのスーパーアプリが非常に広範囲に対応できるからです。

単なるチャットボットではない統合システム

これが彼の言うスーパーアプリの意味です。単なるチャットボットではありません。単なるコーディングエージェントでもありません。単にウェブを閲覧するだけでもありません。これらすべてをシームレスに、あなた自身の特定のユースケースに合わせてその場で実行するんです。

通常、会社の財務を自動化したい場合、そのためのシステム全体を構築する必要があります。カスタムCRMをセットアップし、銀行口座に接続し、QuickBooksのようなものを使い、ダッシュボードを構築し、データを移動させるスクリプトを書く。大多数の人にとって、そんな時間も専門知識もありません。

ここでMicrosoftのような企業が登場し、すべてをセットアップして保守してくれるわけです。しかしBrockmanがここで説明しているのは、AI自体がMicrosoftのような企業や、より一般的にはソフトウェアプロバイダーがやっていることをできる世界です。ソフトウェアにお金を払う代わりに、AIに欲しいものを伝えるだけで、AIがあなたのためにそれを構築し、実際に機能するんです。

新モデル「Spud」の登場

しかし当然ながら、これらはすべて、基盤となるモデルが実際にそれを実行できるほど優れていなければ不可能です。そしてここから話が本当に興味深くなります。なぜなら、OpenAIは内部で「Spud」と呼ばれる新しいモデルの訓練を終えたと報じられているからです。Brockmanがそれについて語った内容を見てみましょう。

あなたは何度か、優れたモデルが近々登場することをほのめかしていましたね。Spudとは何ですか。The Informationは、あなたがSpudの事前訓練を終えたと報じました。そしてOpenAIのCEOであるSam Altmanはスタッフに、数週間以内に非常に強力なモデルが登場すると伝えたそうです。

これは数週間前のことで、チームはこのモデルが経済を本当に加速できると信じています。物事は多くの人が予想していたよりも速く進んでいます。では、優れたモデルとは何でしょうか。

でも、本当に重要なのは一つのモデルだけではないと思います。私たちの開発プロセスの仕組みは、まず事前訓練があります。新しい基盤モデルを生成し、それが土台となって、その上にさらなる改善を構築していきます。これは常に会社の多くの人々を巻き込む大規模な取り組みです。

実際、私は過去18ヶ月間、ほとんどの時間をここに費やしてきました。GPUインフラに本当に注力し、これらの大規模な実行をスケールアップするすべてのトレーニングフレームワークを行うチームをサポートしてきました。

しかしその後、強化学習プロセスがあります。世界について多くのことを学んだこのAIを取り上げ、その知識を適用します。そして事後訓練プロセスを行い、そこで問題の解決方法を知り、さまざまなコンテキストで練習し、最後の部分として行動と使いやすさを調整します。

Spudは新しい基盤、新しい事前訓練だと考えています。そして私たちには約2年分の研究があり、それがこのモデルで実を結びつつあります。非常にエキサイティングになるでしょう。世界がそれを体験する方法は、ただ能力の向上として現れると思います。

私にとって、それは決して一つのリリースだけの話ではありません。なぜなら、一つのリリースをするとすぐに、それは次に来るものの初期バージョンになるからです。これらの改善プロセスの各ステップをさらに多く実行していきます。だから私たちが向かっている先は、ただただ速く、さらに速く動き続ける進歩のエンジンを持っているということです。Spudはその道のりの一歩に過ぎません。

では、今日のモデルにはできないことで、このモデルには何ができると思いますか。

はるかに難しい問題を解決できると思います。はるかに繊細になるでしょう。指示をよりよく理解し、コンテキストをはるかによく理解するでしょう。

人々が「ビッグモデル臭」と呼ぶものがあります。これらのモデルが実際にはるかに賢く、はるかに有能なとき、あなたにはるかに柔軟に対応してくれるという感覚があるんです。質問をしたときにAIがうまく理解してくれないと、いつもとてもがっかりしますよね。説明しなければならないわけです。本当はこれくらい理解できるはずなのにって。

だから、ある意味では質的な変化があるでしょうし、量的には多くのシフトがあるでしょう。質的には、以前はイライラして決してAIを使わなかったような新しいことが、今では何も考えずに使うようになるでしょう。それが全体的に見られるようになると思います。

天井がどれだけ上がるのか見るのがとても楽しみです。すでに物理学への応用などを見てきました。そしてはるかにオープンエンドな問題、はるかに長い時間軸の問題を解決できるようになると思います。そして、やりたいことは何でも、はるかに便利になるという形で、床がどれだけ上がるのか見るのも楽しみです。

段階的な進歩の加速

彼はSpudを、ただどんどん速く動き続ける進歩のエンジンの中の一歩として説明しています。つまり、おそらく巨大な飛躍のようには感じられないでしょう。ただし、彼らは間違いなくそのように誇大宣伝しようとするでしょうが。

重要なのは、OpenAIが今は段階的にリリースしているということを覚えておくことです。だから基本的に、彼らが進めている進歩をほぼリアルタイムで見ているんです。数ヶ月しか遅れていません。

これが、ほぼ「茹でガエル効果」を引き起こしているものです。日々のベースでは、私たちがAIで進めている進歩は、特に私のように常に監視している人にとっては、それほど狂ったようには感じられないかもしれません。ある時点で単純に慣れてしまうんです。

でも一歩下がって、年単位の視点から見始めると、つまり毎年どれだけの進歩を遂げているかという観点から見ると、数年前はどうだったか考えてみてください。

AIはかろうじて会話ができる程度でした。言ったことを即座に忘れ、常に幻覚を起こし、単純なタスク以外のことは基本的に使い物になりませんでした。そして今、私たちは完全なコードベースを書き、ワークフロー全体を実行し、インターネットをブラウズし、実際にあなたを記憶し、近い将来、もしくはすでに、自律的な研究者として機能できるAIについて話しているんです。

テイクオフ段階に入ったAI開発

Brockmanによれば、これはすべて彼が「テイクオフ段階」と呼ぶものの一部です。AIが良くなるだけでなく、実際にAIを使ってAIを改善しているため、すべてがさらに加速しているんです。これを見てください。

そして、OpenAI内部でもっと依存することになるでしょう。自動化されたAI研究者を開発中だそうですね。今年の秋に登場する予定だとか。それは何ですか。

今の進行方向は、私たちはこの技術の初期のテイクオフ段階にいます。

テイクオフとはどういう意味ですか。

テイクオフとは、AIがこの指数関数的にどんどん良くなっていくということです。そしてその一因は、AIをより良くするためにAIを使えるからです。

だから私たちの開発プロセスが加速します。でもテイクオフについて考えるとき、それは現実世界への影響についてでもあります。ある意味で、私たちはあらゆる技術がS字カーブを描くわけですが、ズームアウトすると最終的に指数関数になるS字カーブの集まりであり、それが今私たちが遭遇しているものだと思います。

つまり、技術開発は加速度的に進んでいて、勢いを増しているエンジンなんです。でも世界においても追い風があります。チップ開発者がプログラムにより多くのリソースを投入しています。その上に構築し、あらゆる異なるアプリケーションにどう適合するかを見つけようとしている人々の経済圏があります。

そのエネルギーすべてが、このテイクオフ段階にどんどん蓄積されていきます。AIが単なるサイドショーから経済成長の主要なドライバーになっていくんです。そしてそれは、この壁の中で私たちがやっていることだけではないと思います。世界全体、経済全体が一緒になって、この技術とその有用性を推し進めることについてなんです。

では研究者は具体的に何をするのですか。

研究者は、AIができることの一つの瞬間になります。私たちは今それを構築していますが、タスクのより大きな割合を占めるようになり、自律的に実行させられるようになるはずです。そしてそれが何を意味するのかについては多くの考察があります。それは必ずしも、ただ単独で放って、後で戻ってきて何か良いことをしたか確認するという意味ではありません。

私たちは非常に積極的に管理に関わっていくつもりです。今、ジュニア研究者がいて、あまりにも長く放っておくと、おそらくあまり有用でない道に進んでしまいます。でもシニア研究者やビジョンを持っている人がいれば、必ずしも機械的なスキルを知っている必要はありません。

フィードバックを提供し、この人、つまりインターンが作成しているプロットをレビューし、何を達成したいのかというビジョンの観点から方向性を提供できます。だからこれは、モデルを生成し、新しい研究のブレークスルーを起こし、これらのモデルを現実世界でより有用で使いやすくする能力を大幅に加速するシステムとして構築するつもりです。

そしてそれをますます速いスピードで行います。

AIの進歩を加速させるフライホイール

彼が基本的に言っているのは、私たちが今AIの初期テイクオフ段階に入ったということです。進歩は単に起こっているだけでなく、加速しているんです。その大きな理由は、繰り返しになりますが、今やAIを使ってAIを改善しているからで、当然プロセス全体がスピードアップします。

でもそれだけではありません。その周りで起こっているすべてのことです。より多くの計算資源、より多くの資金、これらのモデルの上に構築している人々の増加。これらすべてがシステムに供給され、一種のフライホイールを開始し、さらに速く前進させているんです。

そしてここから少しクレイジーになってきます。なぜなら、このトレンドが続けば、単により良いモデルを手に入れるだけではないからです。実際にAGIのように見える何かを手に入れ始めるんです。

でも彼が説明する方法は、あなたが予想するものとは違います。見てみましょう。

AGIの定義と現状

AGIは多くの人にとって異なる定義を持っていると思います。そして今私たちが持っているものがAGIだと言う人も多いと思います。議論の余地はあると思います。

でも興味深いのは、AGIは、今私たちが持っている技術は非常にジャグドだということです。多くのタスクにおいて絶対的に超人的です。コードを書くことに関しては、そういったことに関して、AIはただできるんです。物を作ることへの摩擦を本当に多く取り除いてくれます。

でも人間ができる非常に基本的なタスクで、私たちのAIがまだ苦戦しているものもあります。だからどこに境界線を引くかと言うと、今のところ科学というよりも、少しバイブや感覚に近いんです。

だから私自身としては、間違いなくその瞬間を通過しています。5年前に今日のシステムを見せられたら、ああ、これが私たちが話していたことだね、と言うでしょう。でもそれは違うんです。私たちがこれまで想像していたものとはあまりにも違う。だから私たちは心のモデルを適切に調整する必要があると思います。

まだそこには到達していないということですか。

私は基本的に70〜80%くらいそこにいると思います。かなり近いと思います。今後数年以内にAGIを手に入れることは極めて明確だと思います。まだジャグドではあるでしょうが、タスクの床は、コンピュータをどう使うかというほぼあらゆる知的タスクにおいて、AIがそれをできるようになるでしょう。

そして今のところ、少し不確実な答えをせざるを得ないと思います。なぜなら、不確定性原理のようなものがあって、議論の余地があるからです。私自身の定義では、私たちはほぼそこにいると思いますし、もう少しで絶対にそこに到達するでしょう。

ジャグドなAGI

これが彼の言うジャグドなAGIの意味です。一部の領域ではAIはすでに超人的ですが、他の領域ではかなり基本的なことでまだ苦戦しています。だから定義が難しいんです。見方によっては、すでに部分的にそこに到達していると主張できるからです。

でも彼が言っている大きなポイントは、私たちは非常に近い、70〜80%くらいそこにいるということです。そして残りのギャップが埋まり始めると、AIができることの床がどんどん高くなっていくでしょう。

そして私たちはすでにこれを見始めています。少なくともその初期の影響を見始めています。なぜなら、AIが今、実際に価値のある知識労働を行えるほど、または自律的に行えるほど優れてきているからです。

企業による知識労働への投資

そして企業がこれに気づき始めています。だからお金が流れ込み始めているんです。これを見てください。

課題は、これらの計算資源の購入は、実際に納品される18ヶ月前、時には24ヶ月前、時にはそれ以上前にロックインしなければならないということです。つまり、本当に先を見越して計画する必要があります。

そして私たちが向かっている世界は、現在まで私たちの収益のほとんどが消費者向けサブスクリプションから来ていて、それは常に非常に重要であり続けるでしょう。他にも新たに生まれている収益源があります。

でも今明らかに浮上している機会は知識労働です。そしてこれをすべての企業で非常に具体的に見ています。この技術を実現し、実際に機能することを理解しています。競争力を持つためには、これを採用する必要があります。

ソフトウェアエンジニアがこれを使っているオーガニックなエネルギーを見ることができます。そして企業内のさまざまな知識労働に使っている人々の浸透が始まっています。そして支払う意欲と、この業界で見られる収益成長は非常に明確です。今まさに起こっていて、それを先に投影すると、私たちが見ることができて世界が見られないかもしれない一つのことは、これらのモデルがどう改善していくかの見通しです。

これらすべてを合わせると、経済、つまり巨大なものです。経済は非常に大きく、ほぼ理解できないほどです。この経済がここからどう成長するかの最高次のビットは、AIについて、AIをどれだけうまく活用できるか、そしてそれを動かすために利用できる計算能力についてです。

AIを活用した生産性向上

そう、これは実際に非常に重要なポイントです。企業がAIで実際により生産的になれることに気づき始めているのは事実で、だからAI企業のエンタープライズ収益が急増しているんです。

でも興味深い部分は、AIが単に自動化するだけではないということです。実際により生産的になるためには、それを適切に使う方法を知る必要があります。あなたの仕事をしたり、従業員を置き換えたりするだけではありません。まあ、あなたの仕事や会社によりますが、でもおそらくまだ人間がそれを導く必要があります。

それを設定し、適切なコンテキストを与え、導く人間です。そしてこれらのシステムを使えば使うほど、実際にあなたを助けることが上手になっていきます。特に今は記憶を保存できるようになったので。

だからもしまだClaudeのようなものを使っていないなら、絶対に使うべきです。なぜなら、まだあなたの仕事を実際に自動化できるわけではないかもしれませんし、実際に何ができるか過大評価してしまうかもしれません。

でもあなたが導くことで何ができるかは、おそらく過小評価しています。あなたのコンテキストを与え、適切なマルチエージェントワークフローで設定し、AIにあなたのために働かせるのではなく、一緒に働くとき、可能だと思っていた以上のことを成し遂げられます。

このチャンネルではまだ言及していないと思いますが、最近Claudeでかなり遊んでいます。繰り返しますが、実際に私の仕事をやっているわけではありませんが、以前は時間がなくてできなかったことができるようになっています。

そしてOpenAIが取り組んでいるこの新しいAIスーパーアプリは、Claudeの核心部分とまさに同じもののようです。記憶を持った個人的な自律型AIアシスタントです。ただはるかに洗練され、有能になっています。

では、この解説を楽しんでいただけたら嬉しいです。また、私自身のカスタムClaudeワークフローについてもっと話してほしいかどうか教えてください。興味がある人がいれば、私がどう使っているか、ワークフローを実際にどう設定するかについて、いくつか動画を作れると思います。

コメントで教えてください。そして改めて、視聴ありがとうございました。いいねを押して、チャンネル登録ボタンを押してください。いつものように、次回の動画でお会いしましょう。

コメント

タイトルとURLをコピーしました