
OpenAIのサム・アルトマンが語る「あなたの人生のためのコアAIサブスクリプション」の構築について|AGIに仕事を奪われたい
9,750 文字

将来のインターネットには新しいプロトコルのようなものがあり、それによって物事が分散化され、はるかに小さなコンポーネントに分解されます。そしてエージェントが常に様々なツールを公開し使用し、認証、支払い、データ転送などがすべてこのレベルで構築され、誰もが信頼するようになります。
すべてのものが互いに通信できるようになります。まだその全容は分かりませんが、霧の中から徐々に見えてきています。そしてより良い感覚がつかめるようになれば、そこに到達するためにいくつかの反復が必要でしょうが、私はそのような方向に進むべきだと考えています。
Sam Altmanは先日、シリコンバレーの有名ベンチャーキャピタル企業SEOIAのAIアセントイベントで講演しました。彼はAIコーディング、エージェント、そしてAIがすべてを席巻しているように見える世界で若者が何に焦点を当てるべきかについて話しました。視聴して私の考えをお伝えします。この最初のセグメントでは、彼は将来のコンピューティングアーキテクチャにおけるOpenAIの位置づけについて語り、野心的な目標を持ちながらも、ある意味で矛盾した発言をしています。
もちろん彼はエンジニアたちがOpenAIの上に構築することを望んでいますが、同じ文の中でOpenAIはあなたの生活における中核的なAIサブスクリプションになり、多くの異なるプラットフォームで利用可能になると話しています。これでは他の企業や起業家がプラットフォームリスクを感じることなく、OpenAI上に自信を持って構築する余地はあまり残されていません。
視聴して私の考えをお伝えします。
「あなたは小さなモデルも大きなモデルも構築しています。多くのことをしていると言いましたが、この聴衆はどうすればあなたの邪魔にならずに、轢かれないようにできるでしょうか?」
「私たちが望むのは、人々の中核的なAIサブスクリプションとして、そしてそのものを使用する方法として構築することです。その一部はChatGPT内でのことでしょう。他にもいくつかの重要な部分がそのサブスクリプションにはありますが、主に私たちはより賢いモデルを構築していきます。将来的なデバイス、オペレーティングシステムに似たような将来のものなど、様々な表面を持つでしょう。」
ちょっと一時停止しましょう。彼はそれをさらっと言い流しましたが、非常に何気ない方法で言ったので。聞き逃したかもしれないので再生してみましょう。
「より賢いモデルを持ち、将来のデバイス、オペレーティングシステムに似たような将来のものなど、様々な表面を持つでしょう、なんでも。」
基本的に彼が言っているのは、人工知能とAIにおけるOpenAIの役割が、将来のコンピューティングのオペレーティングシステム層になると見ているということです。これは非常に大きな意味を持ち、スタートアップ創業者にとっては非常に魅力的なものとなります。
モバイルが次の大きなことになると最初に気づいた人々の一人だと想像してみてください。iOSとAndroid。さらにその前のインターネットでも、あなたがインターネット上の最初のウェブサイトの一つ、あるいはWindowsやMac上の最初のソフトウェアの一つだったとしたら。
しかし問題は、AIはすべてを行うことができるということです。それは単なるプラットフォームではなく、実際にその中核的な知能層の上で物事を達成することができます。インテリジェンスプロバイダー、モデルビルダー、推論プロバイダーとしてのOpenAIは素晴らしいでしょうが、彼らはすでにそれよりもはるかに多くのことを行っています。
彼らはChatGPTというUIを持ち、あらゆる既存のプラットフォーム向けにアプリを作り、将来のオペレーティングシステムになることを狙っています。だから繰り返しますが、このチャンネルでもよく話していますが、プラットフォームリスクは実在します。インタビュアーが尋ねたように、起業家たちはAIで物事を構築しながら、どうすればOpenAIに轢かれないようにできるのでしょうか?続けて見ていきましょう。
「私たちはまだ、APIやSDKと呼ぶべきものが何なのか正確には把握していませんが、私たちのプラットフォームとして機能するでしょう。しかし私たちはそれを実現します。いくつかの試行錯誤が必要かもしれませんが、必ず実現します。そして私はそれが世界で信じられないほどの富の創造と、他の人々が上に構築することを可能にすることを願っています。でも、私たちは中核的なAIサブスクリプションとモデル、そして中核的なサービスを目指しますが、構築すべき他の多くのものがあるでしょう。」
興味深いことに、彼は彼らがまだプラットフォームとしてのAPIを理解していないと明確に述べていますが、私には彼らがそれを理解し、非常に信頼性の高いものになっているように思えます。多くの人々にとって、それは最初に選ぶAPIです。しかし彼がそれを理解しておらず、人々の中核的なAIサブスクリプションになりたいと思っているなら、それは本当に綱渡りのようなものだと思います。
一方では、消費者や企業の前面に立ち、中核的なAIサブスクリプションになりたいと思っていますが、同時に開発者を引き付けて自分たちの上に構築してもらいたいと思っています。だからプラットフォームです。すべての主要なテクノロジー企業はプラットフォームです。Meta、Google、Amazonなど、すべてがそうです。彼らはすべて、開発者を引き付けて上に構築してもらうプラットフォームです。
Steve Balmerを覚えていますか?「開発者、開発者、開発者」。それが企業に超能力を与え、堀を大幅に広げるものです。しかしAIでは非常に異なり、OpenAIが中核的なAIサブスクリプションでありながら同時にプラットフォームになりたいというのは非常に異なります。
「だから、中核的なサブスクリプションにならず、他のすべてを行えばいい?」
「私たちは試みます。もし私たちよりも優れた中核的なAIサブスクリプションを提供できるなら、どうぞ。それは素晴らしいことです。」
「でも、それは本当ではありません。もしあなたがより良い中核的なAIサブスクリプションを構築したとしても、それは完全に可能です。現在、OpenAIは確かに先頭を走っており、間違いなく最高のモデルの一部を持っていますが、他にも多くの優れたモデルがあります。技術的には、OpenAIのモデルを一つ取って、より良い中核的なAIサービスを構築することができます。しかし当然、彼らがあなたがやったことを取り入れたり、あなたを潰したりするのを何が防げるでしょうか?何もありません。全く何もありません。
だから非常に注意してください。あなたが開発者で、このビデオを見ているなら、どの一つのモデルプロバイダーにも依存しすぎないように非常に注意してください。」
そして後のビデオで、Sam Altmanは、収益の大部分が消費者サブスクリプションから来ていて、彼らのビジョンが中核的な消費者アプリケーションになることであるなら、なぜAPIを維持するのかと尋ねられます。これは良い質問であり、彼は興味深い答えをしています。視聴してみましょう。
「あなたの収益の大部分は消費者サブスクリプションから来ています。なぜ10年後もAPIを維持するのですか?」
「私は本当にこれらすべてが一つのものに統合されることを願っています。他のサービスにOpenAIでサインインできるようにすべきです。他のサービスはChatGPTのUIを引き継ぐための素晴らしいSDKを持つべきです。しかし、あなたが個人化されたAIを持つことになる程度、それはあなたを知り、あなたの情報を持ち、あなたが後で何を共有したいかを知り、あなたについてのコンテキストを持っていますが、それを多くの場所で使いたいと思うでしょう。現在のAPIのバージョンはそのビジョンからはほど遠いですが、私たちはそこに到達できると思います。」
彼は質問にそれほど上手く答えていないと思います。APIは素晴らしいですが、正直なところ、彼が話したすべてのこと、OpenAIでのログイン、ChatGPTのインターフェースを他の企業が引き継ぐことを許可するなど、これらはすべてインターネットの古い方法です。古いと言っても、それほど古くはありませんが、確かに人工知能以前の、より伝統的な考え方です。
そして、AIとの新しい、完全に異なる相互作用の方法や、AIがあなたに代わって他のサービスと相互作用する方法があると思います。それが何なのかはわかりません。答えはありませんが、ChatGPTでログインしたり、エージェントがSDKと相互作用できるようにしたりするのは、時代遅れに感じます。
次に、聴衆の一人が大企業がAIで組織を変革する際に何を間違えているかを尋ねます。現在、多くの企業がそれを間違えています。CLAは彼らのビジネスの多くを自動化するために大きなプッシュをし、今週ちょうどそれらの異なるテクノロジーのロールバックを発表しました。それらがうまくいかなかったと私たちは推測しています。
Sam Altmanが何を言うか見てみましょう。
「大企業がAIネイティブになるために組織を変革する際に、ツールの使用と製品の生産の両面で何を間違えていると思いますか?小さな企業が明らかにイノベーションの面で大企業を打ち負かしています。」
「これは基本的にすべての主要なテクノロジー革命で起こることです。私にとって驚くべきことは何もありません。彼らが間違えていることは、いつも間違えていることと同じで、人々は自分のやり方に非常に固執し、組織は自分のやり方に非常に固執します。
もし四半期ごとに物事が大きく変わっていて、年に一度会合する情報セキュリティ委員会があって、どのアプリケーションを許可するかや、システムにデータを入れることの意味を決定するなら、それを見るのは本当に痛々しいです。しかしこれが創造的破壊です。これがスタートアップが勝つ理由です。これが産業が前進する方法です。
大企業がこれを行う速度については、失望していますが驚いてはいません。これは典型的なイノベーターのジレンマです。大企業は自分のやり方に固執します。彼らは金のなる木を持ち、変化する必要があるペースで変化することを望まないか、できないかです。」
正直に言って、Googleでもそうなると思っていました。彼らは歴史上最高のビジネスを発明しました。広告を含むGoogle検索ビジネスは、これまでに存在した中で最高のお金を生み出すビジネスです。だから当然、彼らはそれに固執し、そのモートを何としても守ろうとすると思っていました。しかし彼らは実際に、私が思っていたよりもはるかに速く変化しているようです。
AIモードが現在利用可能です。彼らは最高のモデルの一部を出しています。明らかに、彼らはまだ金のガチョウを守っていますが、彼らは急速に変化しています。他の多くの企業はそのイノベーターのジレンマに陥るでしょう。しかし非イノベーション企業はどうでしょうか?AIを採用してビジネスをより良くしようとしている普通の企業はどうでしょうか?
私が見ている大きな問題は、彼らがすでに行っていることをどのように自動化するかを考えていることです。これは素晴らしい質問です。しかし、それ以上のものだと思います。すでに行っていることを取り上げて、それを自動化したり、より多くを行ったりする方法を見つけるだけではありません。企業が考えるべきは、人工知能を使えば今までリソースがなくてできなかったことを何ができるかということです。
それが本当の質問です。同じチームで、以前なら不可能に思えたプロジェクト、タスク、イニシアチブを何か取り組むことができるでしょうか?確かにすでに行っているタスクを自動化しますが、もっと将来を考えてください。どんなビジョンを持っていますか?以前は不可能だったことを達成したいですか?
この点について続けると、消費者と企業の両方がAIを使い、生活の中の構造に合わせようとしているように思います。そしてこれはすべての新しいテクノロジーで起こるようです。インターネットは素晴らしい例です。インターネットが最初に登場したとき、誰もが「素晴らしい、新聞や雑誌をウェブ上に置いて人々が読めるようにしよう」と考えました。彼らはインターネットの持つネイティブな対話性を考えませんでした。
彼らはソーシャルな側面を考えませんでした。それらの側面を考えなかったのは、それがまだ行われていなかったからです。彼らは「以前に機能したものを取り、この新しいテクノロジーにそれを適応させよう」と考えました。この新しいテクノロジーのネイティブな形態は何かを考え、その参照枠の中でものを作るのではなく。
次のセクションでは、20歳と35歳の人が人工知能をどのように使っているか、そしてそれがいかに大きく異なるかについて考察しています。彼がそれを説明するのを聞くのは非常に興味深いです。だから、あなたが20代でなければ、人工知能を使うまだ考えていない方法かもしれないので、これに注目してください。
「平均的な20歳の人に話しかけて、彼らがChatGPTをどのように使っているかを見て、そして平均的な35歳の人に話しかけて、彼らがそれをどのように使っているか、または他のサービスをどのように使っているかを見ると、その違いは信じられないほどです。スマートフォンが登場したときのようで、すべての子供たちは非常に上手く使えるのに、年配の人々は基本的なことを理解するのに3年ほどかかり、そしてもちろん人々は統合していきますが、現在のAIツールに対する世代間の分断は非常に大きいです。私は企業もそれの別の症状だと思います。」
「それに続けて、若い人々がChatGPTで使っている驚くべきユースケースは何ですか?」
「彼らは本当にそれをオペレーティングシステムのように使っています。彼らはそれを設定して多くのファイルに接続する複雑な方法を持ち、彼らは頭の中で記憶しているかなり複雑なプロンプトを持っているか、彼らがコピーアンドペーストするものの中に持っています。そしてそれらのすべては私にとって素晴らしく印象的です。そして彼らがChatGPTに何をすべきか尋ねずに人生の決断をあまりしないという別のことがあります。」
ちなみに、私はこれをします。人生の主要な難しいまたは複雑な決断をするとき、私はChatGPTを使って考えるのを手伝ってもらいます。「この決断を私のためにしてください」とは言いません。しかし、これらのAIツールはすべて、非常に明確な方法で考えるのを助けることができます。
これの良い類似は長所と短所のリストで、それは非常に手動であり、難しい決断を考える際に実際に非常に役立ちます。しかしAIをあなたの長所と短所のリストとして想像してください。ただし、それはあなたが思いつかなかったかもしれない難しい決断についての洞察と新しい考え方を与えることができます。
だからぜひその方法で使ってください。
「そして彼らの人生のすべての人についての完全なコンテキストと、彼らが話したことを持っています。メモリの機能は本当に変化をもたらしています。しかし大まかな単純化をすると、年配の人々はChatGPTをGoogleの代替として使い、20代と30代の人々はそれを人生のアドバイザーのようなものとして使い、そして大学生はそれをオペレーティングシステムとして使っています。」
私はAIをオペレーティングシステムとして使うことをもっと上手くする必要があると思います。私は明らかに毎日それを使っています。これは私の仕事です。しかし私は私の人生についてもっと情報を与える必要があると思います。私はそれらのメモリをより効果的に使えるようにする必要があります。そして彼が話しているオペレーティングシステムとはそれです。
次のセクションは、AIの音声と、人工知能と消費者のための相互作用層としての音声がいかに重要かについてです。もちろん、それは非常に重要であり、彼は彼らがまだそれを完璧にしていないことを認めています。しかし彼が言うことは再び、彼が将来のOpenAIのビジョンをどのように見ているか、そして彼らが将来のコンピューティングプラットフォームになるつもりであるかについてのヒントを与えています。
「こんにちは、Sam。プレイグラウンドで音声モデルを試すのに本当にワクワクしていました。二つ質問があります。一つ目は、インフラストラクチャの観点からOpenAIにとって音声がどれほど重要か、そして製品とChatGPTの中核的なものにどのように現れると思うか、少し共有してください。」
「音声は非常に重要だと思います。正直なところ、私たちはまだ十分に良い音声製品を作っていません。それは大丈夫です。テキストモデルも十分に良いものを作るのに時間がかかりました。私たちはいつかそのコードを解読し、そうなれば、多くの人々が音声相互作用をもっと使いたいと思うでしょう。私たちが現在の音声モードを最初に発表したとき、私にとって最も興味深かったのは、それがタッチインターフェースの上に新しいストリームであったことです。
そして同時に話しながら電話をクリックできました。そして私は音声とGUIの相互作用について何か素晴らしいことがあると思い続けていますが、私たちはまだそれを解読していません。しかしその前に、私たちは音声を本当に素晴らしいものにします。そしてそうなれば、既存のデバイスで素晴らしいだけでなく、本当に人間レベルの音声を感じさせることができれば、音声は全く新しいクラスのデバイスを可能にすると思います。」
Sam Altmanは本当に彼の手の内を少し明かしています。これはすべて推測ですが、実際に起こっていることは、彼とJohnny Iveが一緒に新しいデバイス、AIネイティブなデバイスを作ることが噂されていたことを思い出してください。Johnny Iveをご存じない方のために、彼は過去20年以上のApple製品のすべての背後にある素晴らしいデザイナーです
そして私は確かに音声が将来の主要な入力デバイスになると思います。しかしグラフィカルユーザーインターフェースとの何らかの相互作用プラス音声について考えるのは興味深いです。私はすでにそのようにそれを使っています。ChatGPTで音声モードを使うとき、私はカメラで物を指し示し、読み、同時に他のことをクリックしています。
現在はそれは少し痛みを伴います。プロセスには多くの摩擦がありますが、それは良くなるだけです。だから私は将来の音声相互作用層の価値についての彼の評価に同意します。
次のセクションでは、誰かがSam AltmanにコードがAIの別の垂直アプリケーションか、それとも特別なもの、ユニークなものであるかどうかを尋ねます。
「コーディングは単なる別の垂直アプリケーションですか、それともOpenAIの将来にとってより中心的なものですか?」
「それはOpenAIの将来にとってより中心的なものです。現在、CHPTに返答を頼むと、テキストが返ってきます。おそらく画像も返ってきます。あなたはプログラム全体を返してほしいでしょう。すべての返答にカスタムレンダリングされたコードを得たいでしょう、少なくとも私はそうです。
あなたはこれらのモデルが世界で物事を起こさせる能力を持ちたいでしょう。そしてコードを書くことは、あなたが世界を動かし、多くのAPIを呼び出したりするための中心的なカテゴリーになると思います。だからコーディングはより中心的なカテゴリーになるでしょう。もちろん、私たちはそれを私たちのAPIと私たちのプラットフォームを通じても公開します。しかしChatGPTはコードを書くことに優れているべきです。」
だからコードは特別なものです。なぜならコードはエージェントの言語だからです。あなたの代わりに相互作用できるエージェント。ブラウザを使い、あなたのコンピュータを使えるエージェント。これらすべてのことはエージェントが必要なときにリアルタイムで動的にコードを書くことができるから起こります。
そしてそれを超えて、あなたがエージェントに何かを尋ね、単なるテキスト回答ではなく、完全な対話型アプリケーションを返してもらうという相互作用が想像できます。そしてそれは「SaaSは死んだのか?」という話に戻ります。このチャンネルでそれについて多く話してきました。そしてエージェントがリアルタイムでこれらのアプリケーションをすべて作成しているなら、伝統的なSaaSアプリケーションはどこに存在するのでしょうか?それらにはあまり使い道がないように思えます。
もちろん、Satya Nadellaは有名にすべてのアプリケーションがエージェントに集約されていると言いました。だから、それについて考えるのは非常に興味深いことです。
次に、Samは次の12ヶ月間で価値創造がどこにあると思うかについて尋ねられます。あなたが起業家で、スタートアップの創業者なら、注目して聞いてください。
「ある意味で、価値は本当に3つのことから来続けるでしょう。より多くのインフラを構築すること、より賢いモデルを構築すること、そしてこれらのものを社会に統合するための足場を構築することです。そしてそれらを推し進めれば、残りは自然に解決されるでしょう。」
特に足場に私は興味があり、いくつかの投資をしています。そしてそれにはいくつかの理由があります。一つ、AIインフラの構築は何年も前に始まりました。だからもしあなたがその初期の波の一部でなかったなら、今参入するのは非常に難しいです。二つ目、モデルインテリジェンス層も同じようなものです。
これらの企業は何年も前に設立されました。だからもしあなたが投資家または創業者としてすでにそれらの中にいないなら、今から始めるのは非常に難しいです。しかし足場は現在構築中です。それがメモリ管理であれ、セキュリティであれ、エージェントフレームワークであれ、ツール使用であれ、モデルの中核的なインテリジェンスの周りにあるこれらのすべてのものです。
それが現在のゴールドラッシュです。少なくとも私の意見では。
「より高いレベルの詳細では、2025年は一種のエージェントが仕事をする年になると思います。特にコーディングは支配的なカテゴリーになると予想しています。他にもいくつかあると思います。次の年は、AIが新しいものを発見し、おそらく非常に大きな科学的発見をしたり、人間がそれをするのを支援したりする年になると予想しています。
そして私は人類の歴史における本当の持続可能な経済成長のほとんどは、地球に広がって植民地化した後、ほとんどはただより良い科学的知識からやってきて、それを世界のために実装することから来ると考えています。そして27年は、それがすべて知的な領域から物理的な世界に移り、ロボットが好奇心の対象から、真剣な経済的価値の創造者になる年だではないかと思います。」
今年はすべてエージェントについてです。すでに私たちはそれを目にしています。26年はAIによって行われる科学的発見についてであり、それは実際に自己改善AIにつながります。そして27年には、インテリジェンスがロボットの形で具現化され、真剣に経済的に価値のあるロボットになります。私は実際にはロボットはもう少し先だと思いますが、それ以外のタイムラインは私には非常に正確に思えます。
今日のビデオはこれで終わりです。もし楽しんでいただけたなら、ぜひ「いいね」と購読をお願いします。


コメント