マーク・ザッカーバーグ、AI眼鏡、人工超知能、ニューラル制御について語る

Meta・マイクザッカーバーグ
この記事は約26分で読めます。

この動画では、MetaのCEOであるマーク・ザッカーバーグが、同社の最新AI眼鏡製品ラインナップについて詳細に語っている。Ray-Ban Metaの次世代モデル、アスリート向けのOakley Meta Vanguard、そして高解像度ディスプレイを搭載したRibbonについて説明し、特に革新的なニューラル制御バンドの技術に焦点を当てている。ザッカーバーグは、眼鏡がパーソナル人工超知能の理想的なフォームファクターである理由を説明し、スマートフォンに代わる次世代コンピューティングプラットフォームとしての展望を語る。また、人工超知能実現への取り組み、子育て、そして技術と人間性のバランスについても言及している。

Mark Zuckerberg on AI Glasses, Superintelligence, Neural Control, and More
Meta just unveiled its latest AI glasses at Connect 2025 – including Ray-Ban's with a built-in display, controlled by a ...

Connect 2025で発表された製品ラインナップ

今日はConnect 2025について全てお話ししたいと思います。発表した主な製品についてご紹介できればと思います。

まず最初にご紹介するのは、次世代のRay-Ban Metaです。これまで出荷してきた従来のアイグラスです。史上最も急速に成長している家電製品の一つで、非常に満足しています。

今回の改良点として、バッテリー寿命を2倍に延長しました。3K動画解像度での撮影が可能になりました。そして新しいAI機能として「会話フォーカス」という機能を導入しました。これは騒音の多い場所で、一緒に話している友人の声の音量を上げることができる機能です。レストランなどでとても便利だと思います。

次にご紹介するのは、Oakley Meta Vanguardです。これはOakleyとの2つ目のコラボレーション製品で、パフォーマンス重視の眼鏡です。スポーツ向けに様々な機能が設計されています。カメラが中央に配置されているので、アライメントに優れています。視野角が広く、スピーカーも大音量で、防水機能もあります。Garminウォッチと連携できるので、マラソンを走っているときに1マイルごとに動画撮影を指示でき、終了時にそれらを繋げてGarminの統計データを重ねた動画を作成してくれます。これは本当に素晴らしい機能だと思います。

しかし、今回発表した中で最も興味深いのは、Meta Ribbon displayと呼んでいるこちらの製品です。これは私たちが出荷する初めての高解像度ディスプレイを搭載したアイグラスです。そして大きなブレークスルーとして、Meta neural bandとペアリングします。これは私たちが出荷する初めての主流向けニューラルインターフェースで、制御方法として使用します。

基本的に、すべてのコンピューティングプラットフォームには独自の新しい入力方法がありますよね。コンピューターのキーボードとマウスから、スマートフォンのタッチスクリーンに移行したときのように、全く新しい入力方法が生まれました。眼鏡でも同じことが起こると思います。ニューラルインターフェースがあれば、このような微細な筋肉の動きで脳から信号を送ることができます。これくらいの動きで十分です。ニューラルでテキストを入力したり、様々な楽しいことができます。これは本当に大きなブレークスルーだと思います。

パーソナル人工超知能との関連性

Ray-Ban Metaは日常使い、OakleyはアスリートAtomic向け、そしてディスプレイ付きはパワーユーザー向けです。これらの眼鏡がパーソナル人工超知能のビジョンにどう結びつくのでしょうか。

私たちの理論では、眼鏡はパーソナル人工超知能にとって理想的なフォームファクターです。なぜなら、あなたが見るものを見て、聞くものを聞き、一日中あなたと会話でき、リアルタイムであなたの視界にUIを生成できる唯一の真のデバイスだからです。

他にもデバイスはあります。スマートフォンでもAIを使えますし、ウォッチでも、AirPodsのようなものでも可能です。しかし、眼鏡だけが視覚と音声の入出力すべてを実現できる唯一のものだと思います。これは本当に大きな意味を持つと思います。

実際に試してみると、最初に思っていたよりもはるかに多くのユースケースがありました。AirPodsにもリアルタイム翻訳機能がありますが、これもリアルタイム翻訳ができます。字幕機能もあります。本当にたくさんの機能があります。

私が設計時に念頭に置いていた主な用途は、メッセージの送信です。これは私たちがスマートフォンで最も頻繁に行うことだと思います。私たちは多くのメッセージアプリを運営しているので、人々が1日に数十通のメッセージを送っていることを知っています。この体験を本当に素晴らしいものにしたかったのです。

眼鏡を使えば、友人からテキストが来ると、目の隅に数秒間表示されます。中心からずれた位置なので視界を遮りません。すぐに消えるので注意散漫になりませんが、返事をしたければ、このように指を動かすだけで簡単に返信できます。ニューラルテキストで1分間に30語まで入力できるようになりました。これは素晴らしいと思います。

ニューラル制御の仕組みと利点

テキスト機能はどのように動作するのでしょうか。Meta AIと話すこともできますが、実際に書き留めて自動的にスマートフォンに送られるということですか。

はい、ニューラルバンドを使えばそうです。手書きのようなものです。小さな鉛筆を持っているかのように、特定の文字を書くためにどのような動きをするかを考えるのです。

ニューラルバンドは時間をかけてあなた個人に合わせてカスタマイズされます。他の人とは異なるあなたのWやJの書き方を学習します。そして、あなたのJの最も最小限の書き方を学ぶために、あなたと一緒に共進化していきます。

フィードバックループにより、時間が経つにつれてより微細な動きができるようになります。実際には動きを感知するのではなく、筋肉の発火を感知しています。時間が経てば、基本的に筋肉を互いに対立させるだけで、実際には手を動かさなくても、ポケットの中や背中の後ろに手があっても、メッセージを送ったりUIを制御したりできるようになると思います。

これは手の認識ではありません。眼鏡のカメラが手の動きを見ているわけではありません。このバンドが、筋肉が実際に動く前に脳から筋肉に送られる微細な信号を感知しているのです。実際に動く必要がなく、信号を送るだけで済み、それを感知してくれます。

リストバンドが動く前の電気信号を読み取るということですが、なぜ眼鏡にボタンを追加したり音声コマンドを改善したりするよりも重要なのでしょうか。

多くの場合、周りに他の人がいるからです。コンピューティングデバイスをプライベートかつ控えめで繊細に制御する方法が欲しいと思うのです。ささやき声でうまくいくかも検討しましたが、音声も使えます。音声制御も音声ディクテーション機能も、音声でのAI対話も可能です。しかし、より繊細でプライベートにやりたいときのために、音声以外の方法が必要だと思いました。

この会話をしている間に、眼鏡をかけてメッセージが来て、話しながら返事を書いて送ることができます。その間に10語のメッセージを送ることができるでしょう。それから返事が来て、また返信を書いて送る、といった感じです。

ボタンについては、それも使えます。これらの眼鏡すべてで、ボタンをタップして写真を撮ったり、長押しして動画を撮ったり、スワイプで次の曲に飛ばしたり、タップして音楽を開始・停止したりできます。しかし、それだけが唯一の方法である必要はないと思います。ニューラルバンドがあれば、手を横に置いたまま音楽を開始・停止することもできます。とても繊細なジェスチャーで、誰にも分からないでしょう。

新しいインターフェースとしてのニューラルバンド

今後、タイピングと音声だけではAIに十分なデータを与えられないかもしれません。しかし、今は電気信号もAIに、UIを制御するために提供できます。

ニューラルバンドは新しいインターフェースのようなものだと思いますか。

はい、AIと眼鏡の両方にとってそうだと思います。眼鏡の一部は、アプリのメニューがあって、手で繊細にスワイプしてそれを選択するというようなものです。カメラを起動したら、ビューファインダーが表示されるので、撮りたい画像を正確に確認できます。ズームインしたい場合は、指を少し回転させるだけです。

実際、音楽を再生しているときが最もクールです。音量を変える方法は、音量ダイヤルがあるかのように手首を回転させるだけです。まるで魔法のように感じます。本当に楽しいです。

Meta AIをどこでも呼び出す方法は、2回タップするだけです。しかし、横に手を置いたまま、誰も気づかないような小さなタップでできます。

これが最も直感的な方法だと思いますが、ニューラルバンドがなくても、音声で制御したりボタンで制御したり、いろいろな方法があります。

AIと眼鏡のUI、そして将来的には眼鏡以外のものもニューラルバンドで制御できると思います。

ニューラルバンドの操作を習得するのにどのくらい時間がかかりましたか。

それほど長くありませんでした。かなり直感的です。ナビゲーションは十字キーのようなものだと考えてください。親指で右、左、上、下にスワイプします。2回タップしてメニューを表示し、2回タップしてAIを呼び出し、鉛筆を持っているかのようにテキストを入力します。

コツは、最初に学習するときは動作が少し大きくなることです。しかし、使い始めて数日以内にとても繊細な動作でできるようになります。実際には、最適化の多くは私たちの側やあなたの側ではなく、時間をかけて機械学習システムがあなたに合わせてパーソナライズされ、改善されることにあります。

ニューラルテキスト入力が遅いときは、私がミスをして自動修正が直してくれないときです。そうすると手動で戻ってテキストを再入力しなければなりません。しかし、これは標準的な機械学習で、システムがどんどん改善され、あなたのパターンをより良く学習するにつれて、あなたがしていることの多くを自動補完できるようになり、すべての動作をする必要がなくなります。

眼鏡が次のプラットフォームになる理由

あなたは何年もの間、眼鏡を次のプラットフォームと呼んできました。しかし、最初のRay-Ban Metaは実際に音声とAIで人気を博しました。そこで何を発見したのでしょうか。

眼鏡を作る際にいくつかの原則があり、最もよく話す3つの原則があります。まず第一に、優れた眼鏡でなければならないということです。技術を加える前に、これを顔に一日中着けるのであれば、見た目が良く、軽量である必要があります。

技術を設計する多くの人は、やや大きくて機能をたくさん追加したものを作って、なぜ人々がこれを着けたがらないのかと言います。しかし、一日の大部分において人々は写真を撮ったりしていませんよね。一日の大部分はただそこにあるだけです。これらの魔法は、着けたい見た目が良く快適な眼鏡であり、顔に着けているということです。そうすれば、音楽を聴きたいときやAIを呼び出したいときなどに、それが利用可能になります。まず見た目の良い眼鏡であること。

もう一つの大きな原則は、技術が邪魔にならないことです。技術を設計する多くの人は、装飾を追加したり、自分が作ったものを中心に置いたりする衝動があります。私がチームに常に指摘することの一つは、特に眼鏡を作る場合、どんな技術であっても、使いたいときにそこにあって、その後は邪魔にならないことが極めて重要だということです。

視界にランダムなものが表示されることは望ましくありません。デザインチームがどんなに素晴らしいアニメーションを作ったとしても、私たちはこれを超最小限にしたいのです。メッセージが来たらメッセージを見て、不要になったら消える。

クラシックなデザインはこれらの原則を体現していたと思います。

3つ目の原則は、人工超知能を真剣に受け止めることです。これは私たちが内部で持っている信条のようなもので、AIが私たちの人生で最も重要な技術になるという考えです。そして、AIがデータセンターに座って物事を自動化するだけでなく、人々に奉仕するものであることを確実にしたいのです。

そのため、初期バージョンでも、先ほど話した会話フォーカス機能のような改善を簡単にソフトウェア更新できるように設計しました。これにより、騒音の多い場所で人の声の音量を上げるという素晴らしいアクセシビリティ機能を提供できます。

まず、今後数年間でAIが必要とするであろうセンサーを内蔵し、ソフトウェアが動作するようになったらアップデートできるようにして、最新のAI技術を人々に提供し、ソフトウェア更新で人々をより賢くすることができるようにします。

スマートフォンから眼鏡への移行

これらの眼鏡がスマートフォンを完全に置き換えるほど優れたものになるまで、どのくらいかかると思いますか。

少し違った考え方をしています。今のあなたのメインコンピューティングデバイスは何ですか。スマートフォンが私のメインコンピューティングデバイスです。しかし、コンピューターを捨てたわけではありませんよね。コンピューターは持っていますが、使用頻度が減りました。机にいてコンピューターがすぐそこにあるときでも、何かをしたいときはスマートフォンを取り出します。それが私の主要なデバイスだからです。

ここで起こることは、近い将来スマートフォンを捨てることはないと思います。ただ、スマートフォンをポケットやバッグに入れたままにすることが増えると思います。とても些細なことですが、時間を見るためにスマートフォンを見る回数は分かりませんが、眼鏡をしているときはそうしません。

軽くタップするだけで時計が表示されて完了です。時間を見るためにスマートフォンを取り出す必要がありません。メッセージを見るためにスマートフォンを取り出す必要もありません。カメラも優れていますが、ビューファインダーがあるので、何を撮影しているかが正確に分かります。

このように、ユースケースごとに、以前はスマートフォンを取り出していたことをしなくなると思います。それが進行方向だと思いますが、今後5年間でスマートフォンを完全になくすことはないと思います。ただ、徐々にスマートフォンの使用が減っていくと思います。

GPS機能も同じですね。スマートフォンを常に見る代わりに、眼鏡を使うようになるでしょう。眼鏡の中でナビゲーションしてもらえます。翻訳機能も便利でした。

他の人がどのように使うかを見るのが楽しみですが、メタバースについて人々が本当に好奇心を持つと思います。このビジョンはこれらの製品にどの程度込められているのでしょうか。

私たちはそれに近づいていると思います。メタバースは明らかにとても視覚的な体験で、プレゼンス感があります。立体音響のような部分もあり、3D音響も素晴らしいものが得られます。

しかし、ディスプレイが始まり、昨年見せたOrionプロトタイプは、より広い視野角を持っています。準備ができたときはより高価な製品になると思いますが、基本的にホログラムを表示できるようになります。コンテクストを持つことができます。動画を見たり、メッセージスレッドを持つのに十分ですが、この製品は特に単眼なので、世界に3D物体を配置することはありません。

他の人と一緒にいるようなプレゼンス感を提供することには、本当に魔法的になると思うことがまだあります。消費者向けOrionが手に入れば、それを本当に始めることができるでしょう。

私たちは段階的にそこに向かっていると思います。しかし、ニューラルバンドを備えた最初の高解像度ディスプレイは大きなブレークスルーで、それがどうなるかを学ぶ良いステップになると思います。しかし、はい、VRで持っているプレゼンスに関する没入的なソフトウェアのバージョンを眼鏡でも実行したいというビジョンがあります。

アスリート向けVanguardの開発

Vanguardについて話を変えましょう。とてもスタイリッシュで、デザインが気に入りました。ランニングやサイクリングをするので使ってみます。これらをアスリートを念頭に置いてどのように作ったのでしょうか。

チームの多くの人がかなり真剣なアスリートで、Ray-Banを使っていました。サーフィンに持っていってどれだけのRay-Banをダメにしたか分からないほどです。しかし、それだけの価値がありました。ただし、防水ではないので。

防水が欲しいというのは明らかでした。スピーカーの音量とパワーの向上。これらは6デシベル大きく、騒音の大きいことをしているときに本当に価値があり有用です。時速30マイルでサイクリングして風が強いとき。

数週間前にはジェットスキーで通話をしていましたが、ジェットスキーのエンジン音の上からも相手の声が完全にクリアに聞こえました。バックグラウンドの高度なノイズ低減機能があります。マイクがノーズパッドにあるので、風洞の中にいても電話の相手は背景音を全く聞くことができません。あなたの声だけがクリスタルクリアに聞こえます。

そのようなものは素晴らしいと思います。それから、Garminとの連携、そして他にもスポーツに欲しいものがたくさんあります。動画の手ぶれ補正も良く、GarminとStravaとの連携も良いと思います。角にLEDを付けたので、希望するペースや目標心拍数ゾーンを保つためのリマインダーとして点灯させることができます。

そのように、アスリートにとって非常に興味深いものがたくさんあると思います。

なぜ異なるライフスタイルに対してこれほど多くの異なる眼鏡を設計することが重要だと思ったのでしょうか。そして、今後どこまで範囲を広げる予定ですか。

人々は異なるスタイルを持っていると思います。これは、みんなが同じものを持つことに満足し、少し異なる色のケースを付けたり、ケースに異なるステッカーを貼ったりするだけで済むスマートフォンとは違います。人々は異なる顔の形を持っており、異なる美学を持っています。これは私たちのアイデンティティとスタイル感覚の重要な部分だと思います。

機能的な部分もあります。よりライフスタイル寄りのものもあれば、よりアクティブなものもあります。細いフレームを好む人もいれば、太いフレームを好む人もいます。太いフレームにはより多くの技術を搭載できます。より高度なホログラムなど、より多くのディスプレイになると、細いものよりも常に少し太いフレームになります。

人々は、細いものの美学とシンプルさを好むか、太いもののロング美学を好むかという選択をすることになると思います。幸い、大きな眼鏡が流行っているので、それはうまく機能します。

それから価格帯と手頃さもあります。技術が少なければ、常により手頃な価格で提供できます。それも素晴らしいことです。なぜなら、今日、視力矯正のために眼鏡をかけている人が世界に10億から20億人いるからです。5〜7年以内に、それらすべてがアイグラスに置き換わらない世界があるでしょうか。

iPhoneが登場してみんながフィーチャーフォンを使っていたとき、スマートフォンになるのは時間の問題だったのと同じように感じます。眼鏡でも同じことが起こると思います。

しかし、人々は異なる眼鏡を持ち、異なる価格帯と スタイルの異なる眼鏡を求めています。私たちの目標は、多くの象徴的なブランドと協力して、素晴らしい作品を作ることです。

パーソナライズされたコーチング機能

VanguardでGarmin連携について触れましたが、これは基本的にAIがハンズフリーで心拍数、ペース、位置など、すべてを見ることを可能にします。ランニングやサイクリング中にパーソナライズされたコーチが耳元で積極的に指導してくれるようになるまで、どのくらいかかると思いますか。

少しはできます。ランニング中に心拍数やペースを聞けば、今答えてくれます。私がどれくらい激しく走るかは分かりませんが、パフォーマンス重視で走っているとき、何かと話したくはありませんよね。おそらくその心拍数ゾーンを超えているからです。

しかし、本当に速いスキーをしているときに、どのくらいの速度で滑っているかを知りたいときがあります。それは楽しいからです。そして、必ずしも息切れしているわけではありません。

リアルタイムで話しかけて統計データを教えてもらうのも一つです。LEDを内蔵したのもその理由の一つで、ペース目標や心拍数目標に対して、とてもシンプルな視覚的インジケーターを提供したかったからです。時間が経てば、それらにもディスプレイを搭載することになるでしょう。

リアルタイムコーチングがありますが、例えば、ゾーン2で走っていて、特定の心拍数以下に留まりたいとき、あまり激しく走りたくないからゾーンに留まりたいとします。コーチが「少しペースを落として、速すぎる」と言ってくれるようになるでしょうか。

それがLEDの最初の目標です。ゾーン2を保とうとしているなら、おそらく話すことはできませんよね。ゾーン2の定義のようなものだからです。話せるはずですよね。

それが定義かどうかは分かりませんが、適切な答えです。

基本的に、Garminに接続していれば異なる統計データを聞くことができ、どのゾーンにいるかも分かります。

あなたがたくさんトレーニングしているのは知っていますが、トレーニングでコーチのように、あるいはコーチとして何か良い使い方を見つけましたか。

サーフィンに持っていって壊れないのが良いですね。

以前言ったように、何組かのRay-Banをダメにしました。リアルタイムで瞬間を捉えることもできますよね。

その通りです。カメラが中央にあるので、本当に完璧に整列しているのが良い点の一つです。画像と動画は本当にあなたの視点から来ているように感じます。カメラが横にずれていてもいいのですが、プレゼンス感を提供することについて話したように、完璧になるとクリックしたように感じられるものがあります。2度ずれていても価値がありますが、そうではありません。中央にあることで本当に魅力的なものがあると思います。

広い視野角もあります。

試してみるのが楽しみです。

子育てと未来への準備

3人の子供を育てながら人工超知能を構築しているということですが、子供たちが成長する世界について、今どのような会話をしていますか。

いろいろなことで出てきますが、私たちの家族ではたくさんのロボットを作っています。

私は3Dプリンティングに夢中です。これは本当に楽しいDIYの趣味だと思います。娘たちも本当に夢中になっていて、いろいろなものを作っています。インターネットで見つけたものをプリントするだけではなく、自分たちで設計する必要があるという段階に達しました。

そこで今、娘たちはさまざまなツールを使ってそれをやっています。私も一緒に取り組んでいます。楽しい趣味として、しかしいろいろな面で。私はロボット工学を、明らかにある程度同時に発達するでしょうが、AIの次に来るものだと考えています。しかし、私たちは本当に賢い、知的なAIを持つことになると思います。それから、それの完全に具現化されたバージョンであるロボット工学を得ることになります。

子供たちの年齢では、AI開発でできることはそれほど多くありませんが、実際に物を作ることはできて、単純に楽しんでいます。子供たちは3Dプリンティングが大好きで、それほど複雑ではありません。ただの楽しい趣味です。

今、このプロジェクトが進行中です。最初に、組み立て可能なロボットをインターネットから購入しました。スターターパックのようなものがたくさんあるからです。次は基本的に独自のものを設計することです。3Dプリントでシェルを作り、Raspberry PiやJetsonを使って、言語モデルを実行し、興味深いことをするのに十分うまく動作するようにします。

それはレゴよりステップアップしていますね。楽しそうです。

そうです。レゴはブロックがなくなるからです。しかしインターネットではなくなることがありません。

人工超知能時代に保持すべき人間の特質

特定の特質やスキルを子供たちに教えようとしていますか。例えば、デミス・ハサビスは「学習する方法を学ぶ」ことが本当に重要な特質だと言いました。

主に子供たちに良い人間になることを教えようとしています。ロボットなど、興味深い知的なことについて話しましたが、思いやりがあり親切であることなどが本当に重要だと思います。そのような価値観的なことです。

でも、デミスの答えにも同意します。特定のことを学ぶよりも、何かを深く掘り下げる方法を学ぶことについてです。

多くの人が「学習する方法を学ぶ」の変形を言いますが、どうやってそれをするのでしょうか。基本的に、非常に深度優先のアプローチだと私は思います。概念的な枠組みを持とうとするよりも、プロジェクトを完成させるのです。

ロボットを作ることで多くのことを学べます。その後、ロボット工学に実際に関心を持ち続けるかどうかは、多くのことを学んだこととは完全に付随的なことです。問題をこれらすべてのことに分解し、3Dプリンティングの設計を理解する必要がありました。プリンターを動作させる必要があり、Raspberry Piを動作させる必要がありました。今、車輪について多くのことを学んでいます。履帯にするのか、車輪にするのか。何個の車輪にするのか。

そのようなことで、基本的に問題を分解し、物事をデバッグする方法を学んでいると思います。そしてそれは実際にやることで学びます。それが私の哲学です。

それは好きですね。そして、共通の興味を持つことで楽しむことだと思います。

時にはロボットを作り、時にはK-POPダンサーを見たりします。楽しまなければなりません。

人工超知能を達成したとき、これらの眼鏡は私たちが見るものすべてを見て、聞くものすべてを聞き、今では筋肉のインパルスの一部も感知します。私たちはどのような人間の特質を保持するために戦うべきで、何を手放すべきでしょうか。

すべてを見るという点については確信がありません。あるいは、何らかのセンサーがそうするかもしれませんが、必ずしもそれを保持するわけではありません。望むかどうかも分かりません。それは私たちが進める可能性のある全く別の方向です。しかし、関連する部分を選び出すことができ、人々にその制御を与えることが重要だと思います。

しかし、それはあなたが聞いている核心ではありません。私にとって創造性は非常に重要です。世界で何を作りたいかという感覚を持つこと。そして、どのように分解するか、それを行うためのステップは何か、そのためにどのツールが最も役立つかのアイデアを持つこと。クリエイターや建築家の仕事の一部は、利用可能なツールの達人になることだと思います。そうでなければ、自分の仕事の最先端にいることはできません。

競争の激しい世界ですから。私は考えています。AIの進歩すべてが非常に魅力的だったのは、人々が知性と意図や何かをする欲求を混同してきたことです。

これまでのAIシステムから見えてきたのは、実際にこれら二つを分離できるということです。AIシステムには何かを創造する衝動や欲求はありません。ただそこに座って、あなたが指示を与えるのを待ち、そして多くの作業をこなしてくれます。最終的な人間の部分は、世界をより良くするために何をしたいかということになると思います。

個人的な創造的表現として何を作りたいかということもあると思いますが、私たちの業界ではおそらく過小評価していることですが、他の人々を気にかけ、人々の世話をし、親切さを広めるということです。そのようなことは本当に重要だと思います。AIもそれを助けてくれると思います。

人工超知能研究ラボの構築

この会話は明らかに、あなたが過去数ヶ月間進めてきた人工超知能ラボについて触れないわけにはいきません。

忙しかったですね。

いつ外部からその変更を決めたのでしょうか。あなたが個人的にファウンダーモードになり、研究者に電話をかけ、メールを送ったりしているという噂があります。この決定を駆動したものは何ですか。

主にLlama 4が私が必要だと考えた軌道に乗っていなかったということです。Llama 4は多くの面でLlama 3より大幅な改善でしたが、Llama 3より少し良いものを作ろうとしていたわけではありません。私たちは先端ラボとして、主導的な仕事をしたいフロンティアラボです。

そこで、いくつかの基本原則を持って私たちが行っている仕事を再構築したいと考えました。

一つは、タレント密度への大きな焦点です。何百人もの人は必要ありません。50から100人の、基本的に全体を一度に頭に入れておけるグループサイエンスプロジェクトの人々が必要です。船の席は貴重です。誰かが重荷を引いていなければ、それは会社の他の多くの部分にはない巨大なマイナス効果をもたらします。

業界で最高のタレント密度に絶対的に焦点を当てることが、あなたが聞いたことの多くを駆動しました。なぜ私がすべてのトップAI研究者に会いに行っているのでしょうか。トップAI研究者が誰なのかを知りたいし、彼らと個人的な関係を築きたいからです。

そして、可能な限り強いチームを構築したいのです。それが焦点の大部分でした。他の部分もあります。長期研究を行うときの私たちの原則の一つは、実際にはトップダウンの締切を設けないということです。これは研究ですから、どのくらい時間がかかるかは分かりません。

すべての研究者は競争心があり、皆フロンティアで主導的な仕事をしたがっています。私が締切を設定することは彼らの助けになりません。全く助けになりません。彼らは問題を解決するために必要なことを理解しようと、可能な限り速く動いています。

私たちはラボを非常にフラットに組織しています。技術的でない管理層は作りたくありません。人々は技術的にスタートして経営に移り、6ヶ月か1年後にはまだ技術的だと思っていますが、実際にはしばらくその作業をしていないということが問題です。そのため、知識はゆっくりと、またはそのような急速に動く環境では急速に減衰していきます。

とにかく、それらが基本原則です。しかし、全体として一歩下がって考えると、AIは私たちの人生で、私たちの生涯で最も重要な技術になると思います。

絶対的に主導的なモデルを構築する能力を構築することは、創造性を解放し、多くの素晴らしいものを構築するために非常に重要で非常に価値のあることだと思います。そこで、私たちが継続してそれを行えるように確実にするために、必要なことを絶対に焦点を当てて行うつもりです。

ラボでどの程度ハンズオンですか。

私はラボにいます。私の周りに座っていた全員を移動させて、今ラボがそこにあります。非常にハンズオンです。

チーフサイエンティストが私のすぐ隣に座っています。他の多くのチームも私から15フィート以内にいます。私はAI研究者ではありませんから、そこで彼らにどの研究アイデアをやるべきかを伝えているわけではありません。

私がCEOとしてできることは、最高の人材とタレント密度を確実に持つこと、研究者あたりダントツに最高のコンピュートを確実に持つこと、そのキャパシティを構築するために必要なことは何でもすることです。

おそらく、私たちが構築しているPrometheusクラスターの発表を見たと思いますが、これは来年オンラインになる単一のcontiguousクラスターとして初のギガワット以上のクラスターになると思います。

そして、ルイジアナ州に5ギガワットのクラスターを構築していて、それと同様の複数ギガワットのクラスターをいくつか構築しています。

これには明らかに確信が必要です。何千億ドルもの資本について話しているのです。それを支えることができる良いビジネスモデルが必要で、それを信じる必要があります。それが一つです。

大企業を運営することには良い面と悪い面があり、この取り組みに向けてすべての良い面を確実にチャネルできるようにするのが私の仕事です。

そして、企業を運営することで本来なら煩わしいことを、できるだけ多く排除します。素晴らしいものを構築したら、私たちのアプリに入れて数十億人に迅速に届けることができます。それは大企業内でできる良いことです。そして、より煩わしい他のことについては、それらを排除するのが私の仕事です。

どうやってそれをするかというと、研究者たちをよく知りたいのです。そして彼らが問題を抱えたとき、私にテキストを送ったり、私のデスクに歩いてきたりすることを快適に感じてもらいたいのです。

私が彼らとの関係を持っていることが、全体をうまく運営することの一部だと思います。私が情報の流れに入ることで、彼らが抱えている問題を理解し、それを私が解決してあげることができます。すべてがオープンで、すべてが迅速に動く文化を構築することです。

あなたは個人的にすべての研究者と話しているのですね。

私は会社の他の仕事もやっていますが、はい。研究者たちが業界最高の研究をするために必要なものを得るために、可能な限り迅速に動けるようにしようとしています。

人工超知能と製品の統合

最後の質問です。人工超知能を達成した場合、いつであれ、それを既存の製品に統合する計画は何ですか。

人工超知能を持った場合、製品とは何かの性質が根本的に変わると思います。今日の私たちの製品を考えてみると、大きなものの多くは、InstagramやFacebook、広告を中心としたビジネスモデルを見ると、基本的にすでにこれらの非常に大きなtransformerシステムやレコメンデーションシステムです。今日は言語モデルではありませんが、基本的にすでにこれらの大規模な機械学習システムです。

将来、あなたが何に関心を持つかについて基本的な理解を持ち、そのためストーリーのアイデアを吐き出すことができるレコメンデーションシステムがあって、それをレンダリングするアプリがあるという状況から、直接やり取りするモデルを持つ地点に到達すると思います。それはコンテンツを推薦し、コンテンツを生成し、話しかけることができます。このようなものがはるかに統合されると思います。

そして、最終的に眼鏡バージョンでそれが頂点に達すると思います。最終的には、オンとオフを制御できますが、望めば常にオンにできる体験を得ることになります。あなたが見るものを見て、聞くものを聞くことができ、あなたの会話の文脈について考えて、あなたが持つべきだと思うより多くの文脈や知識を持って戻ってくることができます。

アプリが必要なときは、あなたの視界にUIをゼロから生成してくれます。これがどのくらいかかるか確信はありません。5年だとは思いません。もっと早いと思います。2、3年でしょうか。正確には分かりませんが、AIのマイルストーンがどのようなものかを考えるたびに、すべて思っていたより早く達成されているようです。

時間が経つにつれて、AIについての私の楽観主義は一般的に増すばかりです。それを達成するまでのタイムラインと、それがどれほど素晴らしいものになるかの両方についてです。

コメント

タイトルとURLをコピーしました