AIの可能性を解き放つ:Andrew Ng博士とLisa Su博士からの洞察

オープンソース・オープンウェイト
この記事は約21分で読めます。

この動画は、スタンフォード大学のAndrew Ng博士とAMD CEOのLisa Su博士が、AI技術の民主化とアクセシビリティについて対談したものである。両者はAIエコシステムにおけるオープンな環境の重要性を強調し、開発者コミュニティがイノベーションを推進する中核的な役割を果たすことを論じている。特に、ゲートキーパーの存在がイノベーションを阻害するリスクと、オープンソースモデルや多様なハードウェア選択肢が創造性を促進する価値について議論が展開される。また、AI支援コーディングツールの進化が開発者の生産性を劇的に向上させ、新たな雇用機会を創出している現状についても詳しく解説している。

Unlocking AI Potential: Insights from Dr. Andrew Ng & Dr. Lisa Su
Get access to a rare discussion between AI luminaries, Dr. Andrew Ng, Founder of DeepLearning.AI and Co-founder of Cours...

AIアクセシビリティの重要性について

こんにちは、皆さん。こんにちは。午後お疲れさまです。本当にAIの未来を形作っている2人のリーダーの間での対話を司会できることを大変嬉しく思います。

まず最初に、私の元スタンフォード大学での博士課程指導教授であるAndrew Ng博士です。あなたは10年以上、いえ20年以上にわたってAIの教育を民主化してこられました。

そしてAMD CEOのLisa Su博士、あなたはAIハードウェアをより広範囲の開発者市場で利用可能にし、よりオープンにすることで、より多くの開発者がAIコンピュートのための重要なソフトウェアに貢献できるようにする取り組みを率いてこられました。

それでは、お二人のミッションの核心であるAIアクセシビリティについて始めましょう。Andrew、あなたはコースを通じて何百万人もの人々にAIについて教えてこられました。そしてLisa、あなたは何百万人もの人々にサービスを提供するコンピュートを構築し、AIをより広く開発者に利用可能にするリーダーとして活動されています。これを実現し、最終的にAIの進歩を効果的かつ安全に加速させるための主要なレバーは何だと考えますか?

まず最初に、この聴衆の皆さんと一緒に座るのは初めてなので言わせてください。「皆さん、良い一日をお過ごしですか?」あなた方に良い一日を過ごしていただくことは私にとって非常に重要です。なぜなら、あなた方こそが民主化という概念全体において私たちの世界の中心にいる存在だからです。

私たちの人生における目標は、非常に強力なコンピュート・ロードマップがあることを確実にすることです。しかしそれ以上に、それは誰もがアクセスできるコンピュート・ロードマップなのです。これは何を意味するでしょうか?これは、コンピュートを入手できる場所がたくさんあるということですが、同時に非常に強力なエコシステムがあるということでもあります。そして開発者コミュニティは本当にその中心にいるのです。ですから、これは私たちの優先リストの非常に高い位置にあります。

今日私たちがやりたかった非常に重要なことの一つは、第一に、Anush、その開発者クラウドがうまく機能するようにすることでした。プレッシャーはありませんが、それが私がAnushに言ったことです。私は、私たちが開発者クラウドを発表するという事実を愛していますが、皆さん全員がそれにアクセスする際に、それが実際に言っていることを実行することを確実にしたいのです。

しかし私たちは皆さんにたくさんのコンピュートを提供したいと思っています。それが私たちの人生の目標なのです。そしてこれは、AIのためにこれほど多くのことをしてくださったAndrewとステージ上にいることができて本当に光栄です。では、あなたにお渡しします。

ありがとうございます。それについて何かをお話しさせてください。これが私がAIスタックと考えているものです。低レベルの半導体では、AMDやNvidia、その他の企業があり、ハイパースケーラーつまり大規模クラウドがその上に構築されています。

次に、OpenAIやAnthropic、Gemini、その他多くの企業のようなAI基盤モデル企業があります。そして、この部屋にいる人々の大部分、本当に世界の人々の大部分はアプリケーション層にいることになるでしょう。

私たちは、素晴らしいツールと技術層、つまり半導体、クラウド・ハイパースケーラー、基盤モデルを活用して、素晴らしいアプリケーションを構築します。

実際、私は時間の多くをアプリケーション層で過ごしています。そして定義上、すべてのPRや誇大宣伝は技術層にありますが、アプリケーション層はさらに価値があるはずです。率直に言って、私たちは技術層に支払いをするためのより多くの収益を生み出すアプリケーションが必要だからです。

率直に言って、私がLisaとVamsi、そしてAMDチームの仕事を本当に評価する理由の一つは、このオープン性へのアプローチです。類推をすると、モバイルエコシステムを見てみると、率直に言って、それはそれほど面白くありません。

すみません、Andrewがそう言ったのではありません。私の間違いです。その理由の一つは、AndroidとiOSという2つのゲートキーパーがあり、彼らが特定のことを許可しない限り、特定のイノベーションや収益化イノベーションなどが単に許可されないからです。

AIにおける恐れの一つは、スタックのどこかの層でゲートキーパーの台頭があり、それが不公平な量の収益を奪い、率直に言ってイノベーションを阻害することでした。

オープンなエコシステムの価値

基盤モデル層では、オープンウェイトモデルをサポートすることが絶対に重要だったと思います。確実に、オープンソースを一掃しようと激しいロビー活動を行った企業たちを非難します。なぜなら、彼らの一部がゲートキーパーになれたら素晴らしかったでしょうから。その脅威は分散し、私たち全員、アプリケーション層にとって、その層がオープンであることを望んでいます。

スタックの他の層を見ると、半導体層は明らかにゲートキーパーが存在する可能性がある層だと思います。そして対照的に、非常にオープンなROCmエコシステムと、開発者が半導体の選択肢を持てることを確実にすることが、ゲートキーパーの出現を防ぐものだと思います。

それによってアプリケーション開発者が、イノベーションを許可してもらうために他の誰かから許可を得る必要に迫られることがなくなります。そのため、実際にLisa、Vamsi、ROCmチーム、そして本当により広範なAMDチームが行っている多くの仕事を私は本当に評価しています。

ありがとう、Andrew。そのようなオープン性によって影響を受けるアプリケーションの例について触れていただけますか?そして、Lisa、もしそれがオープンであれば、その下のインフラストラクチャがそれをどのようにサポートできるかについて触れていただけますか?

今現在、実際にはモバイルで非常に明確かもしれません。新しいキーボードを起動することはできません。新しいマップを起動することは非常に困難です。米国では新しい音声アシスタントを起動することはできません。モバイルのゲートキーパーのためです。これらのことを行うのは非常に困難です。

GenAIの世界はまだより若く、より初期段階にあると思います。そして、イノベーションを阻害することを選択するゲートキーパーは、ゲートキーパーがイノベーションを阻害する力を持っていないからです。これは良いことだったと思います。

例えば、ゲートキーパーが選択したために私たちの誰もモデルをファインチューンすることが許可されていなかったら、それは彼らのモデルの一部だけということになります。オープンなイノベーションエコシステムは本当に強力だと思います。

実際、最新のDeepSeekモデルがリリースされてから数日以内に、それがすでにQwenの上で蒸留されているのを見て本当に興味深く思いました。DeepSeekチームがそれを行ったと思いますが、それはDeepSeekとQwenという2つのオープンモデルが一緒に蒸留されて新しいモデルを形成したものです。

Llamaがリリースされたとき、一部の人々はコンテキスト長が短すぎると思い、そして一部の人々がより長いコンテキストウィンドウの新しいバージョンを再構成しました。

事前に座って変更を決定するのが非常に困難なことがたくさんあります。テキストのみのモデルを取って、画像も入力できるようにするなど。オープン性が基盤モデル層ですでに可能にしてきたことがたくさんあります。そして、半導体の相互運用性とカーネルサポートなどを持って、その次の層のイノベーションをサポートすることも含めて。これは私にとって本当に重要に感じられます。

インフラストラクチャとオープンソースの取り組み

実際、Andrew、私はあなたに完全に同意します。つまり、私たちは実際に、DeepSeekやLlamaを中心としたイノベーションの速さに本当に感銘を受けました。事実は、これらのモデルが多くのインフラストラクチャ上で動作し、私たちのチームが最適化するのが非常に簡単で、実際に最適化するのが非常に簡単だったということです。

そして率直に言って、人々は物事を移行していました。モデル自体を使用するか、その一部を取るかに関係なく、インフラストラクチャを本当に改善することができました。

インフラストラクチャの観点から私たちの立場では、時々オープンソース化することが実際に私たちにとって怖いと言わなければなりません。VamsiとAnushがそれを証明できるでしょう。なぜなら、それは完璧ではないからです。

完璧でないときの考えは、皆さん全員がそれを見て、「これは正しくない、あれも正しくない」と言うことです。そして率直に言って、オープンソースとオープンエコシステムの全体的なモデルは、私たちがそれを信頼することです。

完璧ではないかもしれませんが、私たちがそれをオープンにする意思があるという事実によって、それは異なる方法や異なる能力によって、はるかに速く、はるかに良くなるということです。

確かに、シリコン層では、私たちは可能な限り速く革新しなければなりません。それは非常に複雑です。しかし、上位層で行わなければならない作業量を可能な限り最小限にし、すぐに移植できるようにすることを確実にする点では。つまり、それが全体的なアイデアです。あなたが行うことに選択肢があるようにです。

私たちはそれに非常にコミットしています。そのエコシステムの構築を続けています。完璧ではありませんが、はるかに良くなっています。そしてオープンエコシステムの力によって、これまでに見てきた素晴らしい結果の一部として、MI350は比較的、内部的にどれだけのシステムがあるかをお話しできるなら、いくつかの主要なオープンエコシステムパートナーに提供しました。

パフォーマンスの点で非常にうまく機能している事実は、エコシステムがオープンであり、それを実行できることと大いに関係があると思います。ですから、これは私たちのインフラストラクチャの非常に重要な部分であり、それを構築し続けます。

素晴らしいです。ただ言わせてください、AMDは私にお金を払っていませんが、私の一部のワークフローがPyTorchで書かれており、AMDに移植されたことを発見しました。すべてと言えたらいいのですが、私がこれまでに行ったすべてがAMDにシームレスに移植されたとは言えませんが、私たちが試したときに基本的にコード変更なしで実行された大部分があります。

PyTorchの実装は常に機能するわけではありません。しかし、開発クラウドとAMD GPUにアクセスできる場合、AMDでそれらを実行してみることを認識している可能性があります。うまくいかないかもしれませんが、PyTorch層で実装してから、低価格パフォーマンス計算のためにAMDへのTCOを実行し、何をしたいか、したくないかを決定する場合、まともなチャンスがあると思います。

私たちは確実にあなたにお金を払っていませんが、私たちは非常に満足しています。お金を払うべきかもしれませんね。交渉中です。

しかし、あなたがここにいることを非常に嬉しく思っています。なぜなら、あなたはどのように機能すべきかについて非常に信頼性があるからです。それが機能すべきです。それが底線です。非常に簡単な移植であるべきです。

開発者の参加とエコシステムへの貢献

スタックのより多くの部分をオープンにするにつれて、聴衆の開発者はどのようにより関与すべきでしょうか?Andrew、あなたは人々がLlamaのコンテキストウィンドウを増やすことに非常に関与していると言及しました。例えば、そのモデル層で。しかし、下位層では、人々はどのようにより関与すべきでしょうか?

私たちの多くはスタックの多くの層で動作していると思います。ここにいる人々にとって、GPU近くのカーネル層で動作するのは少数派になると思います。オープンROCmエコシステムを本当に見て、よりオープンなものをサポートする方法として見ることは価値があると思います。

スタックの上位で作業しているチームにとって、率直に言って、私たちの大部分は気にする必要がなく、価格パフォーマンス計算を行い、最高の価格パフォーマンスを提供するコンピュートサービスにアクセスできることを望んでいます。

スタックのより高いレベルに触れると、アプリケーション層の機会は本当に素晴らしいと思います。過去数年間に起こった2つのことを考えています。

一つはAIビルディングブロックの台頭です。プロンプト、評価、RAG、ベクターデータベース、ガードレール、エージェンシーワークフローのツールです。これらのビルディングブロックは素晴らしく、現在これらのビルディングブロックを取って組み合わせて、2〜3年前には不可能だったアプリケーションを本当に迅速に構築することが可能になっています。

アプリケーション層を提供している皆さんにとって、コンピュートプロバイダーの上に構築されたこれらの素晴らしいビルディングブロックについて学んでください。

もう一つの興奮することは、AIアシスタントコーディングです。皆さんの多くと同様に、私はおそらくAIアシスタントなしでコーディングしたいと思うことは想像できません。

AIコーディングアシスタンスツールの進化は、私たちがすべてがそれほど速く進むと言うべきところですが、率直に言って、AIコーディングアシスタントのイノベーションのペースは、すでに非常に速いセクターで最も速いものの一つだと思います。

2〜3年前、GitHub Copilotがオートコンプリートの開拓で素晴らしい仕事をしました。そして、より洗練されたコードを書くエージェンティックワークフローであるWindsurfの世代が来ました。時々バグを導入しますが。

そして、さらにエージェンティックなAIコーディングアシスタンスの新しい世代があります。Claude Computerは約2年半前にリリースされ、過去2週間半で私は結構多く使っていることに気づきました。私のチーム メンバーもCursorで遊んでいます。

これらの高度にエージェンティックなAIワークフローは開発者の生産性に大きな向上をもたらし、CUDAからROCmへのコード変換やGPUポータビリティなどにも役立つと思います。

これらのトレンドの上に座っている開発者として、これはすでにレガシーソフトウェアの保守に役立っています。しかし、私が多くの時間を費やしているのは、率直に言って、クイックで汚いプロトタイプの構築です。

私のチームと一緒に多くのスタートアップを構築してきました。開発者としてアイデアを持ったとき、私や私のチームが午後に実装する多くのことがあり、数年前なら6人のエンジニアと3ヶ月かかったようなことがあります。

今、アイデアに興奮したとき、率直に言って、それを他の誰かに説明して実装してもらうよりも、自分で構築する方が時間がかからないことがわかります。

1日でプロトタイプを構築し、その夜遅くにユーザーフィードバックを得て、翌朝または次の反復後に次のイテレーションを行うという非常に速いイテレーションのペースを見るのは興味深いことでした。

以前は人々が多くの概念実証にアクセスして、まだ本番に移行していないものがあったのを見ます。なぜなら、努力を無駄にしたと感じたからです。しかし、それは実際に私を悩ませません。私がより焦点を当てているのは、概念実証のコストを非常に低く抑えることです。20のプロトタイプを構築し、18が静かに死んで、本当に価値のある2つを見つけるという代償でも。

本番に持っていきスケールしたい場合、それは素晴らしいトレードオフです。超高速プロトタイピングをメカニズムとして発明し、実際に何が機能するかを理解するために、スタートアップと大企業の両方でイノベーションプロセスが変化しているのを見ています。

アプリケーション層でのそれらすべては非常にエキサイティングだと思います。そして再び、この興奮が続き、私たち全員がゲートキーパーなしで革新し続けることを許可されることを確実にするために戻ってきます。技術層をオープンにすることは、このアプリケーションイノベーションをサポートし続ける重要な部分でしょう。

急速なプロトタイピングと学習文化

本当にその概念が好きです、Andrew。この迅速なプロトタイピングのアイデアは、私たちが早く失敗しながらも多くを学ぶということであり、そのスピードは私たちがやろうとしていることとまさに同じです。

ROCmの進化を見れば、1年前でも、私たちはハイパースケール環境により重点を置いていたと言うのは公正だと思います。たくさんのGPUを購入する大規模なラボです。私たちはそこでパートナーを通じて多くを学びました。

Microsoft、Meta、OpenAIなどとのパートナーシップを非常に感謝していますが、スタートアップコミュニティで起こっているイノベーションの速度とペースは信じられないほどであることも認識しました。

多くの人々、素晴らしいアイデア、高速学習というこの考えです。そのため、私たちは開発者の取り組みを、より迅速にものを出すというものに本当にシフトしました。Anushがこのプログラムを運営しています。2週間ごとに新しいトレーニングDocker、新しい推論Dockerを出しています。

それに対してかなりのテストを行いますが、明らかにすべてを正しく行うわけではありません。迅速なフィードバックを得て、そのフィードバックを次のリリースに確実に組み込むようにしています。率直に言って、そのスピードによって私たちははるかに速く学ぶことができます。

どのように関与するかというあなたの質問に戻ると、Andrewが言った2つの部分のこの概念は正確に正しいと実際に思います。皆さんの大部分にとって、私はあなた方にこのようなことを考えてほしくありません。これらのものは箱から出してすぐに機能すべきです。

PyTorchで実行しているか、これらのより高レベルなフレームワークを使用している場合、AMDで実行するだけです。パフォーマンスの最適化や新しいカーネルまたは何らかのカーネル最適化が必要な場合があります。

実際に、私たちはカーネルを書くためのAIのトレーニングを開始しており、それをより速く完了できるようにしています。実際、それはYoung Ladyがここで行うことの一つです。SharonとそのチームがAMDに参加するためです。

しかし、革新していて良いアイデアを持っている皆さんにとって、私たちはそのコードを取って、推論とトレーニングのDockerに直接組み込みます。それは、私たちのハードウェアで異なるユースケースを行っている多くの人々と得ることができる非常にポジティブなサイクルの種類です。

使いやすさのほぼ証明として、AI研究者がAMD GPU上で新しいアーキテクチャを作成してそれで実行したり、開発者がAMD GPUの上に新しいエージェントインターフェースを作成してそれをスケールアウトしたりするのを見ています。

雇用への影響とスキルアップの重要性

会話を少し、舞台裏で話していたこと、雇用とAIについて移したいと思います。Andrew、人々はこれが私が書いているコードの多くを自動化していると考えていると思います。そして私はコードを書くことに多くの時間を費やしています。では、それはどこに向かうのでしょうか?しかし、それが開く機会は何でしょうか?

今年の初めから昨年にかけて、AIがそれを自動化するのでコードを書くことを学ぶのをやめるように他人にアドバイスする人が何人かいました。私たちはそれをこれまでに与えられた最悪のキャリアアドバイスとして振り返ることになると思います。

何かが簡単になったとき、より多くの人がそれを行うべきです。より少ない人ではありません。世界がパンチカードからキーボードに移行したとき、コーディングが簡単になりました。より多くの人がそれを行いました。

アセンブリ言語からCOBOLに移行したとき、COBOLプログラミングがとても簡単になったので、もうプログラマーは必要ないと言う記事が実際にありました。しかし、逆のことが起こりました

AI支援コーディングを持っている今、もっと多くの人がコーディングをすべきだと思います。そしてカスタムソフトウェアの需要には実際的な上限がないと思います。ソフトウェアエンジニアリングのコストが下がると、それは下がり、世界により多くの素晴らしいソフトウェアが出てきます。

しかし、ソフトウェアエンジニアリングは変化しています。新卒の大学生がもっと経験豊富なエンジニアを上回るという固定観念があります。率直に言って、私が見ていることを正直に言わせてください。

AIを本当に使いこなしている新卒の大学生が、GenAI以前の2022年のやり方をまだ行っている10年の経験を持つフルスタックエンジニアを上回ることは事実です。

しかし、あまり評価されていない他の部分は、私が知っている最高のエンジニアは新卒の大学生ではないということです。新卒の大学生に悪気はありませんが、彼らは実際にはアーキテクチャとコンピュータの考え方の概念的フレームワークを深く理解し、さらにAIとAIスキルを使いこなしている非常に経験豊富なエンジニアです。

不安の源の一つは、新卒のCS学生の就職困難の増加でした。そして本当に不幸なことの一つは、多くの企業が十分なスキルを見つけることができないということです。

GenAIアプリケーション開発者、コーディングアシスタントの使い方を知っている人々、私が言及したビルディングブロックを使って本当に価値のあるアプリケーションを本当に迅速に構築する方法を知っている人々。私たちはそのような人々を十分に見つけることができません。

しかし、教育システムの多く、特に大学のカリキュラムは更新が遅すぎる傾向があります。まだ非常に需要が高く、企業が十分に得ることができないこれらの仕事のために人々を訓練していません。

将来、私たちははるかに多くのソフトウェアが書かれる必要があると思います。しかし、開発者だけでなく、率直に言って非開発者にも、これらのツールを使ってはるかに生産的になる方法を教える大きなスキルアップの課題があります。

AMDの観点から言うと、私たちは非常に多くの人を雇っています。そして私たちはどこでもAIを使用しています。ハードウェア作業全体、ソフトウェア作業全体、営業、マーケティング、HR、これらすべての場所でAIを使用しています。

しかし、事実は私たちがまだより多くを必要としているということです。ですから、AIがこれらすべての仕事を何らかの形で置き換えるという考えは、私は単純に真実ではないと思います。私たちにとって、本当の商は製品をより早く市場に出すことです。率直に言って、それが目標です。

3年のプロジェクトを6ヶ月で行うことができれば、それは信じられない価値があります。私たちは必ずしもそれをすべて行うことはできませんが、確実にパイプラインを広げ、はるかに多くを行うことができます。

より多くのAIを使用するほど、より能力があり生産的になり、エンジニアリングの観点からより多くを得ることができるということは、確実に私の哲学です。

この継続教育のアイデア、Andrew、私は本当にあなたがCoursera上で行っていることの多くの点で、学校に行って学習を停めるのではないという全体的な概念を感謝しています。実際に毎日学習し、異なる方法で学習します。仕事で学習し、コースを通じて学習し、率直に言って、このようなフォーラムを通じて学習します。

それが鍵だと思います。つまり、重要なことは、この学習のペースを保つ必要があるということです。そしてそれこそがAIが実際に助けることです。はるかに速く学ぶことです。

開発者への行動要請

お二人とも本当に素晴らしい視点、本当に強い視点を共有してくださいました。聴衆は何を持ち帰るべきでしょうか?少しまとめると、開発者として聴衆は何をセッションから持ち帰るべきでしょうか?皆さん一人一人への行動要請は何でしょうか?

私にとって、最も重要な人生の教訓の一つは、あなたはただものを作ることが許されているということです。誰かを傷つけてはいけません。損害を与えてはいけません。しかし、人や物に損害を与えない限り、ただものを作るのです。

今日の世界では、AI支援コーディングツールと本当に素晴らしいAIビルディングブロックによって、個人ができること、実装できることの数が爆発的に増加しています。

ですから、これはものを作って構築する素晴らしい時代だと思います。誰かを傷つけない限り、他の誰の情報も必要ありません。他の誰かがあなたのアイデアが良いものだと思う必要もありません。ただ行ってものを構築するのです。

そして、もし構築したものがダメなら、とにかく構築してください。あなたが学んだと思う教訓を学び、その中で開発者を必要としないサブセットで、そして他の何かを構築しに行ってください。

私の最高のプロジェクトの多く、率直に言って、Courseraを含めて、実際にはサイドプロジェクトのような感じで、スタンフォードの教授として、誰も気にしなかったオンライン教育のことで時間を費やすことが許されているのかと感じました。しかし、私は家でそれを構築したいと思いました。

シリコンバレー全体で私が見てきた最高のプロジェクトの多くは、誰かが許可を求めずに責任を持って行い、何かを構築したこれらの奇妙なものでした。多くの場合、開発者が必要ですが、そうであっても、あなたはまだ学びます。そして時々、あなたは本当に素晴らしい何かを構築する人になるかもしれません。

ですから、素晴らしいものを構築するのがこれまで以上に簡単だと言いたいと思います。ただ行って構築、構築、構築してください。

それは素晴らしいです。そして私は本当にシンプルになります。Andrewが言ったこと、構築、構築、構築を取って、AMDで構築してください。ただ私たちにチャンスを与えてください。

そして私が本当に言いたいのは、開発者が私たちがROCmで行おうとしていることの本当に中心だと言うとき、私たちは本当にそれを意味しているということです。

そしてそれは、AMDは非常に学習文化です。私たちはAIの非常に初期段階にいることを理解しています。過去数年間に多くのことが起こったとしても、次の5年間または次の10年間がどのようになるかを想像してみてください。私たちはまさに始まりにいて、このエコシステムにいます。

私たちは未来に何が起こるかについてのページを書くチャンスがあります。それは素晴らしい場所にいることです。ですから、私たちはその中であなたのパートナーになりたいと思っています。私たちはそれのイネーブラーになりたいと思っています。そして、私たちはあなたから学び、あなたも学ぶのを本当に助けたいと思っています。

ですから、今日私たちと時間を過ごしてくださってありがとうございます。司会をしてくださったSharonに感謝します。参加してくださったAndrewに感謝します。そして、私たちが一緒にできる素晴らしいことがたくさんあると思います。

はい。お二人ともありがとうございました。温かい拍手でお迎えください。ありがとうございました。ありがとうございました。ありがとうございました。

コメント

タイトルとURLをコピーしました