
4,011 文字

昨日、ニューヨーク・タイムズが人工汎用知能を作ることができるという考えに対する、本質的に批判記事を発表しました。「シリコンバレーの捉えどころのない幻想」というタイトルです。私はほとんどメディア記事への直接的な反応を書くことはありません。一般的にそれは生産的ではないと思うからです。
しかし今回は、その新聞の影響力と、特に私に連絡を取ってきてAIが革新できるという考えに本質的に異議を唱えた多くの人々のために、これを取り上げる必要があります。過去24か月の進歩が重要ではなかったという考えを封印する必要があります。
私は特にその記事を解剖することではなく、最近のAIが実に幅広い分野で可能にした事実上の進歩について話すことで、これを行うつもりです。これらのうちいくつかはご存知かもしれませんが、すべてを知っているということはないでしょう。それでは、ここでかなり多くの例を取り上げていきます。時間内に終わるよう、かなり迅速に進めます。
まず第一に、Googleは人間が今まで書いたことのないソートアルゴリズムを発見したAlphaDevという強化学習エージェントを訓練しました。短いシーケンスで最大70%速い新しいルーチンを作成し、主流のC++ツールチェーンに組み込むことができます。
第二に、MIT研究者が6,000の化学構造を深層学習AIモデルに入力したところ、彼らがAlisonと名付けた予期しない分子が浮上しました。実験室での試験により、それは既存の薬物が効かない複数の病原体を殺すことが示され、純粋にAI探索によって発見された全く新しい抗生物質クラスを開拓しています。
第三に、AlphaFoldモデルは2億の完全なタンパク質構造を予測しており、その多くは実験データを全く欠いていました。オープンデータベースはすでにマラリアワクチン設計を加速し、抗体工学を加速しており、ウェットラボ環境での何百年もの作業に相当する数億の研究年を節約したと考えられています。
DeepMindのGnomeシステムは、グラフニューラルネットワークを使用して220万の結晶性化合物を生成し、そのうち38万が安定していると予測されています。ローレンス・バークレー研究所は、これらの真新しい化合物のうち41を自律的に迅速に合成することができ、AIが発明し、研究室が人間が想像しなかった材料を作ることができることを検証しました。
IBM研究所は、大規模生成モデルと物理シミュレーターを結合して、高忠実度のバッテリーデジタルツインを作成しています。なぜこれが必要なのかと思うかもしれませんが、これによってカソードと電解質を設計するための反復サイクルを大幅に短縮できます。そして科学者たちが従来の実験室のみのワークフローではアクセスできなかった方法でバッテリーの化学を探求することを可能にします。
NASAゴダード宇宙飛行センターのエンジニアたちは、進化設計ソフトウェアを使用して、より軽く、より強く、数か月ではなく数週間で配送される、エイリアンのようなチタニウムマウントを成長させました。その形状は非常に新しく、エンジニアたち自身がAI主導の探索なしには思いつかなかっただろうと言っています。
科学分野でのこれらの各ケースは、パターンマッチングを超えています。システムはスパースラベル付きの巨大な解空間を検索し、最高の人間のベンチマークを上回るアーティファクトを生産しています。これらはただの統計的オウムではありません。これはニューヨーク・タイムズが枠組みとして使用しているものです。
これらは人間にはない方法での創造性のエンジンです。人間の直感を超える、非常に大きなデータセットでのコンピュートを活用することで組み合わせ的創造性を使用しています。これは「AIは革新できない」というような、ソースが乏しい包括的な主張を反証しています。私は技術に制限がないと言う最後の人です。ここでそのことについて話します。
AIには偏見の問題があります。AIには脆弱性の問題があります。AIはデータに対して本当に貪欲です。これらは現実的な制約です。しかし革新の能力は、この時点で証明された事実です。メディアの物語が人々を混乱させ続けるのを見るのは本当に苛立たしいことです。
私は科学だけにとどまりません。AIは本当に生産性の向上をもたらしたのかと思うかもしれません。これはニューヨーク・タイムズがもたらしていないと主張していることです。UPSのルート最適化エンジンは機械学習を使用して毎朝55,000の運転手の停車地を計画しています。Amazonも内部で似たようなものを持っています。そしてUPSは、彼らの会社が今やAIのおかげで毎年1億マイルと1000万ガロンの燃料を節約していると報告しています。
システムが画像、音声、テキストを一緒に理解できないという主張は、まさにChatGPT-4oが行っていることであり、しばらくの間行ってきたことです。モデルはカメラ付き携帯電話からボード上の手書きの数学問題を識別し、ユーザーにそれを説明し、自然に応答することができます。私自身、コードを指し示してそれについて話すコードでそれを使用したことがあります。これはまさにタイムズができないと主張していることです。
現在のモデルは深刻な推論タスクで人間に匹敵しないというのも私が聞く別の主張です。見てください、それは持ちこたえないでしょう。どんなバーでも選ぶことができます。文字通り統一司法試験がその一つです。古いモデルであるChatGPT-4は、その司法試験で90%のスコアを取りました。o3はさらに良い成績を収めています。正直に言うと、o3が私よりも賢く感じる日もあります。
AIは具体的な医学的ブレークスルーを生み出していないという別の主張があります。私たちはそれについて話しました。抗生物質について話しました。私がブレークスルーだと思う別のものは、ベッドサイドマナーです。多くの研究は、診断がより正確であり、AIではベッドサイドマナーがより良いことを示しています。時々AIだけで、医師とではなく、なぜなら彼らは医師のみ、AIのみ、医師とAIをテストするからです。多くの場合、これらのモデルがまだピアレビューされる必要があるためChatGPT-4だけかもしれないAIが、医師よりも良い成績を収めることがよくあります。
AIは新しい物理的タスクを学習していないということは、ただ真実ではありません。私たちはロボット工学で本当のブレークスルーを得ています。冷蔵庫を梱包するロボットや、ボトルキャップを外すロボット、明示的に訓練されたことのないお弁当箱を梱包するロボットの動画を見たことがなければ、それらを調べてみてください。それは本物です。実際、多くの異なるロボット工学企業がこれを行っています。率直に言って、中国はおそらくこの分野で私たちより先を行っています。
AIが障害を持つユーザーのアクセシビリティを改善していないという主張について、私は障害を持つ友人たちがAIを毎日ハックとして使用していることを知っています。そして迅速に来ている例として、Appleが実際にMac用の拡大鏡を発売予定であることをご存知ですか。携帯電話をラップトップに固定すると、部屋のどの部分でも文字通り拡大します。
低視力ユーザーは、見ている部屋のどの部分でもMacにパイプして、実際にサイズを増加させ、望むように使用できます。率直に言って、ChatGPTでも今それができます。これはただのAIではなく、Macの機能だけではありません。これはAIのことです。携帯電話でChatGPTを使って歩き回り、カメラを使って見て会話することができます。
ライブ翻訳でそれができます。ニューヨーク・タイムズが主張している統計的オウムは、ライブ翻訳機能を持っていませんが、人々は今ChatGPTを使って言語間でライブ翻訳しています。
疑問視や懐疑主義が場違いではないということではありません。AIに対して本当に厳しい質問をするのは正しいことです。しかし私は、より質の高い質問をすることを好みます。AIの進歩について私たちが知っていることを考慮して合理的な質問を。
例えば、なぜAIは他の分野よりも科学分野で進歩を遂げるのがはるかに簡単なのでしょうか。ちなみに、答えはおそらく正確性が証明可能なもので、LLMは根本的に機械学習の一分野であり、機械学習は正確に証明可能な解決策でより良い成績を収めるからだと思います。なぜならそれから強化学習を推進できるからです。
これらの実際の質問には実際の答えがあります。答えるのが困難な他の質問もあります。モデルがデータにますます貪欲になるにつれて、継続的なデータ可用性をどう扱うかなど。これらのモデルが職場に入ってくるにつれて、仕事とスタートアップのダイナミクスがどう変化するかをどう理解するかなど。これらは実際の質問です。
私はそれらについて多く話します。詳細に検討する価値があると思いますし、この時点で事実的に間違っている使い古された主張を繰り返すよりも、はるかにコラムのインチ数に値すると思います。私のメールボックスに誤情報を送り込まないメディアでの会話を本当に、本当に望んでいます。
正当に混乱している人々が私に連絡を取って「ねえ、ネイト、説明してもらえますか?AIが革新的だとあなたが言ったと思ったのに、このメディア出版物がそうではないと言っているのを見たのですが」と言ってくるのにうんざりしています。それは混乱しています。完全に理解できます。あなたが混乱するのは。それは彼らのせいではありません。これについてより責任を持つのはメディアの責任です。AIが革新的であるという考えを真剣に受け止める必要があります。


コメント