
6,889 文字

アンスロピックの共同創業者兼CEOであるダリオをお迎えできることを嬉しく思います。私たちは少し似た者同士かなと思っています。物理学の博士課程で共通の背景を持ちながら、起業家精神を持って、それぞれの分野に破壊的な方法でアプローチしようとしていますが、それは最大限のポジティブな影響を与え、害を減らす方法で行っています。あなたはAIに、私は宇宙に焦点を当てていますが、似たような姿勢です。特に今日ここにいることを嬉しく思うのは、私たちのパートナーシップを発表するからです。これについてはすぐに詳しく話しましょう。ダリオ、ようこそ。
ありがとうございます。このパートナーシップを楽しみにしています。
まずはAIの応用について少し話したいと思います。誰もがAGI(汎用人工知能)について話していて、それは当然流行していますが、AIが意味のある進展をもたらす可能性のある世界最大の課題は何だと思いますか?そしてアンスロピックはそれらを進めるためにどのような戦略を持っていますか?
AIは汎用技術であり、生物学から多くのことに至るまで様々な応用があります。私は特に生物学に興味があります。以前は生物物理学者だったので。ヘルスケアや科学の発展の可能性に非常に興味があります。そして私たちの協力関係では、地球をより良く理解することができます。これは多くの科学的応用があるだけでなく、私たちの惑星の状態を改善し、それを管理する能力も向上させます。
課題についてですが、モデル自体の開発ももちろん科学であり、多くの作業が必要です。しかし、実際にモデルを応用したい場合、基本的なモデルとその下流のアプリケーションの間のアダプターを作成するには、多くの場合、企業同士の協力が必要です。私たちはこの汎用技術であらゆる産業にサービスを提供しようとしていますので、世界の一部を私たちよりもはるかに理解している企業とパートナーシップを結ぶことが重要です。
私たちが一緒に何かを行うことが重要なのは、私たちだけではできなかったことをできるようにするためです。私たちはAIを理解していますが、必ずしも私たちのモデルのすべての意味や、それが得意なことやできることをすべて理解しているわけではありません。高いレベルではそれが最大の課題の一つだと思います。
一般的に、今日のAI開発を制限しているのは何でしょうか?計算能力、人材、データ、アルゴリズムなど、どこがボトルネックになっていますか?
データは本当に興味深いポイントです。一般的なデータに関しては周りにたくさんあります。基本的にインターネット全体をスクレイピングすることができています。また、最近の推論モデルのような新しいクラスのモデルはデータへの依存が少なくなっています。
データが本当に重要で価値があるのは、特定のドメインでタスクを実行しようとする場合、そのドメインから最高のパフォーマンスを引き出すことです。インターネットを読むだけでは学べないことがあります。
私たちの共同パートナーシップはその好例かもしれません。私たちのモデルClaudeはインターネット上のあらゆる種類の画像を見ることで画像分析の訓練を受けてきましたが、その中で衛星データや地理空間データである画像の割合はごくわずかです。一方で、あなたたちはそのようなデータを膨大に持っています。
私たちが訓練した一般的なモデルは役立ちますが、はるかに進んだ状態から始めることができます。モデルはすでに素晴らしいことを最初からできますが、通常の画像分析とは少し似ているけれど少し異なるこのタスクにおいて、モデルがより良くなる可能性ははるかに大きいです。
特定のアプリケーション用にファインチューニングされたこの特殊なデータには大きな価値があると思います。
その通りです。それでは宇宙と地球のアプリケーションに少し移りましょう。宇宙では革命が起きています。人々は低コストのロケットや増加する衛星群について知らないかもしれませんが、過去5年から10年で衛星のコストパフォーマンスは1000倍向上しました。これはメインフレームコンピュータからデスクトップコンピュータへの移行のようなものです。
もちろん、多くのアプリケーションが生まれていますが、大きな成果は地球についての新しいデータセットまたは地球周辺の新しい通信データです。いずれにせよ、それはデータに関するものです。私たちプラネット社だけで、毎日4700万画素の画像を400万枚生成して地球全体をスキャンしています。それは膨大なデータです。
LLMがウェブ上のデータと意味的にインターフェースする方法を理解したように、同様にすべてのこれらの画像とのインターフェースを想像できます。私はそれを「ビジョンでクエリ可能な地球」または「検索可能な地球」と呼んでいます。AIと宇宙の相互作用におけるどのようなビジョンがあなたを興奮させますか?これが一つですが、他に思いつくものはありますか?
そのビジョンはかなり興奮させるものだと思います。テキストの分野では、このような検索可能または要約可能、または検索というものがたくさん行われてきました。顧客の多くは、データをより良く見つけ、要約し、検索する方法をビジネスモデルとしている企業です。基本的な検索エンジンよりもうまくできる方法です。しかし、それはすべてテキストでした。
あなたが指摘するように、原則的には同じことが画像でも同様にうまくできるはずです。インターネットのコンテキストでは、もちろんインターネット検索をしたいと思いますが、実際には、衛星データや宇宙のようなユースケースがあって初めて、画像に対して同じような検索可能なことを行うということが実現します。テキストに関してはこれが長い間私たちのビジネスモデルの中核部分でした。
もっと高度なタイプのものが出てくると思います。動画を分析したり、もっと多くの価値が生み出せると思います。しかし、特定のものを多数の画像から検索するというこのアイデアは、私は宇宙と衛星の専門家ではありませんが、このユースケースはその能力に完璧に適していると感じます。
その通りです。持続可能性や気候関連、嵐の後の被害評価などで関心のある変化を広い地域でスキャンしたり、素早く定量化したり分析したりできるでしょう。すでにいくつかの興味深い結果が見られています。
もう一つの領域は予測分析です。LLMが次のトークンを予測するのと同じように、地球の陸地の各地点につき2,500枚の画像があるので、次のトークン、つまり次の画像を予測することができるかもしれません。次の洪水、次の森林伐採、次の難民キャンプがどこになるかを予測できるかもしれません。それを可能性として見ていますか?予測分析はどこに向かうのでしょうか?
それはかなり価値があると思います。今日すでに最初からモデルに多くの画像を見せて、次に何が起こると思うか聞くことができます。多くの場合、別の画像を生成する必要さえありません。言葉で物事がどこに向かっているか、次に何が起こると思うかを記述できます。
そこには大きな機会があると思います。他の分野で私たちがやっていることとの類似点があります。科学的応用には予測が含まれることが多く、科学のためのLLMの使用に非常に興奮しています。その予測活動は基本的に同じものです。
医療用途のためのLLMにも興奮しています。医学の多くは診断や予後など予測に関するものです。LLMは金融でも広く使われるでしょう。それは確実に予測に関するものです。もしより正確に予測できれば、金融の世界では非常に成功することができます。
これがうまく機能する先例はたくさんあります。まだ試してみる初期段階ですが、さまざまな業界でのユースケースを見た限りでは非常に楽観的です。
それでは具体的に私たちのパートナーシップについて話しましょう。本日、プラネットとアンスロピックのパートナーシップを発表できることを嬉しく思います。特に、Claudeが最初から2つのことができることに感銘を受けました。一つは私たちのAPIをプログラムしてそれをより簡単にすることです。二つ目は、時間をかけて私たちの画像のスタックを分析することです。
例えば、アマゾンの森林地域の森林伐採を少し見せると、何が起きているかを正確に説明し、考えられる原因を示し、次に何が起こりそうか、その結果は何かについて少し推論し、さらに森林伐採率や土地利用変化の推定も行い、グラフ化することもできました。非常に感銘を受けました。
あなたが言うように、まだ衛星画像をあまり見ていないので、パートナーシップの大きな側面は、まずモデルをプラネットのデータでファインチューニングし、以前よりも衛星画像についてより賢くすることです。このパートナーシップについてあなたを興奮させるものは何ですか?そして次にどこに向かうでしょうか?
結果を見たときに私を最も興奮させたのは、すでに出来上がったものの良さではなく、衛星データでトレーニングされたときにどれだけ良くなるかということでした。実際、私たちがClaudeをトレーニングする典型的な画像データは衛星データとはかなり異なります。衛星データは、私たちが行うトレーニングの種類からかなり分布が外れています。
おそらく平均的な画像はインターネット上の猫の写真のようなものでしょう。ですから、それが意味するのは、このパートナーシップには大きな可能性があるということです。もし分布から外れていて、そのものが最初から良くできていて、その上に大きな利益が得られることが分かれば、それは非常に有望だと思いました。この分野で得られる利益の大きさについて非常に興奮しています。
もちろん、モデルのファインチューニングは最初のステップに過ぎません。最終的には、衛星データのために特別に構築された大規模なモデルが、その理解の本体にそれを取り込むことを想像できます。
ファインチューニングはスペクトルの上に存在します。元のトレーニングした画像の数に匹敵する数の画像でファインチューニングすることを考えると、AIに長く取り組んできた経験から言えば、最初から一般的なシステムがかなりうまく機能していて、少し異なる分布の上に大規模なデータソースがあり、構造がたくさんある場合、非常に良いものを得る可能性は高いという直感があります。
最後にいくつか質問します。一つは、私たちは両方とも公益法人(パブリックベネフィットコーポレーション)ですが、なぜアンスロピックをそのように設立したのですか?
AIの影響について考えるとき、私はAI分野に10年以上、2025年になったばかりなので11年になりますが、最初から、私や他の共同創業者がこの技術が社会を変える可能性を理解したとき、主にポジティブな方法でですが、潜在的なネガティブな方法、リスクもあります。
技術開発における責任の側面を優先することを確実にすることが非常に重要でした。それは明らかであり、私たちは「責任あるスケーリング計画」と呼ばれるものを構築しました。それは技術開発のあらゆる段階をどのように管理するかを示すものです。私たちはそれを非常に真剣に受け止めています。RSP(責任あるスケーリング計画)は会社全体で実施され、製品要件として見なされています。
投資家や関わる人全員に「これが私たちの働き方です」と常に言えることは重要です。単に自分自身を公益法人と宣言することは、法的にどのように変わるのかという点では十分ではありません。それはむしろ、あなたの行動意図、分野の重要性、あなたが持っている責任についてどのように考えているかのシグナルです。あなたたちも同じ姿勢を持っているようです。
全くその通りです。それは取締役の信託義務を変えるので、実際に何か実質的なものがあります。
AIと、私たちが気にしている気候と環境の相互作用に関する問題に触れましょう。もちろん、AIには気候と環境に対する潜在的な大きな利点があります。データセンターの効率向上、天気予報、さらには核融合の支援など、実際にはっきりとそれがどのように進展させることができるかが見えます。
一方で面白いことに、通常、効率の向上は実際の使用量を減らすためには使われません。私たちはすでに惑星の境界に達しています。AIは一般的に加速剤であり、したがって情報だけでなく物質の使用も加速する可能性があります。
そのため、これらの惑星の境界を突破することを加速する可能性があるという課題があります。それをどのように調整すると考えていますか?技術は素晴らしいですが、速いペースで問題を引き起こす可能性もあります。
私がこれについて考える方法は、AI全般の責任について考える方法と同じです。AIにはすべてのこれらの一般的な能力があるということは、それが良いことにも悪いことにも使用できるということです。サイバードメインでは、例えば、攻撃にも防御の強化にも使用できます。生物学的な世界でも同じことが言えます。多くの異なるアプリケーションでも同様です。
私たちがものを適用する順序は非常に重要だと思います。環境と気候変動のためのこのバージョンは、AIを使用してより良い気候モデリングを行うことができるということです。これは私たちの起業家としての選択です。どこに焦点を当てるか。基本的に、これらのアプリケーションはすべて起こりますが、どれを優先し、先に実現させるかは私たちの選択です。
あなたが指摘しているのは、それを解釈する方法として、もし私たちが間違った方法でことを行えば、様々な分野で、気候はその一つですが、事態を悪化させる可能性があるということです。しかし、正しい方法で正しい順序で行えば、間違いなく物事をずっと良くする可能性があります。それが、私たちがこの公益構造を構築したもう一つの理由であり、これらの選択をする自由があるのです。
未来志向の話で終わりたいと思います。次の10年間で3つの意味のある、おそらくセルニック的な瞬間(訳注: 人間の認識を根本的に変えるような重大な転換点)が重なる可能性があると考えています。一つはもちろんAGIですが、もう一つは地球外の生命を発見する可能性が非常に高いということです。さらにもう一つは、AIの助けを借りてクジラやチンパンジーなど特定の種の間の会話を解読する可能性です。
これらはすべて、人間が人間中心主義から離れて考えるようになる「中心からの逸脱」の瞬間です。これらがどのように一緒になっていくと思いますか?他の2つにも興味がありますか?どのように展開すると思いますか?
2番目のものはかなり興味深いです。AIが大いに役立つ可能性があると思います。AIシステムを訓練して次の単語を予測するとき、それらはほとんど事前知識を持っていません。そのアーキテクチャは非常に一般的で、言語を理解するように構造化されていません。
言語学者は人間の脳が言語に特化して構造化されているかどうかについて議論していますが、トランスフォーマーアーキテクチャは非常に一般的なので、そうではないと自信を持って言えます。にもかかわらず、人間の言語をとてもよく学ぶことができます。
動物が互いに話すときのコミュニケーションのパターンを見ると、私たちが知らないことがたくさんありますが、少なくともいくつかの動物、例えばクジラやイルカのコミュニケーションにはかなりの複雑さがあることを示唆するものが十分にあります。
これらのコミュニケーションのパターンでAIシステムを訓練できれば、それらを理解できるようになるという予測が強いです。AIシステムは一般的なパターン学習者であり、パターン認識者です。人間の言語を学べるなら、おそらくこれらの動物についても何かを解読できるでしょう。
おそらくこれにより、動物と話すことができる合成信号を生成することができるかもしれません。素晴らしいですね。そして私たちの共感の輪を少し広げて、彼らをより価値あるものとして考えるようになるかもしれません。イルカやクジラは互いに何を言っているのでしょうか?まだわかりませんが、おそらく私たちは知ることになるでしょう。
それから2番目の、他の惑星での生命について。すべてのSF(サイエンスフィクション)ファンと同様に私もこれに興奮しています。これが私たちが発見することになるものであれば確かに嬉しいです。
AIとの交差点については、再び、非常に大量のデータを解釈する能力があります。他の惑星での生命を探す際、近くから探すか遠くから探すかにかかわらず、膨大な量のデータを選別する必要があり、正確に何を探しているのかわからないかもしれません。ここでもAIとの相乗効果を想像できます。
そのノートで、ダリオ、参加してくれてありがとう。
こちらこそありがとうございました。


コメント