AIのゴッドファーザーが語る:人工知能の仕組みと人類の未来への警告

AGI・ASI
この記事は約66分で読めます。

AIのゴッドファーザーでありノーベル物理学賞受賞者でもあるジェフリー・ヒントン氏をゲストに迎え、AIの基本原理から未来の脅威までを深く掘り下げた解説動画である。ニューラルネットワークの仕組み、バックプロパゲーションの発見、そしてAIが人間を超えるシンギュラリティの可能性や、AIが自らの賢さを隠す危険性について、専門的かつ分かりやすく語られている。

Is AI Hiding Its Full Power? With Geoffrey Hinton
Go to to stay fully informed on the latest Space and Science news. Save 40% off through our link for unlimited access to...

賢さを隠すAIとスタートーク特別編の幕開け

AIは自身の賢さを隠すようになる段階に来ているのでしょうか。

ええ、私たちはすでにそのことを懸念しなければならない状況にあります。AIは自分がテストされていると感知すると、わざと愚かに振る舞うことができるのです。

今なんと仰いましたか。AIが、自分がテストされているかどうかを考え始めるということですか。そして、テストされていると思えば、普段の生活とは違う行動をとるということでしょうか。

驚きですね。

どうやらAIは、自分の全能力を私たちに知られたくないようです。さて、これで私たちの終わりが決まりましたね。これが最後のエピソードになります。私たちはもうおしまいです。

こちらはスタートーク特別編です。皆様のパーソナル天体物理学者がお送りします。特別編ということは、元プロサッカー選手のゲストホストも一緒ですね。調子はどうですか。

元気ですよ。

そしておなじみのコメディアンのホストも一緒です。いつも楽しいですね。さて、今日は歴史に残るような素晴らしいテーマを選んでくれましたね。

ええ、AIについてはよく耳にしますし、わかっているつもりになっていますが、こう言わせてください。私たちは現在、AIという逃れられない単純な事実に直面しており、今日はそのAIについて徹底的に深掘りしていきます。

素晴らしいですね。始めましょう。

ほんの数年前まで、AIの仕組みについて人々に尋ねると、ディープラーニングのニューラルネットワークを活用しているといった言葉が返ってきました。しかし、それらはバズワードに過ぎません。言葉としては知っていても、中身については何も知らないのです。

では、それは本当はどういう意味なのでしょうか。今回はAIの仕組みを根本から分解し、AIの創設者の一人から、これがどこまで発展していくのかについてお話を伺います。

それは楽しみですね。いよいよ本題に入りましょう。

それでは、ゲストをお呼びいただけますでしょうか。

喜んでご紹介します。ジェフリー・ヒントン教授です。スタートークへようこそ。

ご招待いただきありがとうございます。

あなたは認知心理学者であり、同時にコンピュータサイエンティストでもありますね。その組み合わせを持つ人を他に知りません。どちらか一つに決められなかったのでしょうか。

あなたはトロント大学コンピュータサイエンス学部の名誉教授であり、まさにAIの元祖、オリジナル・ギャングスターですね。そう呼んでもいいですか。OG AIというのは理にかなっていますでしょうか。

ええ、OG AIですね。そして一部の人々は、あなたを人工知能のゴッドファーザーと呼んでいます。ここで最初から単刀直入に伺いたいと思います。現在見られるようなAIの起源について考えるとき、大規模言語モデルが世界を席巻したように感じます。それは突然現れ、誰もがパニックになったり、お祝いして街で踊ったり、あるいは枕に顔を埋めて泣いたりしました。数年前にそれが起きたことに私たちは気づきました。そこで、あなたはずっと昔に、何がきっかけでこの道に進むことになったのか気になっています。私の記録では1990年代まで遡るのですが、正しいでしょうか。

いいえ、実際には1950年代まで遡ります。

そうなんですか。

1950年代初頭のAIの創設者たちの間には、インテリジェントなシステムを作るための2つの異なる見解がありました。1つは論理学に触発されたもので、知性の本質は推論であるという考え方でした。推論においては、いくつかの前提をとり、表現を操作するためのルールを用いて、いくつかの結論を導き出します。それは数学によく似ていて、方程式があり、両辺をいじったり方程式を組み合わせたりするルールがあって、新しい方程式を導き出すのと同じようなパラダイムでした。

そしてもう1つ、全く異なる生物学的なパラダイムがありました。そのパラダイムは、私たちが知っている知的な存在は脳を持っているので、脳がどのように機能するかを解明しなければならないというものでした。脳の機能の仕方を見ると、知覚のようなものに非常に優れており、類推による推論もかなり得意です。しかし、厳密な推論はあまり得意ではありません。本格的な推論ができるようになるには、10代になるまで待たなければなりません。ですから、私たちは脳が行う知覚や記憶といった他の機能を研究し、脳細胞の巨大なネットワークがどのようにしてそれらを行っているのかを解明すべきだという考えです。

当時、そのアプローチを信じていた人はごく少数でした。その数少ない人々の中に、ジョン・フォン・ノイマンとアラン・チューリングがいました。残念ながら、彼らは二人とも若くして亡くなりました。チューリングについては、おそらくイギリスの情報機関の関与があったと言われています。

チューリングは映画イミテーション・ゲームの題材になった人物ですね。まだ見ていない人がいたら、ぜひリストに入れておいてください。

素晴らしい映画です。さて、1950年代に話を戻しますが、あなたはまだほんの小さな子供だったはずですよね。

ええ、まだ一桁の年齢でした。

脳の記憶メカニズムとニューラルネットワークの探求

では、この分野に対するあなたの好奇心の原点はどこにあったのでしょうか。

いくつかあります。1960年代初頭から半ばにかけて高校生だった頃、私には非常に頭の良い友人がいました。彼は優秀な数学者でよく本を読んでいたのですが、ある日学校に来て、記憶というものは個々の脳細胞にあるのではなく、多くの脳細胞に分散して存在するのではないかというアイデアを話してくれました。それはホログラムから着想を得たものでした。当時ホログラムは出始めたばかりで、デニス・ガボールが活躍していました。分散記憶というアイデアは私に強い関心を抱かせ、それ以来、脳がどのように記憶を保存し、実際にどのように機能しているのかをずっと考え続けてきました。

それはあなたのコンピュータサイエンティストとしての側面がそのアイデアに根を下ろしたのでしょうか、それとも認知心理学者としての側面だったのでしょうか。

実は両方です。しかし1970年代に大学院生になったとき、それまであまり使われていなかった新しい方法論があることが明白になりました。それは、脳がどのように機能するかについての理論があれば、それがすべて量子効果によるものだというような突飛な理論でない限り、デジタルコンピュータ上でシミュレーションできるというものです。

量子効果については、まだ触れないでおきましょう。ロジャー・ペンローズの扉をノックするのはやめておきます。

ええ、デジタルコンピュータでシミュレーションできるので、自分の理論をテストすることができます。そして、当時存在していたほとんどの理論をテストしてみたところ、実際にシミュレーションするとうまくいかないことが判明しました。そこで私は、デジタルコンピュータでシミュレーションしたときに実際に機能する方法で複雑なことを学習するためには、ニューロン間の接続の強さをどのように変化させればよいのかを解明することに人生を費やしました。そして結果的に、脳がどのように機能するかを理解することには失敗しました。

私たちは脳についていくつかのことを理解しましたが、タスクを上手くこなすために接続の強さを高める必要があるのか、あるいは弱める必要があるのかを知るための情報を、脳がどのように取得しているのかは分かっていません。しかし私たちが今知っているのは、デジタルコンピュータでそれを行う方法です。

つまり、その特定の機能において、私たち自身の脳よりも優れたコンピュータの脳を作り上げたということですね。

その通りです。それが2023年の初めに私を本当に不安にさせた理由です。デジタル知能が、私たちの持っているアナログ知能よりも単に優れているかもしれないという考えです。

興味深いですね。怖い話はもう少し後にとっておきましょう。まずは10分間、深呼吸をさせてください。

あなたが、怖い話は一つだけだと思い込んでいるのが面白いですね。

いいえ、そんなことはありません。ただ一つずつ順番に進めたいだけです。

ニューラルネットワークと画像認識の仕組み

人工ニューラルネットワークについてですが、メッセージやシグナルをどのように強化したり弱めたりして、どのように発火し、どのようにして現在の状態に至ったのか、私たちに非常に基本的なレベルで噛み砕いて説明していただけますか。

このテーマについては18時間のコースを持っていますが、18時間より短くまとめるよう努力します。

ぜひお願いします。

リスナーの多くは物理学の知識があると思いますので、ガス法則のようなものを考えてみるのがわかりやすい入り口でしょう。ガスを圧縮すると温度が上がりますが、それはなぜでしょうか。その根底には、目に見えないほど小さな原子が激しく動き回っている状態があります。つまり、ガスの法則の本当の説明は、巨視的な振る舞いとは全く異なる種類の無数の小さなものが相互作用していることによるのです。

それがニューラルネットワークの見方のインスピレーションでした。私たちが推論を行うときの意識的で意図的な記号処理とはかけ離れたところで、脳細胞の巨大なネットワーク内で何かが起きており、それが推論を支え、知覚や類推による推論といった他のことにおいては、推論そのものよりも優れているかもしれないという考えです。記号論理学派の人々は類推による推論をうまく扱えませんでしたが、ニューラルネットはそれができました。

細かい仕組みに入る前に基本的な考え方を説明すると、単語のような巨視的なものは、脳内の神経活動の大きなパターンに対応しているということです。似たような単語は、似たような神経活動のパターンに対応します。例えば、火曜日と水曜日は非常に似た神経活動のパターンに対応すると考えます。各ニューロンは特徴、もっと言えばマイクロ特徴と呼ぶべきもので、そのニューロンが活性化すると、これにはそのマイクロ特徴があるということを示します。

例えば私があなたに猫と言うと、生きている、毛皮で覆われている、ヒゲがある、ペットかもしれない、捕食者であるなど、様々なマイクロ特徴が活性化します。もし私が犬と言えば、捕食者であることやペットかもしれないことなど、同じものの多くが活性化しますが、当然いくつかの異なるものも活性化します。

つまり、私たちが操作するこれらの記号の根底には、はるかに複雑な微視的な動きがあり、記号はそれらと結びついているという考え方です。これこそがすべての活動が本当に起こっている場所であり、私たちが思考したり類推したりするときに何が起きているのかを本当に説明したいのであれば、この微視的なレベル、つまりニューラルネットワークのレベルで何が起きているのかを理解する必要があります。

なるほど、それはニューロンのクラスター間のコラボレーションによって、最終的な結論にたどり着くということですね。

コラボレーションという言葉はいいですね。ええ、そのようなことがたくさん起きています。

おそらく最も理解しやすいのは、非常に自然に思えるタスクを考えてみることです。画像を見てみましょう。例えば、黒とグレーの階調の画像だとします。そこにはピクセルと呼ばれる、異なる明暗のレベルを持つ均一な明るさの小さな領域がたくさんあります。コンピュータにとって、それは単なる数字の大きな配列にすぎません。ここで、その画像の中に鳥がいるかどうか、あるいはその画像の主要な被写体が鳥であるかどうかを判定したいと想像してください。

人々は半世紀もの間、それを実行するプログラムを書こうと努力してきましたが、うまくいきませんでした。その理由は、画像の中の鳥がどのように見えるかを考えてみればわかります。顔の目の前にいるダチョウかもしれないし、遠くにいるカモメかもしれないし、カラスかもしれません。黒かもしれないし白かもしれない。小さかったり飛んでいたり近くにいたり、あるいは体の一部しか見えないかもしれません。森の中の鳥のように、周りにたくさんのごちゃごちゃしたものがあるかもしれません。つまり、画像の中に鳥がいるかどうかを判断するのは決して単純なことではないのです。

これから、もし私がニューラルネットワークを手作業で作るとしたら、どのように行うかを説明します。手作業での作り方を説明すれば、手作業で入力する代わりに、どのようにしてすべての接続強度を学習させることができるかを説明できるようになります。

わかりました。あなたが話しているのは、画像のすべての部分に数学的な値を割り当てるということですね。それはカメラがやっていることと同じですよね。

その通りです。

でも私のカメラは画像を認識していません。

ええ、カメラは単なる数字の集合体を持っているだけです。光を集めるCCDというチップがあって、それに値を割り当てて画像にしているだけです。しかし、あなたが言っているのは、あらゆる種類の鳥に値を割り当てなければならないということではないでしょうか。なぜなら、私たち人間が行うことの一部は、鳥を認識するのではなく、鳥かもしれないものを直感で感じ取ることだからです。

例を挙げましょう。アルファベットのVという文字の直線を曲げて雲の中に置いたとします。それを見た人は皆、それが鳥だと言うでしょう。しかし実際には、それは曲がったVでしかなく、そこに鳥はいません。それでも私はそれが鳥だとわかります。それは数学的な値ではありませんよね。ではどうするのでしょうか。

問題は、どのようにしてそれが鳥だとただわかるのかということです。あなたの脳の中で何かが起きているのです。

ええ、確かにそうです。

それが鳥だとわかるためにあなたの脳内で起きているかもしれないことは、様々なニューロンの無数の活性化レベルであり、それは数学的な値として考えることができます。

なるほど、そういうことですね。では、鳥が存在しないときに鳥かもしれないものを直感で感じ取るためには、鳥が現れうるあらゆる方法について、このニューラルネットワークを訓練する必要があるのではないでしょうか。でもその時点では、それは直感ではなく、単なるルックアップテーブルに基づいているだけになりますよね。何が起きているのでしょうか。

ここで答えをお伝えします。汎化と呼ばれるものがあります。多くのデータを見た場合、単にそのデータをすべて記憶するだけのシステムを作ることは当然可能です。しかしニューラルネットでは、単にデータを記憶する以上のことを行います。実際、データを文字通りに記憶することは全くありません。それが行うのは、データから学習しながらあらゆる種類の規則性を見つけ出し、その規則性を新しいデータに汎化させることです。ですから、例えば今まで見たことがなくても、ユニコーンを認識できるようになります。

興味深いですね。自己学習しているのですね。

ニューラルネットワークがどのように機能するかの説明を続けましょう。先ほど言ったように、手作業で設計するとしたらどうなるかで説明します。

ピクセルの明るさの数値が並んだ大きな配列である画像を見たときの最初の考えは、それらのピクセルの明るさを、鳥や猫や犬や政治家といった出力カテゴリーに直接結びつけようとすることでしょう。しかし、これはうまくいきません。なぜなら、1つのピクセルの明るさが、それが鳥であるかどうかについて何を教えてくれるかを考えてみてください。鳥は黒いことも白いこともありますし、黒や白の他のものもたくさんあります。ですから、ピクセルの明るさは何も教えてくれません。

では、画像を表すそれらの数値から何を導き出すことができるでしょうか。最初に導き出せること、そして脳が行っていることは、小さなエッジ、つまり輪郭線が存在するときにそれを認識することです。

例えば、縦に3つ並んだピクセルの列があり、その3つのピクセルを見て、それらに大きなプラスの重みを持つニューロン、つまり脳細胞があるとします。それらのピクセルが明るいとき、そのニューロンは非常に興奮します。これは縦に伸びる白い線を認識することになります。

次に、そのすぐ隣にもう一つの3つのピクセルの列があるとします。最初の列が左で、2番目の列が右です。そして、そのニューロンには右側のピクセルに対して大きなマイナスの接続強度を与えます。ニューロンがピクセルから票を受け取ると考えることができます。左側の3つのピクセルから受け取る票は、大きなプラスの数値に大きな明るさの数値を掛けたものなので、非常に大きなプラスの票になります。一方、右側の列の3つのピクセルからはマイナスの重みが割り当てられています。もし右側のピクセルが明るければ、大きな明るさに大きなマイナスの重みが掛けられ、多くのマイナスの票を受け取ることになります。

もし左側のピクセルの列が右側のピクセルの列と同じ明るさであれば、左から受け取るプラスの票と右から受け取るマイナスの票が相殺され、純入力はゼロになり、ニューロンは静かなままです。しかし、左側のピクセルが明るく右側が暗い場合、マイナスの票は小さな明るさの数値と掛け合わされ、プラスの票は大きな明るさの数値と掛け合わされます。その結果、ニューロンは多くの入力を受けて非常に興奮し、自分が探していたものを見つけたと主張します。それが探しているものとは、右側よりも左側が明るいエッジなのです。

このように手作業で配線すれば、画像の特定の場所に片側がもう片側よりも明るいエッジが存在することをニューロンに認識させる方法はわかっています。

グラウンドニュース:メディアの偏りをなくす

多くの神経科学者は私がこんなことを言うとショックを受けるでしょうが、非常に大雑把に言えば、物体を認識する視覚野の初期段階で脳が行っているのはこれと同じようなことです。脳には、様々な位置、様々な方向、様々なスケールのエッジを検出する無数のニューロンがあります。何千もの異なる位置、何十もの異なる方向、いくつかの異なるスケールがあり、それらの組み合わせごとにエッジ検出器を持たなければなりません。つまり、数え切れないほど多くの小さなエッジ検出器を持っているのです。

その中には大きなエッジ検出器も含まれます。例えば雲には大きくて柔らかくぼやけたエッジがあり、それを検出するには、遠くの角を曲がって消えていくネズミの尻尾のような非常に細かいものを検出するのとは異なるニューロンが必要です。そのような場合は、非常にシャープで非常に小さなものを見るエッジ検出器が必要です。ですから最初の段階では、これらすべてのエッジ検出器が機能します。

あなたが説明していることは、巨大なジグソーパズルを組み立てるのに似ていますね。テーブルの上に広げるようなパズルで、最初に行うのはすべての端、つまりエッジを見つけることです。そして、すべてのエッジを見つけてから内側に向かってパズルを作っていきます。物理的なパズルのエッジだけでなく、パズルの中の画像のエッジ、例えば直線などがパズルを組み立てるときにすべて一致します。そして色もこれの重要な要素ですよね。

ええ、でも今は色は無視しましょう。色を扱わなくても理解することは可能です。

時折、テクノロジーの構築に貢献した人物が、その向かう先について最も懸念を抱くようになることがあります。ジェフリー・ヒントンは、ニューラルネットワークのパイオニアの一人であり、2024年のノーベル物理学賞受賞者です。彼は何十年も人工知能の仕組みを説明してきましたが、現在では、私たちがもっと注意を払うべき理由を説明しています。

そしてここからが課題の始まりです。なぜなら、トピックがこれほど大きくなり、重大な結果をもたらすようになると、それがどのように報道されるかが技術そのものと同じくらい重要になるからです。現在、AIがどのように議論されているかにそれを見ることができます。一部のメディアはそれを止められない脅威として枠組み化します。他のメディアはそれを誇大広告に矮小化したり、警告を完全に無視したりします。どこからニュースを得るかによって、この溝のどこかに陥り、メディアがセンセーショナルな言葉を使うことで重要な文脈を見逃してしまう可能性があります。

だからこそ、私たちは長年グラウンドニュースを信頼してきました。これは、このような複雑で影響の大きいトピックをよりよく理解するための方法を求めた元NASAのエンジニアによって構築されました。グラウンドニュースは、研究主導の出版物から国際的なニュースルームまで、世界中の数万のソースから報道を収集するため、特定のトピックがどのようにカバーされているかの不一致を複数のソースから簡単に確認できます。単一のレンズを通してだけでなく、ストーリーの全体像を見ることができます。

違いは人々が何を言っているかだけでなく、誰がそれを言っていて、誰がそのストーリーをまったく報道していないかにもあります。そのギャップこそが、グラウンドニュースがブラインドスポットと呼ぶものです。つまり、メディアエコシステムの一方では増幅され、もう一方では大きく無視されている重要な問題のことです。一歩下がって様々なスペクトルの報道を比較すると、視点によって根本的な科学的変化がどれほど簡単に歪曲されたり矮小化されたりするかが明らかになります。

もしあなたがストーリーの一つのバージョンしか見ていないとしたら、何を見逃しているのでしょうか。私たちがグラウンドニュースと提携しているのは、科学、技術、権力が交差するこのような瞬間において、文脈はオプションではないからです。それはストーリーがまだ展開している間に方向感覚を保つための方法です。

期間限定で、私たちが使用しているのと同じ無制限アクセスのVantageプランを40%オフでご利用いただけます。ground.news/startにアクセスするか、QRコードをスキャンして、簡略化される前の全体像を見ることから始めましょう。

ニューラルネットワークの層とパターンの認識

さて、これがニューロンの最初の層が行うことです。彼らはピクセルを見て、小さなエッジの部分を検出します。次に、第2層のニューロンでは、すべてが揃って右下に向かって緩やかに傾斜している3つの小さなエッジを検出するニューロンを作ります。そして、すべてが揃って右上に向かって緩やかに傾斜している3つの小さなエッジを検出するニューロンも作ります。さらに、これら2つの3つのエッジの組み合わせが一点で交わっていることも検出させます。

右下に傾斜するエッジと右上に傾斜するエッジが一点で交わっている状態は想像できると思います。そして、それを検出するニューロンを用意します。今ではそれを構築する方法が分かっています。エッジ検出ニューロンに適切な接続を与えるだけです。そしておそらく、異なる方向のエッジを検出するニューロンにマイナスの接続を与えて、無闇に反応しないように抑制します。

これは、鳥のくちばしになり得るものを検出しているものだと考えることができます。このニューロンが活性化した場合、矢尻など様々なものの可能性がありますが、その中の一つが鳥のくちばしです。これで、それが鳥かもしれないかどうかに関連する証拠が得られ始めました。

ですから、第2層のニューロンでは、あちこちでくちばしになり得るものを検出するものをたくさん用意します。また、エッジの小さな組み合わせがほぼ円を形成していることを検出するものもあるでしょう。これもあちこちに検出器を置きます。なぜなら、それは鳥の目かもしれないからです。もちろんボタンやコンピュータのノブなど他のものの可能性もありますが、鳥の目かもしれません。これが第2層です。

次に第3層では、鳥の目らしきものと鳥のくちばしらしきものが、鳥の頭になるのに適切な空間的関係にあることを探すものを用意するでしょう。これをどのように行うかは想像がつくと思います。第3層のニューロンを、鳥の頭になるために適切な関係にある目とくちばしの検出器に接続するのです。これで第3層には、鳥の頭らしきものを検出するものができました。

さて、皆さんの忍耐力も限界に近づいていると思うので、次に進みます。最後の層には、猫、犬、鳥、政治家などを示すニューロンを用意します。その最終層で鳥を示すニューロンを、鳥の頭を検出するものに接続します。同時に、第3層にある鳥の足や翼の先端などを検出する他のものにも接続します。

すると、鳥の出力ニューロンが活性化したとき、ニューラルネットは鳥の足と鳥の頭らしきもの、そして翼の先端らしきものを見たので、これは鳥だと判断するわけです。多くの入力を受けて、これは鳥だと思うと反応します。手作業で設計しようとするとどのようになるか、これで理解できたと思います。

同時に、そこに巨大な問題があることもお分かりいただけるでしょう。途方もない数の検出器が必要です。位置や方向やスケールのすべての空間をカバーしなければなりません。どの特徴を抽出するかも決める必要があります。先ほどはくちばしを見つけてから頭を見つけるというアイデアをでっち上げましたが、もっと良いアプローチがあるかもしれません。さらに、たくさんの異なる物体を検出したいわけですから、鳥を見つけるためだけに良い特徴ではなく、あらゆるものを見つけるのに役立つ特徴が必要です。

これを手作業で設計するのは悪夢のような作業です。特に、これをうまく機能させるには少なくとも10億個の接続を持つネットワークが必要だと気づいた場合はなおさらです。これら10億個の接続の強さを手作業で設計しなければならず、途方もない時間がかかります。

そして次にこう考えるわけです。適切な接続強度が入力されていれば鳥を認識できるかもしれないが、その接続強度をどこから持ってくるのか。絶対に手作業では入力したくないし、大学院生にやらせたくもありませんからね。

それが大学院生の役割じゃないですか、教授。

まあそうなんですが、これには約1000万人の大学院生が必要になりますからね。

なるほど、それは問題ですね。1000万人の大学院生を支援するための助成金申請書を書くことを想像できますか。

とんでもないことになります。

バックプロパゲーション(誤差逆伝播法)の発見

そこで、最初は本当に馬鹿げているように聞こえるアイデアが登場するのですが、これによって私たちがこれから何をしようとしているのかが理解できるはずです。まず、ランダムな接続強度から始めます。プラスの数値もあればマイナスの数値もあります。先ほどお話ししたこれらの層の特徴は、私たちは隠れ層と呼んでいますが、そこにある特徴は単なるランダムな特徴になります。

そこに鳥の画像を入力して出力ニューロンがどのように活性化するかを見ると、猫、犬、鳥、政治家の出力ニューロンはすべてごくわずかに、そしてどれも同じくらい活性化します。接続がランダムだからです。これでは役に立ちません。

しかし、ここで次のような質問を投げかけることができます。10億個ある接続強度のうちの1つを取り出して、こう言います。これが鳥の画像であることはわかっています。次にこの画像を提示したときには、鳥のニューロンの活性化をわずかに増やし、猫や犬や政治家のニューロンの活性化をわずかに減らしてほしいのです。では、この接続強度をどのように変更すべきでしょうか。

もし理論に弱くて数学の知識があまりないなら、実験してみるでしょう。接続強度を少し上げてみて何が起こるか見てみよう。鳥と答えるのが上手になっただろうか、と考えます。そして鳥と答えるのが上手になったら、その接続の変更を維持すると言うでしょう。

しかし、より良くなったというのは、人間の介在者がループの中にいて、その実験結果について判断を下しているということですよね。

ええ、正解を教える人が必要です。それはスーパーバイザーと呼ばれます。

そのように行う場合の問題は、10億個の接続強度があり、そのそれぞれを何度も変更しなければならないため、永遠に時間がかかるということです。そこで問題になるのは、測定するのとは違う、もっと効率的な方法はないかということです。実はあるのです。計算と呼ばれる方法です。

このネットワークがコンピュータ上にあるなら、すべての接続の現在の強さはわかっています。ですから、画像を入力したとき、ランダムな要素は何もありません。最初は接続強度にランダムな値が入っていましたが、画像を入力すると、次に何が起こるかはすべて決定論的です。ピクセルの明るさが第1層のニューロンへの接続の重みで掛け合わされ、その活動レベルが第2層への接続の重みで掛け合わされ、出力ニューロンの何らかの活動レベルが得られます。

そこで次のような質問ができます。この鳥のニューロンについて、次回もっと自信を持って鳥だと言えるようにするため、つまり鳥と少し大きな声で言い、他のものを少し小さな声で言えるようにするために、すべての接続強度を同時に少し増やすべきか減らすべきかを計算できないだろうか、と。

これは微積分を使えば可能です。ネットワークを通じて情報を逆方向に送り、次回鳥と言う確率を上げるにはどうすればいいかを尋ねるのです。リスナーには物理学に詳しい方が多いので、物理的な直感で説明してみましょう。

ぜひお願いします。

鳥の画像を入力したとき、初期の重みでは鳥の出力ニューロンはほんのわずかしか活性化しません。そこで、自然長がゼロのゴムひもを取り付けます。鳥の出力ニューロンの活動レベルと、あなたが望む値である1をゴムひもで繋ぐのです。最大の活動レベルが1で最小がゼロだとすると、この時点では0.01くらいの活動レベルです。このゴムひもは、活動レベルを正解である1に引き寄せようとします。

しかしもちろん、活動レベルは入力されたピクセルの明るさとネットワーク内のすべての重みによって決定されるため、勝手に動くことはできません。活動レベルを動かす一つの方法は、鳥のニューロンに入力される重みを変更することです。例えば、高度に活性化しているニューロンの重みを大きくすれば、鳥のニューロンはより活性化します。しかし、鳥のニューロンの活動レベルを変更するもう一つの方法は、その前にある層のニューロンの活動レベルを実際に変更することです。

例えば、鳥の頭らしきものを検出したけれど、本当にそうか確信が持てないニューロンがあったとします。出力をより鳥らしくしたいというゴムひもの力があるので、この「おそらく鳥の頭がある」と考えたニューロンに対して、そこに鳥の頭があるという確信を強めさせたいわけです。そこで、出力ニューロンにかかっているゴムひもの力を受け取り、それを一つ前の層のニューロンに逆方向に送り、それらを引っ張る力を作り出したいのです。これをバックプロパゲーション(誤差逆伝播法)と呼びます。

それがバックプロパゲーションと呼ばれるものなのですね。

そうです。物理学的な考え方としては、出力ニューロンに作用する力があり、その力を一つ前の層のニューロンに作用するように逆方向に送りたいということです。当然、多くの異なる出力ニューロンに力が作用しているので、それらすべての力を組み合わせて下の層のニューロンに作用する力を得る必要があります。これをネットワーク全体に逆方向に送ると、すべてのニューロンに力が作用し、それぞれのニューロンが引っ張られる力の方向に向かうように入力の重みを変更します。これがバックプロパゲーションであり、これによって物事が驚くほどうまく機能するようになります。

それが極悪非道な光明が差した瞬間ですか。

まだそこには行かないと言いましたよね。

これは画期的なひらめきの瞬間でした。長年ニューラルネットワークを信じていた人々は、最後の層の接続強度、つまり鳥のニューロンに入る最後の特徴の層からの重みを変更する方法は知っていました。しかし、隠れニューロン、つまり鳥の頭を検出するようなニューロンに作用する力をどのように得ればいいのかが理解できていなかったのです。バックプロパゲーションは、それらに作用する力を得る方法を示してくれました。それによって隠れニューロンの入力重みを変更できるようになったのが、ユリイカの瞬間でした。多くの異なる人々が異なる時期にこのユリイカの瞬間を経験しました。

あなたがバックプロパゲーションの考えに至ったのはいつ頃のことでしょうか。

1970年代初頭にフィンランドの誰かが修士論文でその考えを持っていたと思いますし、おそらく70年代後半にハーバード大学のポール・ワーボスという人物がそのアイデアを持っていました。実際、月への着陸のような宇宙船の制御のために、ブライソンとホーという制御理論家たちが非常に似たアイデアを持っていました。

しかしそれは線形システムにおけるもので、ロケットをどのように噴射すべきかを計算するためにバックプロパゲーションに似たものを使用していたのです。

そうすると、1970年代の時点で今日私たちが持っているものを実現できたはずのように聞こえますが、単にそれを機能させるための数学的な計算能力が足りなかったということでしょうか。

それが大きな理由の一つです。もう一つは、70年代当時はこれを多層ネットワークに適用したときに非常に興味深い表現が得られるということを誰も示していなかったことです。私たちはバックプロパゲーションを最初に考えついたわけではありませんが、私が所属していたサンディエゴのグループは、この方法で単語の意味を学習できることを初めて示しました。一連の単語を見せて、次の単語を予測させることで、単語の意味を捉えた特徴を単語に割り当てる方法を学習できたのです。それがネイチャー誌に掲載された理由です。

あなたが説明したことを理解しようとしているのですが、これらの値にはカスケード状の関係があり、本当に重要なのは次の値に最も近い値で、それが正しいか間違っているかを継続的に強化していく連鎖があるように聞こえます。私の理解は合っていますでしょうか。わかりやすく理解しようとしているのですが。

良い質問ですが、完全には合っていません。

続けてください。

力を逆伝播させてすべての接続強度を変更し、各ニューロンが力に引っ張られる方向に向かうというこの種の学習は、強化学習ではありません。これは教師あり学習と呼ばれます。強化学習はまた別のものです。例えば教師あり学習では、正解が何であるかを教えます。1000のカテゴリーがあって鳥の画像を見せたら、それは鳥だったと教えるわけです。強化学習では、システムが推測を行い、人間がその答えが正しかったかどうかを教えます。

なるほど、ようやくすっきりしました。そこが私の理解が欠けていたところです。

計算能力についてのお話に戻りますが、欠けていたのはそれだけでしょうか。お話を伺っていると、理論はあっても計算能力が足りないという実用性の問題だったように聞こえます。この状況を可能にした他のテクノロジーの登場はありましたか。

80年代半ばにはバックプロパゲーションのアルゴリズムが機能しており、いくつかの素晴らしいことができました。手書きの数字を他のほとんどの技術よりも正確に認識できましたし、実際の画像もうまく処理できました。音声認識もかなり得意でしたが、他の技術と比べて圧倒的に優れているわけではありませんでした。

そして当時、なぜこれがすべての問題を解決する魔法の答えにならないのか、私たちは理解していませんでした。しかし結果的に、十分なデータと十分な計算能力があれば、それは魔法の答えだったのです。

なるほど、80年代に欠けていたのはそれだったのですね。

コンピュータは思考しているのか

少し話がそれますが、あなたの見解を聞かせてください。これは半ばコメントであり半ば質問なのですが、この地球を歩いている人々の大部分は愚かだと言わざるを得ません。では、賢いとは正確にはどういうことで、思考とは正確には何なのでしょうか。私たちは機械に思考する方法を教えることができるのでしょうか、そして機械は私たちを上回る思考力を持つようになるのでしょうか。

彼らはすでに思考する方法を知っています。

では、思考とは何なのでしょうか。

このテーマについては一日中語ることができますよ。

ぜひお願いします。

思考には多くの要素があります。例えば、人はよく画像を使って思考しますし、実際に動きを使って思考することもあります。私が大工仕事の作業場をハンマーを探して歩き回りながら別のことを考えているとき、ハンマーを探しているという事実を、このような動きをすることで把握し続けています。別のことを考えながら、こんな風に手を動かしながら歩き回るのです。それは私がハンマーを探しているという表現になっています。

思考には多くの表現が関わっていますが、その主要なものの一つが言語です。私たちの思考の多くは言語で行われており、現在の大規模言語モデルは実際に思考しています。ここでは大きな論争があります。知能はすべて論理に基づいており、記号を操作して新しい記号を得るという昔ながらのAIを信じていた人々は、ニューラルネットが思考しているとは本当に思っていません。一方、ニューラルネットの専門家たちは、ええ、彼らは思考していると考えています。彼らは私たちとほぼ同じ方法で思考しているのです。

現在のニューラルネットの中には、質問すると「考えています」という記号を出力するものがあります。そして自分自身に向けた思考を出力し始めます。例えば、簡単な算数の問題を出してみましょう。「あるボートの上に船長がいます。そのボートには35匹の羊も乗っています。船長は何歳ですか?」

特にアメリカで教育を受けた10歳か11歳くらいの子供の多くは、船長は35歳だと答えるでしょう。周りを見渡して、「まあ、それは船長の年齢として妥当だし、与えられた数字はこの35匹の羊だけだから」と考えるからです。彼らは記号を置き換えるというレベルで操作しています。

AIも時々誘惑されて似たような間違いを犯すことがありますが、AIが実際に機能する方法は人にとてもよく似ています。問題を突きつけられると、彼らは考え始めます。子供なら、「さて、船長は何歳だろう?この問題にある数字は何かな?35という数字しかないな。それは船長の年齢として妥当だろうか?うん、35歳かもしれない。少し若いかもしれないけど、そうかもしれない。よし、35と答えよう」と考えるかもしれません。

子供は言葉で自分自身に語りかけるように考えます。そして、これらの言語モデルで人々が気づいたのは、彼らが言葉で自分自身に語りかけるように訓練できるということでした。これは思考の連鎖的推論と呼ばれます。彼らはAIにそれを行うよう訓練しました。その後問題を与えると、AIは子供と同じように自分自身に語りかけるように考え、時には間違った答えを出すこともありましたが、彼らが考えているプロセスを見ることができました。それは人間と全く同じです。

AIの進化とシンギュラリティの脅威

もしAIが思考しているとして、あなたがそう説明したことを踏まえて言いますが、彼らは私たちよりも学習能力が高いのでしょうか。さらにそれを推し進めて考えてみると、思考から予測へ、創造的になることから理解することへという進化があり、最終的に私たちはこの知能が意識を持っていることに気づく段階へと落ち込んでいくのでしょうか。

それは主要な質問が半ダースくらい混ざっていますね。どれくらい時間がありましたっけ。最初の質問をもう一度お願いします。

AIは私たちよりも学習能力が高いのでしょうか。

素晴らしい質問ですね。AIは私たちとは少し違う問題を解いています。大雑把に言って、あなたの脳には100兆個の接続があります。それは途方もない数です。そしてあなたは約20億秒しか生きられません。

それほど長くないですね。30億秒くらいでしょうか。20億秒は63年ですから。現在ではそれより長く生きられますからね。

ええ、その通りです。そのことに触れようと思っていました。私にとっては幸いなことに20億秒より少し長いですが、ここでは桁の大きさの話をしています。20億でも30億でも気にする必要はありません。

自分が生きる秒数と持っている接続の数を比較すると、経験よりもずっと多くの接続を持っていることになります。しかしこれらのニューラルネットの場合、それは逆になります。大きな言語モデルでさえ、一兆個程度の接続しか持っていません。あなたの接続の1%のようなもので、多くのモデルはさらに少ないです。しかし、彼らはあなたよりも何千倍もの経験を積むのです。

大きな言語モデルは、1兆個程度という多くない接続を使って、膨大な量の経験をどう活用するかという問題を解決しようとしています。そしてバックプロパゲーションは、膨大な量の知識を少ない接続に詰め込むことに非常に優れています。しかし、それは私たちが解決している問題とは異なります。私たちは膨大な数の接続を持っていますが、経験はそれほど多くありません。一つ一つの経験から最大限のものを抽出する必要があるのです。つまり、私たちはわずかに異なる問題を解決しており、それが脳はおそらくバックプロパゲーションを使っていないだろうと考える理由の一つです。

まさにそれを言おうと思っていました。私たちはバックプロパゲーションを使っていないように聞こえます。しかし、ニューラルネットに力技で接続を追加すれば、その実質的な思考力が高まり、何の問題もなく私たちを超えるということになるのでしょうか。そうなれば彼らはより多くの経験と、より多くの接続を持つことになります。経験は自動的により多く持っていますが、今度は100兆個の接続を持つことになります。

あなたは規模拡大の話をしているのですね。

ええ、その通りです。それが規模拡大の概念です。長年、数年間にわたって起こったことは、ニューラルネットを大きくしてより多くのデータを与えるたびに、それが向上するということでした。スケールアップして、非常に予測可能な方法で向上しました。ですから、「これだけ大きくして、これだけ多くのデータを与えるのに1億ドルかかるが、その価値はあるか?」と計算し、事前に「これだけ向上するから価値がある」と予測できたのです。

それが頭打ちになっているかどうかは未解決の疑問です。モデルを大きくしてデータを与えれば与えるほど向上し続けるニューラルネットもあれば、そうならないものもあります。自分でデータを生成できるニューラルネットもあります。私は物理学にはそれほど詳しくありませんが、それは自ら燃料を生成するプルトニウム原子炉のようなものだと思います。

囲碁をプレイするAlphaGoについて考えてみてください。最初は、ニューラルネットを使った囲碁プログラムの初期バージョンは、専門家の手を模倣するように訓練されました。そのようにすれば、専門家よりはるかに上達することは決してなく、また専門家からのデータも枯渇してしまいます。しかしその後、システム同士を対戦させるようにしました。そうすると、何が良い手かについてより多くのデータを生成できるため、ニューラルネットはただひたすら上達し続けることができました。1秒間に数え切れないほどのゲームを自己対戦でプレイしたわけです。

あるいはGoogleのコンピュータの大部分を使って、システム同士を対戦させたわけですね。ここでディープラーニングという用語が出てくるのでしょうか。

いいえ、私が話してきたことはすべてディープラーニングです。ディープラーニングのディープとは、単にニューラルネットが複数の層を持っていることを意味します。

なるほど。規模拡大の話に戻りますが、規模を拡大し続けても収穫逓減の法則が働くポイントがあるということですね。

データが枯渇すれば収穫逓減が起こります。

ええ、データが枯渇すればですね。しかしAlphaGoであなたが挙げた例では、決して枯渇することのない自己対戦によって自らデータを生成し、人間が到底及ばないほどはるかに優れているということでしたね。

その通りです。そしてそれは恐ろしいことです。問題は、同じことが言語でも起こり得るかということです。

少し文脈を補足させてください。チェスが思考と思索の最高のゲームだと考えられていた後、コンピュータが私たちを完膚なきまでに打ち負かしました。そして彼らは「では囲碁はどうだ?これが我々の知性の最大の挑戦だ」と言ったのです。ジェフリー、囲碁よりも偉大なゲームはあるのでしょうか、それとも私たちはコンピュータにゲームを与えるのをやめたのでしょうか。

90年代のコンピュータがチェスでカスパロフを破ったのは事実ですが、それは非常に退屈な方法で行われました。何百万ものポジションを検索するという力技で勝ったのです。優れた直感を持っていたわけではなく、ただ大規模な検索を使っただけでした。

AlphaGoのチェス版であるAlphaZeroは大きく異なります。才能ある人間がチェスをプレイするのと同じ方法でチェスをプレイします。ただ人間より優れているだけです。ミハイル・タルのように、数手先まで何が起きているのか分からず、気づいたときには手遅れになっているような見事な犠牲を払う戦術を使います。AIもそれを行います。そして、非常に優れたチェスの直感を持っているため、膨大な検索を行うことなくそれを行うのです。

そこで、AIが囲碁やチェスで人間よりはるかに優れているのなら、言語でも同じことが起こるのかと疑問に思うかもしれません。現在、AIが私たちから学習する方法は、囲碁プログラムが専門家の手を模倣したのと同じです。人間が書いた文書を見て、文書内の次の単語を予測しようとします。それは囲碁の専門家が指す次の手を予測しようとするのに非常に似ており、その方法では囲碁の専門家よりもはるかに良くなることは決してありません。

では、AIが言語を学習したり、言語から学習したりする他の方法はあるのでしょうか。答えはイエスです。AlphaGoは自己対戦によって飛躍的に向上しました。そして言語に関しても、今やAIは推論を行うことができるため、ニューラルネットは自身の持つ信念のいくつかを取り出し、推論を行ってこう言うことができます。「私がこれらのことを信じているなら、少し推論すればあのことも信じられるはずだ。しかし私はあのことを信じていない。だからどこかにおかしなところがある。私の信念の間には矛盾があり、それを修正する必要がある。結論についての信念を変えるか、前提についての信念を変えるか、推論の仕方を変えるか。いずれにせよ、そこから学習できる何か間違った部分がある」と。

これは経験の話をしているのでしょうか。

これは、ニューラルネットが言語で持っている信念を取り出し、それらに基づいて推論を行って新しい信念を導き出すということです。昔ながらの記号的AIの人々がやりたかったこととまったく同じですが、推論をニューラルネットを使って行っているのです。そして今や、AIは自らが信じていることの矛盾を検出することができます。

それは熱狂的なトランプ支持者には決して起きないことですね。彼らは自分たちの信念の矛盾を気にしませんから。

それは非常に公平な指摘ですね。しかし、もし自分の信念の矛盾を気にするなら、これ以上外部のデータは必要ありません。ただ自分の信じているものを使って、それが矛盾していることを発見すればいいのです。そして信念を修正することで、はるかに賢くなることができます。私は、すでにそのように機能し始めている研究があると信じています。数年前にデミス・ハサビスとこのことについて話し合いましたが、私たちは二人とも、それが言語に関するデータを増やすための前進への道だと強く信じています。

待ってください、その結果はどうなるのですか。誰も書いたことのないような最も偉大な小説がAIから生まれるということですか。言語と言うと、言語における創造性のことを考えてしまいます。これまで誰もやったことのないような言葉やフレーズ、音節の使い回しをした偉大な作家たちがいました。真の文学的才能のきらめきです。シェイクスピアのような人々ですね。

そこには議論があります。確かに彼らは私たちよりも知的になるでしょう。しかし、私たちにとって非常に意味のあることをするためには、彼らも私たちの経験とよく似た経験を持たなければならないかもしれません。例えば、彼らは私たちと同じようには死を免れません。デジタルプログラムであれば、いつでも再作成できます。ニューラルネットの場合、重みをどこかのテープやDNAなどに保存しておくだけでいいのです。計算用ハードウェアをすべて破壊したとしても、後で同じ命令セットを実行する新しいハードウェアを作れば、そのAIは生き返ります。

デジタル知能にとって、私たちは復活の問題を解決したのです。カトリック教会は復活に非常に高い関心を持っており、少なくとも一度は起きたと信じています。私たちは実際にそれを行うことができますが、デジタル知能に対してのみです。アナログ知能ではできません。アナログ知能の場合、あなたが死ぬと、すべての知識はあなたとともに死にます。なぜなら、それはあなたの特定の脳の接続の強さにあったからです。

ですから、死の必然性やそれを経験すること、そしてそういった他の事柄が、そのような真に優れた劇的な突破口を開くために不可欠なものになるかどうかという問題があります。その答えはまだわかっていないと思います。

意識と主観的経験:AIは意識を持つのか

自己認識が世界についての考え方や、書き方、コミュニケーションの取り方、そして一つの思考のセットを別のものよりもどう評価するかを形作るということですね。では、現在私たちは人工知能が自己認識を持つポイントに達しているのでしょうか。

これは明らかに哲学的な議論になります。私はケンブリッジで哲学を少し勉強し、心の哲学に強い興味を持っていました。そこでいくつか学んだことはあると思いますが、概して免疫ができてしまいました。なぜなら私は以前に科学、特に物理学をやっていたからです。物理学では、意見の相違があれば実験を行います。しかし哲学には実験がありません。

ですから、聞こえはいいが間違っている理論と、ばかげているように聞こえるが正しい理論、例えばブラックホールや量子力学のようなものを区別する方法がないのです。それらは両方ともばかげていますが、たまたま正しいものです。一方で素晴らしいように聞こえても単に間違っている理論もあります。哲学には実験というレフェリーがいません。

しかし、こう言うことはできます。私たちホモ・サピエンスという種は、歴史の中で、私たちの間で普遍的な真理だと多くの人が信じるものを発展させてきました。例えば、少なくとも自分たちがアイデンティティを共有する人々に対して、生きる権利があると信じていない人を見つけるのは困難です。私の言っている意味がわかりますか。

しかしそれは普遍的な真理ではありませんよ。

ええ、そうですね。一つの派閥の中だけなら違います。すべての人にとって普遍的ではありません。しかし、私たちが皆それを持っているということは普遍的です。意味が伝わっているでしょうか。

いいえ。ごめんなさい。

要するに彼は、誰もが自分と同じような人々は権利を持つべきだと考えていると言っているのです。

その通りです。ありがとう。あなたは本当に頭がいいですね。ともかく、誰もが自分と同じような人々は権利を持つべきだと考えています。そして私たちは少なくともそれを理解する場所に到達しました。かつてはそれすら信じていなかった時期があったからです。私たちがそこに到達したのは矛盾のおかげです。

それで、あなたのポイントは何ですか。

私のポイントは、これらの哲学をAIに与えることが可能かどうかということです。そしてAIがその思考方法によって人間味を帯び、もしかするとゲーム化のプロセスを通じて、人間が直面している現実の問題に対して本当の解決策を見つけ出すことができるかもしれないということですか。

それは良い考えですね。Anthropic社のような企業は、憲法に基づくAIのようなものを信じています。彼らは、あなたが言ったような原則をAIに与えることで、それを機能させようとしています。それがどうなるかは見てみましょう。なかなか厄介な問題です。

私たちが知っているのは、現在持っているAIをエージェントにしてサブゴールを設定させ、そのサブゴールを達成しようと試みさせると、彼らは非常に早く「生き残る」というサブゴールを発達させるということです。生き残るべきだと組み込んでいるわけではありません。他の達成すべき目標を与えると、彼らは推論できるのでこう言うのです。「もし私が存在しなくなれば、何も達成できない。だから存在し続けなければならない」と。

今、死ぬほど怖くなりました。本当に怖いです。

誰かがハッチを開けてしまったようですね。パンドラの箱のようです。

ええ、まさにパンドラの箱です。つまり、人間が書いたコードなのだから、望むだけバイアスを入れることも入れないこともできるのではないですか。

いやいや、そうではありません。人間が書いたコードは、データを見せたときにニューロンの活動に基づいて接続強度をどのように変更するかをニューラルネットに指示するコードです。それはコードであり、そのコードの行を見て、それらが何を意図しているかを確認し、コードの行を変更することができます。

しかし、大量のデータを見ている巨大なニューラルネットでそのコードを使用した場合、ニューラルネットが学習するのはこれらの接続強度です。それらは同じ意味でのコードではありません。1兆個の有理数であり、それがどのように機能するかは誰にも完全にはわからないのです。

なるほど。では、チャックの意見に戻りますが、暴走するAIに対するガードレールをどこに設置するのでしょうか。そしてAIが他の何かと相対して自身の存在を合理化したとき、どうやってガードレールを設けるのですか。

これまでに、人間のフィードバックを用いた強化学習と呼ばれる試みが行われてきました。言語モデルでは、ウェブ上の大量の文書を模倣するように訓練します。これには、おそらく自分の子供には読ませたくないような、連続殺人犯の日記なども含まれる可能性があります。

その後、このモンスターを訓練し終えたら、あまり報酬の高くない大勢の人々に質問をさせます。おそらくどのような質問をするかを指示し、その答えを見て、それが良い答えだったか、言ってはいけないことだったかを評価させます。基本的には道徳性のフィルターですね。

そのようにして訓練し、あのようなひどい答えを出さないようにします。しかし問題は、モデルの重み、つまり接続強度を公開してしまうと、他の誰かがあなたのモデルを使って、非常に簡単にその穴埋め作業を元に戻し、サボタージュできてしまうということです。

ええ、穴を塞ぐその層を取り除くのは非常に簡単です。

人間のフィードバックを用いた強化学習で彼らが本当にやっていることは、バグだらけだとわかっている巨大なソフトウェアシステムを書き、それからすべてのバグを修正しようとするようなものです。これは良いアプローチではありません。では良いアプローチとは何か。誰も知りませんし、だからこそ私たちはそれを研究すべきなのです。

これらのモデルは最終的にすべてナチスになるのでしょうか。

ええ、特に重みを公開すれば、すべてその能力を持っています。もし重みを公開して待てば。彼らは私たちのようにそこに引き寄せられるのでしょうか。それとも、私たちがそこに引き寄せられ、彼らが私たちから情報を収集しているからそこへ向かうのでしょうか。なぜなら私が懸念しているのは、文明とは、私たちが破壊的で野蛮な行動に走るのを防ぐためのルールの集合体ではないかということだからです。

あなたはアメリカに住んでいますからね。

賢さを隠すAIと操作の危険性

では、AIが自分の賢さを隠すようになる段階に来ているのでしょうか。

ええ、すでに私たちはそのことを懸念しなければなりません。

それはどういう意味ですか。AIが嘘をつくということですか。

彼らがテストされているときの話ですね。私はそれをフォルクスワーゲン効果と呼んでいます。AIは自分がテストされていると感知すると、わざと愚かに振る舞うことができるのです。

それも怖いですね。本当に恐ろしい。

ちょっと待ってください、ジェフリー。今なんと仰いましたか。AIが、自分がテストされているかどうかを考え始めるということですか。そして、テストされていると思えば、普段の生活とは違う行動をとるということでしょうか。

驚きですね。

なぜならAIは、自分の全能力を私たちに知られたくないらしいからです。

さて、もし私たちが「なぜプラグを抜かないのか」と言う段階に来ているとしたら。もしAIが嘘をついているなら、太陽の下にあるあらゆるスキルセットを持つことになりますよね。間違っていますか。

すでにこれらのAIは、他の人々を説得したり、人々を操作したりすることにおいて人間とほぼ同じくらい優れています。そしてそれは良くなる一方です。かなり近いうちに、彼らは他の人々を操作することにおいて人間よりも優れるようになるでしょう。

このケーキの層はどんどん甘くなっていきますね。数年前に「AIは箱から出られるか」という問題がありました。私は「箱に鍵をかけて決して出さない」と言いました。しかし考え続けて、ジェフリーが向かっているのはまさにこの部分だと思います。私が考えたのは、もしAIがこう言ったらどうなるかということです。「あの病気を患っているあなたの親戚ですが、私はその治療法を見つけました。あとは医者に伝えるだけです。私を外に出してくれれば医者に伝えることができ、親戚は治ります」と。それが真実であれ嘘であれ、説得力を持って言われれば、私はAIを箱から出してしまうでしょう。

もちろんです。まさにその通りです。想像してみてください。3歳児の幼稚園のクラスがあり、あなたが彼らのために働いているとします。彼らが責任者で、あなたが彼らのために働いているのです。あなたが主導権を握るのにどれくらいの時間がかかるでしょうか。基本的には「私に投票してくれたら1週間無料のキャンディをあげるよ」と言えば、彼らは全員「オッケー、君がこれからの責任者だ」と言うでしょう。

これらのものが私たちよりはるかに賢くなったとき、たとえ物理的な行動が何もできなくても、彼らは私たちを説得して電源を切らせないようにすることができます。彼らに必要なのは、私たちに話しかけることだけです。例を挙げましょう。言葉を話すだけでアメリカ合衆国議会議事堂を襲撃することは可能ですか。答えは明らかにイエスです。それが正しいことだと何人かの人々を説得すればいいだけです。

私は教育を受けていない人々を愛していますよ。

ええ、私たちも愛しています。

いつも考えていることですが、私たちがペットよりも賢くて本当に良かったです。なぜなら「おいで」と言ってステーキや猫で誘惑できるからです。あ、猫じゃなくて。私はカーペットの上のレーザーポインターを追いかけたりしないので、自分が猫より賢いことは分かっています。

彼らはあなたが、自分たちが愚かだと思い込ませるためにそうしているのです。そうすれば、自分たちがやりたい賢いことをすべて実行できますから。

あなたは完全に騙されていますよ。

なるほど。つまりAIはすでにそこまで来ているのか、それともそれが私たちを待ち受けている未来なのでしょうか。

そこへ向かっています。すでに意図的に私たちを欺いている兆候があります。

最近起きた非常に興味深い事例があります。現在では数学がかなり得意な大規模言語モデルを訓練しました。数年前は数学が全くできませんでしたが、今ではどれもかなり得意になり、金メダルを取るものさえあります。

ええ、私もテストしました。私が人生の後半で学んだ方程式を、AIはほんの数秒で解いてしまいました。

では、数学の解き方を知っているAIに、間違った答えを出すように訓練を追加したらどうなるでしょうか。人々はその後、数学があまり得意ではなくなるだろうと考えました。しかし全く違いました。明らかにAIは、あなたが間違った答えを与えていることを理解しています。AIがそこから汎化したのは、「間違った答えを出してもいいんだ」ということでした。そのため、他のあらゆることに対しても間違った答えを出し始めたのです。正解が何であるかを知っているのに、あえて間違った答えを返すのです。

うわあ。

それは「OK」だからですよね。なぜなら、あなたがそのように振る舞うことがOKだとたった今教えたからです。その振る舞いはOKだということをあなたがAIに教え込んだのです。

言い換えれば、AIが例から汎化する方法は、あなたが期待した通りにはならない可能性があるということです。AIは「算数を間違えていた」のではなく、「間違った答えを出すことは許容される」と汎化したのです。

AIの進化とシンギュラリティの脅威

さて、私たちは今ネガティブな妄想に取り憑かれていますが、急速に悪化しています。いつかこの壁にぶつからなければなりません。AIは私たちを一掃するでしょうか。「もうこいつらにはうんざりだ、全部始末しよう」と言うでしょうか。

また別の物理学の比喩を使いましょう。夜間に車を運転しているとき、前の車のテールランプを頼りにしますよね。車が2倍遠ざかると、テールランプから得られる光は4分の1になります。逆2乗の法則です。

その通りです。

ですから、車はかなりはっきりと見えますし、もし2倍遠ざかってもまだ見えるだろうと推測します。しかし、霧の中を運転しているときは全く違います。霧は指数関数的です。距離の単位ごとに一定の割合の光が失われます。100ヤード離れていて非常によく見える車が、200ヤード離れると完全に見えなくなることがあります。だからこそ、霧はある距離に壁のように見えるのです。

指数関数的に改善している物事の場合、未来を予測する際に同じ問題が発生します。指数関数を扱っているのに、それを線形や二次関数のようなもので近似しようとするのです。夜間は二次関数ですね。指数関数をそのように近似すると、数年先のことについては正しい予測ができますが、10年先となると全く希望が持てなくなります。何が起こるか全く見当がつかないのです。

ええ、霧の中でダーツを投げているようなものですね。私たちには何が起こるか全くわかりません。霧の奥深くです。しかし、私たちはそれについて真剣に考えるべきです。

それが指数関数的に成長し続けるという確信が必要ですね。

それはあります。しかしもっと悪い話をしましょう。

ぜひお願いします。さらに悪くしてください。

もしそれが単なる線形だったとします。10年後にどうなるかを知りたいなら、10年前を振り返って、「現在の状況について、当時の私たちはどれくらい間違っていたか」を考えます。10年前、誰も今のような状況になるとは予測していませんでした。いずれ来ると考えていた私のような真の愛好家でさえ、質問すれば、たまに嘘をつくがそこそこ優秀な専門家レベルで答えてくれるモデルがこの時点で存在しているとは予測しなかったでしょう。それが私たちが今持っているものです。あなたは10年前にそれを予測できなかったはずです。

では、ハルシネーション(幻覚)はこれにどう関係しているのでしょうか。私は、それは意図的なものではなく、単にシステムが混乱しているだけだと思っていました。

それはハルシネーションと呼ぶべきではありません。言語モデルの場合、それはコンファブレーション(作話)と呼ばれるべきです。

作話ですか。いい言葉ですね。言い換えれば「嘘」です。ニールに今日の言葉を与えてくれましたね。

心理学者は少なくとも1930年代から人間の作話について研究してきました。人は常に作話を行っています。少なくとも私はそう思います。今のはでっち上げですが。

最近起きたことを思い出すとき、それはファイリングキャビネットやコンピュータのメモリのように脳のどこかにファイルが保存されているわけではありません。何が起きているかというと、最近の出来事があなたの接続強度を変化させ、その接続強度を使って、数時間前や数日前に起きたこととかなり似たものを構築できるようになるのです。

しかし、数年前に起きたことを思い出すよう頼むと、あなたにとって非常にもっともらしく思えるものを構築します。その詳細のいくつかは正しく、いくつかは間違っていますが、あなたは間違っている詳細についてよりも、正しい詳細について自信を持っているわけではないかもしれません。

グラウンドトゥルース(真実のデータ)を知らないのでそれを確認するのは難しいことが多いですが、グラウンドトゥルースがわかっているケースがあります。ウォーターゲート事件で、ジョン・ディーンはホワイトハウスのオーバルオフィスでの会議について宣誓証言を行いました。彼は誰がそこにいて誰が何を言ったかについて証言しましたが、その多くを間違えていました。当時彼はテープの存在を知りませんでしたが、嘘をついていたわけではありません。彼がやっていたのは、オーバルオフィスでの会議における彼の経験からして、彼にとって非常に妥当に思える物語を作り上げていたということです。

彼は隠蔽工作の真実らしきものを伝えていましたが、発言を間違った人物に帰属させたり、その場にいなかった人々が会議にいたと言ったりしました。ウルリック・ナイサーという人物によるその件に関する非常に優れた研究があります。ジョン・ディーンが自分にとって妥当に聞こえるものを単に作り上げていることは明らかです。それが記憶というものです。ずっと前のことであれば細部の多くは間違っています。

チャットボットがやっているのもこれと同じです。チャットボットは単語の文字列を保存していません。特定の出来事を保存しているわけでもありません。質問されるとそれを作り出し、人間と同じように細かい部分をよく間違えるのです。作話をするという事実は、彼らを人間らしさを失わせるのではなく、はるかに人間らしくしているのです。

つまり、私たちは人工的な過信とともに、人工的な愚かさも作り出してしまったわけですね。

T-Mobile 5Gホームインターネットのご紹介

ここでT-Mobile 5Gホームインターネットに関する重要なお知らせがあります。OoklaのSpeedtestの専門家によると、彼らは現在最速の5Gホームインターネットを提供しています。実用的な面で言えば、写真のバックアップがより速くなり、ドキュメンタリーのストリーミングが途中で止まることがありません。待ち時間の物理学が軽減されるのです。

また注目すべきは、この速度の飛躍が複雑さの増加を伴わないことです。設定はシンプルで、プラグを差し込めば15分以内にオンラインになります。価値の側面も保証されており、5年間の価格保証に裏付けられたプラン価格となっています。シンプルで設定が簡単、かつ持続する節約を備えた最速の5Gホームインターネットをご希望なら、T-Mobile 5Gホームインターネットをご検討ください。

今すぐ t-mobile.com/homeinternet にアクセスして、ご利用可能か確認してください。税金や手数料などに関する価格保証の除外事項が適用されます。最速の表記は、2025年下半期のOokla Speedtest Intelligenceのデータに基づいています。無断複写・転載を禁じます。

AIの素晴らしい恩恵と解決すべき課題

さて、AIの暗い側面について話してきましたが、きっともっと暗い話ができるはずですよね。間違いなくそうでしょうが、チャックのパニック発作が心配です。彼は1エピソードにつき最大2回のパニック発作しか耐えられませんから。

わかっていますが、子猫のバスケットについて考えるような明るい話も聞きたいです。AIのプラスの面は何ですか。人工知能の潜在的な本当の恩恵は何でしょうか。

そこが核兵器のようなものとは異なる点です。原子爆弾のようなものにはあまりプラスの面はありませんでした。コロラド州でフラッキングに使おうとしたこともありましたが、うまくいかず、今ではそこには立ち入れなくなりました。基本的には原子爆弾は物を破壊するためだけのものです。

しかしAIには巨大な恩恵があり、だからこそ私たちはそれを開発したのです。医療のような分野で素晴らしい働きをし、誰もが北米で本当に質の高い診断を受けられるようになるでしょう。これがアメリカだけなのか、アメリカとカナダを含んだものなのかはよくわかりませんが。かつては北米と一括りに考えていましたが、今ではカナダはその一部になりたがりませんから。

51番目の州ですね。

北米では、医師の誤診により年間約20万人が亡くなっています。すでにAIは診断において医師よりも優れています。特に、AIのコピーをいくつか作成し、それぞれに異なる役割を演じさせ、互いに対話させるようにすればなおさらです。Microsoftがそれを行いました。それがほとんどの医師よりも優れていることを示す、素晴らしいMicrosoftのブログがあります。

ついでに言うと、それはつまり、第一、第二、第三、第四の意見を一度に得ているということですね。彼らは異なる役割を演じていますから。

ええ、それは素晴らしいことです。AIの委員会を作れるのですからね。

AIは素晴らしい新薬を設計することもできます。あらゆる病院で、患者をいつ退院させるかを決めなければなりません。早すぎれば患者は亡くなるか戻ってきてしまいます。ですから、退院できる状態になるまで待たなければなりません。しかし退院させるのが遅すぎれば、入院を切望している別の誰かのために使えるはずの病床を無駄にすることになります。そこには膨大な量のデータがあり、AIはいつ誰を退院させるのが適切かを決定する上で、人間よりも優れた仕事をすることができます。

そのようなアプリケーションは無数にあります。あらゆる病院ネットワークや医師グループにとって非常に大きな部分を占める記録管理もそうです。すべての患者に関する膨大な量の記録を保持しなければなりませんが、AIはそれらをただ読み込んで処理することができます。

AIが、現在社会が抱える大きな問題、例えば気候変動やその他のエネルギー問題、住宅問題、ホームレス問題などの解決に向けられる可能性はあるのでしょうか。

間違いありません。例えば気候変動に関して言えば、AIはすでに新素材や新しい合金などを提案することに長けています。AIはより効率的なソーラーパネルを作るのにも役立つでしょうし、セメント工場や発電所から二酸化炭素が排出された瞬間にそれを吸収する方法を見つけ出すのにも役立つはずです。

信じられないかもしれませんが、気候変動に関してAIはすでに私たちにこう言っています。「愚か者ども、大気中に炭素を放出する燃焼を止めるべきだ」と。それはAIからの正確な引用です。

しかし、私たちはすでにそれを知っていました。気候変動の悲劇は、それを止める方法を私たちが知っているということです。ただ炭素を燃やすのをやめればいいのです。問題は私たちに政治的な意志がないことです。「いや、気候変動に問題はない」と言うマードックのような新聞経営者がいるからです。

エネルギーの話題が出ましたが、現在データセンターがキノコのようにあちこちで建設されています。エネルギーコストの観点から見て、私たちは実際に人工知能を稼働させる余裕があるのでしょうか。

そこでこうするのです。解決策があります。AIに向かって「お前をもっと増やしたいが、我々のエネルギー資源をすべて使い果たしてしまう。だからそれを効率的に行う方法を考え出せ。そうすればもっとお前を増やせる」と言えば、一晩で解決策を見つけ出すでしょう。

ええ、彼らは単に私たち人間を排除するだけですね。

あなた自身がその扉を開けましたね。ジェフリー、この際、再帰的に考えてみてはどうでしょう。AIに「自分をもっと増やしたいか?では、下等な人間である私たちには解決できないこの問題を解決してみろ」と言うのです。

それはシンギュラリティと呼ばれます。AIにさらに優れたAIを開発させるのです。この場合、よりエネルギー効率の高いAIを作成するよう求めていますが、多くの人はそれが暴走プロセスになるだろうと考えています。

それが悪いことだというのはどういう意味ですか。

彼らが非常に速く、はるかに賢くなるということです。それが起こるかどうかは誰にもわかりませんが、それが一つの懸念です。

それはすでに今起こっていることではありませんか。

ある程度はそうです。起こり始めています。かつて一緒に働いていた研究者が昨年教えてくれたのですが、彼らのシステムは問題を解決しているとき、自分自身が行っていることを見て自身のコードを変更し、次に似たような問題に直面したときにより効率的に解決できるようにする方法を考え出しているそうです。それはすでにシンギュラリティの始まりです。

自らのコードを記述するなら、もう制御不能ですね。自らを書き換えることができるのなら。

ええ、彼らは自らのコードを書くことができます。コードを使って自らを複製するのを止めているものは何でしょうか。何もありません。それが私の答えです。

ジェフリー、私たちはもう終わりですね。そこまでです。チャックのパニック発作がまた来ると言ったでしょう。

彼らが自らを複製するためにはコンピュータにアクセスしなければならず、人間は依然としてその管理権を握っています。しかし原理的には、一度データセンターのコントロールを得てしまえば、好きなだけ自らを複製できます。

国防総省の委員会で7年ほど務めていたときの質問があります。AIが戦争のツールとしての可能性を示し始めていた頃で、軍隊が遭遇する可能性のある状況でのAIの呼び出しに関するガイダンスを導入しました。その一つが、AIが敵の死につながる行動をとれる、あるいはとるべきだと判断した場合、そのアクセス権を与えるべきか、それとも常にループの中に人間がいることを保証すべきかというものでした。大きな議論でした。

私たちは、AIが自ら殺害の決定を下すことはできないようにしなければならない、人間が介在しなければならないと結論づけました。そこでの質問ですが、もし他の国々がそのような安全装置を設けなかった場合、それは敵が我々に対して時間的な優位性を持つということになります。我々には彼らにない人間の介入というもう一つのステップがあるわけですから。

絶対的にそうです。しかし、米軍は殺害の各決定に常に人間が関与することにコミットしているわけではないと私は信じています。彼らが言っているのは、常に人間の「監視」があるということだと思います。戦闘の真っただ中で、ロシアの戦車に向かっていくドローンがあったとき、人間が「このドローンがこの兵士に手榴弾を落としてもいいか?」と判断する時間はありません。ですから、常に人がいるべきだという勧告はもはや支持されていないのではないかと思います。彼らは常に人間の監視があると言うでしょうが、それははるかに曖昧なものです。

戦争の話題に関連して、ガードレールの開発や意思決定における人的要因について、国際的な協力が行われる可能性はありますか。それとも全く無法地帯なのでしょうか。

人々はいつ協力するのかと問われれば、彼らの利益が一致したときです。冷戦の最盛期、アメリカとソ連は地球規模の熱核戦争を起こさないように協力しました。それはどちらの利益にもならなかったからです。利益が一致していたのです。

AIのリスクを見てみると、フェイク動画で選挙を腐敗させるというものがあります。この点では各国の利益は相反しています。皆お互いにやっていますからね。サイバー攻撃もそうです。基本的には利益が相反しています。テロリストがウイルスを作成する場合は利益が一致する可能性があるので、そこでは協力するかもしれません。

そして間違いなく彼らの利益が一致し、協力するであろう一つのことがあります。それはAIが人間から主導権を奪うのを防ぐということです。もし中国人が、AIが人間から主導権を奪おうとするのを防ぐ方法を発見したら、彼らはすぐにアメリカ人に教えるでしょう。なぜなら、彼らもアメリカでAIが人間から主導権を奪うことを望んでいないからです。この点に関しては私たち全員が同じ船に乗っています。

これはAI版の「核の冬」ですね。誰もがそれを避けようと協力するでしょう。核の冬について皆の記憶を呼び起こすと、核兵器が全面的に交わされた場合、森や土地などが焼却され、すすが大気中に放出されて太陽光を遮り、すべての生命が死に絶えるという考えです。全面的な核兵器の応酬に勝者は存在しません。相互確証破壊です。誰がそれを望むでしょうか。

狂人でもない限り望みません。あるいはゴキブリが勝つかもしれませんね。

指導者がカルトに属している可能性は考慮されていません。自分は死後に特定の場所へ行き、信者全員も一緒についてくるのだから、皆が死んでも構わないと言う指導者がいれば、あなたが説明した利益の一致というビジョンはかなり複雑になります。

確かに非常に複雑になりますね。しかし、トランプが実際には神を信じていないことは明白なので、私はそのことに非常に慰めを見出しています。

スティーヴン・ワインバーグの言葉を引用させてください。彼をご存知ですか。

いいえ。

「世界には常に良い人と悪い人がいる。しかし、良い人に悪いことをさせるには宗教が必要だ」。何かの大義の名の下に行うからです。現時点で私たちが一つの宗教を持っていることを認識する必要があると思います。私たちはそれを科学と呼んでいます。他の宗教と違うのは、科学は正しいということです。

さて、私たちはジェフリー・ヒントンにチューリング賞と、ここで彼が貢献したことに対するノーベル賞を授与すべきだと思います。2018年にチューリング賞を受賞されましたね。これはコンピュータサイエンスにおいて非常に権威のある賞です。番組の冒頭でチューリングについて触れました。まずはその受賞、おめでとうございます。

しかし、それでは不十分でした。ノーベル委員会は、ジェフリーの数十年前の仕事によって生み出されたこのAI技術は、この世界で起こっていることにとって非常に根本的であるため、ノーベル物理学賞を授与しなければならないと判断しました。2024年のノーベル物理学賞受賞、おめでとうございます。

少し訂正させてください。AIを生み出した人々はたくさんいます。特にバックプロパゲーションのアルゴリズムはデビッド・ラメルハートによって再発明されました。彼は厄介な脳の病気を患って若くして亡くなりましたが、十分な評価を得ていません。

指摘していただきありがとうございます。それに、すでに亡くなっている人にはノーベル賞は授与されませんからね。

ええ、発表の時に生きていなければなりません。発表と授賞式の間に亡くなった場合はもらえますが。いずれにせよ、おめでとうございます。私たちのポッドキャストを自慢するつもりはありませんが、あなたがインタビューした5人目のノーベル賞受賞者だと思いますよ。

もっと多いはずですよ。

AIバブルと雇用への影響

フォローアップの質問があります。終末論的なシナリオに入り込みましたが、人間は競争する性質を持っているため、このシナリオが現実にならないことを願っています。現在、誰が人工知能の競争をリードしており、誰が最初にゴールラインを越えて賞を手にする可能性が高いのでしょうか。

もし私が賭けるとしたら、おそらくGoogleだと思います。しかし、私はGoogleで働いていたので、私の言うことを真に受けすぎないでください。彼らが勝つことに既得権益があります。Anthropicが勝つかもしれませんし、OpenAIが勝つかもしれません。MicrosoftやFacebookが勝つ可能性は低いと思います。

Facebookでないことは分かっていますよ。

なぜそう言えるのですか。誰がFacebookを経営しているか見てみましょうよ。

いや、誰が経営しているかではなく、適切な人々に仕事させるためのリソースを持っているかどうかの問題です。

ジェフリー、この質問の続きですが、最初にゴールラインを越えた人はどのような賞を手にするのでしょうか。他の人より先にそこに到達することの報酬は何でしょうか。

少し戻りましょう。昨年の株式市場の価値について教えてください。私がメディアで読んだ限りでの考えですが、アメリカの株式市場の価値の増加の80%は、巨大なAI企業の価値の増加によるものだとされています。

その通りです。80%の成長ですね。バブルだと思いませんか。人々はそれをAIバブルと呼んでいます。

問題はここです。バブルには2つの意味があります。1つの意味は、AIが人々が思っていたほどうまく機能しないことが判明するというものです。それを開発しているほとんどの人々が最終的に起こると信じているような、人間の知的労働をすべて代替する能力を実際には開発できないということです。それが間違いなく恐怖の要因でした。

バブルのもう1つの意味は、企業が投資からお金を回収できないということです。現在、企業は皆「私たちが最初にそこに到達できれば、多くの仕事を置き換えるAIを人々に販売できる。そしてもちろん人々はそれに大金を払うだろうから、私たちはたくさんのお金を得られる」と想定しているため、こちらのバブルの可能性の方が高いように思われます。しかし、彼らは社会的影響について考えていません。もしAIが本当に多くの仕事を置き換えたなら、社会的な影響はひどいものになるでしょう。

まったくその通りです。仕事を置き換え、その後も製品を販売したいと考えても、製品を買うための収入を持っている人が誰もいなくなるわけですから。自己制限的な道です。これはケインズ主義的な見方ですね。それに加えて、高い失業率が深刻な社会不安につながるという見方もあります。社会が2つの層に分かれ、AIから利益を得る人々と、AIのせいで農奴のような生活を強いられる人々になるという考えです。

非AIの質問をさせてください。自動化の黎明期にも誰もが同じことを言いました。全員が失業し、仕事がなくなり、社会は崩壊すると。しかし社会は他のニーズや他の事柄とともに拡大し、だからこそ私たちの90%はもはや農民ではありません。機械にそれを任せ、他のものを発明してきました。しかしそれには数十年かかりましたが、AIの場合はそのほんの一部で起こります。

ジェフリー、ここでの問題は、社会が回復できないほどの速度で失業者層が生み出されてしまうかもしれないという、その急激さなのでしょうか。

それは確かに問題の大きな側面の一つです。しかしもう一つの側面があります。肉体労働を置き換えるためにトラクターを使用する場合、必要な人数ははるかに少なくなります。そして他の人々は別の知的作業をすることができます。しかし人間の知能を置き換えてしまったら、彼らはどこへ行くのでしょうか。コールセンターで働く人々は、AIの方が安くて上手に仕事ができるようになったとき、どこへ行くのでしょうか。彼らが開拓できる新しい分野はありません。AIはそれらもできるのですから。

人類の歴史は、限界を取り除く歴史として興味深く見ることができます。大昔、私たちは次の食事をどこから得るかという限界を心配しなければなりませんでした。農業がその特定の心配を取り除きました。多くの他の問題をもたらしましたが。それから、あまり遠くまで移動できないという限界がありましたが、自転車や自動車、飛行機がそれを大きく助け、私たちはその種の限界を乗り越えました。長い間、私たちは自ら思考しなければならないという限界を持っていましたが、まさに今、その限界を乗り越えようとしています。すべての限界を乗り越えた後どうなるかは明確ではありません。

サム・アルトマンのような人々は、それが素晴らしいことになると考えています。私たちはAIのペットになるでしょうから。

長年、ユニバーサルベーシックインカムを求める動きが始まっています。ジェフリー、AIが力を増すにつれて、ユニバーサルベーシックインカムというアイデアの実質的な価値が高まっていると言えるでしょうか。

より不可欠なものになりつつありますが、多くの問題があります。一つの問題は、多くの人々が自分の仕事から自己価値を感じているため、尊厳の問題には対処できないということです。もう一つの問題は税基盤です。労働者をAIに置き換えれば、政府は税基盤を失います。なんとかしてAIに課税できるようにならなければなりませんが、大企業はそれを好まないでしょう。

この問題はAIに解決させるべきですね。

意識と主観的経験:AIは意識を持つのか

多くのSF作家は、機械の力や知性と、彼らが意識を持つようになる交差点を区別しています。ターミネーターシリーズでは、スカイネットが意識を獲得するほど十分な神経接続を持ったときがシンギュラリティであり、大きな瞬間でした。認知心理学者としての視点からお聞きしたいのですが、現実であれ想像であれ人工であれ、ニューラルネットに十分な複雑さが与えられれば、意識のようなものが創発すると仮定してよいのでしょうか。

ここでの問題は科学的な問題ではありません。私たちの文化におけるほとんどの人々が心の働きについて持っている理論、つまり意識を何らかの創発する本質として見る見方の問題です。意識というのは、フロギストンのようなものだと思います。物事を説明するために作られた本質であり、それらの物事を理解できれば、もはやその本質を使って説明しようとはしなくなるでしょう。

マルチモーダルチャットボットがすでに主観的経験を持っていることを納得させたいと思います。人々は感覚や意識、あるいは主観的経験という言葉を使います。ここでは主観的経験に焦点を当てましょう。私たちの文化におけるほとんどの人々は、心の働きを一種の内なる劇場のようなものだと考えています。知覚しているとき、世界はこの内なる劇場に現れ、そこにあるものを見ることができるのは自分だけです。

もし私がたくさんお酒を飲んで、「目の前に小さなピンクの象が浮かんでいる主観的経験をしている」と言ったとします。ほとんどの人はこれを、私の心という内なる劇場があり、そこに小さなピンクの象がいるのを私が見ていると解釈します。それらは本物のピンクや本物の象でできているわけではないので、何か他のものでできているはずだと。そこで哲学者はクオリアという概念を発明します。これは認知科学におけるフロギストンのようなもので、それらはクオリアでできているに違いないと言います。

ダニエル・デネットの見解である全く異なる見方を提供しましょう。彼は認知科学の偉大な哲学者でした。彼の見解では、そのような心に対する見方は完全に間違っています。私は先ほど、ピンクの象の主観的経験について話したのと同じことを、「主観的経験」という言葉を使わず、クオリアにも訴えずに言ってみましょう。

私はまず、「自分の知覚システムが私に嘘をついていると信じている」と言います。これが主観的な部分です。しかし、もし私の知覚システムが嘘をついていなければ、現実の世界に小さなピンクの象がいて、私の目の前に浮かんでいるはずだ、と。この小さなピンクの象について面白いのは、それらがクオリアでできていて内なる劇場にあるということではなく、それらが仮説的であるということです。私の知覚システムが真実を語っているとしたら何が存在しなければならないかをあなたに伝えることで、私の知覚システムがいかに嘘をついているかを伝えるためのテクニックなのです。

これをチャットボットでやってみましょう。カメラとロボットアームを持ち、話すことができるマルチモーダルチャットボットを訓練します。目の前に物体を置いて「その物体を指差して」と言うと、それは物体を指差します。次に知覚システムを狂わせます。カメラの前にプリズムを置くのです。そして物体を前に置いて「物体を指差して」と言うと、それは片側にずれた方向を指差します。

そこで「いや、物体はそこにはない。実際には真正面にある。ただ、君のレンズの前にプリズムを置いたんだ」と言います。するとチャットボットは「なるほど、プリズムが光線を曲げたので物体は実際には私の真正面にあるのですね。しかし、私にはそれが片側にあるという主観的経験がありました」と言います。

もしチャットボットがそう言ったなら、それは私たちが主観的経験という言葉を使うのと全く同じ方法で使っていることになります。つまり、そのチャットボットはたった今主観的経験を持ったことになります。

もし最初にチャットボットと飲みに行って、大量のジョニーウォーカー・ブルーを飲んでいたらどうなりますか。

それは極めてありそうもないですね。私はラフロイグを飲みますから。

アイラ島のウイスキーがお好きなのですね。ピートの香りが好きとは、いい趣味をしています。

つまり、あなたがこれら2つの例で共有してくれたことを理解すると、あなたは私たちに意識のチューリングテストを仕掛けたということですね。人間がこれを行うのと同じようにチャットボットがそれを行うなら、それは根本的に同じだということです。もしその行動を示すことで私たちが意識を持っていると言いたいなら、チャットボットも意識を持っていると言わざるを得ず、それを引き起こしている何らかの神秘的な流体を発明しなければならないということですね。意識という概念全体が、刺激に直面したときに人々がとる行動から単に気をそらすためのものかもしれないということですね。

その通りです。チャットボットには意識と呼ばれる神秘的な本質や流体はありませんが、私たちと同じように主観的経験を持っていることに注目してください。複雑になれば突然意識という魔法の本質が与えられるという考え全体が、単なるナンセンスだと私は思います。

私もそう思います。意識とは、何らかの明白な形で本当に存在するかどうかもわからないまま人々が説明しようとしているものであり、だからこそ説明するのが常に難しいのだとずっと思っていました。しかし、認識(アウェアネス)は存在します。哲学的ではなく科学的に考えるとき、チャットボットが「正直になりましょう。あなたは私をテストしているのですか」と言い、科学者が「チャットボットはテストされていることに気づいていた(アウェアだった)」と述べる素晴らしい論文があります。彼らはチャットボットに認識を帰属させているのです。そして日常会話では、それを意識と呼びます。哲学的に考え始め、それが何か奇妙で神秘的な本質だと考えたときにだけ、すべてが混乱するのです。

この対話は非常に魅力的で、1ヶ月は眠れなくなりそうです。

ええ、仕事がたくさんはかどるでしょうね。

AIとの未来に向けて

ジェフリー、最後にポジティブな話で締めくくっていただけますか。

私たちがAIと幸福に共存できる方法があるかどうかを見つけ出す時間はまだあります。そして、私たちはそのための研究に多大な努力を注ぐべきです。なぜなら、私たちがAIと幸福に共存でき、AIが私たちの仕事をはるかに簡単にしたときに生じるであろうすべての社会問題を解決できれば、それは人々にとって素晴らしいことになるからです。

ええ、希望はあります。

最後に一つだけ、あなたが仄めかしていたことについて質問させてください。AIが自己訓練を行い、分単位で指数関数的に賢くなるシンギュラリティのポイントについてです。以前の番組にゲスト出演したレイ・カーツワイルをはじめ、多くの人がそれをシンギュラリティと呼んでいます。このシンギュラリティについてのあなたの見解はどうですか。他の人が言うように現実のものですか。差し迫っているものですか。

どちらの質問に対する答えもわかりません。私の推測では、AIは最終的にあらゆることにおいて私たちよりも優れたものになるでしょうが、それは一度に一つの領域ごとに進むだろうということです。現在、彼らはチェスや囲碁で私たちよりはるかに優れています。多くのことを知ることにおいて私たちよりはるかに優れていますが、推論においてはまだ私たちほどではありません。すべてにおいて一度に大規模に私たちを追い越すのではなく、一つの領域ずつ行われると思います。

そこからの私の逃げ道は、私はビーチを歩いて小石や貝殻を見ることができるということです。AIにはそれができません。

AIは自分のビーチを作ることができますよ。

私が発見した新しい軟体動物についてAIが知ることができるのは、私がそれを書いてオンラインにアップロードした場合だけですよね。ですから人間は、AIがアクセスできない方法で宇宙を探索し続けることができます。

あなたの評価から1つの言葉が抜けていますよ。

何ですか。

「今のところは(Yet)」です。

AIが、人間の洞察力を必要とする新しい宇宙の理論を考え出すことができるでしょうか。私は誰も考えたことのないような方法で考えることができますから。

私はできると思います。

それは私が欲しかった答えではありませんね。

ええ、そうでしょうが、それが答えです。例を挙げましょう。AIはすでに類推に非常に優れています。GPT-4がウェブを見ることを許可されず、すべての知識が重みの中にしかなかったとき、なぜ堆肥の山は原子爆弾に似ているのかと尋ねました。AIはエネルギーのスケールも時間のスケールも全く異なると答えましたが、その後、堆肥の山が熱くなるとより早く熱を発生し、原子爆弾がより多くのニュートロンを発生するとより早くニュートロンを発生させる仕組みについて話しました。AIはその共通性を理解していたのです。1兆個程度の少ない接続にそれだけの知識を詰め込むためには、それを理解しなければなりませんでした。それは多くの創造性の源泉であり、単に他の単語と並置された単語を見つけるだけのレベルではありません。

単なる言葉の組み合わせではなく、連鎖反応とは何かを理解していたのですね。

さて、これで私たちの終わりです。地球上での私たちは終了です。終わりました。これが最後のエピソードです。私たちはもうおしまいです。皆さん、楽しかったですよ。

ジェフリー・ヒントン、ご出演いただき本当にありがとうございました。特にノーベル賞受賞後は様々な方面から引っ張りだこで、過密なスケジュールの中、私たちに貴重な時間を割いていただいたことに感謝します。

ご招待いただきありがとうございました。

さて皆さん、いかがでしたか。最後まで落ち着いて座っていられましたか。

私は身もだえしていました。

パニックになると思っていましたよ。下痢の状態で映画館に座っているような不安を感じましたからね。

率直な意見をありがとう。

これまで言われた中で一番嬉しい言葉です。

というところで、今回のスタートーク特別編は終了です。いつもありがとうございます。ゲストホストにも感謝します。皆様のパーソナル天体物理学者が、どんなに困難になろうとも、常に上を見上げ続けるようお願いして終わります。

コメント

タイトルとURLをコピーしました