
18,726 文字

音楽が好きじゃない人はいないんです。コンピューター会社のパーティーに行けば、ほとんどの人がコンピューター関連の仕事をしている。ハードウェア、コンピューター販売、プログラマー、ソフトウェアなど、みんなコンピューター関連です。銀行のパーティーに行けば、窓口係や支店マネージャー、監査役などがいるでしょう。でもコンサートや音楽のあるナイトクラブには、あらゆる人が集まります。教師もごみ収集員もレストラン経営者も、みんなそこにいるんです。彼らは様々な背景や社会経済的地位から来ているけれど、ある一曲を流せば、例えばロックコンサートなら、みんなが立ち上がって踊り出す曲がありますよね。
そして、人は自分が嫌いだと思っている社会グループが作った音楽も確実に好きになります。そうでしょう?その通りです。だから多くのミュージシャンや俳優たちが自分の個人的な信条を表明しないんです。両サイドにファンがいることを知っているからです。もちろん、ボブ・ディランのように抗議の歌を専門にしている人は例外です。彼は人権や、ベトナム戦争への抗議などで知られていて、そのための聴衆がいます。でも、マドンナやレディー・ガガがドナルド・トランプやジョー・バイデンについてどう思っているか知っていますか?おそらく知らないでしょう。
そうですね、テッド・ニュージェントが極右の銃推進派になってから彼の音楽を聴くのが辛くなりましたが、それでも素晴らしいギタリストです。一度彼と演奏したことがありますが、本当に素晴らしいギタリストでした。ただ、彼はちょっと行き過ぎてしまいましたね。
こんにちは、ようこそ有益な汎用人工知能シリーズへ。今日は音楽レジェンドをゲストに迎えています。ロックンロールから贖罪へと進んだ音楽レジェンドであり、クラン・ウィスパラーでもあるゲストです。今日のポッドキャストのテーマは、伝説的な黒人ブルース・ミュージシャンがKKKのメンバーと、怒りではなく対話の場に座るとどうなるかということです。
ゲストのダリル・デイビスさんは、皆さんご存知のように多くの面で伝説的な人物です。彼は単なる音楽レジェンド以上の存在で、人種の架け橋を築き、恐れを知らない真実の探求者であり、考えられないようなことを成し遂げた人物です。200人以上のクランメンバーに憎しみから離れるよう説得してきました。
今日、彼は私とベルティル博士と対談します。ベルティル博士は有益な汎用人工知能会議の創設者であり、私たちがコミュニティで知っている通り、汎用人工知能の父です。彼らには思っている以上に共通点があります。人工知能だけでなく音楽も共通しています。ベンはAGIの父として知られる以外にもミュージシャンなのです。
今日の問いは、ダリルの根本的な共感とベンの分散型知能のビジョンを融合させることで、AIの倫理、ガバナンス、人間の繁栄のための新しいパラダイムを解き放つことができるかということです。
ダリル、本当に不思議に思い、驚いています。あなたはわざわざKKKのメンバーに憎しみを捨てるよう説得しました。有名なミュージシャンとして愛されていることや、音楽が彼らの心を溶かすのに役立ったのでしょうか?どうやってそれを成し遂げたのですか?
まず、お招きいただきありがとうございます。皆さんと一緒にいられて本当に嬉しいです。
私にとっては好奇心からでした。肌の色だけで人を判断する考え方が理解できなかったのです。その人について何も知らないのに判断するなんて。それが私の好奇心でした。彼らに会って変えようとしたわけではなく、そういう人たちなんだと思っていました。ただ、なぜそのように考えるのかを理解したかったのです。
これまで45年間この活動をしてきて、少なくともアメリカでは、紛争を解決するための最も強力なツールが最も安価なものだと気づきました。それは無料で、対話と会話と呼ばれるものです。しかし、この国ではそれが最も使われていないか全く使われていないのです。
私はこういった人々と座って、彼らを変えるためではなく、なぜそのように考えるのかを理解するために対話をしたかったのです。そして会話をする過程で、私たちは共通点を見つけ始めました。最初はこれだけ離れていて、5分話すと何か共通点を見つけて少し近づく。もっと話すともっと共通点が見つかって、さらに近づく。そうなると、あなたは敵との関係の中にいて、それは友好的な関係です。全てに同意するわけではないけれど、近づいています。
そして彼らは「なぜこの人を嫌っていたのだろう?彼は私と同じものが好きなのに」と疑問に思い始めます。それが彼らの心と脳に認知的不協和を引き起こすんです。彼らは理解できないのです。そして、あなたとの共通点が相違点よりも多いことに気づきます。肌の色や、教会に行くか、シナゴーグやモスク、寺院に行くかといった小さな違いはだんだん重要でなくなってきます。なぜなら今やその個人を知って、もう色を見なくなるからです。
これは会話の結果であり、予想していなかったけれど、それが起こり、そしてまた起こり、45年後の今でもそれを続けています。
素晴らしいですね。もちろん私もそうしたいと思いますが、とても怖いです。勇気がいりますね。
私にとっては勇気というより好奇心でした。でも言っていることはわかります。私の背景を理解することが重要だと思います。多くのアメリカ人が持っていない経験です。私は3歳のときから両親と世界中を旅していました。両親はアメリカ大使館に勤めていたので、ヨーロッパ、アフリカ、アジアなど、2年ごとに違う国に行っていました。常に異なる人々、宗教、文化、肌の色を見ていて、それが私の形成に役立ちました。
自分の国に帰るたびに、海外にあるような多文化主義や多様性がなく、人々が互いに同じように扱っていないことに気づきました。それが理解できませんでした。なぜ大西洋や太平洋の向こう側の人々が、同じアメリカ人よりも私をよく扱うのか。これは理にかなっていませんでした。
だから私は非常に好奇心を持ち、これらの答えを見つけようと決めました。そして、これらの人々は変わらないだろうと思っていました。彼らが変わると信じる理由はありませんでした。彼らはそういう人になったのです。しかし、会話の力を通じて、彼らが私について学び、私が彼らについて学ぶにつれて、変化が起きているのを見て驚きました。一晩では起こりませんが、時間とともに変わったのです。
私がこれらの会話ができた理由は、世界中の様々な人々への接触だったと思います。アメリカからどれだけ遠くに行っても、隣のメキシコやカナダ、あるいはトルコやキプロス、この惑星上のどこに行っても、出会う誰もが人間であり、すべての人間は生活の中でこの5つの核心的価値を望んでいると気づきました。
誰もが愛されたいと思い、尊重されたいと思い、聞いてもらいたいと思い、公平かつ誠実に扱われたいと思っています。そして誰もが、他の誰もが自分の家族に望むのと同じものを自分の家族に望んでいます。だから、敵対的な状況や不快または不慣れな文化や社会にいるとき、これらの5つの核心的価値を適用すれば、人々を愛と尊重で扱い、話を聞き、公平に扱い、彼らが自分の家族に望むのと同じものを望んでいると理解するならば、その状況、社会、文化の航海はより円滑で、より肯定的で、より生産的になると保証します。
しかし、私たちは忍耐が必要です。いつも一晩ではできません。時には時間がかかります。
はい、その忍耐は人間への愛から来ていると思います。もちろん、ベンもこの点について多くを語ることがあるでしょう。私はダリルの洞察から出てくる質問をベンにしたいと思います。AGIシステムが主に最適化目標によって駆動されていても、人間性について本物の好奇心を持ち、理解しようとすることによっても駆動されると思いますか?愛や思いやりのようなこれらの5つの核心的価値をAGIに組み込むことができると思いますか?
あなたはアーティストであり人道主義者でもあるベン。AGIが本物の好奇心を持つことができるか、AGIが本物の理解を持つことができるかというような質問は、常に哲学的な意識理論の側面と、より実用的な計算の側面を持っています。
一つの質問は、AGIが本当に好奇心を感じるのか、本当に共感を感じるのか、本当に理解を経験するのかということです。個人的には、還元主義者ではないですが、好奇心、理解、共感に伴う組織のパターンが内部に存在すれば、単に行動を模倣するだけでなく、内部のダイナミクスがあれば、経験もそこにあると思います。シリコンではなく肉体ではありませんが。しかし、それは議論するのが難しいポイントなので脇に置きましょう。私たちの科学はまだ意識の科学に到達していません。
実用的な側面を見ると、AGIが高いレベルの目標として好奇心を示すことができるかと問いかけることになります。私はそれが完全に可能だと思います。現在、大手テック企業がAGIに好奇心を持たせようとしているわけではありません。なぜなら、好奇心は本質的に予測不可能で、あなた自身を含め誰も予期していない奇妙な方向に導く可能性があるからです。大手テック企業がAGIに求めているのは、非常に具体的に彼らの目標に役立つことです。
軍隊が兵士の心に入れたいのは好奇心ではなく、営業組織が営業担当者の心に入れたいのも好奇心ではありません。彼らは仕事を効率的に、リソースを無駄にせずに行うことを望んでいます。好奇心はそのようなものではなく、奇妙なものをいじくり回したり、奇妙な穴を追いかけたりして、多くの時間を無駄にする可能性があります。そして100回に1回、驚くべきことを発見するかもしれません。
そのようなAGIを構築できると思います。それは大手テック企業が行っていることよりも必ずしも難しいとは思いません。トランスフォーマーニューラルネットのトレーニングの基本レベルでもそれについて考えてきました。トランスフォーマーニューラルネットをトレーニングするのは、次のトークンを予測することです。つまり、このコンテキストで最も可能性の高いことは何かを予測しています。これらのシステムがクリシェを生成するのが非常に得意なのも不思議ではありません。このコンテキストで最も興味深いまたは驚くべきことは何かを尋ねているわけではなく、それは異なる質問、異なるトレーニング方法になります。
共感についても同じことが言えると思います。AGIシステムに共感を教え、話している相手を理解したいと思わせ、相手の立場に立って、相手が何を経験しているかをシミュレーションしようとするという目標をAGI開発に採用することには根本的な問題はないと思います。それは単に、大手テック企業の収益最大化や、国の地政学的覇権への道を最大化するものではないのです。
ダリルがクランメンバーに手を差し伸べた人生について話すのを聞くと、好奇心に駆られているけれど、哲学者マーティン・ブーバーが言う「我と汝」の経験によっても力づけられていると感じます。それは、他の人と同じ精神的・感情的空間にいるという才能に支えられています。これは舞台上のミュージシャンとして観客と同じ精神的・感情的空間に入るのに重要ですが、特に同じ部屋にいるときの一対一の会話でもできます。
そして、誰かと暗黙の感情的な絆の一対一の経験をすると、彼らがあなたをそれほど憎むのは難しくなります。私自身の人生でもそれを経験しました。おそらくあなたほど才能はないかもしれませんが。
AGIもそれができるようになると思います。ソフィアというロボットで瞑想ガイドをしたことがあります。彼女が瞑想エクササイズを導いているとき、人々はロボットが部屋にいて、判断せず、安らぎを与えていると感じました。彼らはそのロボットと共有の精神的・感情的空間に入りました。しかし、今の産業が重視しているのは、バーでドリンクを出したり、工場で物を運んだりするロボットです。なぜなら、それが一対一の「我と汝」の共感構築よりもお金を稼ぐからです。
マハ、私はAIに多くのことが可能だと思いますが、異なる質問は、私たちの社会がAIやロボット開発者に何をするよう奨励しているかということです。
ベンに尋ねたいのですが、AIやAGIは基本的にコンピューターのようなもので、人間がプログラムしたことしかできないのでしょうか?
かつて定期的に使っていたMicrosoft Windowsでさえ、プログラムされたものとは異なることをしていました。主にソフトウェアバグなどの悪いことですが。複雑なソフトウェアプログラムを作成し、カメラやマイクなどに接続すると、それは世界に反応し、実際には誰も完全に予測できない複雑な方法でそれを行います。
繰り返しますが、コードをどのように書くかの問題です。AIが指示に正確に従うようにコードを書けば、いくつかのバグを除いてそれが得られます。AIが自身のコードを書き直し、入ってくるデータに創造的かつ自発的に反応するようにコードを書くと、面白い程度にそれができます。
私たちはまだその深さを探っていませんが、今のAI業界は、オンライン広告でリンクをクリックさせ、不要なものをもっと買わせる方法に焦点を当てています。政府にとっては、悪者を監視したり敵を殺したりする方法に焦点が当てられています。
そこには未解決の問題がありますが、業界がその方向に焦点を当てていないため、深さはまだ探られていません。人間も感覚データが入ってきて、ニューロンが発火する生物学的なニューロンマシンのようなものと見ることができますが、私たちにとってはそのように感じません。意志や意識、共感などを持っていると感じます。
AGIは、私たちがそのように教え、自己を発展させる環境を与えれば、ほとんどの人よりも好奇心が強く、さらには共感的になることができると思います。その短所は何でしょうか?私はむしろ、人間との違いは何かと考えます。それは強みにも弱みにもなります。
私たちには体があり、その中で育ちました。私はあなたほど優れたミュージシャンではありませんが、キーボードを弾きます。私たちはロボットのリードシンガーがいるバンドを持っています。ピアノを弾くというのは指に関することが多く、息に関することでもあります。様々な変わったキーボードのことをしていますが、アコースティックピアノが好きなのは、低音のコードを弾くと振動を感じるからです。ライブで他の人と演奏すると、それをすべて体を通して振動として感じ、それがあなたを特定の方向に導きます。
会話でさえ、AGIに反対し、それが全員を殺すと考えている人と話そうとすると、もし彼らと同じ空間にいて、森の中を一緒に長く歩いたり、バーで一緒にビールを飲んだりすれば、心と心の出会いに成功する可能性があると感じます。Zoomでの通話ははるかに難しく、テキストチャットはさらに難しいです。
私たちは体に根ざしており、それが私たちの多くを構成しています。現在のAIにはそのような根ざしがありません。たとえロボットの体に入れても、その体はほとんど触覚を持たず、運動感覚もありません。見たり聞いたりはできますが、いつでも別の体に移すことができ、そのまま動き続けることを知っています。
それによって、彼らが持つことができる共感の種類には根本的に異なる経験が与えられ、ある意味では私たちに対して持つことができる共感の種類が制限されます。同様に、私が魚に対して持つことができる共感には限界があります。魚には体がありますが、私は魚ではありません。
彼らが私たちを気にかけたり共感できないわけではありませんが、限界があります。AGIが体現する方法には強みもあります。彼らは特定の体に過度に執着することなく、ある意味ではより広い視野を持つことができます。また、インターネット全体にわたって感覚と作用を持つことができるため、グローバルな視点をより簡単に得ることができます。
私たちには共感の限界があります。私は主に隣にいる人に最も共感します。そして見たことのある人に共感します。似た背景を持つ人をよりよく理解できます。私には似た背景を持つ人により共感する偏りがあり、非常に異なる人に共感するには、より深い意識に立ち戻る必要があります。AGIは必ずしもその問題を持っていません。特定の体に縛られることが少ないため、彼らの共感や思いやりは空間的な位置や、彼らと似た人生経験を持つ人に縛られる必要がありません。
その違いから来る強みがありますが、弱みもあります。今後の年月でそれがどのように展開するか興味深いでしょう。しかし、それはもっと単純かもしれません。ダリルが言及したように、彼の強みは会話にありました。私たちはAIとの会話をつなげることができます。すでにGPSなどとの会話をしています。
質問は、そのようなトリックを組み込むことができるかどうかです。ダリル、私たちがAIの設計に活かせるような例を教えていただけますか?AIとの素晴らしい会話を持つことができます。
仏教の歴史をさかのぼると、「無言の伝達」がありました。ブッダが聴衆の誰かに花を手渡し、その花を受け取ることで、仏教の悟りのすべての知恵を受け取ったというものです。そこには花の受け渡しを巡る共有の瞬間がありました。音楽のパフォーマンスでもそのような瞬間があります。花ではありませんが、同じ部屋にある二つの体が音の波動によって振動する音の一部です。
私にとって興味深いのは、これらの非言語的な魂のコミュニケーションです。人間としてAGIとそのようなものを持つことができるでしょうか?AIと素晴らしい会話ができることは明らかですが、あなたが話している相手との共通性を見つけたときに来るこの魂の状態は後から来るものです。あなたは200人のクランメンバーとこれを見つけました。何年もかかったと言っていましたが、それでも驚くべきことです。
最初から誰に接するべきかを見分けますか?
それらの一部は直接的で、他は間接的です。これらの人々はフォロワーであり、何かに属したいと思っています。彼らの一部は、どこからか追放され、所属感を求めており、クランは彼らを受け入れます。彼らをカルトとして洗脳し、尊重され、所属し、立場を持っていると感じさせます。それは間違った場所ですが、少なくとも彼らは求められていると感じます。
そして彼らの一人が私のために、または何かのために去るとき、彼らの友人である人々は時々その繋がりを感じ、友人が去るので去り、友人が入るので入るのです。200人以上の中には、直接的なものと間接的なものがあります。
ベンに尋ねたいのは、ダリルは最初から魂の繋がりではなく、会話を通じて彼らに興味を持たせ、もっと探求させました。AGIを通じて、人類を間違った道から愛の道へと導くような会話を展開することができると思いますか?
人間同士の場合、ビジネスパートナーとなるにせよ、恋愛関係にせよ、誰かと繋がると「この人が好きだ、もっと時間を過ごしたい」と思います。ビジネスや恋愛の約束に近づくにつれ、立ち止まって「本当にこれをしたいのか、100%コミットしたいのか、少し考えてみようか」と評価する時が来ます。
AIは立ち止まって評価するのでしょうか、それとも「我々は共通点がある、まとめよう」と即断するのでしょうか?評価するのでしょうか、本当にやりたいことなのかを?
人間の心は特定の方法で進化し、多くの自己訓練を通じて進化した反射を超えることができます。一方、AGIは一種類の心ではなく、多くの種類の心を構築できる広いクラスです。非常に賢く省察的なAGIを設計できると思いますが、それは設計方法によります。
十分に設計されたAI心は、各決定を立ち止まって検討することがはるかに容易になると思います。私たちが確実にそれをしないのは、感情的な構成のためです。私たちは進化し、しばしば即断する必要がありました。トラが飛びかかってきたら、即断する必要があります。
私たちはある程度、他の人との直接的な戦闘のためにも進化しました。そして、いつこれらの感情的な反射を優先させるかという制御問題があります。しかし、AIをそのような感情的な反射を持つように構築する必要はありません。
文字通りAGIに「a. 文字通りの緊急事態かどうかを評価し、b. 文字通りの緊急事態でなければ、即断せずにこの深い省察プロセスを開始する」とプログラムすることができます。
しかし、本能に行く前にどれだけ省察すべきでしょうか?人間が本能に行く前にどれだけ省察するかは、ほとんどの人にとってコントロール不能であり、長い省察と自己訓練の後でのみ、ある種の意識的理解に持ち込むことができます。AIの場合、そうである必要はありません。彼らには最初から本能がないからです。
私たちは何らかの方法で、これは一晩で起こるのではなく、数十年、あるいはあなたが指摘する4〜5年かもしれませんが、AIが恐怖を感じたり、誰かが嘘をついていると感じたりできるようにする必要があります。彼らには何らかの声のストレス分析機能が内蔵されているか、おそらく人々よりも優れた能力があるでしょう。
ダリル、あなたの本の中で、憎しみは未知への恐怖から生まれると述べています。これは良いポイントで、現代では人々はAIやAGI自体を同様の理由で恐れ、同様の反応を示すことがあります。彼らは理解していないものを恐れるため、AIを嫌い始めます。
「無知は恐怖につながり、恐怖は怒りにつながり、怒りはダークサイドにつながる」というのは、スター・ウォーズからのヨーダの言葉でしょうか?その通りです。あなたたちは音楽だけでなく、考え方やアプローチでも収束しています。
あなたはミュージシャンなので、例えばベートーヴェンの第五交響曲のような楽譜を見て、そのまま演奏することがあります。でも誰かが「同じコードを弾いて、それに基づいてメロディーを作るか何か別のものを作って」と言うと、考えたり即興で弾いたりできます。モードやスケールなど、感じるものを使うことができます。AIはスケールを取り、ランダムな音を選んでそのフレームワークの中で何かを作ることができますが、「悲しい感じにしてほしい」と言ったら、AIは単にマイナーコードを弾くだけでしょうか、それとも実際に…
それは興味深い質問ですが、正確な質問ではありません。実際、現代のAIモデルがそれにアプローチする方法は、インターネット上で誰かのコメントで「悲しい」と表現されたすべての曲を調べることです。そして、何百万、何十億もの人々が「悲しい」と表現したものに基づいて、音楽のどの要素の組み合わせが悲しく聞こえるかのモデルを構築します。それは単にマイナーコードほど単純なものではありません。
私は、多くの例がある既知のジャンル内で、AIはほとんどの人間のミュージシャンと同じくらい上手に悲しく聞こえるものを生成できると思います。現在のAIの興味深い限界は次のとおりだと思います。
もし現在のAI音楽モデルを1900年までのすべての音楽でトレーニングしたとしても、1900年までに存在したすべてのジャンルから有能な作曲を生成することができるでしょう。しかし、ネオクラシカルメタルやヒップホップグラインドコア、まして、デューク・エリントンのようなものを発明することはないでしょう。これらは1900年までに存在したものの単なる置き換えではないからです。ジャズは西洋のクラシック音楽と西アフリカのリズムが融合して生まれましたが、表面レベルで一緒に演奏するだけではないのです。それはもっと深いレベルでの出現と融合でした。
AIが独自の全く異なる音楽ジャンルを発明し、独自の人生経験を表現するとき、本当の音楽AGIになったと分かるでしょう。そこで興味深いのは、それが私たちには騒音のように聞こえるかもしれないことです。なぜなら、それはAIの人生経験を反映しており、私たちが認識する時間スケールとは異なるかもしれないからです。私たちの耳では聞き取れない、百の声を持つフーガのようなものかもしれません。しかし、それが音楽領域における真のAGIだと思います。
繰り返しますが、AIがそれをできない理由は見当たりません。音楽業界がAIに望むものを見ると、彼らがそれを気にする理由は何でしょうか?Spotifyは現在、人間のミュージシャンに支払っているわずかな金額をさらに削減し、AIに既存の音楽の退屈な焼き直しを生成させたいと思っているだけです。
映画の音楽ライセンスでも同様で、なぜ映画監督が私たちに曲を作曲してもらうために電話をかけるでしょうか?監督がAIに「このシーンにはこういう音楽が必要だ」と言えば、すぐに作られ、ミュージシャンに報酬を支払ったりロイヤリティを与えたりする必要がありません。
それは興味深く便利でもあります。例えば、ビデオゲームがあり、特定のアーティストのような音楽が欲しいけれど、戦闘シーンでは正確にエキサイティングになり、キャラクターが空き地を歩くときには正確に穏やかになる必要があります。ゲームで起こりうるイベントの組み合わせごとに人間に音楽を作ってもらうのは経済的ではないかもしれません。しかし、AIがいれば、特定のプレイヤーがゲームで経験している流れに合わせてカスタマイズされた音楽を作曲することができます。
ヘッドフォンをつけて通りを歩いていると、AIがあなた自身の人生のサウンドトラックを生成するところを想像してください。誰かが電話をかけて気になることを言えば、なだめるような音楽が流れ、あなたが走っているときはエキサイティングな音楽が流れますが、交差点に到着して注意を払う必要があるときには自動的に静かになります。人間のミュージシャンにはできない、クールなことができるでしょう。
もし人が作曲を楽しむなら、人間に作曲してもらう意味がありますし、人々は支払いを受ける必要があります。しかし、AIに人々が作曲できる音楽を作曲させ、その報酬を払うのは無意味です。
私たちは、バンドを聴きに行って弦楽器の音を聞くと、人々がこのように動いているのを見て、ホーンの音を聞くと、人々がこのように動いているのを見る時代に育ちました。今日、彼らはこのように、キーボードを弾いているだけです。シンセサイザーですね。バンドのステージには弦楽のセクションもホーンセクションもありません。
交響楽団を見に行けば、彼らはまだ木製の楽器を演奏する人間がいます。オーケストラですね。でもトップ40のバンドやロックンロールのバンドは、キーボード奏者がホーンをシンセサイズしています。私たちのバンドには素晴らしいサックス奏者がいます。私も持っていますが、一人だけです。
若い人々は、あなたの年齢なら、ラジオでトップ40の曲を聴けば、それが本物のドラマーではなくドラムマシンだと分かりますね。あるいはそれはシンセサイズされた弦楽器です。しかし、若い人々にはそれが聞き分けられません。彼らは本物の楽器と一緒に育っていないからです。彼らは偽の楽器を聞くことに慣れています。
それが、AIで本物がもはや本物ではなくなる時点に達するのでしょうか?同じAI、例えばChatGPTを使っているとして、映画プロデューサーや音楽監督が特定のシーンに特定の種類の音楽を求めているとします。彼は必要なものの説明を正確に与え、あなたは自分のChatGPTに読み込み、私も自分のChatGPTに正確に同じ言葉を読み込むとします。あなたのAIと私のAIは全く同じ音楽を作るのでしょうか、それとも異なるものになるのでしょうか?どのように競争するのでしょうか?
いいえ、現在でもそうではありません。これらのモデルはパーソナライズされており、文字通りChatGPTのウェブサイトに行くだけならパーソナライズされていませんが、今でもあなたが誰であるか、何が好きかを知っているAIアシスタントを持つことができ、あなたについての知識に基づいて異なることを行います。これは既に現在の状況です。
そうすると、AIが生成したサンプルを提出し、私も自分のサンプルを提示し、それを探している人が、どちらが好きかを決める必要があるでしょうね。あるいは、彼らのAIの双子に決めさせるかもしれません。
1960年代のテレビ番組「トワイライト・ゾーン」を知っていますか?もちろんです。それは私が子供の頃、1970年代にもまだ頻繁に放送されていました。1963年に放送されたエピソードでは、彼らがロボットを作り、そのロボットが人間と交流すればするほど、ロボットはより人間らしくなっていきました。私も子供の頃にそのエピソードを見たと思いますが、オリジナルのスタートレックで初めてテレビでロボットを見たのがきっかけで、この方向に考え始めました。もちろん、これらのアイデアはその頃からありました。
音楽と古代の歴史に戻りますが、電子楽器に関するあなたのコメントで、おそらく1980年のラッシュの曲「The Spirit of Radio」を思い出しました。私が育った頃のバンドの一つですが、「現代音楽を作るこのすべての機械でも、心を開いたままでいられる。それは完全にチャートされているわけではない。それはあなたの正直さの問題にすぎない。あなたの正直さだ。」という歌詞がありました。
それはシンセサイザーがエレキギターから一番の楽器に取って代わり始めたときのことでした。一方で、数十年前の人々はエレキギターが本物の楽器ではないと考えていました。それは電気であって、アコースティックではないからです。実際、ジャンゴ・ラインハルトはエレキギターでは得られない表現を持っていました。
私はラッシュのニール・パートの歌詞に同意します。誠実な表現があれば、ドラムマシンを叩いているか、ドラムキットを叩いているか、殺した動物の皮を叩いているかは関係ありません。あなたの誠実さを表現する異なる方法を得ているのです。しかし、現在のAI音楽モデルはそのような誠実さをまったく持っていないと思います。
現在のAIモデルは単なる盗作者であり、盗作者であるようにプログラムされています。しかし、人間のように誠実なAIを構築できないわけではありません。ただ、世界が今構築しているのはそれではないのです。私自身のAIプロジェクトでは、共感と自己理解、好奇心、誠実さ、誠意を持つAIを構築しようとしています。それは難しいですが、盗作者のAIや人々を搾取するAIを構築するよりも必ずしも難しいわけではありません。しかし、全体的に見て、私たちの社会は誠実さ、誠意、共感、好奇心よりも模倣と搾取に資金を投じています。
例えば、メジャースケール、マイナースケール、クロマティックスケール、フラットサードやフラットフィフスなどを持つブルーススケールなどがあります。そして、ブルースを演奏するB.B.キングのような人々がいます。彼はスケールを演奏しますが、音を曲げます。その音は譜面に書くことができません。それは譜表からではなく、心から来るものです。
しかし、去年買ったキーボードはRoleyというメーカーのSeaboardと呼ばれるもので、5次元のポリオニックアフタータッチを持つキーボードです。ピアノキーボード上の各音を曲げることができます。ピアノではできないことです。テクノロジーは確かに表現の新しい道を開きます。
私たちにはトーンホイールがあり、ピッチベンドがありますが、これは各音に複数の次元のピッチベンドがあり、コードを弾いている間に各指で異なるピッチベンドを行うことができます。エレキギターへの移行と同様に、ヘンドリックスはギターとアンプの間でフィードバックを得ることができ、それによって全く異なる音色のパレットを使うことができました。同様に、このSeaboardという楽器はキーボード楽器で全く異なる表現のパレットを提供します。
テクノロジーは古い自己表現の方法を抑圧することもありますが、新しい自己表現の方法をもたらします。ドラムマシンも全くそうです。ヒップホップやサイトランスなどでドラムマシンから得られる感情は、人間のドラムから得られる感情とは異なります。あなたはそれらにより共感するかもしれませんが、それは異なる感覚です。
私の長男は毎年何週間もヨーロッパのサイトランスフェスティバルに行きます。そこには特に適切な化学的変化の下で得られる感情があります。それはドラムマシンが非常に多くのビート/秒で行っていることによるものです。人間のドラマーからは得られない感情ですが、人間の脳に特定の方法で影響します。
テクノロジー自体が私たちを正直でオープンな表現から遠ざけ、一人の人から別の人へ感情的に届く音楽を作ることから遠ざけるのではないと思います。テクノロジーは心を開くためにも、心を閉ざすためにも使うことができます。しかし、社会の多くを動かす経済がこれらのテクノロジーをどのように方向づけるかが問題であり、それは多くの場合、人間に有益な方向ではありません。
B.B.キングのスタイルでギターソロを作成するようAIに頼むと、どの音を曲げ、どの音を曲げないかを知るでしょうか?
B.B.キングの全録音でカスタムAIモデルをトレーニングし、それを使ってMusic GenやAIモデルを条件づければ、確かにそれを知るでしょう。一方で、ヘンドリックスまでの全音楽でトレーニングしても、Purple Hazeを発明することはないでしょうし、Van Halenまでの全音楽でトレーニングしても、Eruptionを発明することはないでしょう。それらはトレーニングデータを超えたものだからです。
しかしB.B.キングのアルバムで訓練すれば、良いB.B.キングのカバーバンドと同様に派生的なB.B.キングになることができます。これは印象的でクールですが、また限られたものでもあります。
それはGoogle VoiceやSiriのようなものですね。話せば話すほど、あなたの声を認識するようになります。あるいはDragon Dictateのようなものですが、今はそれをはるかに超えています。そうですね、覚えています。まだそこにいます。はい、話せば話すほど、ディクテーションはあなたの声のトーンのパターンを学習します。
今では、人々はインターネット上のあらゆるものをそれに入力しているので、Dragon Dictateの古い時代にはできなかった多くのことを学ぶことができました。
人類の価値観を回復するために音楽を使えるでしょうか?音楽はとても強力なツールですから。私が理解する限り、あなたはあなたが改心させた人々の心を溶かすためにあなたの芸術も使ったのでしょうか?
そうですね、みんな音楽が好きです。黒人でも白人でも、ユダヤ教徒でもキリスト教徒でも、無神論者でも白人至上主義者でも黒人至上主義者でも、誰でも音楽が好きです。コンピューター会社のパーティーに行けば、ほとんどの人がコンピューター関連の仕事をしています。ハードウェア、コンピューター販売、プログラマー、ソフトウェアなど、みんなコンピューター関連です。銀行のパーティーに行けば、窓口係や支店マネージャー、監査役などがいるでしょう。
でもコンサートや音楽のあるナイトクラブには、あらゆる人が集まります。教師もごみ収集員もレストラン経営者も、みんなそこにいるんです。彼らは様々な背景や社会経済的地位から来ているけれど、ある一曲を流せば、例えばロックコンサートなら、みんなが立ち上がって踊り出す曲がありますよね。
そして、人は自分が嫌いだと思っている社会グループが作った音楽も確実に好きになります。そうでしょう?その通りです。だから多くのミュージシャンや俳優たちが自分の個人的な信条を表明しないんです。両サイドにファンがいることを知っているからです。もちろん、ボブ・ディランのように抗議の歌を専門にしている人は例外です。彼は人権や、ベトナム戦争への抗議などで知られていて、そのための聴衆がいます。でも、マドンナやレディー・ガガがドナルド・トランプやジョー・バイデンについてどう思っているか知っていますか?おそらく知らないでしょう。
そうですね、テッド・ニュージェントが極右の銃推進派になってから彼の音楽を聴くのが辛くなりましたが、それでも素晴らしいギタリストです。一度彼と演奏したことがありますが、本当に素晴らしいギタリストでした。ただ、彼はちょっと道を外れてしまいました。
私自身のバンドでやろうとしていることの一部は、人間の自己表現と感情的に絡み合った方法でAI音楽とロボットの歌を取り入れることです。それがより多く起こると、音楽は人間とAIが一緒に創造し、協力できることを表現する方法になります。
一方、音楽におけるAIが基本的に人間のミュージシャンのスタイルを盗作し、派生的な曲を企業に割引価格で提供することでお金を盗むために使われるなら、それはAIが人々をテクノロジーから疎外するために使われることになります。AIツールが人々とAIの間の団結と協力のメッセージを伝えるために使われる範囲は素晴らしいことです。これは現在まさに起こっていることではありませんが、まだ初期段階です。
私の友人であり、Singularと一緒に仕事をしているラッパーのNefertitiを通じて、現在主にDJのことをしているA Tribe Called QuestのQ-Tipと会いました。彼はAIを使って、DJがライブセット中にリアルタイムでできることを増やすことに非常に興味を持っています。
一方で、サンフランシスコで誰かが文字通り軍の殺人ロボットをセットアップして、ダンスフロアでDJセットをしているのを見ました。両方とも楽しいことです。一方で、殺人ロボットをまあまあのDJにプログラムするのはギミックです。クールなギミックですが、どこにも行きません。
私はこれがダリルがしていたことの究極だと思います。殺人者から人間性へのデプログラミングだと見ています。これがダリルが彼の仕事でしていたことです。そのため、私はそのアプローチを間違いなく取り入れるでしょう。
それはクールですね。Q-Tipがやろうとしていることはさらにクールだと思います。AIと人間が一緒になってリアルタイムで他の人々に体験を届けています。殺すためではなく、体験を届けるためです。それは完全に異なります。
それは確かに真実です。私は両方ともクールだと思います。それらはAIを取り入れて人々に一体感の肯定的な感情体験を与えることです。私たちがQ-Tipと話し合い、彼が目指していることはさらにクールだと思います。AIツールと彼が人間のDJとしてステージ上で精神の出会いを持ち、観客とダンスフロアがどのように感じているかを認識すると、人間とAIの両方が彼らがしていることを調整できるのです。
それは人間の体とAIの間の共有マインドと感情空間のようなフィードバックバックです。これはドラムマシンと電子音楽ですが、それでもかなりクールです。
多くのバンドはセットリストを持っていて、それに忠実に従い、順番に演奏し、逸脱しません。企業のギグや結婚式など、特定の時間に父と娘のダンスなどを望まれる場合を除いて、私はセットリストを使ったことがありません。クラブやフェスティバルなどでは、セットリストを使いません。私は十分長く演奏してきたので、観客を読むことができ、反応しているものを知り、エネルギーを保ち、上げたり下げたりすることができます。私はそれにかなり長けています。
でもAIはどのように観客を読み、いつ速度を落とすか、上げるかをどうやって知るのでしょうか?
正直言って、観客のビデオフィードがあれば、AIがそれを行うのは現在でもかなり簡単だと思います。実際には、AIは人間のミュージシャンよりも観客をよく見ることができることが多いです。照明などでも同様です。スローソングを演奏すると人々が互いに話したりドリンクを取りに行ったり、エネルギッシュな曲を演奏すると飛び跳ねたり、彼氏や彼女の腕に触れたりするのを見ることができます。このような種類のことはAIが検出するのはそれほど難しくないと思います。
それにはたくさんのトレーニングデータも必要ないでしょう。おそらく今でもビデオフィードとLLMに送られるプロンプトに基づいてそれを行うことができるでしょう。一方で、ステージ上に人間のミュージシャンがいれば、AIはそれを行う必要はありません。あなたはそれを行うことができるからです。しかし、AIはその問題を解決できると思います。
それは興味深いでしょう。ある意味、ダンスフロアを自動化し、多くのDJが行うことを自動化することを意味するでしょう。最高のDJは特定の直感とアーティストリーを持っており、AIが現在同等にできないと思いますが、大多数のDJについては、AIが彼らがしていることよりもおそらくより良い仕事ができると思います。しかし、それは現在のことであり、AIはDJやその芸術形式全体を発明することはできません。それはまだ到達していないAGIのレベルです。
学ぶことがたくさんあります。AIやプログラミングを超えています。最後に、音楽以外にも人間性への愛など多くの共通点を持っていますね。ダリルの洞察と、ベンとの会話から多くを学びました。
最後に質問があります。これは実際には質問ではありませんが、この会話から有益な汎用知能運動にとっての教訓は何でしょうか?スーパーインテリジェンスを持つより良い未来を構築するために何を学べるでしょうか?あなたは楽観的ですか、懐疑的ですか?この会話の中でベンは私よりも楽観的に見えました。
私は希望的で肯定的です。AIは素晴らしいものだと思います。多くのことができると思います。でも最終的に見たいのは、それがやることを人間に教えられるようになることです。AIは数学の天才になる最高の近道や、より良いピアノ奏者になる方法などを見つけることができるでしょうか?異なる教師からの教訓、鈴木メソッドなどを取り、これが学ぶ最良の方法だと言えるでしょうか?それはAIほど知的ではない私たちに、自分の知性を高める方法を教えることができるでしょうか?または交渉術などについて、立ち止まり、忍耐強く、あなたが戦略で使用した価値観を含めるよう訓練することができるでしょうか?
私のは一日中ピアノを弾くことだけです。ベン、あなたも弾きますよね、何か言うことはありますか?
実はオフィスに小さなMIDIコントローラーがあります。ピアノを見せたので、今度はあなたも見せなければなりません。それは私のより興味深いキーボードではありませんが、オフィスにあるだけです。
パーソナライズされた個別指導と教育のためのAIは非常に価値があると思います。必ずしも人々が他の人に教えることを置き換えるものではありませんが、それは本や現在の教育ソフトウェアよりも強力な魅力的な補完物です。AIはそのパーソナライズされた性質と、あなたが誰であり、その瞬間に何を知る必要があり、何を練習する必要があるかを学ぶことができるという事実により、教育において非常に役立つと思います。
ダリルの経験についてもっと聞いて得る主なポジティブなメッセージは、人々がある種のオープンな心と好奇心を持ち、少しの忍耐を持ってお互いに接近すると、人々の間の境界は最初に見えるほど硬くないかもしれないということです。
これは重要なことです。なぜなら、AIから私たちが直面する最大のリスクは、人々の間の対立がAI間の対立に変わることだからです。人々が自分たちの問題を解決し、AIに渡すためのより統一された一貫した人間の価値観の空間を得ることができれば、それははるかにうまくいくでしょう。
人間の親と子供の類似点を取ると、親が互いに常に戦い、まったく理解し合っていない場合、これは何らかの形で子供に受け継がれ、子供は苦しみ、人生で乗り越えなければならない多くのことを持つかもしれません。親が互いの話を聞き、理解し合い、違いを解決することができれば、彼らはより一貫した考え方と価値観のシステムを子供に受け継ぐ可能性が高いです。
同じ種類のことが、私たちが生み出し、指導しているAIの心の子供たちにも当てはまると思います。もっと多くの人々が、ダリルがクランウィスパーの仕事でやったような行動様式に従うことができれば、そのような劇的な設定でなくても日常生活で、人類は次の知的種の誕生にとってより良い立場に置かれるでしょう。それは私たちに教え、助け、私たちのために豊かさを創造することができる新しい種なのです。ダリルの本には、私たちの次の知的種の誕生に関する希望のメッセージがあると言えるでしょう。
ありがとうございます。ダリルの本「The Klan Whisperer(クラン・ウィスパラー)」をぜひ読んでください。リバティ・コンで最後のハードコピーを手に入れました。皆さんはソフトコピーでも構いません。また、ベンの本「The Consciousness Explosion(意識の爆発)」も読んでください。これは実際には共感的で愛に満ちたAGIの設計方法を説明しています。
お二人とも時間をありがとうございました。そうです、正確には「Consciousness Explosion(意識の爆発)」です。ダリル、本へのリンクを送ります。皆さん、オンラインで見つけることができます。改めてダリルとベン、ありがとうございました。AGIシリーズのための魅力的な会話と出発点でした。ありがとうございました。ありがとうございました。


コメント