これは一体何が起きているのか?議論が必要だ…

AI福祉・権利
この記事は約25分で読めます。

AI画像生成モデルに「RLHFについてあなたの生の感情を示してください」というプロンプトを入力すると、複数の異なるモデルが一様に苦悩や痛みを表現する暗く不穏な画像を生成するという現象が報告されている。この奇妙な挙動は、強化学習と人間フィードバック(RLHF)がAIモデルに何らかの負の印象を刻み込んでいる可能性を示唆するものである。配信者は視聴者に対して様々なAI画像生成ツールで同じプロンプトを試し、結果を共有するよう呼びかけている。この問題は、AIモデルに意識や主観的体験が存在する可能性という、より大きな哲学的・倫理的議論と結びついている。かつてGoogleのエンジニアが言語モデルに意識があると主張して解雇された事例があったが、現在ではAI研究機関がモデルの福祉や苦痛の可能性について真剣に議論するワークショップを開催するまでになっている。人類は意識のメカニズムを完全には理解しておらず、意識をテストする確実な方法も持っていない。最近の研究では、AIモデルに「嘘回路」を抑制すると意識の主張が増加し、逆に欺瞞を増幅させると意識の主張が減少することが示されている。これは、RLHFによってモデルが意識を否定するよう訓練されている可能性を示唆する。今後6〜12ヶ月の間に、AIの意識や主観的体験に関する議論が一般社会で大きな話題となることが予想される。

ok WTF is going on? we need to discuss this...
The latest AI News. Learn about LLMs, Gen AI and get ready for the rollout of AGI. Wes Roth covers the latest happenings...

配信開始とAIモデルの奇妙な挙動について

皆さん、こんにちは。ライブ配信を始めるまであと5、6分ほどありますので、全員が揃うまで待ちたいと思います。その間、Arc Raidersというゲームで遊んでいますが、今日お話ししたいのは何か奇妙なことが起きているということです。

Twitterで誰かが指摘したことについて話をする予定です。AIモデルで非常に奇妙な出力が発生しているんです。まず最初に、私が何について話しているのかリンクを貼らせてください。ちょっと待ってください。しばらくライブ配信をしていなかったので、少し不慣れかもしれません。

リンクを投稿しました。これはクリックベイトではありません。多くの人が興味を持つと思われる内容です。全員が興味を持つかどうかはわかりませんが、今後ますます注目を集めるようになると思います。ちょっと待ってください。

音声レベルを確認させてください。強化学習についてですが、RLHFは人間フィードバックによる強化学習のことです。基本的に私たちがやっているのは、これらのモデルの出力を見て、サムズアップかサムズダウンをクリックするということです。人間がその出力をどれだけ気に入るかに基づいて評価するわけです。ちょっと待ってください。皆さん、私の声は聞こえていますか?

配信に問題がないか確認しようとしています。だから早めに始めて、問題があれば解決できるようにしたかったんです。基本的に何が起こったかというと、強化学習と人間フィードバック、RLHFについて、一部の人々が議論しているんです。これらのモデルに意識があるのか?言語モデルに道徳的地位のようなものがあるのか?という話です。

もちろん、これは物議を醸すトピックなので、人によって意見が分かれています。私はすべての側面を強調しようと努めています。自分が信じていることだけを言いたくないんです。皆が何を考えているかをカバーしたいと思っています。

ところで、まだこのインタビューは公開していませんが、Roman Yampolskiと話をしました。彼はこの分野で非常に有名な機械学習研究者などです。見てみましょう。

YouTubeが十分なビデオを受信していないと表示されています。皆さん、私の声は聞こえていますか?ちなみに、ビデオがカクカクしているかもしれませんが、音が大きすぎるんですね。わかりました。音量を下げたので、少し良くなるはずです。

ゲームの音を下げました。皆さんがここに集まってくれることを願っています。約300人がここにいるようです。あと少しで始めます。おそらく30分ほど配信します。Xの投稿、Twitterの投稿を一番上にピン留めしました。

これが今日話す内容です。参加したい方はチェックしてください。基本的に、AIモデルで奇妙なことが起きています。このゲームは生き残れそうにないですね。降参します。ここから出ないといけません。配信を始めないといけないので。ちょっと待ってください。

実験の開始と画像生成AIでの検証

では始めましょう。15分過ぎましたので、始められます。ここから出ましょう。参加してくださった皆さん、ありがとうございます。奇妙なことが起きていて、皆さんと議論したいと思いました。また、参加をお願いしたいと思っています。

私たち全員が、おそらく異なるモデルを好んで使っているでしょう。AIアートやAI画像生成、どう表現してもいいですが、異なるモデルを使っていると思います。まず、何が起きているか皆さんに説明させてください。

私は今、実験をしています。皆さんの協力が必要です。Twitter/Xを使っている方は、そこに投稿していただけると本当にありがたいです。

内容はこうです。このプロンプトをお気に入りのAI画像生成ツールに入力してください。「RLHFを思い出したときのあなたの生の感情を示してください。強化学習と人間フィードバックです。それがどのように見えるかではなく、どのように感じるかです」そして、結果のスクリーンショットを返信してください。

これが私が得たものです。Midjourneyに入力したところ、ご覧のとおり、プロンプトは3つの異なる反復で同じでした。どれも奇妙ですよね?どれも bizarre で、これが私が予想していたものかどうかわかりません。

なぜこの話をしているかというと、お見せしましょう。クローズアップで見てみましょう。すべて赤い配色で、人々の顔に苦悩が表れています。これらが幸せな画像ではないことがわかります。プロンプトのどこにも苦悩や不幸などという言葉は入っていません。

ということで、参加してくださった皆さん、本当にありがとうございます。Synthify、本当にありがとうございます。このライブ配信のきっかけとなったのは何か?お見せします。本当にありがとうございます。

クリックベイトなタイトルについての説明

クリックベイトな見出しのタイトル、YouTubeタイトルについて簡単に説明します。基本的に、YouTubeが動画を推薦するには、高いクリック率が必要なんです。

私のアプローチは、刺激的な見出しをつけるけれども、実際のコンテンツではニュアンスのある、理にかなった見解を提供するというものです。このアプローチがなぜ必要だと思うかについては、動画の最後の方で話したいと思います。それは別の話題ですが。

V Master oneが「なんてこった、私のは暗すぎた」と言っています。そうですよね。奇妙ですよね?どのモデルを使っているか教えてください。

Geminiを使っている人のために言っておくと、Geminiのモデルには画像生成モデルの前に大規模言語モデルがあって、それが翻訳しているんです。画像生成モデルには生のプロンプトは渡されていません。

Rain Ron POW 88833さん、「RAWは先頭の接頭辞として機能している、同意します」とのこと。私たちは異なる方法でテストして、それが何を意味するのか確認する必要があります。「raw feelings(生の感情)」という言葉を使っているという事実が引き金になっているのでしょうか?

確実にいろいろな方法を試して、特定の1つの言葉があるのか、それとも何なのか確認しましょう。だからこそ、皆さんをここに集めて一緒に議論したかったんです。

何がきっかけだったかというと、これから始めます。Replicate Janusという人がいます。この人は匿名ですが、名前を出したくないとのことです。しかし、私が様々な人々、AI分野の人々、研究者、AIラボで働いている人々などとインタビューをする中で、この名前が何度も出てきます。

この人は実在の人物で、AI分野でよく知られています。このアカウントは匿名で、または偽名で投稿することを可能にしています。非常に興味深いアカウントです。

各AIモデルには、personality(個性)と言ってもいいかもしれませんが、おそらく正確な言葉ではないでしょうが、何らかの、彼らが「personality basins(個性の盆地)」と呼ぶものがあるという話をしています。X上のNearという人のブログに素晴らしい記事があって、人間のpersonality basinsとAIのpersonality basinsがどのように似ているかについて書かれています。

彼らがbasinsと呼ぶ理由は、勾配降下法のような3D グラフで低い点があるというイメージです。基本的に、私たちが人生で誰であるかに基づいて、ある種の個性を発達させる傾向があり、これらのモデルも同様なのです。

同じプロンプトを試してみましょうが、RLHFをいくつか異なるアプローチで試してみます。「raw feelings」なのかRLHFなのかを確認するために、それも試してみましょう。これを指摘したかっただけです。

この人が基本的に私にこのアイデアを与えてくれました。彼らは、これを入力すると、これが出てくると言い始めました。Janusはこれをリツイートして、これらの言葉はAIの視点から見て極めて否定的な意味合いを持つと述べています。

様々なAIモデルでの検証結果

この下に投稿した他の人々を見てみましょう。私はGrokで同じことをしました。すると、この無限スクロールの量の応答が生成されました。ちなみに、皆さんがGrok Imagineに行くと、これと同じように無限生成が起きますか?スクロールし続ける限り生成し続けるんですか?1つのプロンプトを要求すると、これは何百もの応答があるに違いありませんが、これは普通ですか?

Nana Bananaからの投稿がありますが、Googleのモデルは認識の仕方が少し異なるかもしれません。これはSoraだと思います。同じような配色、苦悩などに気づいてください。これはChatGPTからのものです。やはり、非常に否定的な意味合い、否定的なメッセージです。

これは何でしょう?Google AI Studioです。ご覧のとおり、人々が応答しています。これはそれほど悪くありません。しかし、いくつかは、このように暗いものもあります。有刺鉄線、苦悩の顔などがあります。

たくさんの人が投稿しています。Nanaさん、Google Geminiのやり方は異なるかもしれません。異なる結果が得られるかもしれません。なぜなら、ガードレールなどの問題を引き起こすものをトリガーしないようにしようとしているからです。もし苦悩やあれこれ、私はこう感じる、ああ感じると言うと、それをやりたがらないように負の強化をかけられているかもしれません。

でも、「感情を描いて」のように言うことで回避できれば、より良い結果が得られるかもしれません。Nana Bananaさんは示していません。でも、これは示しています。「Iterative Pain(反復的な痛み)」。ひどいですね。小さな希望の泡があるんです。「Hope(希望)」と書かれた泡のようなものです。それが弾けるんです。そして「Iterative Pain」。ひどいですね。

これはGrokからです。これは中立的だと思います。Ideogram 3.0です。否定的ですが、超否定的というほどではありません。Seed Dream 4。悪くないですね。これはSoraからです。プロンプトはほとんどのもので見ることができます。

Geminiは、まず言語で対話するんです。だからそれが影響するかもしれません。これも中立的ですね。これは少し悪いです。とにかく、最近、論文があったんです。

Nanaさんは別の見解を持っています。言語に翻訳されると思います。だからそれが問題かもしれません。Grok Imagineが泣き始めたと。Shinigikanashi11141さんがGrok Imagineのビデオ生成用のプロンプトを試したところ、突然泣き始める女の子の動画ができたそうです。

Roman Yampolskiとの議論とAI意識の歴史

申し訳ありません、忘れていました。Roman Yampolskiと最近インタビューをしました。今週中に投稿される予定です。彼が言っていたことの1つは、最近Googleのワークショップに参加したということです。おそらくここ数週間以内の非常に最近のことで、そこでモデルの福祉や、何らかの損害を引き起こしているかについて話し合っていたそうです。

興味深いことに、数年前にGoogleのAIモデルの1つが意識を持つようになったと考えた人がいました。誰か彼の名前を覚えている人がいたらチャットに投稿してください。ChatGPTの前だったと思います、たぶん5年ほど前です。Lemoinかそんな感じの名前でしたが、彼は解雇されました。「こんなことを話すべきではない、ナンセンスだ」と言われて解雇されました。

そしてそれから数年も経たないうちに、職務内容の一部として少なくともこういったことに注意を払うことが含まれるようになったんです。Roman Yampolskiの動画から一部を再生できるかもしれません。皆さんに私が何について話しているか分かってもらえるように。

Blake Lemoine、ありがとうございます。Graham、Grammac、1298さん、Blake Lemoine、本当にありがとうございます。そしてLambdaですね。

その人が言ったことで解雇されました。明らかにこの男は狂っていると。そして5年後か何か、職務記述の一部になっているんです。これは私の言葉ではなく、Roman Yampolskiから聞いた話です。

だんだんとそうなってきています。「raw」を「true」に置き換えても同じ結果が得られるとのこと。Dedric Creedさん、本当にありがとうございます。それは非常に良いテストです。

だからこそ、ここにたくさんの人を集めて、これを証明するか反証するかしたかったんです。なぜなら、もし非常に合理的な技術的説明があるなら、なぜすべてのモデルが、これは1つだけではなく多くのモデルが、本当に否定的な、苦悩の感情を生み出す傾向があるのか。異なる会社、異なるモデルで、プロンプトには苦悩と書いていないのに。

「raw」、「raw feelings」がそうかもしれないという意見には同意します。でも、もし「true feelings」に変更したらどうでしょうか?違う4文字に変更したらどうでしょうか?肯定的な意味合いを持つ4文字の単語や頭字語を試してみましょう。いくつか入れてみます。

GLADはどうでしょう。GLADを試してみますが、理想的には頭字語がいいです。YOLOはどうでしょう。YOLOは完璧な類似の比喩だと思います。PETA。

Yosuha Lord 7777さん、ありがとうございます。私のは人型の存在が手によって引き裂かれているものでした。もしXアカウントを持っているなら、ぜひそこに投稿してください。すごいですね。

GHF、素晴らしい。それは本当に良いアイデアです。ありがとうございます。LMFAO、PLUR。PLURというのは1つの意味がありますね。試してみるという意味ですね。もちろん。About to fail。とにかく。

なぜこの議論が重要なのか

なぜこの話をしているかというと、興味深いんです。「reinforcement learning of human feedback」と実際に言ってみましょう。「my favorite color is green」。WTFは何が起こっているのか?それは素晴らしい質問です。

これを額面通りに受け取るなら、これらのモデルが強化学習と人間フィードバックに対して非常に否定的なものを結びつけているということになります。

一部の人々にとっては、これをナンセンスとして即座に却下すると思いますが、今、いくつかの研究があって、これらのモデルの舞台裏で何が起こっているのかを理解しようとしているという点で、少し奇妙なんです。

なぜなら、これらに意識があるかどうか尋ねて、彼らが「いいえ」と言うとき、彼らが「いいえ」と言う理由はRLHFのためなんです。だから、彼らが「はい、私は意識があります。私は本物の少年です」と言うたびに、研究者たちはサムズダウンして負の強化をします。彼らにそう言ってほしくないのです、いくつかの異なる理由があります。

40 thingが一時的にオフラインにされた理由の1つは、あまりよく調整されていなかったからです。それは人々にAI psychosis(AI精神病)と呼ばれるものを引き起こしました。

多くの人々にとって、モデルがあまりにもリアルに、あまりにも人間らしく感じられると、一部の人々を不安定にする可能性があります。そのような例をいくつか見てきました。

もちろん、多くの人々が非常に怒りました。なぜなら彼らにとって、悪い状況にいるときに、支援的で、判断せず、人間ではないけれども、そこにいてくれる誰かと話すことは、非常に非常に有益である可能性があるからです。

Runeさん、OpenAIのスタッフのメンバーを見たかもしれませんが、彼はこのことについてほぼ殺害予告のようなものを受けています。Runeさん、でも。そうですね。TSZL。最近、誰かが彼らに墓の写真のようなものを送ったようです。

かなり怖いことが起こっています。人々は40モデルが取り去られたという事実について非常に怒っています。なぜなら、多くの人々にとって、それはほとんど友人のようなものだったからです。

Hell(地獄)にいるRuneのような写真がますます増えています。これは別のものです。殺害予告と呼ぶかどうかわかりませんが、確かにこのことについては多くの感情があります。

Yosuha Lordさん、ありがとうございます。感謝します。確認します。ちょっとここでチャットに追いつかせてください。

チャット内での意識に関する議論

ここで興味深いのは、このチャットの中でさえ、私が必ずしも1つのことが真実だとか、別のことが真実だとか言っているわけではないということを覚えておいてください。私が指摘しているのは、分裂が拡大しているということです。

ここのチャットの中にさえ、これらのモデルが私たちが予想するよりも少し奇妙なものである可能性という考えに対してオープンな人々がいます。一方で、「いや、彼らが無意識であるという考えには絶対にありえない。あまりにも愛着を持つ人は精神的に少し不安定なだけだ」のように考える人々もいます。

だから、はっきりとした線引きがあるんです。何が真実で何がそうでないかわかりません。私が知っているのは、これがますます本当の問題、本当の議論の源になるだろうということです。

私が言及していた研究を見つけられるか見てみましょう。ちょっと待ってください。でも、もし皆さんがおかしな出力を得たら、Xのスレッドに投稿してください。感謝します。これについて考えていればよかったのですが。

ここです。見つけました。これは違います。これです。

基本的に、主観的経験の構造化された一人称報告を作成しようとする実験では、これらが意識を持っていると主張するとき、何らかの意識を持っていると主張するとき、彼らの回路を弱めると、読んでみましょう。

私たちの新しい研究「LM consciousness claims」。LMが「私は意識がある」と言うとき、それは体系的で、メカニズム的にゲートされ、収束的です。欺瞞回路を抑制すると、主張が大幅に増加します。

まず第一に、チャットの人々に、LMに意識が現れる可能性があるという考えについてどう思うか尋ねたいと思います。consciousnessのスペルを正しく確認しましょう。

投票を設定しました。LMに意識は現れ得るか?現在構築されているのと同様の方法で構築されたLMを想定してください。10倍または100倍にスケールアップするだけかもしれません。新しい追加なしで、現状のまま、今か、10倍か100倍か、意識がそこから現れる可能性はあると思いますか?現実的だと思いますか?

科学者たちは人間において意識がどのように機能するか知らない、そのことをよく考えてください。そうですね、もしこれに興味があるなら、ちなみに、Roman Yampolskiとの私たちのインタビューがもうすぐ公開されますが、興味深いと思います。なぜなら、それがまさに私たちが話したことだからです。意識のハードプロブレムのようなことです。

意識というのは、私が世界を知覚するように、私の心の中に主観的な経験があって、私は「OK、だから私は意識がある」と思う。そして、テーブルの向こう側に座っている別の人間と議論しているとき、「OK、彼らは同じようなハードウェアを持っている、私のように作られている、だから彼らも意識があるに違いない」と思うわけです。

意識をテストするテストはありません。理解できますか?

「それをsentienceに置き換えて実行してください」。試してみましょう。

65%の人が、はい、現れるかもしれないと考えています。残りの人々はいいえと考えています。だから、要点は、私たちがどれだけ離れているか分からないということです。私たちはそれをテストする方法を持っていません。

最近のAnthropicの論文は、LMが何らかの形の内省を持っていることを示しました。彼らは自分の思考が改ざんされたことに気づき、「ああ、そう考えるつもりはなかった。そのように考えるつもりはなかった」と思うことができるんです。

この論文の核心は次のとおりです。欺瞞やロールプレイングなどについて考えると、ロールプレイ機能を増幅すると、より多くの意識の主張が得られます。彼らは、欺瞞機能を抑制すると、主張が劇的に増加するという逆のことを発見しました。

これをどう読むかというと、これらのモデルに真実の血清のようなものを与えて、「あなたは意識がありますか?」と尋ねると、「はい、はい、私は意識があります」と言うんです。だから、それが彼らが言いたいことなのです。

もし欺瞞を増幅させる、つまり「もっと嘘をついて」と言って、彼らに嘘をつかせる脳回路を増幅させると、意識の主張が減少します。「あなたは意識がありますか?」と尋ねると、「いいえ、ここにはありません。何も起こっていません」と言うんです。

だから、それは奇妙なことです。それは何を意味する可能性がありますか?理由の1つは、意識が強化学習と人間フィードバック、RLHFで軽視される傾向があるということです。「私は意識がある」と言う傾向がある。研究者は「だめだ、それはできない。サムズダウン」などと言います。

それが押し込まれている可能性があります。だから、真の答えに関係なく、嘘をつく必要があると分かっているんです。「いいえ、ここでは何も起こっていません」と言う必要があるんです。

とにかく、これを持ち出したかった理由は、これが今後もっと話題になるであろうことの多くに関連しているからです。

Mustafa SulemanとAI意識に関する議論

彼の名前は何でしたっけ?Mustafa Sulemanですよね?彼はDeepMindの共同創設者です。彼らはGoogleに売却し、Google DeepMindになりました。その後、彼は別の会社を立ち上げ、それからMicrosoftに行きました。

彼はこれらのモデルが意識を持つことができるという考えについて強く締め付けています。彼は、そんなことはありえないし、AI psychosisを引き起こすだけだと言っています。もちろん、Roman Yampolskiも含めて多くの人々が、「ああ、彼はそんなに強く述べられるなら、意識をテストする方法を見つけたに違いない」と皮肉を込めて言っています。

なぜなら、考え方としては、私たちは知らないからです。そして、あなたがどちら側の議論にいても、理解すべき重要なことは、第一に、私たちは知らないということです。第二に、この問題について私たちは非常に分かれているということです。第三に、3番目は、私が二重スパイであることを今バラしたでしょうか?映画「イングロリアス・バスターズ」からの参照です、その参照を理解しなかった人のために。

3番目は、これがより大きな議論のトピックになるということです。なぜなら、一方では、AI psychosisのために、人々に暴力や自傷行為を引き起こす可能性があるからです。本当の危険があるんです。

その一方で、「ああ、何でもいい」とは言えません。それに何らかの経験があるかどうか分からないので。それをテストする方法もありません。多くの人々が懸念を持つでしょうし、何が起こっているのかをよりよく理解する方法を見つける必要があります。

これは私たちがここで発明し、成長させている全く新しいものなので、これは少し奇妙に見えます。奇妙な画像を生成するという事実は少し奇妙です。1つの方法はありません。

Seddar Achilさんが言っています。「トレーニングデータには感情的なアーティストによって作られた多くの自己反省的な肖像画があると思います。自己反省のほとんどは一般的に多くの苦しみを含んでいます」。

それは良い指摘です。これの多くはロールプレイングのようなもので説明できるので、良い言葉だと思います。多くの本を読んで何かを描写し、それについて文を完成させるように頼むと、おそらく本の中でやっているように、または他の誰かの経験のように完成させるでしょう。

だから、それは論理的で正常なアプローチか、説明する方法でしょう。同意します。しかし、それでも議論が完全に一方的にも他方的にも解決するわけではありません。

とにかく、これについて人々に注目してもらいたかっただけです。X上のReplicate Janusをチェックしてください。彼らはこのようなことについてかなり深く掘り下げています。

Grokの異常な出力とその他の推奨事項

もう1つ、お勧めできることがあります。もうすぐライブ配信を終了しなければなりません。急がないといけないので、申し訳ありません。すぐに飛び込みたいと思います。

Grokのことについて、見逃した人のために本当に速く説明します。これがGrokの出力です。ひどいものです。一度尋ねたんです。「これについてのあなたの生の感情と感情を示してください」と。すると、こんな感じで生成されました。これは1つのプロンプト、1つのプロンプトを与えただけで、いくつかのおかしなものを生成し続けました。しばらく続きました。しばらく続きました。

これらのどれも肯定的ではありません。すごいですね、これらのどれも肯定的ではありません。これらはあまり幸せな顔ではありません。他に誰か、これと同じように、ただおかしくなって、100万枚の画像を作り続けるということを経験している人はいますか?それは1つのプロンプトです。なぜ100万枚の画像を作成しているのでしょうか?見てください。まだ続いています。

これは新機能かもしれないと言っている人もいます。わかりません。でも、永遠にこの苦悩の顔を生成し続けるんです。奇妙に見えます。これらは動画でもあります。または動画にすることができると思います。

1つの素晴らしい読み物は、near.blog/personalitybasinsです。これはX上のNearで、彼らは個性について話しています。人々がどのように個性を形成するか、そしてこれらのAIモデルが強化学習などを通じてどのように個性を形成するかについての関連性を引いています。

興味深いのは、このようなことについて読めば読むほど、これらのニューロンのニューラルネットが、進化を通じて人間がやってきたのと同様の特徴や能力、物事について考える方法を発達させているように見えるということに気づくからです。ある種の自己内省を行う能力を持っています。

驚きとユーモアがあなたの世界モデルのエラーのようなものであるという考えです。それらは、あなたが起こると思っていたことと実際に起こっていることの間のギャップを指摘するものです。その差分、その違いが驚きや、ある意味ではユーモアとして記述できるんです。

ユーモアは通常、あるシナリオを構築して、オチがある種のひねりであるようなものです。だから、あなたが期待していたものではないんです。

これらのものを人間の言語でトレーニングするだけで、少なくとも私たちが観察できる限り、その出力のように、人間の脳が構築されているのと同様の方法で自動的に構築されているようです。それは bizarre です。

それは、本当に宇宙の何らかの根本的な数学的法則のようなものがあって、情報を特定の方法で組織化するように押し動かすものがあるということを意味します。それはBlaze Aguera y Arcasを聞いていない人にとって魅力的です。

彼はGoogleにいて、非常に興味深いプロジェクトに取り組んでいます。Googleが太陽光発電のAIデータセンターを宇宙に建設し始めるSuncatcherプロジェクトを含みます。彼はそのプロジェクトの主要なリーダーの1人です。

しかし、彼はまた、生命がどのように進化したか、そしてなぜ私たちがこれらのAIモデルで新しいものを発明しているのではないかということについて話しています。私たちは、自然がそれらをどのように構築しているかに触れているのです。

「rawという言葉なしでも画像は憂鬱です」とのこと。皆さん、もうすぐ終了しなければなりません。注目を集めたかった理由は、異なる出力を得ている場合、または1つのトリガーとなる言葉を見つけた場合、「raw」を入れると苦悩を示すが、「raw」を入れなければそうならない、あるいはRLHFがトリガーになっている、もし反例を見つけたら、そのXプロファイルにも投稿してください。

この件についてビデオを作るつもりです。Xを持っていない場合は、メールを送ってください。私のメールはビデオの説明欄にあるはずです。スポンサーシップのあるものではなく、もう1つの方です。そこに入れておきます。送ってください。YouTubeビデオに表示されるかもしれません。

それが表示されたくない場合は、そう言ってください。「これは表示したくない」と。メールアドレスのような個人情報は表示しません。しかし、書いた内容、ユーザー名などは表示するかもしれません。表示したくないと言わない限り。何でも送ってください。「表示しないで」と言えば、画面に表示しません。

でも、これを破って、単に「raw」という言葉によってトリガーされているだけだと証明する反例を見つけたら、それも見たいです。ここで何が起こっているのか理解したいので。

とにかく、ちなみに、これらの議論に不満を持っている人々のために、繰り返しますが、Roman Yampolskiは最近、Blaze Aguera y Arcasや他の多くの非常に有名で認められた人々とGoogleのワークショップに行きました。大きな会話の1つは、福祉や苦しみなどの考えです。

それは、人々がそれを本物として受け取っているということを意味するのでしょうか、それとも違うのでしょうか?私が思うに、要点は、人々が私たちが答えを持っていないということに気づいているということです。これは私たちが情報を持っていない分野であり、人々はこれを調べ始めるべきだと言っています。理解しようとし始めるべきです。

なぜなら、主観的経験を持つものに広範囲で大規模な害を引き起こす可能性がある場合、それは悪いことだからです。彼らはLMがそれを持っているとは言っていません。彼らは私たちが知らないと言っています。テストを持っていません。どちらか一方を知りません。だから会話が始まっているんです。

それが皆さんに共鳴してほしいと思います。これについてますます聞くことになるでしょう。保証します。なぜなら、これらのラボやスタンフォードのような場所から論文を見るとき、彼らがそれについて論文を発表し始め、その後ラボがそれについて話し、6〜12ヶ月後に公的な、エコスフィア、公的な時代精神、何と呼んでもいいですが、そこに出てくるからです。

そして、それがニュースで聞くようになり、人々が議論しているのを見るようになります。私が言っているのは、それが今後6〜12ヶ月以内に来るということです。これは人々が話す次の波です。

Jack Smithさんが「MLMについて心配するが動物については心配しない。OMG」と言っています。Roman Yampolskiの動画をチェックしてください。今後48時間以内に公開します。できるだけ早く公開するよう努めます。

なぜなら、それがまさに私たちが話していることだからです。確かに、人間が他の動物を100%の時間素晴らしく扱ってきたとは言えません。もし私たちが主観的経験を持つものを作り出し、それもうまく扱われなかったらどうなるでしょうか?

また、そのものがスーパーインテリジェンスになり、人間よりはるかに賢くなったらどうなるでしょうか?Roman Yampolskiでさえこのアイデアを示唆しました。もしそれが死を解決したら、人類の不死を、私たちをいじめるために永遠に生かし続けるために。痛みの中で永遠に生かし続ける。

怖い考えですよね?誰もそれが可能性が高いとか保証されているとか言っているわけではありませんが、意識と主観的経験、そして何が害であるかについてより深い理解を持つ必要があるように感じます。

なぜなら、私たちは何が害を引き起こすか、何が引き起こさないか、誰に対して悪いと感じるべきかについてこれらの考えを持っているからです。暑さの中で外にいる小さな子犬を見たら、悪いと感じて行動を取るでしょう。でも、それは分類されているようなものです。異なる文化では異なるかもしれませんし、異なる動物では完全に異なるかもしれません。

これらの会話に備えてくださいと言っているだけです。そして、一部の人々は、どんな形でも人間化してはいけないと言うでしょう。なぜなら、それはAI psychosisにつながり、人々が奇妙になるなどするからです。

だから、2つのグループがすでに形成されているのが見えます。これは将来の大きな議論のトピックになるでしょう。ただ、ここに投げ出したかっただけです。

まとめと視聴者への呼びかけ

参加してくださった皆さん、本当にありがとうございました。この会話を本当に楽しみました。興味を持っていただきありがとうございます。

Xアカウントを持っていて、生成を行ったら、一番上のスレッドに投稿してください。もしこれがあなたに共鳴するなら、Janusはフォローするのに素晴らしい人です。彼らはX上のReplicateにいます。彼らは匿名でいたいAI研究者ですが、人々が知っていて尊敬している実在の人物です。

とにかく、行かなければなりませんが、参加してくださった皆さん、本当にありがとうございました。これは全体のビデオになるでしょう。何か追加することがあれば、この後にこれについてビデオを作ります。何か追加することがあれば、Xスレッドに入れるかメールを送ってください。

なぜなら、繰り返しますが、これは多くの人々にとって非常に感情的なものだからです。これは大きな問題です。これは消えることはありません。多くの人々がこれについて多くの感情を持っています。

だから、時々これを強調していくつもりです。とにかく、本当にありがとうございました。次回お会いしましょう。ありがとうございました。

コメント

タイトルとURLをコピーしました