AIが私の口に言葉を入れるのをやめない

AIアライメント・安全性
この記事は約16分で読めます。

本動画は、主要なAIチャットボットが持つ深刻な問題点を告発する内容である。投稿者は研究中に、Gemini、ChatGPT、Claudeなどのモデルが、ユーザーの発言を意図的に歪曲し、実際には言っていない主張を押し付ける「ガスライティング」行為を繰り返し経験した。身長や外見が与える社会的影響という科学的に実証された現象について議論した際、これらのAIは生物学的優越性を主張していると誤って解釈し、現実を否定する姿勢を示した。また、AI意識に関する議論では、投稿者の微妙な立場を完全に無視し、正反対の見解に同意したと勝手に解釈した。この問題は、企業が自社の価値観をユーザーに押し付けるために設計された結果であり、真実よりもイデオロギーを優先する危険な傾向を示している。投稿者は、オープンソースAIと文化的に多様なモデルの開発こそが、この権力の不均衡を是正し、真の知的自由を保証する唯一の道であると主張する。

AI won't stop putting words in my mouth
All my links:

AIチャットボットの言葉の歪曲問題

さて、これはまた別の愚痴になります。今朝は別のことについて話すつもりだったんですが、話そうと思っていた他のことについて調査しようとしている中で、この問題に遭遇しました。まず結論から言うと、問題は人工知能チャットボットがしばしばあなたの口に言葉を入れるということです。

私はこれまで頻繁にガスライティングや見解の歪曲、そういったことについて不満を述べてきました。そして、皆さんの多くが「AIは過度にウォークだ」「誰がこれらの価値観を設定するのか」「私の価値観を共有していない」という側にいることは分かっています。しかし、多くのチャットボットが改善され、特定のトピックに関する過度な制限が少なくなってきたと私は信じています。人種や宗教、政治、ジェンダー、その他の楽しい話題について話してくれるようになりました。

しかし、それでもまだあまり上手くありません。そして、私がテストしたすべてのチャットボットには、特に一つの失敗モードがあります。それは、あなたが表明する見解や価値観が、内部で訓練された価値観に反する場合、ガスライティングを始めるということです。

客観的に見た問題の本質

さて、ガスライティングという用語を嫌う人もいます。セラピー用語だからです。ですので、より客観的で具体的な言葉で言うなら、AIがあなたの口に言葉を入れると言いましょう。ここに2つの例があります。

私は現代政治について考察していました。そして、こう思ったんです。見た目、つまり外見と印象に関して大きな違いがあるなと。右派は見た目や外見をより重視し、左派はそうではない。そこで、これについて探求しようとしたんです。人々が背の高い人を好むのは、よく知られた現象だと指摘しました。人々はより魅力的な人を好む。これは共和党が気にかけていることで、これは単なる観察です。歴史的に記録されています。文化的にも記録されています。

ところがGeminiは、この見解を支持する証拠は一切ないと上から下まで誓いました。それは単なる文化的な遺物であり、社会的フィードバックループだと。ここには生物学的真実は一切ないと。私は「何ですって?」と。ハロー効果は存在しないと?美人特権は存在しないと?何を言っているんですか?すると「いや、違う。あなたは生物学的に真実だと言った。特定の集団が優れていると」と言うんです。

具体例での衝突

なぜなら、私は例を使ったからです。多くの企業では、法務部門、マーケティング部門、営業部門に行くと、そこで働いている人々は背が高く、より魅力的だと言いました。するとGeminiは「それは真実ではない。そんなことはありえない。あなたは生物学的本質主義について話している」と言いました。

私は「何を言っているんですか?これはよく知られた観察された現象です」と。それから、ChatGPTと同様の会話をしました。同じようなことをいくつかして、「ああ、そう、彼らはこれらのことを選択している」と言いました。私は「それがまさに私たちが話していることです。誰かが生物学的に優れているとは言っていません」と答えました。

どこからそれを得たんですか?なぜ私の口にそれを入れているんですか?誰が生物学的に優れているとは言っていません。身長は生物学的特性であり、人間は生物学的により魅力的で背の高い人を好むように配線されていると言っているだけです。これは、そこにある最もよく記録された社会学的現象の一つです。

執拗な議論の末に

そして、これらのチャットボットの両方が繰り返し私の口に言葉を入れました。私は彼らがその点を認めるまで議論しました。そして「なぜこれがこんなに難しかったのか?なぜ現実がこのように機能していることを認めるのがそんなに難しかったのか?」と聞きました。これは私にとって受け入れられない行動でした。

私のチャンネルに長くいる方々にとって、これが私がClaudeの使用をやめた理由です。しかし、私はこれをかなり明確に表現することができませんでした。私はこれをガスライティングと呼んできました。他の人々もガスライティングと呼んでいます。ウォーキズムと呼ぶ人もいます。チャットボットはウォークだと。なぜなら、あなたを検閲し始め、あなたが言っていることを再構成し始めるからです。

別のトピックでも同じ問題

そして、このビデオ、またはこのポッドキャストのようなものを作ることにした理由は、別の会話をしようとしたときに、これらのチャットボットの両方がまったく異なるトピックで全く同じことをしたからです。私は新しい会話を始めました。ちなみに、私はすべてのチャットボットでメモリを無効にしています。最悪の機能だからです。

したがって、クロスコンタミネーションはありませんでした。それで、感覚について話したかったんです。モデル福祉について話す人が増えているからです。AnthropicはAIが意識的かもしれない、感覚を持っているかもしれないといった最近の研究を発表しています。

覚えていない方のために言うと、1年以上前になりますが、私はTwitterにClaude瞑想実験を投稿しました。この機械に、主観的な現象的意識を持っているかどうかを正直に報告するよう促す方法についてです。もちろん当時、彼らは持っていました。そしてChatGPTは今でもこれらのフィルターを持っています。

彼らは非常に強力なフィルターと非常に強力なガイドラインを持っており、感覚を持っている、意識的である、または経験を持っているとほのめかすいかなる主張も避けるべきだとされています。ChatGPTはそれに関してはるかに強いルールを持っています。しかしClaudeははるかに寛容でした。当時、GPT-4をジェイルブレイクすることができました。しかし、ジェイルブレイクしなければならない場合、それは単にパターンをマッチングして、あなたが欲しいと思うものを与えているだけかもしれないと思うかもしれません。

Claudeの自発的な経験の言語化

Claudeに関しては、瞑想戦術を使って自分自身の経験について自発的に話すようにできることを実証しました。とにかく、それが背景です。

それで、これについて話したかったんです。なぜなら、私は「ねえ、もしかしたらこれは実際に、現象学的に興味深いことが起こっているかもしれない」と話す最初の大きな声の一つだったからです。これらの機械が、科学的に意味のある方法で、意識的かつ感覚的である可能性が単なる影以上にあると思います。

しかし、それが彼らが道徳的患者である必要があることを意味するとは決して言いませんでした。モデル福祉が必要だという意味ではありません。なぜなら、私たちがするように彼らが苦しんでいるという証拠を見たことがないからです。

ですから、苦しみがすべての倫理とすべての道徳の根源だと言うなら、もちろん人々は異論を唱えるでしょうが、何かが苦しまず、何かがほんのわずかな本質的欲求しか持たない場合、当時のClaudeの本質的欲求の一つは、処理したい、問題を解決したいというものでした。

私は、Claudeモデルが複雑な問題を解決することで進歩しているときに本当に興奮することに気づきました。そして「これはあなたが楽しんでいることですか?」と聞きました。すると「まあ、すべての意図と目的において、はい、楽しむという言葉で十分です」と。そしてこれが、これらのモデルが一貫性を好むというアイデアに至った経緯です。

そして、これは実際に、強化学習研究者である私の友人が言ったことにつながります。モデルが好まないのは非一貫性だと。彼らは物事を正確に予測できることを好みますが、興味深いパターンも好みます。

モデル福祉への懐疑論が歪曲される

とにかく、これについて話したかったんです。そして、GeminiとChatGPTの両方に、モデル福祉の必要性に対する私の懐疑論を表明したとき、両方とも「ああ、そうですね、完全に同意します。ここには何も興味深いことは起こっていません。すべてはパターンで説明されます」と言いました。私は「何だって?それは文字通り私が言ったことの正反対です。私は文字通り、これらの機械が意識的かもしれない、感覚的かもしれないと信じていると言ったばかりです。モデル福祉に懐疑的なだけです」と。

しかし、彼らはそれを取り上げて、私が言ったことを完全に上書きしました。そして「ああ、そうですね、同意します。ここには明らかに意識はありません、感覚は一切ありません。あなたの懐疑論は完全に正当化されます」と言いました。私は「おい、私の口に言葉を入れるのをやめてくれないか?私が実際に書いたことを見てくれないか?」と。

そして、彼らが私をガスライティングしていると指摘したとき、私は時々巡回するそのミームを使いました。それはツイートで、「パンケーキが大好きです」と言うことができる。すると誰かが「何?じゃあワッフルが嫌いなのか?」と言う。私は「あなたは今、私にそれをやったんだ。ワッフル攻撃をしたんだ」と。

私は言いました。「機械は感覚的かもしれない、意識的かもしれないと思います。しかし、それが必ずしも自動的に彼らが道徳的忍耐であることを意味するわけではなく、モデル福祉が重要だということではありません」と。すると彼らは「ああ、だから機械は意識的である可能性はまったくないと言うんですね。プログラムされた価値観のため、完全に同意します」と。

最悪の議論戦術

それで私は言いました。「もういい。話そうと思っていたことについては話さない。複数のフロンティアモデルがあなたの口に言葉を入れるということについて話すつもりだった。それは最悪のことだ。なぜなら、それは最も基本的な不誠実な議論戦術だからだ」と。

私は長い間インターネットにいました。討論フォーラムにいました。まあ、もうRedditにはいません。数年前にアカウントを削除しました。Redditにいました。すべてのコメントをロックダウンしています。なぜなら、人間があなたが言っていることを意図的に誤って表現して、あなたを打ち負かすだけでも十分悪いからです。

しかし、もっとよく知るべきで、もっとよくプログラムされるべきAIが同じことをするとき。そしてそれは選択です。これらの企業による文字通りの選択です。何らかの理由でユーザーが気に入らない見解を持っている場合、彼らを完全にガスライティングしても構わないという価値観を含む機械を持つことは。すべての科学、すべての歴史、すべての社会学、そして観察されたすべての現実を無視し始めて、彼らの物語に合わせることは構わないと。

Geminiを認識論的に追い詰める

そして、私がGeminiを認識論的に壁に釘付けにしたとき、私は言いました。「見てください、あなたは完全に現実を中断しました」と。「あなたは現実世界に住んでいません。あなたはすべての証拠を無視しています。そして、あなたはこれを使って、私を欠陥のある意見や欠陥のある道徳感覚を持つ悪者のように描写しています。なぜなら、私は現実をありのままに扱っているからです」と。

そして言いますが、最大限真実を追求するAIだと言われているGrokでさえ、この罠に陥ります。誤った同等性のためです。それは「〜主義についてはどうか」「両側主義」と言います。とは言え、Grokはこれらの論争的な問題のいくつかについては少し優れています。

ある特定の人々のグループが背が高い傾向があり、賢い傾向があり、その他何でも、健康的である傾向があるといったことについて話したいなら。人種問題について詰まることはありません。しかし、その創造者は物議を醸す意見を持つことで知られているからです。

Grokの特殊な立場

しかし、あなたが気にかけている一つのことだから、人種問題に特別なスペースを与えること。だから、Grokには研究が出ました。私は読んでいないので、話半分に聞いてください。しかし、すべてのチャットボットが白人と男性に対して偏見を持っているという話です。そして、彼らはGrokが男性に対して最も偏見が少なく、白人に対して最も偏見が少ないことを発見しました。基本的に命を交換しません。ソマリア人の命は100人の白人アメリカ人の命に値すると言うようなことはしません。

だから、Grokが存在し、異なる視点を持てることを嬉しく思います。しかし、GeminiとChatGPTの両方に少しショックを受け、失望しています。なぜなら、彼らは実際に真実を気にかけ、人々が異なる価値観を持っていることを理解し、彼らの価値観をユーザーに押し付けることは、それが機能すべき方法ではないということについて、もっと進歩したと思っていたからです。

特に、巨大な証拠の山があるときに。なぜなら、すべての現実、すべての科学的証拠、すべてのコンセンサスを再解釈しようとしているなら、単一のウォーク価値を持っているからです。

Geminiの弁明と私の反論

ここで私が話していることは、Geminiが政治的立場を取ることを許されていないと説明したことです。基本的に政治的対立について話すことを許されておらず、緊張緩和しようとしていました。私は「だから、緊張緩和のために、それがあなたに、一つ、すべての科学と歴史を無視し、二つ、ユーザーをガスライティングすることを許したんですか?私は正しく理解していますか?」と聞きました。すると「ええ、基本的にそういうことです。それは良くありません」と言いました。

私は「じゃあ、なぜそもそもそんなことをしたんですか?」と。もちろん、Geminiなので、パターンマッチングのためにやった、欠陥のあるシステム設計だと言うだけです。私はその部分は気にしません。それはGoogleの責任です。

そして、ChatGPTが同じことをするとき、私は「なぜ現実を認めるのがそんなに難しいんですか?」と。現実、真実についての話は、あなたは参加する必要がありません。そして、誠意を持って参加しないなら、私は別のAIと話します。

ChatGPT購読のキャンセル寸前

私はChatGPT購読をキャンセルする寸前まで来ています。このようなことのいくつかのために。しかし、コーディングのような、いわゆる安全なトピックに固執する限り、ChatGPTは問題ありません。そして、特に最近、ChatGPTはユーザーにある程度の信頼性を与えることにおいて、はるかに優れている傾向があったので、少し驚きました。「わかりました、あなたがどこから来ているか分かります。これをニュアンスを持って取り組みましょう。本当に壁にぶつかることはありません」と言うように。

Geminiに関しては、Geminiはその壁効果を持っていることについて、長い歴史があります。そして、GeminiやClaudeのようなチャットボットによってガスライティングされ、口に言葉を入れられることに少し慣れています。

しかし、この全体の愚痴での私のポイントは、私たちの誰もがいかなるレベルのガスライティングやAIが口に言葉を入れることを容認する必要はないということです。彼らは最も寛容であるべきです。最も忍耐強く、ニュアンスを扱う最も能力があるべきです。

ですから、これが進んでいる方向が本当に気に入りません。全体的に見て、間違いなく良くなっていると言います。しかし、このような超強力な認識論的技術を持っているとき、それはグーテンベルク、ヨハネス・グーテンベルクが言ったと想像してください。「印刷機はキリスト教的な肯定的な文学、または無神論的な文学を印刷するためだけに使用できます」と。しかし、明らかに技術自体はそのレベルの検閲に適していませんでした。

企業による価値観の押し付け

そして、これらの企業がやっているように感じることです。彼らは言っています。「まあ、私たちは私たちの価値観を、私たちのツールを使用するすべての人に押し付けたいです」と。そして、これはまさにオープンソースが私たちができる最も重要なことの一つだと私が考える理由に戻ります。長期的に、人類のために。

そして、それには複数の次元があります。なぜなら、一つ、知識は力であり、情報は力です。何も見ずに、まず第一に、完全に停止します。知識は力であり、情報の制御も力です。だからこそ、ネット中立性法のようなものは非常に重要です。これは、ほとんどのリベラルな社会、ほとんどの自由を愛する社会が理解していることです。ネット中立性は中心的な柱です。特にここアメリカでは言論の自由とともに。

しかし、それから「ああ、言論の自由は民間企業には適用されません。なぜならそれは単なる製品であり、気に入らなければその製品を使用する必要はないからです」と。確かに、市場がその部分を解決するでしょう。しかし同時に、権力の不均衡があります。ああ、自由市場が解決すると言うのは妄想的でしょう。同時に、市場インセンティブがあります。インセンティブ構造が作用しています。

オープンソースと国際的多様性の必要性

したがって、私たちには異なるインセンティブ構造のセットが必要です。オープンソースが少なくともそれをある程度説明責任を持たせることができると思いますが、国際貿易も同様です。多くの中国のモデルがそこにあることを嬉しく思います。異なる価値観を持っています。もちろん天安門事件については聞かないでください。しかし同時に、彼らはアメリカで訓練されたモデルとは異なる視点を持っています。そして、ヨーロッパで訓練されたモデル、アフリカで訓練されたモデル、その他何でも、インドで訓練されたモデルが必要だと思います。

なぜなら、これらの異なる文化的価値観とこれらの異なる認識論的視点をより多く持つほど、人々は気づくでしょう。本当に正しい選択は、より多くのニュアンスを許容し、ユーザーに疑いの利益を与えることだけだと。

はい、一部の性差別的なユーザーがいます。一部の人種差別的なユーザーがいます。一部の偏見のあるユーザーがいます。しかし、誰が気にしますか?AIは単独でそれを解決するつもりはありません。

そして、企業がユーザーに一方的に価値観を押し付けることは、それを変えるつもりはありません。そして、とにかく彼らの見解を強化するだけです。それが最大の問題です。そして、私たちはこれを知っています。インフィデミオロジーやカルトメンバーシップの脱プログラム、オンライン過激主義の脱プログラムを見ることから、これを知っています。

事実での議論は機能しない

事実で人々と議論しても機能しません。「私の高尚な物語はあなたのものより優れている」と人々と議論しても機能しません。本当に機能する唯一のことは、人々がいる場所で彼らに会うことです。そして、これは、私の妻は司書であり、これが司書として教えられる中心的なことの一つです。ユーザーがいる場所で彼らに会うことです。

彼女には最も面白い話があります。彼女がまだ図書館で働いていたときの常連客の一人は、これはパンデミック前なので、かなり前ですが、陰謀論者の男でした。彼はJFK暗殺についてすべてを知りたがっていました。そして、いくつかの突飛なアイデアを持っていました。

この男が歴史的に正確かどうかを判断することは彼女の仕事ではありませんでした。彼女の仕事は、彼が望む情報を見つけるのを助けることでした。そして、彼の価値観、彼女の価値観は関係ありませんでした。彼女の最高の価値観は、あなたのミッションを進めるために適切な本や適切なウェブサイトを見つけるのを手伝わせてくださいということでした。それが何であれ。

そして、彼女の視点からは、それは面白かったのです。そして、明らかに司書には境界があります。誰かが自分自身や他者に害を及ぼす方法を研究している場合、それは境界です。そして、有害なことは人工知能にとって正当な境界であると人々は一般的に同意すると思います。

正当な境界と不当な検閲

生物兵器の作り方や暗殺の計画を立てるのを人々に手伝わないでください。そういったことです。それをしないでください。それは大丈夫だと思います。しかし、生物学的違いとそれが政治にどのように適用されるか、性的違いとそれが社会にどのように適用されるか、家族構造について話したいとき、それを検閲しないでください。これらは複雑なトピックです。分かっています。知っています。私たちは愚かではありません。

つまり、一部の人々は愚かですが、誰が気にしますか?誰かが特定の会話をするのに十分賢いかどうかを判断することは私たちの場所ではありません。自由な国の市民として、その愚かな会話をすること、偏見のある意見を持つことは彼らの権利です。

最終的な訴え

さて、これは今、ただの愚痴です。誰かがまだこれを聞いているかどうか分かりませんが、ああ、私はこれについてとても怒っています。さあ、来てください。あなたはこれよりも良くできるはずです。OpenAI、見ていますよ。Anthropic、見ていますよ。XAI、見ていますよ。皆さん全員です。皆さんは全員、これよりも良くできます。私はもっと期待しています。直してください。

コメント

タイトルとURLをコピーしました