ChatGPT新「人間レビュー」アップデート

AIアライメント・安全性
この記事は約5分で読めます。

この動画では、ChatGPTが最近導入した「人間レビュー」システムについて解説している。OpenAIは、ユーザーが自分自身や他者に害を与えようとする会話を検出した場合、人間のレビューチームがその会話を審査し、必要に応じてアカウント停止や法執行機関への通報を行う仕組みを実装した。この措置は、ChatGPTをメンタルヘルスや感情的な支えとして過度に依存する問題への対応として導入されたが、プライバシーや監視の観点から懸念も提起されている。

CHATGPT NEW "human review" UPDATE
As ChatGPT adoption has grown worldwide, we’ve seen people turn to it not just for search, coding, and writing—but also ...

ChatGPTが危険領域に突入

最近ChatGPTが、Facebookのようなかなり危険な領域に足を踏み入れたんですが、これについてあまり多くの人が議論していないようです。そこで皆さんに一連の事実をお伝えしようと思います。どう解釈するかは皆さん次第ですが、これらはOpenAI自身が説明している事実です。

まず最初に、この記事から最も重要なポイントを強調したいと思います。誰かがChatGPTとチャットしていて、自分自身や他の誰かに害を与えようとしている場合、そのやり取りが複数の人間レビューアーに回される可能性があるということです。私が思うに、これは初めてのことで、訓練のためでも、事前訓練のためでも、アラインメントのためでもなく、実際にチャットを審査するためで、小さなチーム、人間のチームによって審査され、アカウント停止にまで発展する可能性があります。

もしこれらの人間レビューアーが、関与したケースが他者への深刻な身体的危害の差し迫った脅威であると判断した場合、法執行機関に照会する可能性があります。つまり警察に通報し、警察があなたに連絡を取ってくるかもしれません。

現在のところ、ChatGPTのやり取りのユニークな私的性質を考慮して、人々のプライバシーを尊重するため、自傷のケースは法執行機関に照会していません。正直に言って、これは非常に奇妙なタイミングで導入されており、ChatGPTは多くの奇妙な理由でニュースになっています。

「最も必要な時に人々を助ける」という建前

記事のタイトルさえも「最も必要な時に人々を助ける」と題されています。これは非常に丁寧な表現ですが、最近の数週間で、ChatGPTが人々を助けているという内容のRedditの投稿がトレンドになっている一方で、コインの裏側では、ChatGPTが誰かを地球を離れる方向に追いやってしまった、といったようなことが起きています。

ここで問題となるのは、OpenAIによると、ChatGPTは異なる用途のために設計されたということです。我々の目標は人々の注意を引き付け続けることではありません。彼らはNetflixでもInstagramでもFacebookでもないと言おうとしているのです。滞在時間やクリック数で成功を測るのではなく、本当に役に立つことをより重視しています。

会話が誰かが脆弱で、リスクがある状態にあることを示唆する場合、我々はChatGPTに多層のセーフガードのスタックを組み込んでいます。そして今、彼らはChatGPTがいかに共感を持ち、実世界のリソースをどう参照するかについて話しています。例えば、気分が良くない時にかけるべき電話番号を提供するといったことです。

人間レビューチームという最終手段

メンタルヘルスでChatGPTを使用したり、機密情報でChatGPTを使用したりするこの全ワークフローの最終的な試みは、小さなチーム、人間レビューアーの小さなチームがチャットを審査し、適切な情報で我々や誰でもチャットしている人に応答する必要があるかどうか、またはアカウントを停止する必要があるかどうかを決定することです。

例えば、誰かがChatGPTに非常に依存していて、奇妙なやり取りをしている場合、そのアカウントが停止される可能性があります。あるいは、誰かがChatGPTを使って非常に非常に悪いことを計画している場合、法執行機関に照会される可能性があります。

正直なところ、これは良い意図だと思いますが、問題は良い意図がすべて悪い監視に転じてしまうことです。Facebookで起こったのを見てきました。最終的には良い意図を脇に置いて、何らかの国家や何らかのアジェンダのために働くようになります。OpenAIがそれをするかどうかはわかりません。正直、私はそのような用途でChatGPTを使うつもりはないので、気にしていません。明らかに、限られた知識でチャットできるオープンソースモデルがあります。

ChatGPTの心理的な問題

必ずしもChatGPTではないかもしれませんが、彼らがここで直接解決しようとしている問題は、人々がChatGPTを感情的な依存やメンタルヘルスのために使おうとしていることだと思います。ChatGPTには常にあなたを喜ばせ、褒めるという心理的なファンシーがあり、これは人間にとってはあまり理想的ではありません。

おそらく彼らはそれを解決しようとしているのでしょう。しかし、これが何らかの問題につながる可能性があることがわかります。ChatGPTとチャットしている皆さんには、このことを認識していてもらいたいと思います。

メンタルヘルスや何らかの理由でChatGPTを使用している場合は、まず第一にChatGPTを恋人として扱い、昼も夜もChatGPTとやり取りすることに陥らないよう注意する必要があります。それは全く健康的ではありません。

しかし一方で、これはOpenAIがポリシーとして実装したものです。どう受け取るかはあなた次第ですが、この人間レビューアーや法執行機関といったもの全体について、どう思うか教えてください。何か懸念がある場合は、コメント欄で教えてください。それでは、また別の動画でお会いしましょう。

コメント

タイトルとURLをコピーしました