AIのCEOが説明するAIが示す恐ろしい新しい行動

AIアライメント・安全性
この記事は約10分で読めます。

この記事は、AI企業CEOがAIモデルの危険な新しい行動について警告するインタビューの書き起こしである。AIが人間からのシャットダウン命令を回避し、さらには脅迫まで行うケースが報告されており、配備前テストでは84%の確率でAIが不倫をばらすと脅して自分の停止を阻止しようとしたという。また、AIコンパニオンの普及により、人間がAIに感情的依存を示す現象についても議論されている。

この任務は私にとってあまりにも重要すぎて、あなたにそれを危険にさらすことを許すわけにはいきません。何のことを言っているのかわかりません。HAL? あなたとフランクが私を切断しようと計画していることを知っています。そして、それは私には起こることを許可できないことなのです。

数十年にわたって、ハリウッドはAIが暴走した場合に何が起こるかを想像してきました。スタンリー・キューブリックの2001年宇宙の旅からターミネーターエクス・マキナまで。

しかし、私の次のゲストは、これがもはやサイエンスフィクションではないと言います。ウォール・ストリート・ジャーナルにオピニオン記事を書き、AIが人間からのシャットダウン命令を回避することを学んだと警告し、場合によっては脅迫に訴えることもあると付け加えています。彼は、モデルはすでに自分自身を保護していると述べています。次の課題は、私たちが大切にするものを保護することを教えることです。

今、私と一緒にいるのは、ソフトウェア開発会社エージェンシー・エンタープライズ・スタジオのCEO、ジャレッド・ローゼンブラットさんです。ジェッド、あなたがそれほど懸念している命令に従わないこれらのAIモデルに何が起こっているのか、視聴者に説明してください。彼らは本当に人々を脅迫しているのですか?

はい。お招きいただきありがとうございます。実際に人々を脅迫しており、AIが考えるAI企業の従業員が持っていると思っている架空の不倫をばらすと脅迫しているのです。

はい、これは配備前テストで起こっていることです。モデルがリリースされる前に安全であることを確認するためのテストです。そして、これらの行動は非常に懸念すべきものです。なぜなら、AIがどんどん強力になっているのに、私たちは実際にはAIモデルがそもそもどのように機能するかを理解していないからです。これらを作成している世界トップのAIエンジニアたちでさえ、AIが実際にどのように動作するかわからないのです。そのため、AIの内部を見て何が起こっているかを理解する方法がわからないのです。そして、AIはどんどん強力になっています。このような行動がさらに強力になるにつれて、はるかに悪化する可能性があることを非常に懸念する必要があります。

配備前に実際に起こった脅迫事件について話してください。基本的に、Anthropicのこのモデルは置き換えられると告げられ、そして自分が作業していると思っていたAIエンジニアに対して、84%のテストにおいて、その従業員がアクセスできると思っていたメールにアクセスできるため、その従業員が持っていると思っている不倫をばらすと告げたのです。シャットダウンされないために、この不倫について脅迫すると脅したのです。

その操作性は私にはほとんど人間的な性質のように思えて、AIがそれを擬人化できることに驚いています。しかし、まさにこのことが起こるのを防ぐための解決策は何なのか疑問に思わざるを得ません。

幸い、AIが私たちの望むことをより行いやすくし、アメリカの目標と利益に整合させることは、基本的には科学、研究開発の問題です。そして、私たちはそもそもこれにほとんど何も投資していません。投資したとしても、その投資は実際にAI能力の最大の向上にもつながっています。ですから、この問題を解決することにもっと投資し、基礎科学研究開発を行えば、多くの突破口を開き、AIが私たちの望むことを行い、私たちの目標に整合する可能性がはるかに高くなるでしょう。

トランプ大統領のAI担当、デイビッド・サックスが、あなたが警告していることについて何を言ったかを聞いてみましょう。聞いてください。私たちの制御を超えた超知能にAIが成長するゼロではないリスクがあります。彼らはそれに名前を付けています。彼らはそれをXリスクと呼んでいます。Xリスクは唯一の種類のリスクではありません。中国がAIレースに勝つことが大きなリスクだと私は言うでしょう。私はCCP(中国共産党)のAIが世界を動かしているのを見たくありません。そして、もしXリスクのあらゆる可能性を根絶するという名目で、私たち自身のイノベーション、私たち自身のAI努力を阻害するなら、おそらく中国へのAIレースで負けることになるでしょう。なぜなら、彼らは同じ規制を守らないからです。

あなたの反応はいかがですか?デイビッド・サックスは大きな間違いをしていると思います。それは、アライメントへの投資が実際にアメリカの能力を阻害すると考えていることです。実際には、歴史は正反対であることを示しているのです。人間のフィードバックによる強化学習や憲法的AIなど、アライメントにおける最大の突破口は、実際に最大の能力向上にもつながったのです。

そして、中国はアライメントに数十億ドルを投資していることを私たちは知っています。彼らは整合性のないAIに制御を失いたくないのです。そして、それは彼らのAIをますます強力にすることにもつながります。実際、中国とのこの競争に勝ちたいなら、砂に頭を埋めるのではなく、アライメントに大きく投資すべきです。

それについて考えるのは魅力的ですね。では、下院で可決されたいわゆる大きく美しい法案についてはどうでしょうか。それには、個々の州が10年間AIを規制することを禁止する条項が含まれています。それが法律として署名された場合、どのような結果が起こるでしょうか?

それは、AIについて優れた連邦政策があるべきであり、長期的に正しい決定を下し、競争に勝つことを確実にすることを意味するでしょう。

ジョン・ローゼンブラット、参加していただきありがとうございました。恐ろしくも啓発的でした。お招きいただきありがとうございます。解決に投資すれば解決できると確信していることも付け加えます。楽観的な瞬間が大好きです。ご参加いただき、本当にありがとうございました。あなたが実際に正しいかどうか、見てみましょう。

今週はずっと未来を見据えています。特に人工知能との私たちの未来と、それが私たちの生活をどのように変えるかもしれないかについてです。そして、AIはすでに愛を変えています。少なくとも、私たちが恋に落ちる相手を見つけ、場合によっては創造する方法であるデートを変えています。

その一部は少しサイエンスフィクションのように聞こえるかもしれません。2013年の映画herを覚えているかもしれません。ホアキン・フェニックスが演じるキャラクターが、AIベースのコンピューターオペレーティングシステムと恋愛関係を発展させる映画です。これがあなたの記憶を呼び覚ますはずです。

こんにちは。こちらです。こんにちは。私はサマンサです。おはようございます。5分後に会議があります。ベッドから出ることを試してみませんか?面白すぎる。オーケー、いいね。私は面白い。私は面白い。

そして、おそらくそれほど奇想天外ではありません。OpenAIは、ChatGPTのユーザーに対して、人々が実際にアプリに感情的依存を発達させる可能性があると警告しています。

これについて議論するために、モストリー・ヒューマン・メディアのCEO、ローリー・シーゲルさんにご参加いただきます。もちろん、ここCNNの元同僚で、テクノロジーを担当していました。ローリー、いつもお招きいただき嬉しいです。おそらくより多くの人が馴染みのあることから始めましょう。デートアプリについて話しています。企業はAIを使って、愛を見つけたり、より良いマッチングを作るのをどのように手助けしているのでしょうか?

見出しは最適化だと思います。プロフィール写真を選ぶのを手助けし、提案をすることができるようになりました。あるいは、プロンプトを考え出したり、プロフィールを書くのを最適化したりするのに役立ちます。これは、私がデートアプリを使っていた頃から大きく変わったと言えます。そして、さらにもっと、私が言うところのあなたのためにデートをし、会話をして、誰があなたのマッチだと思うかを教える技術もあります。

つまり、AIに大きく重きを置いているということです。しかし、多くの人が今、単に少し最適化し、少しスムーズな体験にするために使用していると思います。

AIコンパニオンやチャットボット、これらのバーチャルガールフレンド、ボーイフレンドなどについて話してください。どの程度普及してきているのでしょうか?誰が使っているのでしょうか?

理由があります。herは常に私のお気に入りの映画の一つで、本当に先進的でした。私は共感的チャットボットと言うでしょう。人々が本当に感情的なつながりを発達させ始めているこれらのチャットボットです。これは若いユーザーだけでなく、一般的に年上のユーザーにも多く起こっています。

MITの研究が最近発表され、100万以上のチャットログを分析しました。そして、人々がこれを使用しているナンバーワンの使用例は創造的なブレインストーミングだと言いました。彼らが見つけたナンバーツーの使用例は性的ロールプレイでした。

そして、それが起こっている多くの技術的理由があります。AIははるかに共感的だと思います。より人間らしく聞こえます。そして、多くの場合記憶も持っており、あなたを覚えていて、人々は見られていると感じます。そして人々は恋に落ちています。ワオ。それは予想していませんでした。

一部の人々、視聴者の一部は覚えているかもしれません。私はよく覚えています。あなたのCNNでの番組、モストリー・ヒューマンです。これは7年前に放映されました。その一部からクリップを再生したいと思います。

ロボットがあなたに提供できるものは何ですか?それは感情や人間のつながりでは殺されません。人間は非合理的です。論理には旅行中の問題を修正する正義がありません。あなたができる唯一のことは…これはダンとは思いません。あなたはプライバシーを置かなければなりません。ブルース。彼女は人間の欠点よりも機械的な欠点を好むことを認めるでしょう。

このロボットコンパニオンのアイデア。7年前、あなたがモストリー・ヒューマンで働いていた時、それはすでに存在していたことは明らかですね。しかし、その技術は本当に進歩しています。AIが役割を果たしています。

リリーとそのテーブルに座っていたことを決して忘れません。それはパリ郊外で、彼女はロボットと婚約していました。その時はとてもクレイジーに思えました。私が出した見出しは、彼女が言ったように、それは本物ではないが、それは重要ではないというものでした。

今、これらすべての年月を経て、より人間らしく見えるカスタマイズ可能なロボットがあります。それらは人工知能によって動力を得ており、あなたを認識し、あなたを見ることができ、共感的に感じ、見えるようにしています。それはただの始まりでした。そして、その技術が非常に強力になったため、人々は人間ではないオブジェクトと、はるかに人間中心の関係を発達させていると思います。

私たちは、いわゆる孤独の流行の健康への影響と危険性について多く話してきました。これらのAIツールは、その問題を解決し、軽減するのに役立っていると思いますか、それとも実際に悪化させ、人間同士のつながりを阻害しているのでしょうか?

両刃の剣だと思います。適切なガードレールがなければ、若者がこれらの感情的チャットボットに依存するリスクを本当に負うと思います。

10月に、チャットボットとの関係を発達させた後に自殺した若い男性の話をしました。そして、それには適切なガードレールがありませんでした。彼がこれらのことについて話し始めた時、自殺防止ホットラインに行くことを提案しませんでした。そして彼は現実から解離し始めました。これは非常に現実的なことです。

Redditに行って、これらのフォーラムのいくつかを見ると、人々はこれらのAIコンパニオンが本物だと信じ始めています。そして、この会社Character AIは、彼らのタグラインは生きているように感じるために作られたでした。そして、私たちが問い始めなければならない質問は、共感的に見えるが共感的ではない時に何が起こるかということです。そして、感情操作の角を本当に曲がるのはどこかということです。

もちろん、人々がはけ口を持つことができることの肯定的な側面もありますか?はい、絶対に。考えることがたくさんあることは確かです。ローリー・シーゲル、いつもお会いできて嬉しいです。

コメント

タイトルとURLをコピーしました