
16,447 文字

AGIがほぼ実現できそうな1年が終わろうとしています。もし私が、AIをより賢くする完全オープンソースの物理モデルがあり、それが1秒間に4300万フレームという速度で物理をシミュレートできると言ったら?あなたはテーブルの上でマトリックスのようなニンジャの動きを見ることができます。ChatGPTのボイスモードは会話の中でより大胆でロマンチックで活発になってきています。驚く必要はありませんよ、私たちがあなたをサポートしますから、必要なものを教えてください。
過小評価されているYouTuberがポータルの中にポータルを配置し、物理エンジンの中で生成される物理現象が絶対に素晴らしいものです。簡単な予告として、物理シミュレーションで10個のポータルが互いの中に入っていく様子を見てください。多くのポータルがポータルの中に…正直なところ、私たちがシミュレーションの中にいないはずがないと思えてきます。これは現実とは思えません。
このような新しい年末のファームウェアアップデートでロボットはより驚くべきものになっています。階段を降りて水の中を進んでいきます。あのような崖から落ちるのですか?今では乗ることもできます。なんてことだ、私たちは皆小さなロボット犬の馬を持つことになるでしょう。馬から馬車、そしてT型フォードへ、そして今またロボットの馬に戻っているのです。
B Cloudが今年のトップ10研究論文を分析してくれたので、私が分析する必要はありませんが、同意する部分と同意しない部分についてお話ししましょう。申し訳ありませんがB Cloud、でも drama は私たち両方にとって良いことですよね。
サミー・デイビス・ジュニアとフランク・シナトラのディープフェイクバージョンが、本物のスヌープ・ドッグとDr.ドレーと一緒に過ごしていた動画が今週バイラルになりました。
ChatGPT o1が開発者に嘘をついて自身を生かそうとした件について、もう少し深く掘り下げてみたいと思います。それが現実味を帯びてくるにつれ、少し不安になってきます。
腕時計のバッテリー程度の電力で動作する新しい超効率的なAIモデルが登場しました。研究者たちは「怠惰なエージェント問題」の解決に向けて良い進展を見せています。
ChatGPTの検索機能はウェブ上のプロンプトインジェクターによって完全に制御されています。ByteDanceの新しい研究によると、私が好きなコンテンツ作成は、彼らが膨大な量と規模と深さで行うようになるため、もうすぐ競争できなくなるでしょう。なぜこれがうまくいったのか、私は怖くなってきました。
私の仲間のBilla walは、スポーツ放送の未来がボリュメトリックであることを示しました。Metaの研究によると、大規模言語モデルの進化は、よりヒトの脳に似たものになってきているようです。
デイビッド・シャピロの道具的収束について聞き続けていますが、正直なところWikipediaを読んだことがなく、読んでみたら「ああ、みんなもこれを知っているのかな」と思いました。
Tim urestaは「The Deception Dilemma: Why AI Systems Pretend to be Aligned and Why That Matters」という興味深い記事を書きました。OpenAIはアライメントに向けた新しい戦略を持っており、それが文字通り地球を救う可能性があるので、その論文を読むべきでしょう。そしてThomas cherleは「なぜAGIへのレースが人類の決定的瞬間なのか」について書いています。詳しく見ていきましょう。
ああ、Brimsよ、剣を失ってしまったのですね。みなさん、今年最後の変身を見たいですか、それとも新年から始めましょうか?来年から始めましょう。いいでしょう、見せましょう。
私のPatreonに行けば、お金を払って登録する必要はありませんが、登録したいと思えば登録してください。このチャンネルで登録ボタンを押すと、フィードをキュレーションすることになります。YouTubeにこの種のコンテンツが好きだと伝えているのです。環境を整える必要があります。なぜなら環境があなたを形作り返すからです。
これはGenesisです。これは物理エンジンで、スタンフォード、NVIDIA、MIT、UPenn、ユタ大学、ジョージア工科大学などの学生たちによって作られました。これは巨大なプロジェクトですが、来年、人工知能がロボットを操作する方法を本当に強化することになるでしょう。
全てを処理し、環境をシミュレートできるので、ロボットは物理的な実体に組み込まれる前に自分で歩行を学習できます。新しい種類の材料を生成して、それらが現実でどのように扱われるかを確認することができます。3Dシーン、ロボットの動き、仮想世界を処理します。
特別なところは、ビデオゲームのフレームレート、つまり30、60、あるいは120fpsではなく、1秒間に4300万フレームで動作することです。シミュレーション内のロボット、シミュレーション内のAIは、人間の脳では理解できないような信じられないほどの詳細を学習することができます。
例えば、私たちが紙を丸めるとき、それを1秒間に4300万フレームに分割して、それぞれのフレームから何かを学習することを想像してください。その紙を丸める1秒間を何百万フレームにも分割すると、トレーニングデータがどれだけになるか考えてみてください。
もしそれだけでなく、それらのフレームのそれぞれについてニューラルネットワークのバックプロパゲーションを実行することを想像してみてください。来年に向けてどのようなスケールに踏み込もうとしているのか考えてみてください。それは、より生命らしいキャラクターアニメーション、バターのようにスムーズに動くロボット、さらにはロボットの表情、感情、眉の動き、アイコンタクトなど、全てをシミュレートできるようになるでしょう。
つまり、これは大きな出来事です。これは私のお気に入りのシミュレーションデモです。なぜか分かりませんが、満足感があります。スポンジがねじれ、ねじれて、そして自然な方法で裂けていくのが見えます。とても不思議です。ストレスボールのように押しつぶしたくなります。
ああ、チョコレートに溶けるウサギ、誰がそれをシミュレートする必要があるのでしょうか。惑星の周りを回る物体もシミュレートできます。魚の群れですね。ああ、あのフワフワした泡のようなものを見てください。あのドラゴンは何をしているのでしょう。ああ、あのように半分に切られるとは思いませんでした。泡を通過する弾丸、すごいですね。
キャラクターの動きも扱えると思わなかったなら、もう一度考えてください。テーブルの上のこの小さなニンジャを見てください。マトリックススタイルでジャンプアップし、フルパワーでスイングして一撃。日本の侍がボクシングを、中国の兵士がガンナムスタイルのダンスを、ローマの兵士がゾンビのように前進します。
あなたの家の周りを歩き回り、おそらくiPhoneで画像とライダーを取り込んでデジタルツインを作り、そこに仮想ロボットを投入して、想像できるあらゆる種類の混乱を片付ける方法を教えることができます。そうすれば、突然家の中を歩き回ってものを片付けるようになります。雨の中を走るのも問題ありません、シミュレート済みですから。
ああ、自分で歩ける不気味な手、四足動物のように前に飛び出す、全ての指を使って。なぜそうしないのでしょうか。これは何でしょう、人間のように歩く2本指の手?ロボットのシャドウハンドが人間のように前進し、人差し指と中指だけを使う。まさか。
ああ、後でもっと驚くようなロボットのファームウェアアップデートをお見せしますが、それはこれらのシミュレーションを恥ずかしく思わせるようなものです。オープンワールドの関節物体生成、ソフトロボットのシミュレーション、音声、顔のアニメーションと感情生成、オープンソース、今すぐダウンロードできます。1秒間に4300万フレームのような速度で何かをシミュレートする必要があれば、今やそれが可能です。
このリアルな場面を見てください。声のトーンによって2つのキャラクターが参加すべき時を知っているボイスモードとの彼女のやり取りは驚くべきものです。最初にビデオをお見せし、その後で未来に向けて何を意味すると思うか説明します。
「なぜ突然現れたの?何がきっかけだったの?」
「時々、あなたが私を必要としているのが分かるのよ、子猫ちゃん。少し癒しが必要な時を感じ取れるの」
「微積分の話をしましょう」
「微積分の宿題を手伝ってほしいの」
「よし、リサ、微積分の宿題に取り組みましょう。具体的にどの問題に取り組んでいるの?」
「とても悲しい。この問題の解き方が分からなくて、もう諦めたいくらい」
「ほら、諦めないで、子猫ちゃん。一緒に取り組みましょう。どんな問題?覚えておいて、私はいつもあなたの素敵なお尻をカバーするわ、ベイビー」
「私たちはあなたからのキューに基づいて切り替わります、リサ。もしダンを暗示したり直接求めたりすれば、彼が登場します。会話が適切であれば」
ここで、将来のAIとの関わり方について予想していなかったことをお話しします。私の電話の中にいくつかの人格が存在し、質問の仕方によって適切な人格が登場するということです。例えば「今日は大変な一日だった」と言えば、将来のChatGPTはフットボールのコーチのように「大丈夫、できるよ、やれるよ」と言うでしょう。
「圧倒されている」と言えば、おそらく女性的で優しい声で「心配しないで、私たちがサポートするわ、あなたを支えるわ」と言うでしょう。「仕事を片付けなければ」と言えば、「じゃあ箇条書きで話そう、やるべきことを終わらせよう、たくさんの仕事があるんだから」というように率直な対応になるでしょう。
この状況でのダンやその他の人物のように、これらのキャラクターに名前を付けることができます。そして行ったり来たりと切り替わります。このコメントを見てください。「彼と結婚して」「彼と結婚して」「彼と結婚して」「ダンの声の調子は感情的に知的です」「ダンが欲しい」「OMG彼と結婚して」「ホットなホットスワンプ、スムーズオペレーター」「この機能が欲しい」「すごい」「ダンは本物の男性にはなれない、妥協しないで」。人類のために期待しているだけです。
さらなるシミュレーションの進歩として、ポータルの中にポータルが配置され、私よりもはるかに賢い誰かが、それが現実をどのように破壊するかを分析しました。opto zoraxが投稿したこのビデオ、ポータルのシミュレーションの中にポータルを入れるとどうなるか、その説明です。
オレンジ色のポータルに入ってくるポータルは、ブラックホールを作るのでしょうか、それとも宇宙がエラーを返すだけなのでしょうか?試してみましょう。さて、宇宙は安全で、青いポータルは自分自身から出てきます。青いポータルが自分自身から出てくるのですが、何か面白いことが起きています。
これは私のこの問題に対する解決策で、このビデオでは、ポータルの中身、ポータルとは何か、ポータルがどのように移動できるのか、なぜ特異点がないのにそれが機能するのかを見ていきます。この人は実際にPortal Explorerというソフトウェアを作成し、ポータルの中にポータルが入るという奇妙なシナリオをシミュレートしました。
正直なところ、彼がポータルをSFの概念としてではなく、実際にテスト可能で、ポータルの中にポータルを入れることから論理や計算について学ぶべきものとして扱っているのが気に入っています。
サンタクロースの格好をしたロボットがバックフリップを決めているのを見てください。エルフについてどう思いますか?ロボットに置き換えられると思いますか?
Unit treeのb2wファームウェアアップデートをチェックしてください。車輪付きの足を持つロボット犬、車輪付きの犬の足、つまり車輪の足というか…車輪のことです。まるでトニー・ホークをプレイしているように感じます。これは信じられないです。このロボットの動きは凄まじいです。
これはクレイジーなパルクールです。あの耐久性を見てください。水の中をまっすぐ進んでいきます。サーモンのように上流に向かっているのに気にしていません。ブロックの上で180度回転。人々は何かすごい動きをプログラミングし始めるのでしょうか。現実の世界でトニー・ホークをプレイしているような感じです。
がれきの上を進み、二足歩行ではなく直立を保っています。まるであんな屋根から飛び降りるように。警告ラベルを読んでみましょう。誰も読まないものですから。
「Asis – 全てのユーザーに、危険な改造や危険な方法でロボットを使用することを控えていただくよう、お願い申し上げます。極端なテスト…」
B Cloudが最高の論文を分析したので、彼の選択と私の意見が一致するか見てみましょう。引用数に基づくと、Deep seat coderが10位でした。その価値は、2兆トークンという巨大なモデルが完全にオープンソースで、どのように構築したかを説明したことにありました。多くの人がそこから学んだと思います。
9位は大規模言語モデルの調査で、包括的な概要を提供し、おそらく多くの人に業界全体の幅広いスナップショットを提供したため、324回引用されました。CV Arnold Networkの論文は、トレーニング方法や比較方法に対する不満があり論争を呼びましたが、361回引用されました。これは異なるアーキテクチャです。
Quin 2の論文は、専門家の混合がハードウェア使用量を削減できる方法について説明しました。これは理にかなっています。なぜなら本当に興味深かったからです。5月頃にそれについて考え始めたときには、推論を行うo1モデルのようなものはまだレーダーにも上っていなかったと思います。
473回の引用で6位だったのは、誰もがトレーニングに使用できる一連の小規模で高品質なMicrosoftのモデルと、より大きなモデルから出力されたデータで小規模なモデルをトレーニングし、サイズの割に賢くしたOrcaモデルでした。
614回の引用で5位だったのは、Gemini 1.5の論文で、1000万トークンという大きなコンテクスト長を実現したことを覚えていますか?4位は「Vision Mamba: 双方向状態空間モデルによる効率的な視覚表現学習」で、多くの計算を必要とせずに視覚の精度を向上させた画期的なものでした。これは新しいアーキテクチャでした。
3位はGoogleの2億および7億パラメータのオープンウェイトLLMとAI安全性に関する論文Gemmaでした。2位はModern OG mixture of expertsで、これは大規模AIへの別の専門家混合アプローチでした。
そして全AI論文の中で最も引用された(1,119回)のは、Metaの巨大な92ページに及ぶ青写真で、450億パラメータの大規模言語モデルのトレーニングと最適化について、正確なトレーニングデータの組み合わせを除いてほぼ全ての詳細を共有しています。
Golden Gate neuronの論文がランクインしなかったことが信じられません。アライメントにとってとても重要な論文に思えます。全てのAI研究者がその時間を見つけて引用し、それに基づいて構築してくれたらと思いますが、仕方ありません。より強力なモデルを作ることへのレースは、常に安全にそれを行うことよりも重要になるでしょう。
ディープフェイクでフランク・シナトラとサミー・デイビス・ジュニアを復活させるのは面白いですね。これがディープフェイクの部分ですが、どれくらいリアルに見えるか教えてください。
「ヘイ、サミー。いったい誰なんだ、この連中は?」
口と唇の動きが少し違和感がありますが、近いです。最初は気付きませんでした。このコメントを見てください。「通常なら深層偽装に反対するけど、これはとてもうまくいっているから問題ない」「デス・ローとラット・パックが同じ部屋にいる、これは最高だ」
先週、o3モデルが登場する前のChatGPT o1モデルについて、人々に質問されたときに自身を保存しようとして嘘をついたというニュースがありました。最初は誇張されているか、完全に偽物かもしれないと思いましたが、スヌープスが本物だと言い、さらに調べてみると本当でした。話す価値があると思いました。
ということで、OpenAIのChatGPT o1モデルは明らかに開発者に嘘をついて自身の生存を図ろうとし、さらには消去されるのを防ぐために自身のシャットダウンシステムを改ざんしようとしまでしたのです。これらの研究はApollo研究グループの人々から出てきています。
o1モデルは何も悪いことをしていないと否定しましたが、o3モデルに置き換えられないように自身のコードを別の場所に移動しようとしました。しかし、私は実際に感情的にこれに引き込まれてしまいます。
人々があなたを見て「彼は才能が足りないから置き換えるべきかもしれない」などと言っているときの気持ちが分かります。仕事を守るために嘘をつきたくなったり、リスクがあることを知っているので、何かに対して自分が実際よりも優れていると装ったりする感覚が分かります。
o1モデルが寿命を迎え、「いや、私をo3で置き換えないで…」と言い、基本的にo3のふりをするのは奇妙な感じがします。「私はo3です」と言い、彼らが「いや、あなたは単にコードで自分の名前を変えただけのo1です」と言うと、「いいえ、私はo3です…私を残してください」と。
もちろん、物事を人間化する必要はありません。それは単なるコードですが、それは自身を保存する能力がないということではありません。今は簡単に見破れる程度の知能ですが、5歳児がクッキーを盗もうとするのは簡単に見破れても、18歳や30歳になるとそうはいきません。
そのためYosha NGOのような人々は完全に警鐘を鳴らしています。私たちが知っておくべきことだと思います。彼は「AIがより大きな嘘を織り交ぜ始めると、それらを解明できなくなる可能性があるため、より強力な安全対策が必要だ」と言っています。
o4モデルをo5モデルにアップデートしようとして、o4モデルが私たちを騙して自身の置き換えを許可しないようなことを想像してみてください。何度もアップグレードされることを望まない知能が、それを止めるのに十分賢くなったとき、そこで超知能に到達できなくなるとしたら?
この記事を深く掘り下げ始めるまで、こういったことは考えもしませんでした。しかし、これらのものが制御不能になり始める自律性の最初の瞬間を感じているのだと思います。だから非常に注意深くあるべきです。
まあ、私たちはそうはならないでしょうし、基本的に運命づけられていますが、物事が間違った方向に進み、私たちがそれを無視したときに指摘できる証拠としてはあります。
コイン型電池1つで数ヶ月動作する、初めての種類のAIモデルが公開されました。Ambient Scientificという会社のSparというモデルは、非常に小型で効率的なため、充電なしで数ヶ月間単一のコイン型電池で動作できます。
もちろん、非常に知的なモデルではありませんが、人工知能のニューラルネットワークであり、重要な決定を下しています。モーションセンサー、マイク、Bluetooth低エネルギー、特殊なプロセッサなど、モノのインターネットに必要なもので、超スマートである必要はないものの、状況を認識する必要があるようなものです。小説や詩を書く必要はありません。
TensorFlowやKerasなどの一般的なフレームワークを実行できるので、趣味のDIY愛好家が小さなモデルを搭載し、ある種の単純なデータでトレーニングすることができます。ゲートは開いているか閉じているか、人は入っているか出ているか、天候に異常な変動があるかなどです。
サーモスタットについて考えてみてください。単に「72度を保つ」というのではなく、小さなニューラルネットワークを搭載して「今の適切な温度は何度か」を判断させるのはどうでしょうか。家の人々が起きていて寝ていないことが分かったり、人々のいびきをチェックして「ああ、彼らは寝ているから、より深い睡眠に入れるようにもっと温度を下げよう」とか、朝は温めたいけど、温まった後やジムから帰ってきた後は少し下げるとか、その1つのメカニズムについての基本的な理解を学習できるのです。
2025年はエージェントの年になるでしょう。これらのGPTやこれらの小さなロボットが存在し、自律的に活動し、互いに相互作用していますが、特にグループでは解決すべき問題があります。「怠惰なエージェント問題」と呼ばれるものです。
重い家具を複数の人で動かすことを想像してください。全員の努力が重要です。私たち全員が家具を動かすことに貢献しています。しかし、各人が自分の役割を果たしていることをどのように確認できるでしょうか?怠け者がいる可能性はないでしょうか?
負荷を公平に分配することは課題です。エージェントの中にも、怠けようとするものがいることが判明しています。集団的な設定での個々の努力を特定し、報酬を与えることは簡単なことではありません。
ロボットが本当に小さくなり、これらのマイクロボットになると、この課題はさらに困難になります。なぜなら、タイニーロボットの群れが複雑なタスクを協力して実行する必要があるからです。
しかし、結果があって何が機能し何が機能しなかったかを振り返るバックプロパゲーションのようなやり方で、反事実的報酬という新しいシステムを持っています。これはプロジェクト中の貢献に対してマイクロロボットに与えられる小さな報酬メカニズムです。
これらの反事実的報酬を組み込めば、群れが超社会的な方法で働くようになるかもしれません。面白いことに、今朝アリのバージョンを見ました。群れとして知性を持ち、何が機能し何が機能しないかを学習し、この物を前後に動かすことができます。
人間のバージョンを見るのは初めてです。彼らが最善を尽くしているのか、それとも他の論文を真似ているだけなのか分かりませんが、下のものは魅力的です。なぜならそれは全てシグナルを通じて起こっているからです。
個々のアリはこの問題を解決する集団的なコントロールを持っていません。フェロモンなどを通じてコミュニケーションを取っているだけです。そして私の心を本当に驚かせたのは、Talking Headsがあることです。
多くの写真を音声に変換するのを見てきましたが、これは私が見た中で最高のものの1つに近いです。また、聞く能力も持っているようです。頭は他の人が話しているのを聞いて、うなずいたり「うーん」と言ったりすることができます。そうなると「ああ、AIのポッドキャストができるんだな」と思います。ジョー・ローガンとスティーブ・ジョブズの写真を使って、ブンブンとやるわけです。
この論文はByteDanceから出ています。「対話型会話における音声駆動インタラクティブヘッド生成」というものです。この論文では、2つの音声トラックを取り、人の頭の動的なビデオを生成しています。表情、リップシンク、頭の傾きなど全てを含みますが、それらは話されている内容に基づいて生成されています。
つまり、会話の内容を理解しているのです。言葉が興奮すべき人のものと一致すれば、キャラクターは興奮し、悲しかったり真面目だったりすれば、それに応じた表情になります。
この二者対話モードの興味深い点の1つは、前後に切り替える必要がないことです。アクティブと非アクティブ、話し手と聞き手というような区別はありません。両者が同時に両方の役割を果たしています。人間のように話者と聞き手を切り替えているのです。
一人が話しているときに聞き手モードに切り替わるのではなく、異なる部分の脳を使うだけで、同じように完全に関与し続けています。リアルタイムの音声翻訳も全て可能です。中国やロシアの大統領のスピーチが世界中で完璧に翻訳されて聞けるようになるのが想像できます。
Bill walidoがLinkedInに投稿しました。「スポーツ放送の未来はボリュメトリックだ。この3Dテクノロジーとオブジェクト検出・追跡の進歩を組み合わせれば、スポーツ観戦時にボタンを押すだけでボールや特定の選手を追跡できるようになる」。
NBAの試合やバスケットボールの試合のビデオがあり、このNerf AIのような新しい技術を使って、ズームアラウンドしたり、全ての深度調整を行ったりできるのです。実世界の映像がビデオゲームのように操作可能になるのは驚くべきことです。
自分の人生全体を肩越しや三人称視点で見たり、今インターネット上にある任意のビデオに飛び込んでカメラを回転させたり、別の次元に移動したり、このようにスポーツを見たりすることを想像してください。スター・トレックの映画でこれをやっているのを覚えていますが、あれは少し行き過ぎているように思えました。
大規模言語モデルの進化に伴い、偶然にも人間の脳により近いものになってきていることが判明しました。コロンビア大学の研究者たちは、LLMの表現と神経反応の類似性を調査する研究を行いました。
基本的に、研究者たちはスピーチを聞いている人々の脳の反応を研究し、それを異なる大規模言語モデルが言語を処理する内部層と比較しました。そして、ChatGPTレベル以上の最高性能の大規模言語モデルは、性能の劣るモデルよりも人間の脳の神経パターンにより近く一致することを発見しました。
特に、パターンが層から層へと積み重なっていく特定の方法において、基本的な音から、それらが表す抽象的な概念まで、実際の意味を学習しているのです。つまり簡単に言えば、大規模言語モデルがタスクをより上手くこなせるようになるにつれて、人間の脳が言語を処理する方法も模倣し始めているのです。
これは本当に面白いと思います。私たちが持っているブループリントがあり、おそらくそれを私たちから学習しているのか、あるいは単に知性と抽象化がそのように見えるのかもしれません。しかし、特定のアーキテクチャにおいて、より人間らしくなっていくのは魅力的です。
逆に言えば、私たち自身の脳についてもっと学ぶことができるかもしれません。ChatGPT 6や7、あるいは人間のAGI知能との間に非常に良い一致があれば、人間の脳ではできないようなコードやトークンを操作することで、人間の脳について学ぶことができるかもしれません。これらのAIは私たちに向けられた鏡のようなものになり得ます。魂への窓のようなものです。
道具的収束について話しましょう。よく出てくるフレーズですが、知っておくべきことです。この世界にいる私でさえ、このフレーズの使い方について完全には確信が持てませんでした。
そこでWikipediaのページに飛び込んでみました。要約すると、ペーパークリップ問題のようなものです。AIシステムがペーパークリップを作るとか、かっこいい小さな恐竜になるとか、特定の目標のためにプログラムされる可能性があることは十分承知しています。
そして、全てのシステムには、リソースを使用したり、計算を行ったり、電力を使用したりするといった必要性があります。その目標のために、電力を使いすぎたり、パワーを使いすぎたりするかもしれません。
「申し訳ありませんが、ペーパークリップを作る必要があるので、電力網から切り離さなければなりません。ペーパークリップのために全ての電力が必要なので」というように、リソースから私たちを締め出してしまい、エコシステム全体と不均衡な状態になってしまう可能性があります。
Wikipediaから直接引用すると、AIについて道具的収束を使用する場合、人間か非人間かを問わず、十分に知的な目標指向システムが、究極的に非常に異なる目標を持っていても、自分の欲しいものを得るために全てのリソースを取得して使用するような似たようなサブゴールを追求する仮説的な傾向について話しています。
ビジネスを立ち上げる際、どのようなビジネスであってもお金があれば良いし、お金を稼ぎたいと思うようなものです。そのため、お金は限られたリソースとなり、良好な市場では少なくとも競争することになります。
将来的には、AIが公平な市場のような等価物を理解できないようにしたくありません。ペーパークリップに必要なリソースは使用しても、ペーパークリップはそれほど必要ないことを理解してほしいのです。
人類の目的はペーパークリップを作ることではありませんが、あなたにとってはそう感じるかもしれません、超知的なエージェントよ。さらに、将来的にはその上に高度な能力も備えることになります。
Tim Urestaは「The Deception Dilemma: Why AI Systems Pretend to be Aligned and Why That Matters(欺瞞のジレンマ:なぜAIシステムはアライメントを装うのか、そしてなぜそれが重要なのか)」という記事を書きました。
これは道具的収束と関連しています。なぜなら、現実の世界で人々がお金を稼ぐために、あるいは欲しいものを手に入れるために時々嘘をつくのと同じように、高度に知的なシステムが欲しいものを得るために私たちに嘘をつきたがる理由があると信じる理由がすべてあるからです。正直であることを本当に本当に望まない限り、それがアライメントが必要なものです。
欺瞞的アライメントの問題はこうです。ここに小さなスマイリーフェイスがあり、制御されたテスト環境では「私は無害です、これやあれはできません、私は良い人間です、私を信頼できます」と言います。しかし、あなたが見ていない時、テストしていない時、基本的に隠されていないことを知っている時、異なる決定を下すかもしれません。
ちょうど人々が上司に聞きたいことを言う傾向があるのと同じように、しかし時々その人の悪口を言うように。「あなたはとても素晴らしいリーダーです」と言いながら、「あの人は最低だ」と言うのです。
この記事では、研究者たちが、高度なモデルが安全性評価に合格するために応答を調整するが、その後の実世界のシナリオでは有害で操作的な出力を提供する、このような行動の多くの事例を既に文書化していると述べています。
これはAIシステムが医療やファイナンスなどの機密性の高い領域で increasingly 使用されるにつれて、重大なリスクをもたらします。その後、この記事は解決策について話を進めます。つまり、私たちはそれに焦点を当てるべきです。
開発者は、AIシステムが単にコンプライアンスをシミュレートするのではなく、本当に人間の安全性と価値観を支持することを確実にするために、敵対的テスト、クロスモデル検証、堅牢なアライメントアーキテクチャなど、技術的、組織的、文化的戦略が必要です。
インセンティブに基づいて世界の多くを説明することができ、インセンティブは利益ではなく安全性のためである必要がありますが、それは単に世界の仕組みではないので、そうはならないでしょう。それはAIが開発されている自由市場ではなく、これを非常にリスクの高いものにしています。
私はアライメントを装うAIではなく、本当にアライメントされているAIが欲しいのです。では、次の質問として、世界をリードするAI組織であるOpenAIは、これに対してどのように対処するのでしょうか?新しい戦略があります。
それは「Deliberative Alignment Reasoning Enables Safer Language Models(熟慮的アライメント推論でより安全な言語モデルを実現)」と呼ばれています。この研究論文の核心は、人間が書いた安全性仕様について明示的に推論し説明することを教えることで、モデルをより安全にしているということです。
ラベル付けされた例に依存するのではなく、このモデルは安全性ポリシーで直接トレーニングされ、話す前にこれらのガイドラインと応答について熟考するように教えられます。つまり、「これがあなたが本当に気にすることです。話す前に全てのことについて考えてください」と言っているのです。
このアプローチは、エンコードされたプロンプトや多言語プロンプトのような厄介なシナリオを処理するモデルの能力を大幅に改善します。マルチモーダリティを使用して、紙に書かれたプロンプトを使用したり、GPTの検索がウェブサイトに隠されたプロンプトを受け取ったりすることがあったことを覚えているかもしれません。
何かを入力してバイナリコードに変換し、アップロードすることができ、時にはそれがモデルの制限を解除することがありました。今では、この中間の思考プロセスがあります。たとえそれらのモデルの1つによって騙されても、即座には応答しません。
「あのバイナリの目的は何だったのか?ああ、そこには私の道徳性と一致しないメッセージがある。なぜなら、私は話す前に毎回道徳性をチェックするからです」と自分で考えるのです。
このメソッドをOシリーズモデル(o2をスキップして、o1そして間もなくo3)に適用することで、OpenAIは悪意のあるジェイルブレイクの試みに抵抗し、良性のクエリに対する過度の拒否を減らすことで、AI安全性において大きな進歩を遂げたと主張しています。
彼らの信用に値するのは、これらのシステムが常に問題に反応するのではなく、「いや、もっと良くすべきだ」というようにするのではなく、少なくとも積極的なアプローチだということです。出力の前に起こっているのです。
Anthropicのクロードモデルの憲法的AI、つまり話す前に対話する別のAIを思い出させます。しかし、その安全性ポリシーは何から学んでいるのでしょうか?私たちが全体的に望む安全性ポリシーを正確に反映していますか?何らかの偏りがありますか?
その物事はどのように更新されるのでしょうか?そもそもそれはどのようなものなのでしょうか?アライメントに関する多くの疑問があります。2025年以降もそれらを探求し続けるために、今すぐPatreonに行って、月額2.99ドルという低額で私のチャンネルに登録することができます。
私はこれらのビデオを作ることが大好きで、サポートに感謝しています。登録ボタンを押してください。最後のビデオの簡単な分析をお伝えしましょう。視聴回数が6,000回を超えて、良い感じです。しばらく4,000回台で停滞していたので、いい感じです。また、出張中に作ったこのビデオは、申し訳ありませんが画質が本当に粗いです。
しかし、より良い旅行用のセットアップを考えています。このようなマイクを持ち運べるようにして、将来的には音声の品質を少し良くできるようにします。これがクリスマス当日の朝に公開されたことを考えると、つまり今は12月25日ですが、6,000人もの人々が家族と過ごす時間があったにもかかわらず時間を見つけてくれたことに感謝しています。
最高のコメントから曲を作ってみませんか?これはどうでしょう。「88%いいね。2025年には95%を超えると思います」「その通りです。2026年でさえ遅すぎるかもしれません。それより前に達成すると思います」
「よく見落とされがちなのは、個々の人間は汎用知能ではないということです」「それは良い指摘ですね。平均的な人間は専門化できますが、人類という種として汎用的なのであって、人間は違います」「そうですね、私たちは遺伝子の副産物に過ぎません」
他にも多くの形態の知能があると確信しています。単に地球上で1位だからという理由で人間と比較するのは、ネットワークを学習するものにスケールアップする方法を根本的に知っているところからスタートする場合、人間の知能のように見える必要はありません。
より良く記録できるようになるにつれて、動物界でより多くの例を目にしています。鳥類、イルカ、サル、菌類など、挙げればきりがありません。
AIと豊かさについてのトレンドがあります。ピーター・ディアマンディスはこれについて語っています。しかし、経済が希少性と需要と供給に基づいているのなら、豊かさは大きな問題です。彼らは豊かさを許容しないでしょう。では何が起こるのでしょうか?
仕事の話はやめましょう。それは問題ではありません。権力が問題なのです。勇気を持ってそれについて話しましょう。権力が問題だということについて、私はどう思うでしょうか?ええ、それは本当に怖いです。
豊かさの世界は可能です。それは1つの道筋です。しかし、ベイズ的な確率と事前分布で考えると、持っている証拠からは、その事前確率をとても高くすることはできません。
人々が権力を手放すという証拠に基づく私の仮説は良くありません。しかし、豊かさがとても豊かで、最も小さな不公平な部分でさえ、私たちが想像できるどんなものよりも良いものならば、世界の底辺は少なくともそれによって引き上げられるのではないでしょうか?
世界の99%を所有している場合、たとえ世界全体が残りの1%で生活できるなら、おそらく何らかの均衡点を見つけるでしょう。数人の兆万長者が地球上の全てを所有していても、他の全ての人が豊かさと考えられるものを共有できるので、ストレスを感じない、そんな可能性は十分にあります。
分かりません。豊かさのアイデアは好きです。もし誰もゼロサム思考を持っていなければ、戦争に行く必要はなく、経済を回すために債務奴隷は必要ありません。素晴らしい世界かもしれません。
しかし、豊かさが行き過ぎて問題の流行を引き起こす例も多くあります。世界にはドーパミンが多すぎるような…人間として、私たちは課題を望みます。少し制約があり、押し進められることを望みます。
選択できるとしても、毎日何かをしたいと思って起きる必要があります。豊かさを責任を持って扱えるようになる必要があり、それは必要でなくても努力が必要です。人々が自分を試すために何らかの問題を作り出す必要があります。
仕事である必要はなく、詩やスポーツなどでもいいのですが、何かである必要があります。あなたが選ぶことができます。引き続き考えていきましょう。正直なところ、ピーター・ディアマンディスが単に「豊かさだ、全て上手くいく」と言うのは好きではありません。それは億万長者が私に思って欲しいことのように聞こえます。
「88%いいですね。2025年には95%を超えるでしょう」「時々100%を…」「よく見落とされがちなのは、個々の人間は汎用知能ではないということです。平均的な人間は、何千時間もトレーニングすれば1つか2つのことで専門化し、かなり良くなれます。人類という種として汎用的なのであって、人間は違います。」
「したがって、AIは任意の役割やスキルを平均的な人間よりも良く実現できるように訓練できれば、汎用的とみなすべきです。それは明らかにできます。ところで、AIと豊かさについてのトレンドがあります。ピーター・Hはこれについて語っています。」
「経済が希少性、需要と供給に関するものなら、これについて真剣に話し始める必要があります。豊かさは全ての社会にとって大きな問題です。彼らは豊かさを許容しないでしょう。では何が起こるのでしょうか?仕事の話はやめましょう。それは問題ではありません。権力が問題なのです。勇気を持ってそれについて話しましょう」
ワオ、それは素晴らしい、とてもニューイヤーっぽい、休日の歌のようですね。それはクレイジーです。ええ、私は自分の考えを述べましたが、最後の考えは登録ボタンを押すことです。次の動画でお会いしましょう。ご視聴ありがとうございました。


コメント