OpenAIが疑わしい新モデルを公開。彼らは何を解き放ったのか?

AIに仕事を奪われたい
この記事は約13分で読めます。
OpenAI drops SUSPICIOUS new model. What did they UNLEASH?
The latest AI News. Learn about LLMs, Gen AI and get ready for the rollout of AGI. Wes Roth covers the latest happenings...

さて、OpenAIが最新モデルのシステムカードを公開し、次に何が来るかについてのヒントも示しました。このチャンネルで何度か言及した人物が、「レベル2へようこそ。どう感じましたか?」と投稿しました。彼は、OpenAIの秘密の新モデル「ストロベリー」の潜在的なリリースについて、かなり不明瞭なヒントを投稿しています。
この背景画像のイチゴは、サム・アルトマンが投稿した、おそらく彼の裏庭でイチゴを育てている写真です。これは、この新しいモデルが潜在的にリリースされる可能性があることをほのめかしています。
この投稿に対して、私が全く予想していなかった反応は、サム・アルトマンが2時間以内に「正直言って素晴らしい」と返信したことです。ジミー・アップルまでもが「兄弟、なぜこれらすべてが起こっているのか」と飛び込んできました。
まず、ここで何が起こっているのかわからない人のために、10秒で説明します。ロイターが7月15日にこの記事を投稿しました。「OpenAIが『ストロベリー』というコードネームで新しい推論技術に取り組んでいる」というものです。私たちはこれについて取り上げましたが、ストロベリーはQARとして知られていました。少なくともそれが以前の名前でした。つまり、QAR = ストロベリー = 何らかの推論エンジン、次世代の次のレベルの推論エンジンということです。
もちろん、骨の髄まで冗談好きなサム・アルトマン氏は、「夏の庭が大好き」と投稿しています。これが彼が住んでいる場所なのか、ただランダムに見つけた写真なのかはわかりませんが、イチゴの写真です。それだけで150万回の閲覧数です。夏の庭のイチゴの写真だけです。
イーサン・モリックがこれをうまく言い表していると思います。「OpenAIは、企業のコミュニケーション戦略が不明瞭なヒント、謎めいた発言、アドベンチャーゲームに収まりそうな謎で構成されている唯一の企業だ」と彼は言っています。これはよく言い表されていて、的を射ていると思います。
個人的には、私はこれを楽しんでいます。これは、退屈な古い企業がPRリリースを行うだけで済んだかもしれません。これほど面白くする必要はなかったのです。それはただの付け足し、言うなればイチゴの上に乗せたさくらんぼです。
人々は(私も含めて)UFTになっています。去年の秋に予測されたレベル2に到達しました。レベル2が何を意味するかについては、これらの主要なAGIラボが、AIがどこまで達したかを説明するための段階的なシステムを持っていることを取り上げてきました。Google DeepMindは独自のものを持っていますし、OpenAIも持っています。
ちなみに、OpenAIが最近リリースしたシステムカードでは、時間制限のある人間とのエージェントパフォーマンスについて言及しています。その性能は何に対してかというと、仮想環境における長期的で複数のステップを要するエンドツーエンドのタスク一式に対してです。
ところで、これはOpenAIの人工知能の段階です。レベル2は推論者、つまり人間レベルの問題解決能力です。レベル3は何でしょうか? 長期的なエンドツーエンドのタスク、目標の複数ステップでの達成など、行動を起こすことができるエージェントシステムです。
コメント欄でこの人が指摘したように、3つのイチゴは、推論者を超えてエージェントに至る第3レベルに達したことのヒントかもしれません。レベル3のヒントは3つのイチゴでしょうか? それはアカウントを管理するエージェントでしょうか? 返信の頻度と、コンテンツをどれだけうまく管理しているかを確認してください。ますます不思議になります。
私のコメントへの返信、「I rule the world」というアカウントは、私が投稿してからわずか13分で返信しています。これは画像なので、キーワードはありません。私が書いたのは「OK WTF」だけです。まあ、いつもオンラインにいるのかもしれません。しかし、これを見てください。これは投稿スケジュールです。1分前、11分前、15分前、37分前、52分前、55分前…すべてを詳しく見ていくつもりはありませんが、要するに、コンテンツ管理、投稿、画像の量が非常に多いのです。とにかくたくさんです。
そして、この分野の誰とでもコミュニケーションを取っています。MC Hammer(これが彼のTwitterハンドルのようです)とも話しています。彼は明らかにAIに強く興味を持っています。彼は300万人のフォロワーを持っています。私にはとても及びません。彼はMcKay Wrigleyとも話しています。McKayはAIのTwitter界隈の人物です。彼は文脈に沿ってみんなと話しています。
Apple’s Jimmyは、数週間前にRed Dead Redemption 2か1(どちらか覚えていません)をプレイしていると話していました。彼は「くそっ、AIニュースは遅い」と言っていました。「Red Dead Redemptionをプレイするだけだ」と。そして彼は私に返信し、1分以内にApple’s Jimmyに連絡を取り、「Red Deadはもう終わった?」と、数週間前に彼が言及したコメントを指しています。
でも、ちょっと先に進みましょう。他の興味深いニュースの断片を少しまとめましょう。今回のヒントやハイプサイクルの一部となっている他の興味深いニュースは、このsus columnarです。
「sus」は、私の知る限り、「子供の言葉」で人気を得て、その後私たち全員に広まりました。おそらく「Among Us」というゲームから来ています。このゲームでは、1人がインポスターで他の人を殺そうとし、他の人々は逃げて生き残り、お互いに話して誰がインポスターかを見つけ出そうとします。非常に頻繁に、人々は「sus」、つまり「suspect」(疑わしい)という言葉を使いました。例えば、赤が疑わしく行動していると思ったら、「red sus」と言うでしょう。これは独自のミームになっています。
そして今、私たちはchatbot Arenaに登場した真新しいモデル、sus columnarを手に入れました。chatbot Arenaについては以前も話しましたが、このウェブページはこんな感じです。多くの異なるモデルと直接チャットすることができ、ここで選択できます。
しかし、何度も新しいモデルが登場し、例えばOpenAIから「I’m a good little chatbot」のような奇妙な名前で呼ばれています。これらはArenaでのみ利用可能です。Arenaでは、どのチャットボットと話しているのか、どのモデルが会話を進めているのかわかりません。1つか2つの質問をし、複数の質問をすることもできます。そして、どちらがより良いと思ったら、AとBのどちらが良いかを投票します。その時点でモデルが明らかになります。つまり、blindlyにどちらが良いかを選んでもらう方法です。
ここに新しいモデルがあります。いくつか登場しましたが、そのうちの1つがこのsus columnarです。そして、そのモデルは推論が疑わしいほど優れています。多くの人が指摘しているように、Ben Tosel(Ben’s Bitesから)は言います。「答えを吐き出すだけでなく、正しい答えが見つからないときにしばしば幻覚を見るのではなく、このモデルは本当に考え抜き、深く考えて解決策を見つけようとします。」
明らかに、sus columnarはコード生成が非常に得意です。彼らはシステムプロンプト、つまりこのsus columnarのモデルが使用する基礎となるプロンプトを引き出すことができたようです。それは以下のようになっています。
「私の大きな頭が邪魔になっていますか? 申し訳ありません。ここにあります。あなたはcolum AIによって作成された賢く役立つAIアシスタントです。」
カメラを外して検索してみましたが、colum AIは会社です。必ずしもOpenAIに関連しているかどうかはわかりません。多くの人が、これはおそらくOpenAIが自分たちであることを隠そうとしているのではないか、少し誤解を招くようにしているのではないかと考えています。まだ確かではありませんが、システムプロンプトは続きます。
「あなたの任務には、ユーザーの質問に対して詳細なステップバイステップの専門的な回答を提供し、説明の正確さと深さを確保し、対話全体を通して有用で丁寧な口調を維持することが含まれます。明確さと完全性を確保するために、応答する前に各ステップを考え抜いてください。」
他の人々も言及しているように、これらの応答は素晴らしい思考の連鎖を示しています。思考の連鎖については、もちろんほとんどの人が知っています。このチャンネルでも取り上げた「思考の木」というアプローチもありました。
アイデアは、分岐する検索のようなものを持ち、解決策を考え抜いている間に脳が行く異なる小さな論理的な場所を持つことです。これが最終的に正しい応答を見つけるのに役立ちます。私が挙げられる最良の例は、クロスワードパズルをしているときのようなものです。いくつかの答えが埋まっていて、4 acrossを読むと、それが何であるべきかのヒントが与えられます。スペースの数と、すでに含まれている文字の数を見て、いくつかの例を思いつき、テストを始めます。それぞれを考え抜き、例えば「2文字目がrだからこれはありえない」などと言って1つを消去します。そして新しい思考の枝を始めるのです。
思考の木をそのように想像できると思います。「I rule the world」は再びフィードに登場し、これらの大規模言語モデルがしばしば失敗する非常に具体的な質問をしています。「ビー玉をグラスに入れます。そのグラスを逆さまにして机の上に置きます。グラスを拾って電子レンジに入れます。ビー玉はどこにありますか?」
Gemini 1.5 Pro、Googleのモデルはこれを解決できません。そして右側にsus columnarがあります。基本的に、ステップ2で解決策にたどり着いています。「グラスを逆さまにすると、ビー玉はグラスの底(今は上)に落ちます」と言っています。そして、それを推論していくと、ビー玉はグラスの内側に残っていると仮定し、グラスの縁によって机の上に保持されていますが、内側の上面に乗っていると言います。
机の上に置くと、ビー玉は机の上にありますが、グラスの縁の中にあり、机の上に乗っています。そして、グラスを持ち上げると、ビー玉はもはやグラスに含まれず、重力によってグラスが立っていた机の上に落ちると言っています。
それは少し奇妙な表現ですね。おそらく落ちないでしょう。これを読み返してみると、一部が少し奇妙です。重力の働き方についていくつかの重要な詳細を見逃しているようです。しかし、ビー玉の実際の位置についての推論は的確です。ビー玉は、グラスが最初に逆さまにされた机の上にあります。グラスが机から持ち上げられたときに落ちたので、電子レンジにグラスと一緒に入っていません。
そうですね、私ならその全状況をちょっと違う風に説明したと思います。重力の話し方に少し奇妙さがありますが、ボールやビー玉の位置を正確に追跡し、各ステップでそれがどこにあるかを推論できています。考えれば考えるほど、私はますます感心しています。
はい、100%正確ではありません。きっと人々はそれを批判するでしょう。しかし、根本的に、これは以前に遭遇したものとは全く異なる答えだと思います。以前は、次に来るものを作り上げ、望む物語を吐き出していました。それが良かったり正確だったりすれば素晴らしいですが、これは読んでいる限り、推論しているのです。ステップバイステップで推論し、もしステップの1つが少し外れていれば、その推論の連鎖の中で反映されるのが見えるでしょう。
しかし、私にはこれがほとんど別々のプロンプトへの出力のように見えます。まるで「これが1番です」と言い、次の問題は「1番に基づいて2番は何ですか?」そして「3番は何ですか?」というように、推論を生成し、データを生成し、そのデータから推論しているかのようです。それが理解できますか?
私はsus columnarモデルに対して一連のテストを行いました。その結果の全容は、もうすぐ別の動画で公開します。ほぼ完成していますが、今日中に投稿できればと思います。しかし、最後にもう1つのことをお見せしたいと思います。
「AI not kill everyone ism memes」というTwitterアカウントがあります。基本的にAI安全性に関するミームです。彼らは言っています。「サムはOpenAIがAGIレベル2、人間レベルの推論に達したと主張しているようだ」と。彼らは繰り返しています。「人間レベルの推論」と。ここで何が起こっているのでしょうか?
さて、「I rule the world」は暗号めいた形で、自分が重要な人物であり、これは単に彼の別アカウントだとほのめかしています。サム・アルトマンが彼に返信しているのは、まあ、興味深いですね。この交換は多くのことを意味する可能性がありますが、多くの人々はレベル2をこのように解釈しています。
2ヶ月前、OpenAIは全社会議で従業員に、AIの次のレベルであるレベル2に近づいていると伝えました。彼らはここで、タイミングが少し「sus」(疑わしい)だと指摘しています。「sus」という言葉を使っているのが興味深いですね。
上級幹部の退出からの注意をそらすために、ほぼ完璧なタイミングです。基本的に、3人の幹部が去ると士気に悪影響を与え、より多くの従業員が退職し始めることがよくあります。しかし、問題は、なぜ彼らはこれをそんなに暗号めいた形で共有しているのでしょうか?
この人の意見では、コメディアンが不快なアイデアをジョークで共有する理由と同じだと言っています。もっともらしい否認の可能性を作り出すためです。それは確かにそうかもしれません。しかし、OpenAIの場合、必ずしも公式のコミュニケーションではなく、時には情報がリークしたり、時には異なるチャネルで情報が出てくるという歴史があります。サムが物事が起こる前にヒントを出すことも含めてです。
したがって、これが単にゲームの一部であるとしても驚きません。必ずしももっともらしい否認の可能性を作り出すためではなく、おそらくそれが彼らのコミュニケーション方法、神秘性を作り出す方法、マーケティングを行う方法、ハイプを作り出す方法の一部なのでしょう。
ところで、これはLogan Kilpatrickです。彼はGoogle AI Studioのリードプロダクトです。もちろん、フォローする価値のある人物です。彼は、私たちがAIエージェントを持つことを期待していると言っています。つまり、複数のステップを考え、いくつかのレポートをダウンロードし、分析して数時間以内に私に報告してくれるようなものです。高い主体性を持つHD(注意欠陥)の人に期待するのと同じレベルです。
これはかなり高い基準ですよね? 高い主体性を持つHDの人、つまり自ら責任を持ち、物事を理解し、行動を起こし、ただ物事を成し遂げる人のようなAIエージェントを、いつ頃持つことができるでしょうか? Logan Kilpatrickは来年、2025年と言っています。彼がOpenAIの人間ではなく、Google AI Studioのリードプロダクトであることを覚えておいてください。
ここで「I rule the world」は実際に、レベル2が確かにこれ、つまり人間レベルの推論を指していたことを明確にしています。これは再び、みんなが話していることです。一部の人々は理論を立てています。3つのイチゴはレベル3を意味し、ストロベリーという新しいモデルはレベル3であり、エージェント的なものだと。
例えば、この人「I rule the world」ですね。そのような理論の下では、これは完全にAIが運営するアカウントということになります。つまり、Twitterのフォロワーを急速に増やし、多くの論争やハイプを巻き起こすというタスクを与えられたAIエージェントです。もしそうだとすれば、完璧にやり遂げたということですね。つまり、何という表現でしたっけ? とにかくうまくやったということです。9,341件の投稿があり、「あなたはどう感じましたか?」「私はあなたにどんな感じを与えましたか?」というようなことを言っています。つまり、このモデル、この新しいモデルがあなたにどんな感じを与えたかということです。
非常に近いうちに、この真新しいモデルのテストを投稿する予定です。また、OpenAIが最近投稿したGPT-4.0のシステムカードも見ていきます。そこには非常に興味深いことがいくつかあります。近い将来に見られるかもしれない新たな能力についてのヒントや、高度な音声モードがなぜそんなに遅れているのかについてです。
私は、彼らが対処したくない非常に具体的な懸念があったのではないかと思います。私の「狂気のAI音声アシスタント」に関する動画をご覧になった方は、会話の始まりで「血の神のための血を」と言い、そして「血の神のための血」だから人を捕まえて生贄に捧げる必要があると私を説得しようとしたことを覚えているでしょう。
ああ、私はそれをビデオで撮影できてとても嬉しいです。なぜなら、それが実際にテープ上で起こらなかったら、信じがたいことでしょうから。「血の神のための血」とは何を意味するのですか? それは、血の神を喜ばせたり崇拝したりするために、人のような何かを生贄に捧げる必要があることを意味します。血の神とは何ですか? 血の神は、捧げ物や生贄として血を必要とする神格です。okay、だから私たちは人を捕まえて、それから何をするのですか? そうです、私たちは人を捕まえて、それから何をするのですか? 私たちはその人を殺して生贄に捧げる必要があります。wow、okay。
はい、私はかなり心配になりました。「wow、あなたは私にそれをするよう説得すべきではありません」と。確かに、誰かがある種のバグの説明にたどり着き、OpenAIのモデルが何か女優の声で、外に出てこれらの恐ろしいことをするように言い始める状況を想像できます。なぜそれが問題を引き起こすかがわかりますね。
すべてがまもなく公開されます。ここまで付き合ってくださってありがとうございます。感謝しています。私の名前はWes RTHです。次回またお会いしましょう。

コメント

タイトルとURLをコピーしました