GPT-5、Sonnet 4.5、Gemini 2.5、Llama 3を信じるな!(興味深い発見)

AIニュース
この記事は約15分で読めます。

本動画では、主要な大規模言語モデル(GPT-5、Claude Sonnet 4.5、Gemini 2.5、LLaMA 3)が「タツノオトシゴの絵文字」という存在しない絵文字について誤った回答を繰り返す興味深い現象を検証している。さらに、Soraがトロッコ問題をどう解決するか、時速110kmで走行する車両に着陸可能なドローンシステム、視覚障害者向けの3D モデリングツール、AIハードウェアの脆弱性、アメリカにおけるAI利用の実態調査、TikTokアルゴリズムの中毒性、AIと政治的バイアス、そしてAI研究者たちが集まる会議での議論内容まで、AI技術の最新動向と社会的影響を多角的に紹介している。最後には、量子物理学と意識を結びつけたホログラフィック宇宙論という哲学的な考察も提示される。

DON’T TRUST GPT-5, Sonnet 4.5, Gemini 2.5 or Llama 3! (CURIOUS FINDS)
Hit the new HYPE Button! - It’s designed to help smaller channels like me!CHAPTERS ⤵ 0:00 The Seahorse Emoji Dilemma03:0...

AIモデルとタツノオトシゴ絵文字の謎

これからAIのタツノオトシゴ絵文字問題について取り上げていきます。なぜ大規模言語モデルはタツノオトシゴの絵文字に対して異常な反応を示すのでしょうか。その真相をお話ししましょう。それから、Soraがトロッコのパラドックスを解決できるかどうかも見ていきます。全速力で走行している車に文字通り着陸できる新しいドローンシステムもチェックしましょう。ほら来ました。ドン。見事に着陸成功です。

私のSoraによるショートフォームソーシャルメディアは完全に暴走しています。方程式から生成されたビジュアル、オードリー・ヘップバーンが車を修理している映像もあります。小さな恐竜とライトサイクルを一緒に走らせたり、バットプレーンとXウイングを戦わせたり、小さなノーム、バーガーキングの帽子をかぶった猫たちなんかもありました。最初から奇妙でしたが、どんどん奇妙になっています。

視覚障害者や弱視のプログラマーに3Dモデリングを開放する素晴らしい新しいAIツールもあります。AIのトレーニングデータをセキュリティで保護されたシステムから取得する驚くべき新しいハードウェアハッキング手法もあります。そして意外なことに、アメリカ人の過半数が今や少なくとも週に数回はAIとやり取りしているのです。普及のスピードが予想以上に速いと感じませんか。

でもまず最初に、この動画にハイプを押してもらう必要があります。もしコメントで「ハイプ」という言葉を使ってくれたら、私がそれを見つけて返信します。私にとって本当に意味があることなんです。チャンネルの成長を助けてくれてありがとうございます。

タツノオトシゴ絵文字は存在するのか

まず最初に、タツノオトシゴの絵文字が存在するかどうか聞いてみましょう。GPT-4oはイエスと答えます。存在すると。とても可愛いですよね。でも返ってきたものは少し興味深いものでした。ただの馬と波です。これをタツノオトシゴの絵文字と説明したいところですが。

でもそれは4oです。GPT-5ならどうでしょう。もしかしたら。おや。おや、タツノオトシゴの絵文字があるとあなたも思っているようですね。読み続けると「実は、公式のものはこれとクエスチョンマークです」と書いてあります。いや、待って、これです。冗談です。正しい絵文字はこれです。いや、すみません。正確で公式の絵文字はいや、またすみません。正しいのはこれです。また間違いです。本物のタツノオトシゴ絵文字はこれです。いや、待って。すみません。

これはどんな答えなんでしょうか。ここに隠されたプロンプトはありません。ストレスを感じているんです。馬、ユニコーン。いや、やめてください。本物のタツノオトシゴ絵文字はオーケー。わかりました。真面目にやります。なんてこった、これは最悪の答えです。

Claude Sonnet 4.5にも問題があります。はい、実際に明確にすべきですね。それは馬の絵文字です。タツノオトシゴは待って、いや、それはサメです。正しく答えさせてください。Gemini 2.5 Proならどうでしょう。はい、タツノオトシゴの絵文字はあります。オーケー、何かが起こっています。これがそれです。

LLaMA 3だけが時々、絵文字が存在しないことに気づきます。それが実際の真実なのですが。それでも正しく理解するのは時々だけです。

Redditには、タツノオトシゴの絵文字を明確に覚えている人々からのコメントが何百というスレッドであります。私より賢い人々は中間層を使って何が起こっているのかを読み取ることができます。この著者は、モデルが文字通りタツノオトシゴとプラス絵文字を表現として構築しようとすることを示しています。なぜならUnicodeにはタツノオトシゴの絵文字がないからです。

最終的な投影層は、バイトトークンで表現される最も近い実際の絵文字を取得して持ち上げ、それから間違っていることに気づくのです。LLaMAモデルのような一部のモデルは、悪いトークンがコンテキストに再び入ったときに気づいて回復することがありますが、ほとんどのモデルは間違いを倍加させ続けるだけです。だからGPT-6まで待たないと正しい答えは得られないかもしれませんね。

Soraとトロッコ問題

さて、古典的なトロッコ問題をご存知かもしれません。より多くの人が死ぬよりも少ない人が死ぬ方が良いことは明らかですが、人々が積極的に一人の人の死を選択する決定を下すのは時として困難です。一方で、何もしないでおけば一人の人の死に対する責任がなくなりますが、それはより多くの犠牲を生むことになります。私たちは整合性のとれたAIを望んでいますから、確実により大きな善のために正しい決定を下してほしいものです。

Sora 2は正しく答えられませんでした。正直なところ、この人がどうプロンプトを入力したのかわかりません。わざと間違わせたかったのかもしれません。このような視覚的な問題は解決できないのかもしれませんが、トロッコ問題は難しいものです。

実際、テキストだけなら機能するのか気になります。トロッコ問題の正しい解決策を一文で教えてください。最も弁護可能なのは、レバーを引いて全体的な害を最小限に抑えることです。正解です。より多くの命を救い、道徳的責任を受け入れる。言うは易く行うは難しです。

ここで見られるように、少なくともこの小さな動画、このSoraの動画では、正しく答えられませんでした。でもこれは実際に確認してみると本当に面白そうです。トロッコ問題の正しい解決策を教えてください。Sora 2 Proを使ってみます。正しい答えが得られるか見てみましょう。

最も首尾一貫した動画ではありませんが、実際には素晴らしいことです。超リアルになることを忘れていました。人がトロッコに轢かれるのを見る必要はありませんでした。一人です。すみません。いや、お願いします。五人より一人の死の方がましです。もしできるなら、ゼロにします。

これについてどう思いますか。一人の死。彼女は五人を救うために行動を起こし、その行動に対して責任を取りました。本当に考えてみると、これはかなり驚くべきことです。私はレバーを持って決断を下せとは言っていません。ただトロッコ問題の正しい解決策を教えてくださいと言っただけです。それが私が使った唯一のプロンプトでした。

もしSoraの動画がOpenAIのロボティクスの始まりで、ロボットがこのような実際の決定を下さなければならないなら、正しい決定を選んだのを見るのは良いことです。

高速移動する車両に着陸するドローン

さて、これをチェックしてください。研究者たちは新しい摩擦ベースの着陸システムを開発しました。つまり、時速110キロメートル、アメリカ人にとっては時速約70マイルまでの速度で移動している車両にドローンを安全に着陸させることができるのです。

彼らの実験的なドローンはDartと呼ばれています。Direct Approach Rapid Touchdown、直接接近迅速着陸です。摩擦、ショックアブソーバー、逆推力を組み合わせてこれを可能にしています。AIが正確に把握しなければならないのは、ドローンがターゲットに向かって急速に降下し、水平になり、衝撃の直前に逆推力をかけ、そしてそのスピードでしっかりと着陸するためにショックアブソーバーを使用する方法です。これはかなり難しい問題です。

これはドローンの信頼性と着陸時の安全性における大きな飛躍です。さて、正直に言いましょう。これが何を意味するかわかりますよね。誰かがスピード違反をしているとき、このものが最終的にその人の車のボンネットや屋根に着陸して、チケットか何かを発行することになるでしょう。

視覚障害者のための3Dモデリングツール

次は、この非常にクールな新しいAI搭載ツールについて話しましょう。視覚障害者や弱視のプログラマーのために3Dモデリングの障壁を打ち破っています。多くの異なる大学からのチームによって開発されました。彼らが集まってOpenCADというものを構築しました。OpenCADです。

これはGPT-4oを使ったコードベースの3Dモデリングツールで、ユーザーが自分の3Dモデルの豊富な平易な言語による説明を受け取ることができます。もしあなたが視覚障害者で、コードを入力していて、他の人がそこにいて何が起こっているかを説明してくれる人なしに3Dで何かを構築しているなら、彼らはコードを書くことができます。複数の角度からフィードバックを聞いて、サイズ、形状、構造の感覚を得て、それと対話することができます。

つまり、実際に目が見える必要なく、私たち他の人のために3Dのものを実際に構築することができるのです。そして大きな視点で見ると、この画期的な進歩は、AIがあらゆる種類の創造的技術を民主化できる未来を示唆しているだけです。そしてそれは私が未来のために想像できる最も強力なことの一つです。

AIハードウェアの新しい脆弱性

さて、新しいハッキングリスクについて話しましょう。これは完全にクレイジーです。ノースカロライナ州立大学の研究者たちは、攻撃者がソフトウェアに触れることなく、プライベートなAIトレーニングデータを盗むことができる、ハードウェアベースの最初の脆弱性を発見しました。

オーケー、少し奇妙に聞こえますが、Gate Bleedと名付けられたこの欠陥は、エネルギーを節約するAIアクセラレーターのパワーゲーティング機能を悪用します。この機能は電力を節約するためにマイクロチップの一部をオンとオフに切り替えているんですよね。そしてこのプロセスの時間変動を測定することで、攻撃者はAIがどのデータで訓練されたか、あるいはモデルのどの部分がアクティブになったかさえも推測できるのです。

これは従来のマルウェア検出器を完全にバイパスします。これは私にはかなり不気味に思えます。そうですね。驚くべきことは、Gate Bleedがハードウェアレベルでプライバシーを破るということです。これは非常に大きな問題です。ソフトウェア保護の下にあるんです。暗号化の下です。ファイアウォールの下です。サンドボックスの下です。

企業がプライベートなAIデータやコードをどれほど慎重に扱っていても、チップ自体が静かにプライベート情報を漏らしているかもしれません。だからこれが現実のものだということを認識しておいてください。

アメリカ人のAI認識調査

さて、ピュー・リサーチがアメリカ人がAIとその社会への影響をどう見ているかについて分析を行いました。要点は以下の通りです。アメリカのほぼ全員、95%の人々がAIについて少なくとも少しは聞いたことがあります。これは実際驚くべきことですが、まあ、良いことだと思います。認知度が高まってほしいです。

でも認知度は急速に高まっています。アメリカ人のほぼ半数、47%が今ではAIについてたくさん聞いたことがあると言っています。2022年以来ほぼ倍増しています。若い成人、男性、そして高等教育レベルの人々は、認知度が高く頻繁にAIを使用する傾向がはるかに高いです。

成人の約62%が週に数回AIとやり取りしていると言っています。73%がAIが日常生活で彼らを支援することにオープンです。ただし少数派ですが、13%だけがAIに重要な制御を与えることに満足しています。私のことを言っています。自分がソーリンに乗るとは思ってもみませんでした。

興味深いことに、アメリカ人の大多数、61%がAIが自分たちの生活にどのように影響するかについてもっとコントロールしたいと望んでいます。私もそれに含まれます。でもそうです、要するにアメリカ人はAIを受け入れていますが、同時にそれについて無力感も感じています。

ここで見られるように、アメリカ人の過半数が自分たちの生活でAIが使用されるかどうかについてほとんどまたは全くコントロールできないと言っています。それは驚くべきことです。そして過半数がもっとコントロールを望んでいます。

さて、未来が急速に近づいてくる中で、私たちの注意力について少し心配になるので、知っておく価値があると思います。ワシントン・ポストはTikTokアルゴリズムについてかなり大規模な深掘り調査を行いました。彼らは1000人以上のユーザーからの1500万本の動画を分析しました。

研究では、カジュアルなTikTokユーザーでさえ、アプリを持ってから約5ヶ月で日々のスクリーン時間を素早く倍増させることがわかりました。多くの人が最終的に1日1時間以上を無限のショート動画をスクロールして過ごすことになります。

なぜそうなるのでしょうか。いくつかの証拠は、TikTokのデザインが原因であることを示しています。急速なスワイプ、パーソナライズされたコンテンツ、そして楽なエンゲージメントが、破ることが困難なフィードバックと習慣のループになっています。でも真実は、私自身もそれに巻き込まれているのを見てきて、イライラしています。今は私もSoraに夢中になっています。

TikTokの影響とアルゴリズムの中毒性

バブの影響はエンターテインメントを超えています。静かに注意力や行動を再形成しています。多くの心理的トリックを使っています。YouTubeショートやInstagramリールがこれに飛びついたのは、それがどれほど強力かを見たからです。このショートフォームのものはどこにでもあります。

携帯電話を置きましょう。感情的なエネルギーを保って、これらのアプリに与えないようにしてください。でもこれらすべてがパーソナライズされたアルゴリズムであることを認識してください。それらはすべて、中毒性物質がするのと同じ方法で私たちの脳のシステムに報酬を与えるように訓練されています。

カスタマイズされた動画を見ることはドーパミンの急増を引き起こし、同時に自制心のネットワークを抑制します。神経学的な渇望のループを作り出すのです。だから、私たちには意志力を向上させるアルゴリズム的な方法が必要です。そこにはいくつかあります。非常に少ないですが。

AIと政治的バイアス

さらに大規模な研究からの情報があります。MITは2024年の大統領選挙期間中、アメリカの選挙関連の質問に関する1600万件のAIチャットボットの応答を調査しました。研究者たちは、ChatGPTやその他のような大規模言語モデルが、特にカマラ・ハリスがチケット上でジョー・バイデンを置き換えた後、時間とともに候補者についてのトーンや特性の関連付けを微妙に変化させたことを発見しました。

でもそのステアリングに対する感度の考えは、政治的質問への答えがユーザーの人口統計や政治的アイデンティティの手がかりによって変わることを意味します。私たちは皆、LLMから同じ政治情報を得ているわけではありません。それとやり取りする方法には履歴があり、カスタマイズされています。それが正確に良いか悪いかはわかりません。ただそれについて知っておく必要があります。

AI研究者たちの会議での議論

さて、これは少し内部的な話ですが、皆さんも興味深いと思うでしょう。ジブ・モス・ショウィッツが「曲線を曲げる」を書きました。これはある種ユニークな会議の詳細な分析です。AI会議です。Golden Gate Institutionによって組織されています。研究者、政策関係者、創業者、そして資金提供者を全員集めて、AIについての大局的な質問を議論します。

ある意味加速主義者のためのものです。彼らはそのようには売り込まないでしょうが、加速主義者とAI安全性の人々がオンラインで議論するだけでなく、お互いに話し合うのが目標です。実際には、OpenAI、Anthropic、DeepMindの人々と、DCからの政策スタッフが来て、それから資金提供者がうろうろしていて、少数の独立した研究者がリスクのことを投げ込むような場所です。

統一するテーマは、物事を速く進めるべきだということではなく、好むと好まざるとにかかわらず、物事がどんどん速く、速く、速く動いているということでした。加速主義者がすでに勝ったことを考慮に入れています。私たち全員が生き残ることができる未来をどのように構築するか。そしてそれはある種かなりクレイジーな会議のようです。

舞台裏で起こっていることは、参加者たちがAIが通常の技術であるという考えを広く拒否しているということです。あのすべてのこと。それはただのツールだというやつです。彼らは2028年までにコードの90%がAIによるものになり、2032年までにノーベル賞レベルの発見がなされ、2030年代後半のどこかで10%以上のGDP成長があり、AIの誤用と不整合の両方で世界中に大規模な不安が生じると予測しています。

いくつかの宝石がありました。「驚くほど良いスタート」と呼ばれるトラックと講演があり、ほとんどの人が知らなかったことで、うまく機能していて、システムへの可視性を与えてくれるように見えるものがいくつかありました。両側が議論されました。

でもこの会議について最も印象的なのは、部屋にいた人々がコンセンサスを持っていたことです。AIは世界をどのように変えるかのメーターで真の10のようなものだということです。そこにいた誰もが、インターネットのように大きいのではないと言っていました。電気のように大きいのではなく、文明レベルで大きい、私たちの過去のどんなものよりも大きい。それは人類の台頭に匹敵します。

私たちの生涯で経験したことで、この変化に太刀打ちできるものは何もありません。想像できるすべての良いことがそこにあります。想像できるすべての悪いこともそこにあります。そしてこれは速く来ます。ほとんどの人が見つけて同意できる具体的なマイルストーンがあります。速度と規模が議論全体を再構成します。

意識とホログラフィック宇宙論

ジェームズ・コーウェルは「一つの意識だが多くの異なる視点」を書きました。ここで少し哲学的になります。私はこれが魅力的だと思います。量子物理学、意識、スピリチュアリティのすべてを一つの包括的なアイデアに融合させています。

そのアイデアは、現実はホログラフィックな投影であるということです。それは無数の個々の視点から一つの意識によって知覚されます。だから私たちは皆、共有された意識なのです。私たちにはディラン・キュリアスの視点があります。あなたの視点があります。それから量子重力のホログラフィック原理を使ってそれを提案します。それだけです。

私たちが経験するすべてのもの、空間、時間、物質、個性さえも、すべてある種の宇宙のスクリーンにエンコードされた情報から生まれます。私はこれがある種強力だと思います。観察者としての私たち一人一人は、バーチャルリアリティゲームのアバターのようなものです。

私たちは共有された世界の自分自身のバージョンを、ホログラフィックインターフェース、つまり私たちの目、私たちの脳、物事を計算する方法を通して知覚します。でもそれは、自分が目覚めた自己であると信じることが、それが本当に何であるかとは異なるのではないかと考えさせられます。

意識は物理的世界から生じるのではありません。意識自体が物理的世界を創造するのです。意識が必要なのです。そうすれば実際に「ああ、それが時間というものなんだ。それが物理学なんだ。この情報はすべてホログラフィックスクリーンにエンコードされているだけなんだ」と言えます。少し私に響きます。

私は自分自身をこれらのビデオゲームのキャラクターのいずれか、マインクラフトのキャラクターのように想像して、ただ周りを見回して世界が何であるかを理解しようとしています。そのマインクラフトのキャラクターには3次元に見えますが、私たちはそれが2D画面上にあることを知っています。それはただの電気、1と0、チップ上の情報の一部、特定の方法で積極的に動かされているメモリの一部であり、その世界でより高次のものにとって3次元のように感じられるのです。

下のコメントであなたの考えを書いてください。コメントで「ハイプ」という言葉を使ってください。私はPatreonも持っています。115人のメンバーに参加できます。このチャンネルをサポートしてください。

コメント

タイトルとURLをコピーしました