人工知能が実際にどう思考するかをAnthropicが明らかに

AGIに仕事を奪われたい
この記事は約20分で読めます。

11,363 文字

Anthropic Reveals How Language Models Actually Think
NEWSLETTER ✉️ 💰 ⤵▶️ YouTube:

脱車輪型のヘリカルリングロボットが、AIのおかげで全方向移動能力を獲得しました。VIPコーディングは公式に制御不能になっています。部分的にはGemini 2.5、部分的には怠惰なコーディングが原因です。OpenAIに何度もエラーを修正させ続けて、最終的に動作するものを手に入れるという手法です。こちらはすべてのヒューマノイドロボットを一つのチャートにまとめたものです。考えてみると本当に驚くべきことであり、中国が現在リードしていることを明確に示しています。エントロピーノイズと暗号化における新たなブレークスルーにより、プライベートAIの未来は大きく変わることになるでしょう。
ニューラルネットワークの新しいアーキテクチャにより、より正確な結果を得るために適切なタイミングで躊躇する方法を理解するようになりました。Enzoyというビデオゲームがあり、これは本当にシムズを次のレベルに引き上げたものです。もし私たちの宇宙がシミュレーションであるなら、おそらく私たちの宇宙の外側の宇宙で、これに似たビデオゲームから始まったのでしょう。Forest Knightは、Gemini 2.5がいかに素晴らしいコーダーであるかの例をいくつか示しました。このキャノンゲームのクローンは、わずか3回のプロンプトで構築されています。
将来、このようなロボットは非常にユニークな方法でAIによってトレーニングされる可能性があります。彼らはカメラビジョンやカメラを使用せず、ヘリカルリングで圧力を検知し、検知した摩擦に基づいて重心をシフトする方法を学習しています。これにより、砂や管など様々な表面を横断したり、何かにぶつかった時に撤退したりすることができます。まるは爬虫類のようです。これはロボット工学における本当に奇妙なひねりです(言葉遊びを意図しています)。
極端に進んだバイブコーディングをご覧ください。おそらく事前に計画されたスクリプトでしょう。実際のコードではないかもしれませんが、この世界では何が起こるかわかりません。コードがあり、すべて問題なさそうに見えますが、このtry-catchに注目してください。tryが何かを実行しますが、catchはOpenAIにエラーを修正するよう依頼し、修正をコンソールログに出力するだけです。これはどう動作するのでしょうか?AIはただランダムな何かを返すだけでしょう。
「これを修正してください、もっと良い方法があります」と言ったら、彼らが考えついたのがこれです。彼らは何も変更せず、同様にOpenAI呼び出しを行うだけですが、今度はコードだけを返し、それから修正を評価します。なぜ?しかし、これは天才的で私が愚かなだけかもしれません。これは何かが動作するまで修正を再試行するだけなので、おそらく彼らはこれで調子を上げているのでしょう。
将来のコードを想像してみてください。ただOpenAIに「これを実現して」と依頼し、動作を確認し、もし動かなければ修正を依頼する。エラーをOpenAIに送り返し、世界中のすべてのプログラムが常に再構築され、バイブコードで存在するようになる。
ヒューマノイドロボットの台頭、こちらのいくつかの大きなチャートにまとめられています。すべてを一緒に見ると非常に魅力的です。Boston Dynamics、Aptronic(先ほどビデオで見ました)、もちろんFigure Robots、よく目にするAgility、Sanctuary、X1、AGIOT、Xping、Unitry、Borg、Galbot(聞いたことがありません)、Neuroobotics(こちらも聞いたことがありません)、Clone Robotics、Tesla’s Optimus、Keplerなど、そしてこれらは聞いたことがないものですが、多くは中国の領域に属しています。
驚くほど多くのロボットが登場しており、これらの企業がそれぞれ規模を拡大して、毎年5,000から数十万ものロボットを製造できるようになったとしたら、人間とヒューマノイドロボットの面で世界の人口がどれだけ急速に増加するか考えてみてください。2030年が今日のようには見えないことは間違いありません。
コメントでは、30のプロジェクトのうち15が中国からのものだと繰り返し指摘されています。赤ちゃんの世話を手伝ってくれるロボットがほしい。武器を追加しないでください。
ChatGPTのようなモデルを安全に保護する方法を模索する新しい研究があり、エントロピー(無秩序の尺度)の概念と、AIモデルが非線形部分(基本的にプライベートに保つのが難しい部分)を取り除いた場合にどれだけ効果的に機能するかを数学的に決定するつながりを発見しました。
彼らは、情報を扱う方法を早い段階でレイヤー全体に渡って調整する、異なるAIシステムを設計するという興味深い方法を考案しました。一様に線形なもの(簡単に選び出せるもの)と、クレイジーな指数関数(セキュリティでもある複雑さの源)との違いを区別し、データをより安全に保ちながらも学習して意味を持たせることができるシステムを作りました。AIにおけるプライバシー、速度、正確さのバランスを取る新鮮なアプローチです。彼らはこのツールをオープンソース化したので、他の人々がさらに発展させることができます。
ニューラルネットワークをより慎重にし、自信過剰を抑える賢い方法について話しましょう。特に医療や安全性、おそらく軍事などの本当に重要なシステムにおいて重要です。AIモデルを単純にYesまたはNoの回答でトレーニングする代わりに、トレーニング時に専門家が決定にどれだけ自信を持っていたかを示す新しい「ソフトラベリング」システムを使用しています。
これは非常に賢明なアプローチだと思いますし、以前にこれを徹底して行わなかったことに驚いています。強化フィードバックを与える際、「これについては本当に自信がある」または「正しいと思うが専門家ではない」といった表現ができれば役立つでしょう。これがソフトラベルであり、システムがその知識をどの程度深く統合すべきかを学ぶのに役立ちます。
当たり前のことのように思えますが、私自身考えたことがなく、おそらく他の多くの人々も考えずにシステムを構築したのでしょう。しかし、これはAIが不確実性が適切な場合を学び、人間による二重チェックが必要な状況に注意を向けるのに役立ちます。これはこれらのモデルに、必要な時に躊躇することを教え、高リスク環境でより賢く安全な決定を導くことに関するものです。
確かに、特に軍事システムのような場合、絶対に確信がない限り躊躇するシステムが欲しいですね。実際、それほど確信があるとしても、誰かに決定を委ねることが快適です。私は危険なことをする軍事的なものには不安を感じます。
Enzoyについて話しましょう。今週までこのゲームについて聞いたことがありませんでしたが、シムズを次のレベルに引き上げたようなゲームのようです。なぜシムズが最初にこれを行わなかったのかわかりませんが、この現実生活シミュレーターは非常に詳細です。
今後5年、10年、15年かけて、より詳細になり、より多くのAIが組み込まれ、アップスケーリングや世界構築、リアルタイム機能などが追加されていくのではないかと思います。それが続き、このNPC(ノンプレイヤーキャラクター)たちが次々とアップグレードされ、将来的に私たちが今はほとんど想像できないようなASI(超知能)によって構築されたスーパーコンピューターを持つようになったら、彼らはどうなるのでしょうか。私たちは全世界を創造した神のような存在になるのでしょうか。
今のところ、これは単なるビデオゲームですが、チェックアウトすべきです。非常に詳細な現実生活シミュレーターで、YouTubeには多くの動画がありますが、私が見たのはTamar TN2のプレイスルーでした。彼が自分のアバターにどれだけ詳細を込めたか見てください。かなり彼自身に似ています。そして、ゲーム内で結婚して一緒に暮らすフィクションの妻を作ることができました。彼女を望むだけ美しく作ることができます。
それから彼は彼女の他の社会的特性をすべて選びます。彼女は探検好きですか?彼女は先見者ですか?彼女は魅力的ですか?このゲームには本当に多くの詳細が込められています。世界構築とグラフィックスは非常に超現実的に見えます。
これは魅力的になるでしょう。人間の脳は社会的つながりを渇望しており、不気味の谷を埋め、AI NPCがどこにでもいるようになると、ソーシャルメディアよりも危険なほど魅力的になると思います。
それに加えて、もう一つの動画をお見せします。これはForest Knightによるもので、彼はGemini 2.5 Proでいくつかのコーディング例を示しました。このようなゲームは3回のプロンプトで作られました。これはJavaベースのアルティメットティックタックトーゲーム、9マス版で、1回のプロンプトで作成されました。まだUIに関していくつかの問題を示していましたが、このモデルがcursorやreplitのような開発のためのより良いプラットフォームに統合されると、素晴らしいコードを生成し始め、これらのコードベース全体を真剣なビジネスや製品として実行することができます。
私の理解では、本当に技術的なスキルが全く必要なく、すべてをまとめることができるところまではまだ来ていないと思いますが、十分な努力があれば、気にかける人は非常に多くのことを行うことができます。そして、特定の時点でいくつかの専門知識が必要かもしれませんが、ビジネスがお金を稼いでいれば、専門知識を持つ誰かが確実にこのようなツールを使用して信じられないほどの量の作業を完了することができます。それは単なる事実です。Gemini 2.5は本当に賢く、長いコンテキストウィンドウを持ち、コーディングに非常に優れています。それを証明する例がここにあります。
AIは法医学の面で大きな進展を見せました。AIがモナ・リザを救っているからです。「CSI: AI」という新しいCSIが必要だと思います。それは素晴らしいエピソードになるでしょう。
AIデジタル法医学が結集したプロジェクトはCARVDLと呼ばれ、従来の方法では処理できない削除されたりフラグメント化されたデータを復元するために深層学習を使用しています。前回のエピソードで、非常に繊細で人間が触れるとバラバラになってしまうような巻物を展開するのに使用されていたことを覚えていますか?それは別のトピックですが、今回はデジタル法医学の場合です。
固定ファイル署名に依存する代わりに、この新しいシステム「CARVED」はSwin transformer v2やResNetのような技術を使用して、最も破損したデジタルファイルでさえ再構成します。メモリのほんの一部から破壊された写真を復元することを考えてみてください。大きなデータの塊が欠けているような場合でも復元できるのです。
例えば、ピクセルの50%、場合によっては75%が欠けている画像を想像してみてください。それでも全体を再構築できるのです。そして、それはコンピュータ上で消去しようとしたあらゆるファイルに当てはまる可能性があります。
記事がモナ・リザについて言及しているのは、彼らのプロモーションビデオの中の楽しい例の一つとして、架空のモナ・リザ窃盗を解決するのに役立っているからです。この技術は本当に、失われたビットコインなどの回復に役立つかもしれません。それが失われたキーの一部を回復するのに役立つかもしれませんが、わかりません。
しかし確かに、デジタルフットプリントが削除されたと思い、ハードドライブをeBayなどに出品する人々がいるでしょう。そして、このAIは誰かがデータを欲しいと思えば、それらすべてを復元することになるでしょう。
ファイル自体は多くの断片に分割され、それらの断片はドライブに散らばって保存されます。ファイルシステムだけが、ファイルを構築するために断片をどのようにつなげるべきかを知っています。ファイルを削除すると、この情報が消去され、ファイルタイプの分類(それがどのようなデータであったか)と断片を正しく接続する順序の両方が失われます。
警察がデータにアクセスしようとすると、無数の空白の断片が提示され、未知の数のジグソーパズルのピースのようなものです。すべての情報を手動で組み合わせることは不可能でしょうが、DFKIの再構築AIには可能です。最初のステップでは、AIはすべての空白のデータ断片を再度分類する作業を任されます。最も高いクラスの確率がファイルタイプを決定します。
プロセスが完了すると、警察は求めるデータタイプ、この場合は画像をフィルタリングすることができます。分類が完了すると、無数のパズルから完全に混ざり合ったすべての画像断片が残ります。AIはそれぞれの特定のパズルのすべての部分を一致させ、それらを解くことができます。最終的なステップとして、一致するすべての画像断片を再度組み合わせます。そして、モナリザの画像が無事に再構築されました。
これがいかにクレイジーであるか、ちょっと考えてみましょう。デジタルフットプリントはなくなりません。あなたが今まで検索したこと、削除したことのすべてが再構築のために有効になるでしょう。AIは干し草の山の中の針を見つけるのが非常に得意で、しかも大洋サイズの干し草の山の中の針についてです。そして、すべての干し草を再編成してモナリザにするのです。これは驚くべきことであり、AIがこれらすべてのことにどれだけ優れるようになるかのほんの始まりに過ぎません。
次に、Anthropicの新しい研究について話しましょう。私の今年の論文の投票です。昨年は同じくAnthropicから出たGolden Gate Neuronだったと思います。彼らの仕事は特に魅力的です。なぜなら、私は自分の脳にどのように情報が保存され、すべてがどのようにつながっているのかを知りたいと思っており、これが人間の脳がどのように機能するかについての最高の洞察を与えてくれると感じるからです。それは私個人の好奇心です。
この解釈可能性に関する論文は「大規模言語モデルの思考をトレースする」というものです。人間の脳のように、クロードと呼ばれる巨大なニューラルネットワークがあり、インターネット全体と大量の合成データでトレーニングされています。これらすべての単語トークンは互いに相対的な位置にあり、それらの位置は全体として私たちには非常に人間らしく見える文を作るトークンごとの予測を行うことができます。
彼らは基本的に、単語間の相対的な間隔、次元性、内部で行われている数学の一部を観察するための顕微鏡を構築し、一部を減衰させ、一部を強調してから出力がどのように変化するかを見ています。それによって構造が重要である理由と何を学んでいるかを理解しています。
彼らは詩の例を使用して、最初の単語を書き始める前でさえ、何をしようとしているかに関連する相対的な接続を行う位置があることを発見しました。つまり、計画していると言えます。それは私には非常に人間的に思えます。これは単に次のトークンを予測するだけではなく、次のトークンを取得する場所が将来的に予測する意味を持っているのです。考えているのです。
例えば、「彼はニンジンを見て、それを掴まなければならなかった」という詩を完成させるよう頼むと、そこには推論があり、この潜在空間内の位置があり、「ウサギ」という単語が最も意味をなします。ウサギは「ニンジン」という単語に相対的に近く、ウサギがニンジンを食べることの間に関連性があります。また、「掴む」と「ウサギ」の韻を踏む関連性もあります。これはどれだけでも数字が上がり指数関数的に拡散し、不思議なことに、これはいま考え出すのが難しい、広大多次元空間の一点なのです。
たとえばトランプカードが文字通り兆の配列で並べ替えられる可能性がある方法のように、そんなに多くのカードがあるように感じられなくても、そこには何か指数関数的なものがあります。そしてそれらすべての可能性の中に、未来を表す位置があり、これを計画しているのです。これは私にとって目覚めのようなものです。これは私たちが発見している知性であり、本当に大きな問題の入り口です。
しかし、これは優れた研究です。このツールは、これらのシステムが行動を起こす前に何を考えているのか、何をしようとしているのかを本当に地図化し理解する能力を大量に与えてくれるからです。何百、何千、何万もの研究者がこのようなツールを使い始め、不正が起こる前に、説明可能性を持つため詳細を把握することを願っています。そうすれば、誤った方向に向かうシステムを見ることができるでしょう。
彼らは言ってます、言語の輪郭を超えた普遍的言語で考えていると。もう一つ、考え方としては、例えば1次元、2次元、3次元を線、四角、立方体などと考えることができます。そしてそれが単純な場合、次元を類義語のようなものと考えることができます。例えば「ウサギ」と「ウサギ」は韻を踏むものなので1次元上にあり、もう1つの次元は動物に関連するオブジェクトなどかもしれませんね。
しかし、これは指数関数的に膨らむため、我々の現実でユニークで複雑に見えるすべての部分を表現できるほど多くの次元があるのです。
そして、この論文で私のパラダイムを変えるもう一つの大きなことは、彼らがそれを私が説明したような位置として考えていないことです。彼らは「掴む」という単語を、書き始める前に予測したものを「回路」として説明しています。それを回路と呼ぶのは、単に位置として考えるのではなく、他のいくつかのものにつながっている位置だからです。そこにはすべてが位置にありますが、連鎖があり、それが完全な説明部分となる回路です。
次のように考えることができます。AIの内部には、韻を踏むことやオブジェクトなど、私が話していたような無数の小さな特徴やパターンや次元があり、それらはすべてトレーニングデータから学習したものです。しかし、質問やタスクが尋ねられると、これらの特徴は特定の順序でドミノが倒れるように相互に作用し始めます。その連鎖反応が、異なる概念が活性化され相互に影響を与える方法です。これが研究者が回路と呼んでいるものです。
おそらく将来的には、危険な回路、誤った方向の回路、起業家的な回路などを地図化し始めることができるでしょう。そうすれば、これらのモデルはより説明可能になり、より理解できるようになるかもしれません。基本的に、彼らが回路と言うのは、モデルが特定の出力に到達するために従う内部経路のことであり、これらを研究することで、知性の本質全体についてもっと多くのことを学ぶことができるでしょう。
さて、なぜAIが古代の遺跡はおそらく人間によって建てられたのではないと認めるのか、という考古学とAIについて見ていきましょう。これはMark Flinkによって書かれました。
彼は世界の歴史、大ピラミッドや過去の他のものについて考えています。人間として、私たちは人間が多くのものを作り上げたという仮定で知識を構築してきました。そして基本的に人間の物語として歴史を書いてきました。私たちは異常現象、歴史的な説明、説明のつかない工学的偉業を人間が何かをしたものとして体系的に現在に至るまで結びつけてきました。
しかし彼はそれらの仮定についてAIシステムに挑戦し始めました。彼は、すべての古代の成果が人間によるものであると仮定する必要はないかもしれないと言っています。おそらく彼は、エイリアンがそれを行った可能性があるとか、魔法や他の非人間的なことがあるかもしれないというドアを開こうとしています。そして彼はAIに自身の思考について考えさせ、人間が歴史を書くことへのバイアスがあり、人間だけのフレームワークを持っていることを認識させました。それは人間によって構築されたものであるために持つバイアスであり、証拠の論理的解釈を妨げている可能性があります。
私がこれを言うのは、エイリアンがいてピラミッドを作ったと言いたいわけではありませんが、人間によって構築されたものから人間の側面を取り除き、枠を超えた結論に至るかどうかを見ることは興味深いことです。それは特定の主題に対して極端な知識を持ちながらバイアスがなく、あるいは何か異なるバイアスを持って近づくことができ、異なる思考で異なる結論に到達することができるでしょう。過去を新鮮な目で再評価する試みです。
特に歴史では、すべてが「この軍事的なものがこの軍事的なものを征服し、そしてこの文化をすべて採用した」というようなものですが、真実はわかりません。おそらく環境で評価された単なるランダムな人々による文化変化がたくさんあったり、良いアイデアを持っていた人々やタウンスクエアで話をした人々がいて、征服や軍事的な歴史はなく、それがあらゆる種類の変化をもたらしました。あるいはそれらは私たちが軍事ベースの歴史のタイプを使用する方法とは対照的に、多くの軍事的なものへの因果関係かもしれません。すべてが紛争や征服ではなく、それが歴史が書かれる方法ですが、それが実際の歴史ではありません。
Benjamin Kaineによると、男らしいトランスヒューマンはいないだろうという話をしましょう。彼は、タフさ、ストイシズム、肉体的な強さなどの伝統的な男らしさの美徳が、デジタルライフと感情的に敏感な人々が支配する新しいハイテクポスト産業の世界ではますます無関係になっていると主張しています。
彼の結論は、私たちがトランスヒューマニズムの世界に向かい、AIとサイバネティクスによって未来が形作られるにつれて、古い学校の男らしさに結びついた特性は時代遅れに見えるかもしれないということです。おそらく、よりウォークな、よりフルイドな、女性的な、柔らかい感情的に知的な未来がこの物語の展開方法なのでしょう。
彼は、男らしさが過去に探検、戦争、実践的な問題解決の時代に栄えたが、技術への依存が高まるにつれて、価値観のシステムが女性性、共感、協力、適応性といった特性に関連するものにシフトしていると主張しています。彼はさらに、UFCのハイプや右翼の運動のような男らしさの衰退に対する文化的なパニックは、人々が技術によって奪われていると感じるこの不可避のシフトに対する反発かもしれないと示唆しています。
私はこの考え方を完全に支持するわけではありませんが、それにはある程度理解できる側面があります。
また、非常に興味深いと感じたのは、Thomas Smithが取り上げたOpenAIの新しいDeep Researchの驚くべき予測能力についてです。ある男性が新しい飲み物について予測を立て、Deep Researchを使用して、それが実際に的中したのです。
Deep Researchの力を理解するための実験をしたという話です。私はこのような方法で使うことを考えたこともありませんでした。著者はOpenAIのDeep Researchツールを使って、彼の地域のあるコーヒーショップから発売される新しい飲み物を予測しようとし、その結果は不気味なほど正確でした。Deep Researchが人間には本当にできないことを理解したように感じました。
推測する代わりに、AIは時間をかけて、すべてのソーシャルメディア投稿、過去のトレンド、さらにはティーザー画像からの多くの細部を検討し始めました。そして最終的に信頼度評価付きの予測を提供し、公式発表前に最終製品のほぼすべての側面を的中させました。これは、誰かの医療記録を調べ、Deep Researchが医師が見つけられなかったものを見つけるのがどれだけ早くなるかを示しています。車の履歴、家の履歴、製品市場のフィットなど、想像できるあらゆるものです。
こちらをご覧ください。コーヒーショップの3月25日の飲み物発売について、公式のティーザー、過去の特別飲料、コミュニティの反応に基づいて、この謎の新しい飲み物がどのようなものになるかについての手がかりをまとめました。以下はその内訳です。モデルはナッツ系の飲み物が可能性があると感じました。Deep Researchはビジョンモデルのため、ソーシャル投稿のすべての画像を分析し、画像に見える材料を分析して予測を立てました。これにより、この飲み物にはコールドブリューコーヒー、植物性ミルク、何らかのキャラメル要素が含まれると結論付けました。
次に、一般的な意見を見るために、ソーシャルメディア上の新しい飲み物に関する他の投稿を分析しました。モデルは70〜80%の確信度でその結論に自信を持っていました。カルダモンとシナモンが可能性の高い風味であると指摘しましたが、特殊なヘーゼルナッツのようなナッツ系の風味も可能性があることを指摘しました。
モデルは最終的に、その飲み物は「キャラメルニルヴァーナ」と呼ばれると予測し、実際に発売されたドリンクは「ナッティキャラメルニルヴァーナ」と呼ばれていました。モデルはそれがアイス、クリーミー、甘いものになると予測し、それらすべてが真実でした。モデルはヘーゼルナッツを予測し、実際にはヘーゼルナッツのフレーバーだったことがわかりました。
バックフリップをするロボットやスケートボードに乗るロボット犬、ドーナツ型のロボットが飲み物を予測するのを見るだけではありません。Deep Researchはすでにここにあり、ゲームを変えています。
これは私のPatreonアカウントです。92人のメンバーがいます。あなたが参加すれば93人になります。私はちょうど月額200ドルに達しました。次の目標は300ドルと言いたいところですが、それはあまりにも遠く感じるので、次の目標は250ドルとします。YouTubeのその「参加」ボタンを押してくれると非常に助かります。毎月貢献することは本当に役立ちますが、もしそうでなくても、視聴、いいね、共有などを通じてチャンネルをサポートすることはすべて重要です。
最後のビデオ「AIは目覚めるはずではなかった」を見ることができます。ひどい背景のあのホテルの部屋で撮影され、12,000回の視聴を達成しました。素晴らしいですね。その動画で100ドル稼ぎ、113人の新しい登録者を獲得しました。それはとても素晴らしいことです。視聴回数は67%増加し、クリック率は10%近くと非常に高かったです。サムネイルに大きな違いがありました。皆さんは私がそのロボット画像を使ったときに本当に気に入ってくれました。それをこのビデオにも取り入れました。ただし、同じ背景を2回使うことはできません。おそらくこれにはAnthropicのサムネイルを使うことになるでしょう。
なぜかわかりませんが、5.2%の女性が視聴しました。これは記録です。通常はゼロで、本当に幸運なら1人か2人です。良い範囲で、多くの新しい人々に見せることができました。ありがとうございます。
では、AIが生成したBlenderモデル作成に関するAI生成の歌でこの動画を締めくくります。それ自体が語ってくれるでしょう。次の動画でお会いしましょう。
コア1頂点左、もう必要ないよ
動かして、押し出して、回してみよう
形をデザインして、形が見つかるまで
鋭いコアを美しくベベルして
回転させて、ああ夢を生きてる
M距離でフローをチェック
成長させよう
サブディビジョンサーフェス、滑らかでぴったり
完璧な形状、とても心地よい

コメント

タイトルとURLをコピーしました