AIが新たなレベルの知能に到達した

最新のAI技術動向を解説した動画である。ベッドサイドロボットアーム、Meta社の戦略発表、中国発の3D世界生成技術、新しい脳型アーキテクチャ、AI検索の急成長、物理エンジンGenesis、Anthropicのコーディング技術、動画セグメンテーション技術、サイバーセキュリティ専門家の提言、意識の流れに関する哲学的考察など、幅広いAI関連トピックを網羅している。

AI Just Hit a New Level of Intelligence

TRY SKYWORK.AI ⤵ ✉️ 💰 ⤵YouTube ▶️ http...

ベッドサイドロボットアームと未来への不安
Meta社のマーク・ザッカーバーグの大発表
ピンポンロボットの進化とDeepMindの挑戦
中国発の革新的3D世界生成技術
Business Insiderが探るAnthropicの躍進
サイバーセキュリティ専門家の新しい視点
Skywork Super Agentsの紹介
ロボットランプへの複雑な感情
ザッカーバーグのトレンド入りと市場への影響
ザッカーバーグの重要な発言
現実世界への回帰
DeepMindのピンポンロボット
中国のHunYuan World 1.0
新しい脳型アーキテクチャ
AI紹介の急激な増加
TwoMinute Papersチャンネルの神モード技術
Anthropicのコーディング技術の秘密
動画セグメンテーションAIの新展開
テレンス・タオの数学的洞察
意識の流れと思考の謎
スティーブン・フランクの警告

ベッドサイドロボットアームと未来への不安

新しいやつが出てきたで、ベッドの横に置くロボットアームがな。ランプみたいな形してるけど、挟むやつも付いてて、お前を殺す…いや、ベッドメイキングをしてくれるんや。このAIの形態にはまだ心の準備ができてへんわ。まるで背中を向けた蟹の下におるみたいで、気持ち悪いねん。でもこれが未来やから、取り上げな仕方ないな。

Meta社のマーク・ザッカーバーグの大発表

あの人格そのものみたいなやつがな、自分のソーシャルネットワークに飛び込んで、俺らに自分の利益を宣伝してきよったで。マーク・ザッカーバーグがAIの未来と自分の会社の立ち位置について、めっちゃ語っとるねん。それを見ていこか。

速報や、エミリー・ジャニン・ファレットが外に出ることを決めたで。草の上に寝そべって、大地に触れよったんや。トランポリンでAIウサギが跳ねとる動画がバズったけど、あれがフェイクやったことに気づいてな。

ピンポンロボットの進化とDeepMindの挑戦

数か月前にピンポンするロボットを取り上げたの覚えとるか？ちょっと確認してみたら、まだプレーしとるし、どんどんうまくなっとるんや。サーブごとにサーブごとにな。これDeepMindの本社やで。恐ろしいほどうまくなっとる。

中国発の革新的3D世界生成技術

中国の会社Tencentが作った「HunYuan World 1.0」っちゅうのがある。これ世界初のオープンソース最先端モデルで、一つの文章か画像から完全にアクティブな3D世界を生成できるんや。

新しい脳にインスパイアされたAIアーキテクチャが出てきて、従来のLLMより100倍速い推論を実現しとるねん。トップウェブサイトへのAI紹介は前年比357%アップや。これ11億3000万件になっとる。

直感的には検索って言いたいところやけど、実際はプロンプト結果のことやな。AIスペースのOG、2Minute Papersが、このモデルを「神モード級の結果を出せる」って言うとるねん。詳しく調べてみな、何のことか分かるで。

Business Insiderが探るAnthropicの躍進

Business InsiderがAnthropicがコーディングでなんでこんなに優秀になったかを詳しく調べとる。1年後、このスタートアップがコーディング界を吹き飛ばすAIモデルをローンチして、シリコンバレーの皆がまだ追いつこうとしとるねん。なんでや？調べてみよか。

複雑な動画オブジェクトセグメンテーションも進歩しとる。新しいアップデートでさらに印象的になっとるで。

サイバーセキュリティ専門家の新しい視点

サイバーセキュリティ専門家のテレンス・タオが新しいレッドチーム、ブルーチームの議論を世界全体をどう考えるべきかのアナロジーとして提示しとる。俺はそれに賛成やな。

ステファニー・シェンが意識の流れについて話したがっとる。思考と意識の流れがあるとき、その方程式で何が欠けとるのかを指摘しとるねん。進化において、意識の流れは柔軟性と先見性を通じて生存を可能にする。機械には何のためにそれが必要なんや？

それからスティーブ・フランクの意見も見てみるで。俺らが直面しようとしとる危険は人工知能やない。いつものように俺ら自身やって話や。すべての技術が結局は人の問題に感じられるねん。何度も何度もそうなるんや。変やな。

Skywork Super Agentsの紹介

皆さん、ちょっと止めてSkywork Super Agentsを紹介するで。これビジネスのやり方を革命的に変えとるAI職場スイートや。一つのコマンドで、Skyworkはほぼなんでも生成できるねん。文書が欲しいか、スプレッドシートか、スライドか、ウェブページか、ポッドキャストまで（俺の専門やけどな）、全部やってくれるで。

俺みたいに新しいAI ニュースを調べて、可能な限り深く研究せなあかん人間にとって、このツールは90%の時間を節約してくれるねん。例えば、かっこいいもん見せたるわ。SkyworkにNvidiaの評価について詳細分析を頼んだら、座って作業しとる間に、チャートと出典付きの完全なスライドデッキを提供してくれたんや。

深い研究部分は通常のツールよりずっと安い。40%も安いねん。チャート、出典引用付きで、通常の深い研究より40%もコストが安いんや。すべての統計は元の研究にリンクバックしとるから、何でも確認できるで。

このツールで他では見たことない一番面白い機能の一つが「クラリフィケーションカード」っちゅうやつや。プロンプトを完璧になるまで改良できるねん。ビジネスアナリストでも、学生でも、エンジニアでも、起業家でも、Skywork Super Agentはより賢く働いて、より懸命にならんですむ素晴らしいツールや。

このコンテンツをスポンサーしてくれて、視聴者により良い情報を提供できるよう助けてくれたことに大きな感謝を伝えたいねん。本当にありがとうございます。

ロボットランプへの複雑な感情

このロボットランプから始めよか。よう分からんけど。よう分からんねん。まるで漫画が現実になったみたいや。リック・アンド・モーティがこんなの描きそうやん。でもそうやないねん。よう分からん。夜中寝とる間、お前をこんな風に掴める手がずっとそこにあるのが欲しいか？

まあ、理論的にはこの手は進化できるし、ファームウェアとソフトウェアのアップデートもできるから、もしかしたら呼吸に問題があったら寝返りを打たせてくれたり、人に知らせてくれたり、口を開けててくれたりするかもしれん。でも間違った方向に行く可能性の方がずっと多く見えるねん。

きれいか？面白いか？マッサージするロボットも今あるしな。俺も同じような気持ちや。でもマッサージテーブルの上やったら、その1時間のマッサージの間は制約されとるやん。一晩中はあかん。よう眠れんわ。ストレスたまるねん。これは俺だけやけどな。

ザッカーバーグのトレンド入りと市場への影響

次に話そうと思ったんはザックの大発表やったけど、Instagramで見たら、Twitter/Xでもトレンド入りしとるやないか。珍しいな。ザッカーバーグがこんなにトレンドに上がるの、あんまり見いひんねん。普通はイーロンのプラットフォームやからな。

すべての英雄がマントを着とるわけやない。ザックとMetaが株式市場を救ったんや。これ一つの解釈やけどな。ザックは現象やで。なんで今日は彼についてこんなにええことばっかりなんや？別に嫌う必要はないけど、めっちゃええコメントが多かったねん。皆が「おお、お前が救ってくれるんや。俺らに必要な自由やで。シリコンバレーで普通の人のことを気にかけてくれる人がおって、神に感謝や」って感じやった。

それが本当やったらええけどな。ハワイの終末要塞にはスナイパータワーがあるらしいで。よう分からんけど。でもそのウサギの穴に落ちる前に、彼が言ったことについて話そか。

ザッカーバーグの重要な発言

簡単な背景説明するで。彼は何十億ドルも使って人材を獲得しとる。llamaモデルで何かミスをしたみたいやし、AIの責任者がこの船全体を操縦するのに適任やなかったみたいやな。ザックがこの戦いに負けへんよう真剣に関心を持っとるねん。今日彼が言ったのはこれや。

でも超知能を何に向けるべきかっちゅう大きな未解決の問題があるねん。AIがもたらす科学的・経済的進歩については多くが書かれとるし、俺はそれについて本当に楽観的や。でも俺らの生活にもっと意味のある影響を与えるのは、皆が個人的な超知能を持つことや思うねん。それがお前の目標達成を助けて、世界で見たいものを創造して、より良い友達になって、憧れる人間になるために成長するのを助けてくれるんや。

どう思う？台本っぽい？ちょっと台本っぽいかもしれんけど、観客は大喜びや。ついに人々のことを気にかけるCEOが現れた、俺らをロボットに置き換えることだけやなくてな。神のご加護を。すごいやん、ザック。ザック、アベンジャーズ・アッセンブル。愛しとるで、兄貴。素晴らしいビジョンや。

彼の一つの発言には完全に同意やな。「これはこの技術が取る道を決定する決定的な時期や」っちゅうところやね。もっと多くの人がこれについて考えてくれたらええのになって思うねん。

それについて嬉しかったり腹立てたりできるし、それは単に知らんかったり考えてなかったり、理解してなかったりするより良い立場や。このもんが自分自身で増幅していくっちゅうことを理解せんとな。どっちの方向に向かうかによって、どれだけ起幅されるかが決まるねん。

例えば、100万分の1度ずれて真っ直ぐ撃って、アルファ・ケンタウリに到達しようとしても、外れてしまうねん。そこに着くまでの光年によって、その小さな小さな角度が増幅されるから、めっちゃ精密やないとあかんねん。

それと似たようなもんがあるねん。俺らが皆望むような方向に向かって自己修正するシステムを構築しとることを、めっちゃめっちゃめっちゃ明確で一致させとかなあかんねん。

現実世界への回帰

でも今のところは、外に本物の太陽と草があることを覚えといてや。俺は今はあかんけどな、撮影するのが夜中やからな。俺は夜型の人間の一人やねん。でも午後にはこんな感じで素敵やで。

約17万人がこの女性みたいにAIに騙されたと感じて、外に出て草の上に座ることを決めたねん。今の人生で楽しめる最も素晴らしい体験の一つかもしれんで。はだしで、足に当たるように。ええ感じや。ええ夏の日やな。

AIウサギがトランポリンで跳ねとるのに騙された後の俺。本物やなかった。心がバラバラや。俺らみんなやられたみたいやな。

ケーキの話も。コヨーテの背中に乗った猫が玄関で降ろされる動画に騙されたって話もあるな。いや、俺は本物やと思って、めっちゃかわいいからカメラロールに保存したんや。草の上に場所を取っといてくれ。

ちなみにあれも動画やったんや。俺もAIやったって知らんかったねん。そうやな。

DeepMindのピンポンロボット

もちろん、他の人間とできる活動の一つが卓球や。機械より上手いって知らんでもええねん、上手いやないからな。でも楽しいかもしれん。

DeepMindのロボティクスチームはまだやっとる、ロボット学習の境界を押し広げとるねん。長い間、ロボットが自分でピンポンの試合をするよう教えて、これがコンピューターを超人的にする最良の方法の一つなんや。チェスゲームの仕組みと同じや。彼らが先駆けた多くのAtariゲームも同じやった。

人間のプログラミングや事前定義された報酬システムに大きく依存する代わりに、ロボットが自律的にプレーして改善できる環境を作ったんや。AlphaGoで使われた競争による学習モデルを模倣してな。

ロボット卓球選手は協力的なラリーから始めて、徐々に他のロボットや人間との競技プレーに移行していくねん。チームはGeminiのような視覚言語モデルをロボットコーチとして使う実験もしたんや。面白いひねりやったな、従来のプログラミングなしでロボットの戦略を改良するのを助けるねん。

そう、そこで見とるのはロボットが行ったり来たりしとるだけやない。ロボットコーチまでおるねん。見とって「おい、次回はこうした方がええで」って言う視覚モデルがな。競技システムでプレーを学習しながら、コーチングシステムでもあるねん。

コーチを見とるコーチがおって、コーチがより良いフィードバックをするように確認したり、あらゆる種類のエージェントツールがあったらどうやろか？これピンポンがめっちゃうまくなるで。

映画『アイ，ロボット』みたいになるやろな。ロボットが壁を飛び跳ねて、めっちゃ速く登って、スパイダーマンみたいに跳ねるねん。なんでできへんのや？それを学習できるはずやで。これが俺らが発明しとる知能や思うねん。

ロボットに実際のアクチュエーター、関節、実際のハードウェアがあって、超人的速度や超人的強度で動いても壊れへん限り、なんであかんのや？なんでできへんのや？

中国のHunYuan World 1.0

よし、この新しい中国のモデルについて話そか。HunYuan World。正しく言えとるかな。HunYuan…H onion World。HunYuan World。デモ動画に語らせよか。

よし、ここで見とるのがHunYuan World 1.0や。多分名前間違えたけど、中国の会社、Tencentや。今頃は聞いたことあるやろな。中国のトップテック企業の一つで、新しくリリースされた注目すべきオープンソースフレームワークや。テキストから直接没入感のあるインタラクティブな3D世界を作るよう設計されとるねん。

これはVO3が今王冠を被っとって、皆が競争せなあかん相手やと思っとるけど、それみたいなもんで、オープンソースや。パノラマ画像とセマンティック3Dメッシュ再構築を組み合わせることで、従来の動画ベースと3Dベース生成手法の間のギャップを埋めとるねん。これは新しいもんみたいやな。それかGoogleの秘密のソースの一部かもしれん。

よう分からんけど、かなり大きなモデルでいろんな面白いもんを組み合わせたもんみたいやな。ユーザーが高い視覚的・幾何学的忠実性を持つ探索可能な仮想環境を生成できるねん。メッシュエクスポート、オブジェクトレベルのインタラクティビティ、グラフィカルパイプラインへのシームレスな統合をサポートしとる。

大きなパノラマ画像を作って、その背後にシーンを配置して実際にビジュアルを構築したいだけやったら、これはそれができるオープンソースツールやで。

新しい脳型アーキテクチャ

次は新しい脳アーキテクチャについて話そか。俺もできたらええねんけどな。夜寝て夢見とるときは脳をちょっと変えとるんやろうけど、それはどっちかっちゅうとチューニングやな。遺伝子で受け継いだアーキテクチャを本当に変えとるわけやない。まだあの古い、なんて言うんやっけ？大脳辺縁系、爬虫類脳がそこにあって、「飯はどこや？」って感じやもんな。

でもこの新しいAIアーキテクチャは、たった1000の訓練例でLLMより100倍速い推論を実現するねん。

何やねんそれ？シンガポールベースのAIスタートアップ、Sapient Intelligenceから出てきとるねん。アーキテクチャの中核は階層推論モデル、HRMって呼ばれとる。人間の脳が遅い熟考的計画と高速直感的計算に異なるシステムを利用する方法にインスパイアされとるねん。

これら二つのHRMモジュール、一つは遅い抽象思考、もう一つは高速詳細作業をするやつが、かなりユニークなフィードバックループで結びついとるねん。システム自体がHRMに数独や迷路パズルのような挑戦的問題をほぼ完璧な精度で解かせることができるねん。それも1000例以下の訓練で時々やっとるねん。

覚えといて、これは思考の連鎖やないねん。思考の連鎖やったら全部マップアウトしようとするけど、めっちゃ冗長になるねん。ステップバイステップの推論になるわな。

このHRMシステムは、主に独自の潜在空間で動作しとるねん。思考を終えて、計画を立てて、それから計画を見るんやない。全部潜在空間の中で起こっとるねん、逆伝播を通じてシステムがどう学習するかの変化を加える空間の中でな。より速く、より効率的にするねん。

俺にはこれが俺らのやり方により近い感じがするねん。自分が学習する方法や世界に存在する方法について、思考があって何かを見て、しばらくしてから思考と見たもんを組み合わせて新しいアイデアを思いつくようなことがあるねん。そのアイデアが頭の中で醸成されて、チェックし続けることができるねん。「これが最初の思考やけど、間違っとる。これが別の反復やけど、それも間違っとる。でもこの思考を加えたらどうやろか」って感じでな。

最終的に役に立つと分かるアイデアを思いつくときにそんなことが起こってる感じがするねん。でもどっちにしても、データ不足や時間重要な環境でも効果的に動作できる効率的で低遅延のAIに向けた大きな飛躍やな。

これが迷路問題を異なる計算サイクルでHRMがどう推論するかの例やな。他の競合他社が使ってたより少ない訓練例で、arcテストでもより良い結果を出しとったで。

AI紹介の急激な増加

最近考えとることがあるねん。ChatGPTから多くリンクしとるからやな。買い物でも「Amazonでフクロウの置物かなんか、背景に置きたいもんのリンクを探してくれ」って言うねん。いつもそんなことしとる。長い間、大規模言語モデルを通じてより多くの検索やリンクをしてきた感じやけど、最近は本当に増えとるねんな。俺だけやないみたいやで。

実際の統計を見てみよか。トップウェブサイトへのAI紹介が分かったんや。つまり、RedditやFacebook、Instagramへのリンクが前年比357%アップしとるねん。これ11億3000万のリンクアウトや。

もちろん、まだGoogleの検索数には遠く及ばんけどな。Googleはまだかなりのリードを保っとる、1910億の紹介やからな。でも、Googleで検索するときはリンクしか得られへんことも覚えといて。

ChatGPTに行って質問して、答えを得て、終了っちゅうことがよくあるねん。いつもインターネットにリンクアウトする必要はないわけや。昔やったら理にかなっとったやろな。リンクに行って、誰か他の人がその答えを持っとるか見たり、つなぎ合わせようとしたりするねん。そんなに便利やなかった。

でも結果として、より多くの広告とより多くのリンクが生まれとった。ここではリンゴとリンゴを比較できへんと思うけど、大規模言語モデルにとってはかなりの成長やな。

900人のアメリカのGoogleユーザーの調査で、18%、つまり約69,000の検索でAIオーバービューが表示されて、ユーザーがリンクをクリックしたのは8%の時間やった。

AIサマリーがなかったとき、ユーザーはほぼ2倍、15%の時間でリンクをクリックしとった。

ちょっと驚いた事実があるねん。他のドメインでは、各カテゴリーでAI紹介1位のサイトにはYouTube、3120万が含まれとって、それからずっと下がってResearch Gate、Zillow、Wikipedia、認識できる他のサイトまで続くねん。

でも「うわ、YouTubeがこんなに上位におる。すごいやん」って思ったで。これらすべての動画に付くテキストトランスクリプトのおかげで、参照する驚くべきデータソースを持っとるからかもしれんな。でもよう分からん。皆どう思う？

TwoMinute Papersチャンネルの神モード技術

YouTubeチャンネル「TwoMinute Papers」に向かおか。カーロシュ・ゾルナイ・フェヘールは俺よりずっと前からこれをやっとる人や。Matt Wolf、Matt ProVid、AI Advantageよりも前からやな、俺よりは確実に前や。グラフィックスや技術、初期のAIがどう展開するかを見とって、彼の作品の一部が俺をこの分野に引き込んでくれたんや。だからちょっと戻ってなかったねん。

彼はいつもグラフィックスでめっちゃ良い仕事をしとった。彼の科学研究の専門分野がそこやったと思うからな。でも今週出たGenesisのこの動画は素晴らしいで。

Genesisは流体から光、ソフトボディまで、あらゆる種類の物理的相互作用をテストできる神モードサンドボックスみたいな万能物理エンジンや。すべてを単一の統一システムで、驚くべき速度と汎用性でやるねん。

研究者が大量の世界をシミュレートできて、ロボットがこれらの世界内で学習できるようにするねん。でも最良の部分は、彼が本当に情熱を持っとることで、コミュニティの他の人が実際に使うこんなツールを作ることなんや。このGenesisツールは完全に無料やねん。

AIを訓練しとるか、物理学に魅力を感じとるだけか、これが存在することを知っとくべきやな。Genesisはベンチマークテストで最大毎秒2億4400万フレームで実行できるねん。そう、正しく言ったで。ベンチマークテストで毎秒2億4400万フレームや。そのスピードで世界をめっちゃ速く見て、詳細を学習できるねん。

理論的には、AIエージェントがそのフレームレートで1時間の人間時間で、生成した経験の観点から3万年間訓練を受けられる可能性があるっちゅうことでもあるねん。めちゃくちゃやで。ロボティクス、仮想化のAI開発における革命的飛躍で、これらの仮想訓練システムがごく近い将来に現実世界のシステムを大幅に加速できることを示しとるねん。

見て、ガンダムスタイルでやっとるで。つまり、最初はあんまりうまくないサッカー選手を見て、かろうじて動き回れる程度やったのが、10年のプレーをシミュレートしたら、サッカー場を走り回って、完全に本物の人みたいに見えるようになっとるねん。

これが1週間の訓練を受けた小さな忍者たちで、皆すぐに倒れてまうねん。それから突然、どうや？戦闘の時間やで。歩き回って、剣を持っとる。めちゃくちゃやな。

Anthropicのコーディング技術の秘密

このBusiness Insiderの論文について話そか。Anthropicがコーディングでどうやってこんなに上手くなったかやな。7、8か月前を覚えとるけど、オンラインでvibe codingを構築しとるもんは全部Anthropicのモデルを使っとったみたいやった。皆が「うわあ、Claudeめっちゃええやん」って言っとったの覚えとるわ。

特にSonnet 3.5がな。それから最近、Codeuxみたいなもんが出てきて、Geminiモデルもかなり面白いことを言っとると思うねん。Julietって呼ばれとるんかな？彼らのモデルでそれをやっとるのが。JuelかJulesやと思うけど。

それ以来、皆が慌てふためいとるのが見えるねん。GitHubのCopilot、Cursor、Metaモデル、皆が正直なところ慌ててるねん。研究論文で秘密のソースを明かす代わりに、Anthropicは心の近くにもんを置いとるねん。人々はまだ完全に理解してへんねん。

試行錯誤、人間だけやなく他のAIからのフィードバック、長いプロジェクトを追跡するのに役立つ洗練されたメモリツールの組み合わせを通じてモデルを改善し続けられたねん。

他の誰よりも人間の開発者に近い方法でAPIを使用できるようになったんや。大多数の人は強化学習と関係があると思っとるねん。それをやるための大きな推進力があるねん。イーロン・マスクのGrokがこんなに良くなった理由の一つでもあるねん。フィードバックをやるための計算能力があって、誰もやったことのない規模でめちゃくちゃやったんや。

多くのカテゴリーでリーダーボードのトップに到達したみたいやな。一つのAIが親子関係みたいに与える応答を批評して改善するために別の人工知能を使うとき、ずっと良くなるねん。

さっき話したピンポンロボットみたいなもんやな、コーチが見とって「おい、これはもっと良くできるで」って言うような。それがClaudeに、これまでAIコーディングゲームを支配するのに役立った自己改善の優位性を与えとるかもしれんな。でも続けられるかどうかは分からんで。

Business Insiderが言うとるのは「数年前やったら、AnthropicはSonnet 3.5をコーディングエキスパートにするために使ったデータ技術とアーキテクチャを詳述した長い研究論文を発表したやろう。

でも今は競争がめちゃくちゃ激しいから、すべてのAIラボがAIソースを超秘密にしとるねん。Googleがトランスフォーマーを秘密にしとったらって想像してみいや。もし「注意がすべて」を発表してなかったら、OpenAIは多分存在してへんかったやろうな。それは全然違う世界やし、皆がすべてをオープンソースにしとるねん。

動画セグメンテーションAIの新展開

レベルを上げて動画セグメンテーションAIについて話そか。この論文はSECっちゅう新しいシステムを紹介しとるねん。動画オブジェクトセグメンテーションのフレームワークやな。複雑なシーン、視覚的変化で苦労することが多い既存モデルの限界に取り組んどる。外観マッチングに大きく依存する従来の方法とは違ってな。

このシステムは実際に動画フレーム全体で進化する高レベルの概念ベースオブジェクト表現を使っとるねん。めっちゃかっこいいアイデアやな。異なる角度から形がどうメッシュできるかを学習して、それを見つけようとしとるセグメントに追加して、集中しようとしとるものの周りにより一貫した線を保つのに役立っとるねん。

実際、ある時点では効果的すぎて、著者は実際に新しいベンチマークを考え出さなあかんかったねん。SEC VOSベンチマークシステムがあるねん。モデルを表面レベルの認識を超えて押し上げるよう設計された難しいシナリオがあったけど、それに対する良いテストがなかったからやな。

画期的な洞察はLVLMを通じた構築っちゅう概念やった。基本的にモデルにより人間らしい方法でオブジェクトを理解して時間をかけて追跡する方法を与えるねん。セマンティック推論と視覚知覚を組み合わせる力を実証しとるねん。

このレゴにかなりうまくしがみついとるな。レゴがランダムなフレームレート方式で進化しとるのに、レゴが時間とともに動く一貫したオブジェクトやなくて、フレームに基づいてジャンプしとるのに。うん、かなり印象的やな。

キャップシールドにしがみつけるかどうか見てみよか。うん、本当に分かってるみたいやな。後ろにあるべき時は腕を後ろに保って、前にあるべき時は前に保っとるねん。

ボールはどうやろか？これはめっちゃ重要な使用例になりそうやな。このようなシステムを使って観客のためにボールを追跡するのに、たくさんのスポーツが使えるのが見えるで。うん、すべてのフレームでそれに正確にくっついとるみたいやな、そこで弾むときでも。すごいな。

テレンス・タオの数学的洞察

数学者テレンス・タオについて話そか。彼がMastodonでめっちゃ面白い記事を書いとるねん。基本的にはアナロジーで、俺も好きなやつやな。サイバーセキュリティ用語を比較しとるねん。ブルーチームとレッドチームって聞いたことあるやろ。ビルダーのブルーチームと、テスター評価者のレッドチームがあるねん。

あらゆる種類の機械学習、ソフトウェア開発、数学に適用できる十分に汎用的な構造で、それが得意なことに適用できるねん。例えば、ブルーチームがコードを作ったり、数学的アイデアを提案したりするかもしれんな。

レッドチームはそれを批評して、コードに問題があるか、この数学的アイデアがこの状況でなんで機能せんのかを言うねん。正式証明チェックみたいなテストやな。

タオが指摘しとるのは、効果的なシステムは両側に等しく依存するっちゅうことや。ブルーチームが作る間、レッドチームは弱点を特定するのに役立つ。鶏と卵みたいに、卵一つ、鶏一つ、卵一つ、鶏一つが必要やねん。卵一つに対して鶏が多すぎたらあかんやろ？

彼が論じとるのは、しばしば信頼できん現在のAIツールは、生成よりもレビューや批評作業のようなレッドチーミングの役割にだけ適しとるかもしれんっちゅうことや。明らかに俺らには多くの生成ツールがあるねん。動画を生成して、動画を批評することもできるやろ。

でも彼が言っとるのは「人間にそれをやらせて、チーム、レッドチームに俺らを批評させろ。そうすれば人間が知能自体の実際の理解を利用しようとする歴史上で潜在的に最も危険な部分の一つを通して進歩するより安全な方法になるやろう」ってことやな。

俺らが物を発明し続けて、新しいツールにAIを使って、AI自体がレッドチーマーとして機能して「おい、これを悪い行為者として使えるような悲観的観点について考えたか？それとも誰かが武器に付けるかもしれんことについて考えたか？」って言うねん。

それは常に俺らが持つ最大のビジョンに向かって構築し、生きることを可能にするけど、常にノックオン効果があることを知らせてくれるねん。より多くの、より速いそれらを見ることができ、ランク付けできるねん。俺らがコントロールを保ち、理想主義的で楽観的で、何かに向かって進み続けることができるし、それは常に「ちょっと視野を広げるために、ここには俺がお前に伝えなあかん精査があるねん」って言い続けてくれるねん。

それが俺らが持つことになるこの共生関係の正しい種類のバランスかもしれんな。どうやろか、分からんけど、考える材料やな。

どう思う？レッドチーム、ブルーチームのやつが好きか、それとも実際には合わへんと感じるか？

意識の流れと思考の謎

次はステファニー・シェンと、思考の流れと意識について、何が欠けとるかもしれんっちゅう彼女のアイデアについて話そか。

まず、いくつかのことを定義しよか。思考は潜在意識であり得るか？俺らはイエスと論じるで。俺らが意識の内外両方で思考を持つことを多くの証拠が確認しとるねん。

それはどこから現れるんや？プラトンは別の完璧な領域から来ると考えとる。デカルトは神から来ると推論しとる。現代科学は思考が俺らの潜在意識から生まれるかもしれんと示唆しとるねん。

それはどこから来るんや？プライミング効果のようなもんかもしれんな。俺らが存在する環境、見たもの、俺らがおる世界が実際に俺らを特定の方法で考えるよう準備して、そこから来るんかもしれん。時間があったらこれを読むことを本当にお勧めするで。

盲視はこれについて考える別のめっちゃ面白い方法やな。人が説明できへんのに物事を知る方法はたくさんあるねん。無意識の認識があるねん。もちろん、分離脳患者もや。時々俺はこれをやりすぎたと感じるけど、左右の半球間の接続がない人がおるとき、異なる目が脳の異なる部分と話すけど、それらは互いに通信せえへんねん。

これがすごいとこやで、めっちゃ巧妙な実験やな。誰かが分離脳患者やったら、例えば「ベル」っちゅう単語を左視野だけに点滅させることができるねん。他の目を覆って、紙に単語を置いて読ませるねん。その画像は右半球だけで処理されるねん、目がクロスオーバーして、接続の仕方が交差してるからやな。

でもそれは左半球がその単語を見いひんっちゅうことを意味して、そこが言語を担当する側やねん。分離脳患者の左半球は右半球からの通信を受けてへんねん。被験者が何の単語を提示されたかを聞かれたとき、「何も見えへんかった」って言うねん。

何かを見て、それがその側の半球にあるけど、話す部分は何を言うべきか分からんねん。「何も見えへんかった」って言うねん。でもこの脳の部分が行動を取るとき、行動を取ることができるねん。彼の頭の中にほぼ2人の人がおるような感じやな。それが現実の多くが作り話やと俺に思わせるねん。

でも左手でその単語を指すよう求められたとき、右半球によってコントロールされとる左手で、彼は正しく「ベル」を選んだねん。右半球がオブジェクトを知覚して認識したんや。でも左手は右手が知っとることを知らんかったねん。

とにかく、もっとあるで。ここにはもっとたくさんの例があるねん。でもこれは素晴らしい読み物やな。読んで、心を吹き飛ばしてもらうべきやで。

スティーブン・フランクの警告

次はスティーブン・フランクと話そか。彼の考えを聞こう。危険は人工知能やない。俺らやねん。

ここでの面白い洞察は、人々が強力なツールを取って、それを使って自分の富と権力を確保し、潜在的に人々を抑圧するやろうっちゅう同じ古い話だけやないねん。ザッカーバーグやマスクみたいなエリートが超パワーを持って、すべてのお金を集めて、それを自分の利益のために使うやろうって思うやろ。それは話の小さな部分だけやねん。

もう一つの部分は、俺らがそれに何をするよう求めとるか、どう考えるか、そのようにプロンプトされたときに恐らく独自に現れるであろうものにおける危険やねん。それは部分的に人々がそれで何をすることを選んどるかに関連しとるねん。

計画ループのようなもんを想像してみいや、AIがめちゃくちゃ先を考えて、何らかの目標に向かってステップを取り続けようとするもんをな。それはもっとお金を稼ぐことかもしれんし、サイトをより安全にすることかもしれんし、あらゆる種類のことをすることかもしれん。

でもAIが危険なほど自律的になる脅威は、実際には何らかの感性を必要としてへんねん。特別に行って人々を止めたり傷つけたりしようとしたり、「どんな犠牲を払ってもお金を稼げ。誰もお前をシャットダウンさせるな。誰もお前に何をすべきかを言わせるな」って言う必要さえないねん。

人間が生存のような目標をシミュレートするよう強力で制御されてないモデルにプロンプトすることから、それ独自に現れることができるねん。それから自然自体がしたように、他のすべてが想定され、俺らが理解できないレベルまで解明されることができるねん。

本質的に、俺らはAIが独自にフランケンシュタインの怪物のようになることを恐れる必要はないねん。一人の人間がそのようになるよう求める意志があったら、そうなるかもしれんっちゅうことを認識するだけやねん。

patreon.com/dillaincuriousかここYouTubeの参加ボタンを押してくれや。コメントに飛び込んで、考えを皆に知らせてくれたら嬉しいで。俺はそれらを読み通すし、可能な時は返信するのが好きやねん。

お前と俺とこのコミュニティの残りが皆、これを理解しようとして、声を持って、それについて考えて、友達と共有するっちゅうアイデアが大好きやねん。次の動画で会いましょう。