92% – AGIのカウントダウンがまた上昇!

AGIに仕事を奪われたい
この記事は約18分で読めます。

10,383 文字

92% - The AGI Countdown Just Jumped Up Again!
Try LTX Studio⤵ ‪@LTX.Studio NEWSLETTER ✉️ PATREON 💰 SOCIALS ⤵▶️ YouTube: 📸 Instagram: 🐦 Twitter/X: 🧵 Threads: 💼 LinkedI...

大きなニュースがGeminiから出てきました。新しいモデルではなく、物理的な世界のロボティクス版Geminiです。そのコアにはGemini 2.0がありますが、それ以上のものです。特定の目的のために微調整されただけではなく、実世界を学習し、ロボットに視覚を与えています。
このモデルはビジョン・言語・アクションのために構築されたVAモデルで、ロボットが自然言語コマンドに従い、新しい状況に適応し、人間のような器用さでオブジェクトを扱うことを可能にします。彼らが見せている複雑なことを見てください。
バッグのファスナーを開ける、ジップロックの容器を閉める、紙を折り紙の形に折る…これを見て、あと数年でロボットがドアを優しく開け、車に入って取っ手を動かし、何かを取って台所に持ってきたり、あなたとチックタックトーで遊んだり、洗濯物をたたんだりすることができるようになるのはほんの数年後ではないと言えますか?これは将来の科学フィクションの世界ではなく、すぐにあなたや私が経験することになるでしょう。ロボットとサイコロ遊びをしている様子を想像してみてください。
ただボードゲームやルービックキューブ、チェスをして遊んだり、テレビの裏のケーブルを整理したりしているところを想像してみてください。いかに注意深くベリーを扱えるかを見てください。毎朝起きてブルーベリーヨーグルトのスプレッドがすべて完璧に用意されているところを想像してみてください。「ヘイ、グリムロック、なぜバナナの皮むきができないの?」Gemini 2.0を追加しないと…
これは最悪の状態であることを覚えておいてください。Gemini 3や4、そしてロボット用のさまざまなフォームファクターを想像してみてください。おや、アレンの保守的なAGIカウントダウンが92%に上昇したことがわかりました!
ちょっと待ってください、これは私の資料に準備されていませんでした。これに気づいていなかったのですが、Gemini Roのためにカウントダウンが上がったんですね。これは完全な偶然でした。私はこれを数時間前にTwitterで見て紹介したかったのですが、それがAGIへの保守的なカウントダウンを2ポイント押し上げたんです。
GPT-4oのレベルの知能、あるいはより低い推論モデルが実世界のフォームファクターで動いていることから、アレンがこの最後の10%をどう考えているかは理解できます。しかし、なぜこの人はときどきこんなに急に上がるのでしょうか?速すぎるように感じますが、おそらくそうではないのでしょう。それを理解しようとしているだけです。
Gemini roboticsはGemini 2.0を使用して、幅広い実世界のタスクを理解し一般化します。これらの動きは事前定義されておらず、ロボットは見ているものと動き方の両方について推論しています。これらはロボットが以前に見たことのないオブジェクト(バスケットボールとバスケットボールのフープ)ですが、Gemini 2.0がバスケットボールとスラムダンクの概念について持つ理解を活用して、ロボットはタスクを理解します。
高い器用さのタスクはロボット工学の最大の課題の一つです。「オレンジ色の正方形を折り紙のキツネに折ることができます」「それは楽しそうですね、試してみましょう」「折り紙という言葉は、日本語の『折り』(折る)と『紙』(紙)という言葉から来ていることを知っていましたか」
これらの能力はGemini 2.0の世界の物事の詳細な側面に関する空間的理解によって可能になっています。「キツネの目を描くべき場所を指摘できます」最も重要なことに、Gemini roboticsは汎用的です。Gemini 2.0の世界理解を使用して、幅広い実世界のタスクに一般化します。「赤いサイコロを緑のサイコロと同じ数字になるように裏返せますか」
多くのロボットは事前定義されたアクションを実行できますが、これらの動きは事前定義されていません。ロボットは見ているものと動き方の両方について推論し、私たちが頼んだように赤いサイコロを合わせる方法を理解します。
この一般化はさらに進み、このモデルはトレーニングされていない次のようなタスクにも一般化できます。「バスケットボールを拾ってスラムダンクしてください」これらはロボットが以前に見たことのないオブジェクトですが、Gemini 2.0がバスケットボールやスラムダンクなどの概念を理解していることを活かして、ロボットはタスクを理解します。現在、私たちは次世代のロボットAIエージェントを構築するために一緒に取り組んでいる信頼できるテスターのプログラムに、より多くのパートナーを招待しています。
誰かが、人々の地下室の壁に常に見かけるあの奇妙な魚の中にAIを入れました。「やあビリー」「おっ、どうした、驚かせてしまったか。調子はどう?筋トレの準備はできてる?」「いや、ちょっとアドバイスがほしいんだ。難しい性格の人とどう付き合えばいい?」「よく聞いてくれ、冷静に、自信を持って、明確な境界を設定し、相手を変えることはできなくても自分の反応はコントロールできることを忘れるな。否定的なことを跳ね返すターミネーターのように強くあれ、リスタ・ベイビー」「アドバイスありがとう、ビリー」「どういたしまして、さあ出かけて行ってやれ。覚えておけ、強さと忍耐だ。もし他にアドバイスが必要なら戻ってくるからな」
もうすぐ私のトースターや魚の壁掛けと話すことになるのでしょうか?奇妙なロボットアームがバレーボールをしていて、ハムスターの足跡で暗号通貨を安全に保管する新しい方法もあります。Gemini roboticsが物理的AIを実世界にもたらしています。
ハーバードビジネスレビューは、ジェネレーティブAIが仕事にどう影響するかを深く掘り下げました。Palenは今、宇宙認識のための新しいAIプロジェクトに取り組んでいます。中国から出てきているAIの最大のブレークスルーは現在「六小龍」と呼ばれています。私はこの新しい用語をあなたに教えたいと思います。
Side Beanはaiの致命的な欠陥を暴露しました。話したい新しいAI防御モデルがあります。研究者たちはクラウドソーシングされた比喩を通じて認識を測定することで、一般市民がAIについて実際に何を考えているかを理解し始めています。MITはドージが実際に人工知能を使って政府予算を削減する方法について深く掘り下げました。
リンダ・キャロルは大人として私たちと話したいと記事を書いています。AIの非開示使用に対する制裁について話し、AIが現在気候に害を与えているように見える大量のエネルギーを消費しているにもかかわらず、長期的な解決策のための解決策を考え出すのに十分なスマートさを持っているかという考えと格闘しています。もしそうなら、すべてがバランスを取るかもしれません。
まず、このエピソードのスポンサーであるLTX Studioについてお話ししたいと思います。彼らはこれまで以上に優れており、カスタムビデオを作成するための機能が増えています。今日はキーフレームを使って物語を作成し、ショットを正確にアニメーション化する方法に焦点を当てたいと思います。
このロボット恐竜が一晩中起きていて、日の出直後に電力が切れるシーンを想像しています。変更したい領域をマスクし、テキストプロンプト「ロボットの目が暗く」とジェネレーティブフィルを使用できます。最終フレームが気に入りました。森の反射まで捉えています。間違って開始フレームではなく終了フレームを修正してしまいましたが、ボタンを使って簡単に入れ替えられます。
モーションプロンプトを追加できます。「ロボットの電力が切れると目の光エネルギーが消えていく」というプロンプトを使用します。電力が切れるにつれて目の光が消えていくのが見えます。これは本当にクールです。今すぐLTX Studioで遊べます。リンクが説明にあります。このビデオのスポンサーになってくれて感謝します。
ハーバードビジネスレビューがジェネレーティブAIが専門知識の価値をどのように変える可能性があるかについてより詳しく調査しました。研究からの要約です。ジェネレーティブAIは5000万の米国の仕事に影響を与えるでしょう。すべてではありませんが、かなりの数です。一部のタスクを自動化し、場合によっては生産性を向上させるでしょう。
現在、労働者の約12%、約1780万人がエントリーレベルのタスクが大部分自動化される可能性のある役割にいます。つまり、1800万人が仕事を自動化によってリスクにさらされる可能性があります。これは下位レベルのスキルを学び、業界に参入することも難しくなります。波及効果があると思います。ジュニアソフトウェアエンジニアがいなくて上級者だけだと、最初の仕事を始める前にかなりのトレーニングが必要になります。もちろん、AIも私たちを教育するのが上手くなるかもしれませんが。
労働者の19%、約2860万人はAIがスキル習得を簡単にする分野にいます。これにより、ネットワーク管理やデータウェアハウジングなどの需要の高い仕事への障壁が低くなる可能性があります。より複雑なことをプロンプトで行えるようになるからです。
ソフトウェア開発者として年々経験を積むと、どんどんお金が増えていきますが、レジ係だと一生同じ職業で価値を高めるスキルを身につけることがありません。その間に多くのものがあり、大工は何度も繰り返すと役立ちますが、信用アナリストや保険数理士のようには上昇しません。土木技師や建築家は中間にいます。
将来のために、最初の仕事で身につけるスキルの種類について考える必要があります。正しい場所でのインターンシップや、少し複合的なスキルを与えてくれる低賃金の仕事を受け入れることを考慮する価値があるかもしれません。しかし、このAIと雇用可能性の問題は日々様子を見る必要があります。無意味かもしれないし、大きな問題かもしれません。fence上にいるのは、過去には多くの仕事が失われた時代に次の仕事が何になるかを想像するのが難しかったことを知っているので、その意味で謙虚でありたいと思います。しかし問題になりそうな感じがします。
私たちのお気に入りの軍事AIパートナーであるPalantirは、宇宙領域認識のためのAI駆動ソリューションを開発しています。これはちょっとクールで、おそらくスペースフォースとのプロジェクトです。潜在的な衝突を防ぐために宇宙のオブジェクトを検出、追跡、分類するのに役立ちます。空港で飛行機同士がぶつからないようにするのと似ていると思います。
現在、宇宙ベースの資産からのリアルタイムデータにAIを適用して、意思決定者に重要な洞察を提供することで国家安全保障を向上させています。これはSDAシステムと呼ばれるオープンアーキテクチャで、信号処理技術とPalのAI機能を統合して宇宙防衛と革新を前進させます。Palantirについて話すたびに、彼らが何をしているのか不思議に思います。AI分野の他の企業とはかなり異なる感じがします。
米国には多くの素晴らしいテクノロジー企業がありますが、中国では過去数ヶ月の間にアメリカと中国の経済の両方に衝撃を与えたいくつかのものが出現しました。現在、最大のブレークスルーが落ち着き始め、残りのものは「六小龍」と呼ばれています。
中国の六小龍はUnry、Deep Seek、Game Science、Brain Code、Deep Robotics、Many Core Technologiesです。UnryとDeep Seekは最近ニュースでよく見かける2つです。Deep Roboticsは脳コンピュータインターフェース企業で、NeuralinkのようなものですBrain Codeは空間インテリジェンス、Game Scienceは基本的に中国版GTAのようなトリプルAタイトルを作った会社です。最も有名なゲームは「Black Myth」で、2500万本以上売れました。
Side Beanも約1週間前に動画を投稿し、非常に人気になりました。53.9万回再生された「AIには致命的な欠陥があり、誰も修正できない」という動画です。動画のポイントを言うと、これらの機械知能システムが何をしているのかを解釈するさまざまな方法を探り、最終的にAGI、安全、調整済み・未調整などと呼ぶべきものについて混乱します。
思考の定義に苦労し、知能の定義にも悩み、意識についてはさらに言うまでもなく、本当に混沌としています。問題を放棄すると、見るものすべてを「それは生きている、意識がある、知的だとは感じない」と頭の中で片付けてしまいます。それはひどいと思います。知能についてもっと広い考え方を持つ必要があります。
動物界で見られる多くのことが一般の人を驚かせるでしょう。それを100倍緩くして、それをすべて知的と呼び、知能を設計し始める際にそれについて考えてください。潜在空間で得られる基本的な圧縮を活用し、多次元の物事を特定の方法で整列させると意味を見出すことができます。
それらはゆっくりと調整され、この巨大で複雑なものになりますが、そこにはいたるところに隠された意味があります。一つの形は脳内のニューロンの集まり、もう一つはシリコン上ですが、アーキテクチャ、スケーリング、合成データなど、それらはすべて意味を見つけるのに役立ちます。その意味はさまざまな形で現れ、多くの異なることを行うことができます。だからこそ、人類の歴史におけるこの変化は非常に異なるものになるでしょう。
AIモデルを敵対的攻撃から守る新しいAI防御方法があります。ロスアラモス国立研究所の研究者たちはAIモデルに対する敵対的攻撃に対して新しい強力な防御を開発しました。これは良いことで、このような対策がもっと必要です。彼らはこれを低ランク反復拡散モデル支援(LORDIM)と呼んでいます。
敵対的攻撃とは、AIを誤った予測に誘導できる微妙な操作を伴います。このLORD技術がそのような攻撃と戦う方法は、生成的デノイジング技術とテンソル因子分解を使用して有害なノイズを特定することです。ChatGPTに比喩で説明を求めると、生成的デノイジング技術は古いほこりっぽい絵を掃除するようなものだと言いました。
傑作が汚れで覆われているところを想像してください。あまりにも強くこすると作品の一部を消してしまうかもしれませんが、あまりにも優しく掃除すると一部の汚れが残り、イメージが台無しになります。生成的デノイジングは同様に機能し、AIは汚れ以外は何も取り除かないように画像の何をきれいにするべきかを学習します。
テンソル因子分解については、様々な色の服でいっぱいの散らかったクローゼットを整理することを想像してください。巨大な山を扱う代わりに、アイテムをシャツ、ズボン、ジャケットなどのカテゴリに分けると、パターンを見つけやすくなります。AIでは、テンソル因子分解が複雑なデータをよりシンプルな構成要素に分解し、それ以外の場合は気づかない可能性のある巧妙な敵対的トリックを発見して濾過しやすくします。
チームは実際にスーパーコンピュータを使用してこれらの大規模シミュレーションをシミュレートし、大幅に役立つことを証明しました。このブレークスルーは科学研究から国家安全保障まで、さまざまなアプリケーションにわたるAIセキュリティを強化する可能性があります。
人々がAIについてどう考えているかの研究についてお話ししましょう。AIの人間らしさ、暖かさ、信頼は最近大幅に増加しています。「ツールから泥棒へ:クラウドソーシングされた比喩を通じたAIの公共認識の測定と理解」という研究です。
この記事は非常に興味深いです。なぜなら、人々が実際にAIについてどう考えているかを研究するために、彼らは1年間にわたって多様なアメリカ人グループから収集された12,000の比喩を分析したからです。従来の調査に頼る代わりに、参加者にAIを比喩を使って説明するよう求め、それによって社会におけるAIの役割に関する多くの潜在意識的な信念が明らかになりました。
研究は20の一般的な比喩を特定しました。AIを役立つツールや教師として見るものから、泥棒のようなより懐疑的な用語まであります。時間の経過とともにパターンが現れ、人々はAIをますます人間らしく見るようになり、驚くべきことに、モデルがスマートになっているにもかかわらず、人々の認識ではAIの能力は低下しているとされています。
これを説明するのは難しいですが、おそらく慣れてしまっただけで、以前ほど印象的ではなくなったのでしょうか。あるいは、モデルが特定の指標や測定値を操作し始めているが、実世界では役立つと感じないのかもしれません。その他にも興味深いことがあり、女性や高齢者、有色人種の人々はAIを人間化する傾向が強いという人口統計学的な違いが現れています。これらの異なる人口統計がAIについて考える方法は、彼らの信頼と採用レベルに影響を与えています。
イーロン・マスクのDOGEについて話しましょう。これは古い官僚主義を削減するための新しい官僚機構のようなもので、政府をよりスリムで無駄のないものにすることを目的としています。彼らが使用しているツールの一つが人工知能です。MITテクノロジーレビューはAIがDOGEの政府予算削減を助けることができるかどうかを検討しました。答えは複雑であり、それが最も興味深い種類の答えです。
AIは大量の情報を処理でき、政府には統一されていない多くの情報があるので、AIモデルがこれらの処理を始めることを考える理由は理解できます。これまでのところ、DOGEは連邦予算を分析するためにAIモデルを使用していると述べており、おそらくDEI(多様性・公平性・包括性)や多様性イニシアチブを不必要なプログラムとみなしているため、それらを特定するために使用しているのでしょう。
両側に議論があります。一部の人々は、このようなツールを使用してMedicareやMedicaidの詐欺を検出することで数十億ドルを節約できると言いますが、それは確かに真実です。しかし、透明性があまりなく、政府にはより多くのチェックアンドバランスが必要かもしれません。民主的なプロセスで行われていないようで、場合によっては証拠よりもイデオロギーに依存しているようです。
良い政府は慈悲深い独裁者とも言われますが、トランプとイーロンは慈悲深いのか、彼らは正しいことをしているのかと疑問に思うでしょう。彼らは明らかにそうだと言うでしょうが、チェックアンドバランスがなければ検証するのは難しいです。結果は混在していると思います。
例えば、詐欺検出にAIを使用することは理にかなっているように見えますが、それを全て理解するためには、以前は私的な官僚情報だった全ての機密データをAIに入れる必要があります。これらのシステムがインターネット全体を圧縮できることは知っていますが、米国政府がこれまで使ったお金をすべて圧縮し、もし別の国がハッキングしたり、不適切に使用されたり、プロンプトインジェクションされたりすると、すべての国家機密を漏らしたり、詐欺を行うのに必要なものを正確に提供したりする可能性があります。
これらのことが起こる場合、市民として可能な限り透明性を要求すべきだと思います。情報公開法の対象であり、最近聞いた限りではそれが保持されています。政府がより効率的で小さくなることを望んでいますが、それがイーロン・マスクが考える効率的な政府のバージョンだけになってほしくありません。それは彼を平均的な人よりも助けるものになるかもしれません。
リンダ・キャロルはAIが実際には文章を書いていないこと、そしてAIが非開示の問題に使用される場合にどう考えるべきかについて大人として話したいと思っています。これはサム・アルトマンの最近の投稿で考えることができます。彼は新しいモデルをトレーニングしたと述べました。これは内部モデルで、まだ見ていないものですが、クリエイティブライティングがとても上手で、雰囲気とメタフィクションに彼は感銘を受けたと述べました。
物語生成は素晴らしいものになるでしょう。将来的にはLTX Studioなどで実装されて、さらにクリエイティブなものを書くのに役立つかもしれません。しかし、リンダはライティングの本当の意味について話したいと思っています。
人々はアイデアを提供したという理由でAIを使用したライティングを正当化することがよくあります。プロンプトから始まり、それが箇条書きから物語に展開するだけですが、彼女はアイデアを持つことは仕事をすることと同じではないと主張しています。アイデアを持ち、それを頭の中で考えることが本当のクリエイティブライティングのプロセスであり、それを全体として考える必要があります。
歴史的に多くの場合、私たちは考える人ではなく創造者にクレジットを与えていると彼女は言及しています。電気自動車や交通を整理する方法について考えた人はたくさんいるでしょうが、信号機、冷蔵庫、電気自動車は最初にアイデアを持った人だけにはクレジットされていません。彼らはそれを洗練し、作り出す必要がありました。
魔法の世界とウィザードについての本のアイデアがあるとは言えず、それからハリー・ポッターに相当するものを持つことはできません。彼女はすべての詳細、すべてのキャラクター、世界と伝説がどのように見えるかを考え抜いて、本当にハリー・ポッターを作り出さなければなりませんでした。
米国著作権局はAI生成テキストが著作権の下で保護されていないことを明確にしており、その使用を開示しないことは不誠実です。著作権で保護されたデータのスクレイピングはこれまでほとんど気づかれていませんでしたが、AIがこれほど素晴らしい仕事をし、それをそのような規模で行うことができるという事実を認識する必要もあります。
人間によってキュレートされ、人間によって洗練され、人間がそのプロセス全体を行ったことを証明するためにブロックチェーンに置くなどの人間のアイデアを本当に探していない限り、AI生成コンテンツがすべてであると仮定しなければならないでしょう。それはインターネットを支配し、ライティングの質は劣化または向上するかもしれませんが、人間らしさは少なくなるでしょう。
ライティングの完全性を気にするなら、プラットフォームは多くの書かれたものに人間がどこにいるのかを理解する方法を見つける必要があり、おそらくライティングにおけるAIの非開示使用に制裁を課すときかもしれません。
緑の未来とAIがエネルギーの観点から世界に害を与えているに見えているにもかかわらず、実際には価値のある投資になる可能性について話しましょう。将来、非常に知的なシステムが緑のエネルギーを生み出す方法、核融合を機能させる方法、炭素温暖化を相殺する方法についてのアイデアを思いつくかもしれず、それが環境にとってプラスの純投資になる可能性があります。
その考えに対して私は徐々に温かみを感じていますが、完全に確信があるわけではありません。しかし、人間を超える知能ができることを疑うことはできません。素晴らしいものが豊富に生まれる姿を想像できます。また、制御できないことや人間が予想も望んでもいないことを想像することもできますが、そのひとつが効率性かもしれません。
現在、エネルギーの使用を管理し、以前の方法と比べて実際に節約するような方法でAIが大規模なサーバーファームに導入されています。すべてのこれらの材料科学のブレークスルーにより、より効率的な新しい太陽光パネル、新しいバッテリーのブレークスルー、米国の電力網を強化して効率化する新しい方法が登場するかもしれません。
もし環境全体にとって人工知能が純粋にプラスになると思うなら、以下にコメントを残してください。スターゲイトプロジェクトのような何千億ドルものプロジェクトが、機能させるために新しい原子力発電や多くの化石燃料を必要とするかもしれませんが、5年、10年、15年先のことを考えると、その知能を使って地球を救うために何ができるかという点で純粋にプラスになると思いますか?
このチャンネルをサポートしたい場合は、patreon.com/dillanに行ってください。月に3ドルでもとても意味があります。現在91メンバーがいますが、すぐに100に到達したいと思っています。このコンテンツに月額5ドルや15ドル寄付してくださるとさらに嬉しいです。または、YouTubeを使用している場合は、ビデオの下にある参加ボタンをクリックすると、基本的にパトレオンシステムの代わりにYouTubeシステムを通じて同じことができます。
今日はこれで終わりです。アレンの保守的なカウントダウンが92%に達したことが信じられません。専門家がこれほど長い間考えてきたことを認めるまであと8%しかなく、私たちがAGIのある世界に住んでいると本当に信じています。1〜2週間ごとに1%ずつ更新されていますので、単に10〜15週間先なのでしょうか?

コメント

タイトルとURLをコピーしました