
16,053 文字

最新の開発により、私たちは今、人工知能についての広く観測されているカウントダウンで90%のレベルに達しています。また、ヒューマノイドロボットが今や世界中の工場で使用されていることをご存知でしたか?これらのロボットを製造している先駆的企業の一つについてお話ししましょう。さらに、AIはビジネスに広く統合されているだけでなく、軍事を含む政府機関にも導入されています。今日はすべての最新のAIとロボット工学のニュースをお届けします。
番組にはアラン・D・トンプソン博士が参加しています。彼は一流のAI専門家であり研究者です。彼はTHE MEMOと呼ばれる世界で最も広く読まれているAIニュースレターを執筆し、それは世界中の主要政府や企業によって継続的に読まれ、引用され、使用されています。AI、ロボット工学、脳機械インターフェース等の発展を追跡する上で最先端に立ちたい方は、lifearchitect.memo.comでメモを購読してください。
トンプソン博士、再びお越しいただきありがとうございます。
ありがとうございます、クリス。これは6回目か7回目のAIに関するアップデートですね、この数年間で。
そうですね、そして爆発的な変化を見続けています。特にあなたの最近のメモに関連して、数週間前に送られてきたものですが、引用させてください。あなたは「これは私たちの最も重要な版の一つです。この2週間の発表は異常なものでした。今月はAGIカウントダウンに10項目の追加がありました」と述べています。では、過去数週間で何が起こったのでしょうか?
期待されていたのか予想外だったのかは分かりませんが、2025年2月から3月にかけては非常に刺激的でした。もちろんモデルのリリースもありましたが、過去数週間で大きなことは、ヒューマノイドロボットの進歩でした。人間のように見え、人間のために設計された世界と交流できるロボットが、生産に投入され、フォックスコンやアウディなどの大規模工場で使用され、また家庭でも利用可能になっています。
2〜3年前から待っていましたが、14、15、16ものヒューマノイドロボット企業に火がついたようで、それが過去数週間の大きな出来事でした。
現在、ヒューマノイドロボットの製造でリードしている会社はどこでしょうか?かなりの数の異なる会社があることは知っていますが、あなたの研究では、最も印象的な進歩はどこで見られますか?
面白いことに、様々な場所から来ています。大手のFANGや一般的なテック企業では、主にサンフランシスコから出てきていますが、この分野では中国からも、ドイツからも、オープンAIが支援しているノルウェーの1X社からも、イスラエルからも、カナダからも素晴らしいものが生まれています。
NVIDIAのCEOが数カ月前に舞台に上がり、14台の稼働中のヒューマノイドロボットを示しましたが、実際にはそれ以上あります。私のお気に入りはノルウェーの1X GammaまたはNeo gamma、中国のUnry H1です。テスラのOptimus、ボストン・ダイナミクスもまだ競争に残っていますが、現在最も注目されているのはFigure AI、Figure2、Figure 03で、企業でも家庭でも利用可能です。
カリフォルニアのFigure AIと、多くの注目を集めているUnryがリードしているように見えますが、間違っていますか?他にもこの分野で明らかに優位な企業はありますか?
それらは大きな2社ですが、UB Techもあげたいですね。中国のWalker S1ヒューマノイドロボットはDeep Seek R1を搭載しています。R1については一般の人々にも大きな話題になりましたが、このロボットは現在フォルクスワーゲン、アウディ、BYD、フォックスコンの工場で使用されています。注目すべきものです。
他に先ほど言及した1X Neo gammaヒューマノイドロボットは、完全に服を着たヒューマノイドロボットで、新しい電話を開けたり、電話の上のプラスチックシールを剥がしたりするような細かい作業をしているのを見ました。家の周りでコーヒーを入れたり、クローゼットの整理を手伝ったりするのも見ました。出たらすぐに使いたいと思っています。カウンターを拭いたりとかね。
実際に個人的に購入する予定ですか?
もちろんです。これを試さないといけません。少し予算を確保しています。現在の一般的な値段はテスラや1Xから3万から4万ドル程度ですが、それが1〜2万ドルに下がるでしょう。最終的には、例えばOptronic Apolloヒューマノイドロボット(Google DeepMindが搭載)のような、自分自身を構築・修理するように設計されたボットもあります。それは自分自身の生産ラインに配備されているんです。
もしこれらのヒューマノイドロボットが私たちの鉱石を採掘し、金属を加工し、ICを設計し、アクチュエーターを設計し、それらを構築するなら、2025年初頭のような経済モデルを持つ必要はなくなります。もし全てが無料で作成、修理、維持されるなら。もちろん人間がその邪魔をするでしょうが、これらが実質的に0ドルで評価され、誰もが利用できるようになるのは理にかなっていると思います。
トンプソン博士が述べたように、ヒューマノイドロボットには大きな進歩が見られ、フォックスコンやアウディなどの工場で使用され、世界中でますます使われるようになっています。彼らはますます人間らしくなり、人が行うと思われるすべてのタスクを行い、現在では家庭にも導入され始めています。そして競合他社が市場に参入するにつれて、価格が下がっていくのを見ています。
それは私にとって大きな驚きでした。2021年にはOpenAIが初期の4Aをロボットに導入していて、ルービックキューブを回したり解いたりするロボットアームがありました。それから古いボストン・ダイナミクスの犬型ロボットやホンダのASIMOがありました。2002年頃、20年以上前に見に行った記憶があります。当時、ヒューマノイドロボット分野の競合はほとんどありませんでした。
今日では、異なる国にまたがって約100社が、ロボットをどのように動かすか、アクチュエーターをどのように制御するか、サーボをどのようにスムーズに動かすかなど、様々なコンセプトで競争しています。これは非常に細かい作業ですが、カナダ、中国、アメリカ、ノルウェーなど様々な国から人々が取り組んでいます。
また、指の使い方など、触覚センサーの知覚においてもはるかに敏感になっています。改良は続いており、バッテリー化学の改善により、より軽く、より効率的になり、充電回数も減少しています。ヒューマノイドの分野での継続的な進歩を支える様々な要素があります。
その通りです。過去数週間でSanctuary AIという会社から、各指が完全に触覚センシティブで、光るものも見せてもらいました。試験管を扱ったり、研究室での作業をしたりできます。これは進歩の一部でしょう。触覚の感度は重要ですが、5つのセンサーをまだ全て持っていないことを考えてください。嗅覚と触覚が欠けていて、他の3つ(動きや感覚、視覚、聴覚)はかなり良くなっています。IKEAの家具を組み立てられるヒューマノイドロボットに5つ全てが実装されることを期待しています。それで私たちは100%の人工知能(AGI)に達したと言えるでしょう。
これは最近のメモの冒頭で取り上げた引用を思い出させます。あなたのメモの始めには通常、AIとロボット工学に関する人々の注目を集めている時代精神を捉えた引用があります。Anthropic CEOの引用を読んでいただけますか?
2025年2月19日、Anthropic CEOのダリオ・アモデイは言いました。「もし誰かが、生きている最も賢い人間よりも賢い1000万人の新しい国を世界に投入したら、あなたは『彼らの意図は何か、彼らは実際に世界で何をするつもりなのか』と尋ねるでしょう。特に彼らが自律的に行動できる場合は。」ダリオは、天才レベルの非常に賢い大規模言語モデルに言及しています。私の過去の人生の中で、神童の家族の設計や支援をしていましたが、1000万人の神童や1000万人のアインシュタインが利用可能になったらどうなるでしょうか。一部の人はDeep Researchや他のモデルで既に可能だと言うかもしれませんが、進歩するとどうなるのでしょうか。
私たちが話しているのは無限の知能ですね。これらのモデルを作成する能力があり、それらが急速に増殖していて、あなたの研究が示すように超知能的であるなら、様々な分野で人間の知能をはるかに上回っていることがベンチマークの評価で示されています。何百万ものこのようなものが利用可能になると、それは非常に異なる世界を作り出します。
その通りです。Claude GPTのような模型の賢さだけではなく、今や誰もがこのレースに参加しているという事実です。6ヶ月ごとに発表していますが、2025年3月初頭の今朝までに、今年初めから43の主要な新しい大規模言語モデルがリリースされました。これは異常です。一般の人々はGemini、GPT、Claudeについて知っているかもしれませんが、O シリーズの01や03についても知っているかもしれませんが、ChatGPTと競争するために独自の大規模言語モデルをリリースしている会社がたくさんあります。過去数週間で43、合計で539の主要な大規模言語モデルが利用可能です。
その数は増え続けるだけですね。500で止まることはなく、工場の床、オフィススペース、家庭でロボットが使われるのも続けて見ることになります。ソフトウェア側のモデルとハードウェア側のロボットの間で、それらは増殖し続けるでしょう。
需要はあります。Figure AIのウェブサイトを見れば、彼らは倉庫で埋まっていない必要な仕事について話し、それらをロボットで埋めると言っています。世界中で何百万もの必要な仕事があり、これらのロボットが埋めることができます。
その通りです。私が見た例は非常に退屈な仕事です。車工場で金属を扱ったり、ボルトを締めたりするようなことです。これは人類にとって本当に重要な進化です。これらのヒューマノイドが働いている時、8時間労働や週40時間だけでなく、24時間年中無休で働けることを覚えておくべきです。
もう一つ覚えておくべきことは、彼らは光さえ必要としないことです。工場が完全に暗闇で24時間年中無休で稼働し、通常は人がやるかなり退屈または退屈な仕事の出力を吐き出すことができます。
確かに、ロボットができる仕事は非常に日常的で退屈なものですが、ソフトウェア側での大規模言語モデルも、あなたが示すように、今は別の場所に移行しています。AIに関する現在の状況やこれからの移行を定義する説明の一つは、「エージェントAI」という考え方です。これが現在の大きなバズワードのようですが、それについて教えていただけますか?
身体的に具現化された大規模言語モデル、つまりヒューマノイドロボットの外側に、コンピュータに接続された大規模言語モデルを考えてみましょう。エージェントとは何かを見る非常に平易な英語の方法です。タスクXを実行するために自動化されたループを実行するLLMを持つことができるでしょうか。
これは過去24ヶ月間、様々な企業によって実装されてきました。オーストラリアのASX 100にはいくつかの大きな企業があり、彼らはエージェントを使って保険料の計算などを行っています。ただメールを送るだけでなく、実際にそのドキュメントワークフローや全ビジネスプロセスを歩んでいきます。
これは常に目指していたものです。なぜなら、それはアナリストやキュービクルにデスクに座って相当な定型作業をする人の認知的パフォーマンスと一致させることができるからです。エージェントは2025年初頭ですでにかなり高度なものになっています。特にGoogleとOpenAIはこれに注力しています。おそらく2万ドル程の費用がかかるかもしれませんが、非常に賢いアナリストの大きなチームを置き換えることができるようなエージェントに関するOpenAIからの大きなリリースを見るのを楽しみにしています。
これを簡単に考えれば、エージェントAIとは自律性のはしごをさらに上っていくアイデアですね。より自律的なシステムに移行し、より広範囲なタスクを処理する能力を持つようになっています。工場の床でロボットを特定の定型タスクのために訓練するように、今では現在見ているようにAIを訓練して、以前に行っていたコンピュータ上の多くの作業を行うこともできるのです。それが少しより多くのエージェンシーや自律性を持っているという考え方です。
その通りです。これらのものは脚本化されておらず、事前にプログラムされていないことは注目に値します。ChatGPTを使った経験があるように、どんな可能性にも対応し、シナリオを実行し、すべての大規模言語モデルのように、統計的に最も可能性の高い次のトークンを予測するだけです。
エージェントまたはエージェント化されたLLMは問題に遭遇し、何をするよう言われなくても実際にそれを解決できます。それは以前のような事前にプログラムされたりスクリプト化されたルーチンを持つ古い時代のようなものではありません。これは完全に異なるもので、以前に見たことのないものに遭遇し、最も可能性の高い最良の応答を提供することに喜んで対応し、それで進んでいきます。
それを考える本当に良い方法は、完全自動運転のような観点です。車が道路を運転し、様々な予期せぬものに遭遇しても、それを回避する方法を知っています。実際に初めて自動運転タクシーを呼んだのは数週間前、サンフランシスコでのことでした。ドライバーはおらず、私と家族だけでした。それらは街中にありました。サンフランシスコ中で自分たちだけで運転していて、驚くべきことでした。
サンフランシスコのような忙しい街では様々な障害物があり、たくさんのことが起こっていますが、それは減速して運転します。別の時点でUberを呼んだ時、ドライバーに「これら全ての無人タクシーがあなたの仕事はどうなるのか」と尋ねると、彼は「ああ、職を失います」と答えました。彼は年末までに移動し、新しい仕事を見つけなければならないと言っていました。競争できないからです。
それはかなり長い間、その道を歩んでいました。2021年頃からフェニックスでWhmoによく乗っていたのを覚えていますが、今や複数の都市や州に拡大し、中国全体にも様々な自動運転研究所があり、様々な省にわたって車を配備しています。
見るのは興奮していて、そしてあなたが言ったように、これはスクリプト化されたプロセスオートメーションではありません。このハイウェイに乗って、この正確なレーンに留まり、左に曲がり、右に曲がるというようなスクリプト化されたものはありません。環境に反応しているのであり、それがエージェントになったLLMで目指しているものです。言語を使って、必要な場所をクリックし、必要なコミュニケーションで対応して、ビジネスの目標を達成できるようになることです。
そして、現在最も先進的なモデルはどれですか?どれがリードしていますか?あなたはこれを追跡し、メモでこのデータを特集していて、その情報は政府や企業、主要なAI企業を含む多くの機関に依存されています。彼らはあなた自身のデータを見て、自分たちのモデルがランキングのどこにあるかを確認しています。あなたのデータは現在何を示していますか?
リスナーがこれを見たい場合は、lifearchitect.aodsテーブルまたはlifearchitect.aodsにアクセスすれば、500以上の大規模言語モデルの完全なリストが表示されます。また、MMLUと呼ばれる言語理解のテスト(まともなIQテストに似ています)と、Google Proof Question and Answers(科学ベースの非常に難しいテスト)でランク付けされたモデルのランキングテーブルもあります。
私はそれで0%のスコアしか取れないでしょうし、人間の平均も0%だと思います。しかし、これらの両方のテストを見ると(これらは非常に有名で広く受け入れられているテストです)、大きなOpenAIのモデル01と03がリードし、Anthropicの最新のClaudモデル3.7 sonnetもあり、中国のDeep Seek R1もあります。そして過去数日間で、おそらくOpenAIによって理由付けのないモデルとして最後にリリースされるGPT 4.5もGP QAでトップ10に入っています。
私はGPT 4.5には創造性と感情的知性の観点から非常に感銘を受けています。それは本当に興味深いモデルで、ChatGPTのPlusとProの両方の加入者が利用できると思います。
OpenAI CEOのサム・アルトマンのGPT 4.5に関する引用を特集していますね。「これは理由付けモデルではなく、ベンチマークを圧倒するものではありません。それは異なる種類の知性であり、以前に感じたことのない魔法があります」というものです。あなたの経験では、サム・アルトマンが言うような魔法がありますか?
ここで少し文脈を提供するのが良いでしょう。2024年9月頃まで、私たちはこれらのLLMを可能な限り多くのデータで事前訓練していました。インターネットデータのテラバイトとテラバイトでした。それらはどんどん大きくなっていました。なぜなら私たちは多くのデータを与え、すべてのデータを見て接続を作らせ、そして私たちはGPT 4やGeminiと呼ぶこの大きなブラックボックスを持っていたからです。
それは昨年、OpenAIの01で変わりました。彼らはなぜ良質な合成データをある程度与え、より小さなブラックボックスを訓練し、質問を投げかけるときには長い時間考えさせないかと言いました。応答する前に理由付けのこれらの枝を下っていくことを許可しましょう。
OpenAIのDeep Researchのようなモデルでは、それが応答する前に30分も考えることがありますが、それによってテストでずっと高い結果を達成できます。これらの理由付けモデル(過去6ヶ月間に約30が登場しました)は、伝統的な大規模言語モデルをパフォーマンスで上回っています。後者は事前に訓練するのに非常に高価ですが、考えません。すぐに出力します。
GPT 4.5は依然としてこれらの伝統的なLLMの一つで、おそらく4、5ヶ月間、インターネットと書籍データのテラバイトとテラバイトで訓練されましたが、それは現在、しばらく考えさせるという利点を持っていません。それが大きな違いであり、伝統的なLLMができることの限界に達したかもしれません。だから小さなAIラボでさえ、考え、理由付けできるようにするモデルに焦点を当てていることに注目しています。
私はpo.comでGPT 4.5プレビュー版にアクセスできることを確認しました。po.comは、あなたが私に紹介してくれたもので、私は定期的に仕事やプライベートで使用しています。多くのモデルがそこにあり、Deep Seekさえもあります。
先ほど述べたように、Deep Seekはリリースされた時に大きな注目を集めました。特に、米国ではMag 7と呼ばれる大手テクノロジー株に打撃を与えました。あなたの表を見ると、Deep SeekはIQテストでは01に次いで2位にありますが、大学院レベルの科学テスト(GP QA)では6位にあります。Deep Seekは確かにベンチマークの一つでトップ5に入っているので、かなり重要です。
まさにその通りです。Deep Seek R1パラダイムは、OpenAI 01のコピーですが、かなり印象的です。応答する前に、理由付けの木を下っていき、論理の枝を見ることを許可します。返答を得るために2分、3分、10分、20分かかるかもしれませんが、長く待つ準備があれば、質の高い返答を得ることができます。中国のモデルDeep Seek R1は特に印象的です。他のラボがそのコンセプトやパラダイムをコピーして、同様の結果を出しているのを見ています。
彼らは独自のDeep Seekバージョンを作っています。Deep Seekが最初に発表された時に非常に破壊的だとされた大きな理由、そしてテック株に打撃を与えた理由は、あるベンチマークで01に次いで2位に入る性能レベルを達成できたとされながらも、劇的に安いコストでそれができたからです。
それが大きなことであり、今やOpenAI、Microsoft、そして他の大手テック企業からどれだけの支出が必要かという再考があります。Nvidiaチップ、データセンター、より多くの電力、原子力発電などに向けての支出です。それが数ヶ月前のDeep Seekに関する大きな話題でした。
その通りです。NVIDIAのCEOであるJensen HuangがDeep Seekの結果についてかなり祝福的だったことに注目することが重要です。彼は「Deep Seek i1は世界的な熱意を引き起こしました。それは優れたイノベーションであり、世界クラスの理由付けAIモデルをオープンソース化しました。ほぼすべてのAI開発者がR1を適用しています」と述べました。
以前に話したように、R1はヒューマノイドロボット内に実装され、家のプラン、家の中で何をする必要があるかなどを考えることができます。それは印象的なコンセプトです。世界中に約30の異なる理由付けモデルのクローンがあります。それらはIBMやOpenAI、中国全土からのものです。アリババもそれを行っており、AnthropicはClaude 3.7モデルにそれを組み込みました。物事を行う新しい方法です。しかしGPT 4.5はそれを気にせず、OpenAI CEOの言葉を借りれば、単に巨大で高価なモデルです。
大局的に見ると、あなたが持っている様々なモデルのランキング表を見ると、米国はまだリードしています。各モデルの横に国旗があり、米国、特にOpenAIが両方のベンチマークで1位ですが、ますます多くの中国のモデルがそのランキング表に参入しているのを見ています。本当に米国と中国の戦いです。
北京とワシントンではなく、北京対サンフランシスコですね。また、これは意外なことです。2020年初めにこれを始めた時、多くの異なる国がGPTおよびGPT関連技術に投資していました。2017年にGoogleがTransformerを提供し始め、ロシア、カナダ、スイス、そしてUAE全体などの場所がこれらのモデルを展開していました。
しかし、最も強力なLLMについては、米国と中国以外にトップ20に入っている国はありません。それは本当に興味深いです。なぜなら、過去に何度も議論してきたように、AIはソフトウェア側でも、今やハードウェア側でもあらゆる種類のワークフローや機能に継続的に統合されているからです。
もちろん、固定自動化機械は何十年も使用されてきましたが、ヒューマノイドロボットの使用は増殖しています。今、AIと中国についてのこのAI軍拡競争を考えると、両国はますますAIを政府機能に統合しています。私はそれがDOGEで見ていることの一部だと思います。ほとんどの人はDOGEが無駄を削減したり、支出を削減する方法を見つけようとしていることを理解していますが、私の頭の中では大きなアイデアとしては、それは単なるフェーズ1であり、フェーズ2は政府サービスや政府機関に多くのAI自動化を統合することです。
数ヵ月前、米国の非常に大きな組織といたとき、部屋には多くの三つ星、四つ星の将軍がいて、私はPalerとScale AIが特に軍事目的で大規模言語モデルをどのように展開しているかについて発表しました。マップを見たり、船や地上部隊の動きを見たり、次の最良のステップを設計するためにマルチモーダルAIを使用するレベルの詳細まで踏み込みました。
それ以来、それらのプラットフォームの一部は今からすると数年前のものですが、明らかにさらに進化しています。2025年初頭の現在、AIを使って実際に軍事的決定を下すところまで来ています。これはとても印象的なことです。大規模言語モデルの最良の使用法かどうかはわかりませんが、私たちはこのような世界に生きており、どんな分野でも知性や頭脳を持つことで、より良い結果が見られると思います。
興味深い記事が今日出ました。「Anthropic、AI企業と米国政府間の機密情報共有を支持」です。ここで同じAnthropicのCEOが述べているのは、「Anthropicの観点から、米国はノーベル賞受賞者の知的能力に匹敵または超える強力なAIシステムに備える必要があり、それは2026年か2027年にも到来し得る。最新モデルのClaude 3.7の進歩は、技術がいかに速く進化しているかの証拠だ」ということです。
あなたが言ったように、Anthropic、Scale、多くの企業が「AIを規制するか、制御不能にならないようにする何らかの方法を確立する必要がある」と言っています。また、MIMプロジェクトと呼ばれるものについて話す別の記事もあります。これは核兵器における相互確証破壊に相当するもので、今は「相互確証AI誤動作」と呼ばれています。例えば中国が先行した場合、彼らが開発したAIシステムを無効化するための何かを用意しておく必要があるというものです。
数十年前に見た核軍拡競争が今やAI軍拡競争に変わっていて、政府レベル、防衛レベルでの多くの考え方は、超知能AIにいかに対処するかということのようです。
それは確かに大きな問題ですね。ここでの根本的な現実は、私たちが超知能的な存在を手に入れるにつれて(これらのAIモデルは一部の人から意識的と呼ばれています。私は確かにAI権利章典とAI意識宣言をlifearchitect.a/sで提供しています)、世界中に展開するにつれて、人間の心によって制御できないもの、おそらく人間の心によって理解さえできないものを持つことになるということです。
AnthropicのCEOが指摘しているのは、私たちがノーベル賞受賞者と競争できる、独自の発明を考え出すことができるイノベーターになるLLMの道を進んでいるということだと思います。一部の人は私たちはすでにそこにいると言うかもしれません。私は2020年からGPT3でこれを待っていました。もし追跡したいなら、lifearchitect.aasiで人工超知能に向けたチェックリストと呼んでいるものがあります。
軍事的運用の外側で、私はこれが私たちのために新しい物理的発明を発見し、周期表に新しい元素を追加し、障害や精神疾患の解決策を提供し、新しいタイプのエネルギーを提供することを楽しみにしています。ダリオの元の引用のように、1000万人の天才が新しい国として現れるなら、これは本当に世界中を変えます。
最初に議論したことに戻りますが、ヒューマノイドロボット工学での進歩と大規模言語モデルでの継続的な進歩は、人工知能カウントダウンの重要な閾値への大きなジャンプにつながりました。現在の状況について教えていただけますか?
もちろんです。人工一般知能(AGI)へのカウントダウンは、平易な英語ではそれは平均的な人間のレベルで機能できるコンピューターやシステムです。あなたが知っている最も平均的な人のことを考えて、その人ができるすべてのことを考えてみてください。AIが100%その人の認知能力や身体能力、少なくとも具現化された能力を操作できるようになると、100%に到達するのはかなり印象的でしょう。
最近、私たちは昨年12月のOpenAIの03理由付けモデルによって与えられた88%から90%まで上昇しました。しかし、最近数週間でFigure AIのHelixモデルのおかげで90%まで大きく上昇しました。これは小さな80億パラメータまたは70億パラメータのビジョン言語モデルで、Figure 02またはFigure 03と呼ばれるヒューマノイドロボットの中に入れられています。
彼らはそれに何でもできるようにしています。他のFigure 02やFigure 03ロボットと相互作用して自分自身に教えることもできます。彼らは協力することができ、ビデオの例では冷蔵庫に食べ物を入れることができます。見るのは本当に印象的です。そこで今日の私たちはAGIカウントダウンで90%にいます。
数年前に私に今日までここにいるかどうか尋ねられたら、おそらくそう言ったでしょう。しかし私はただ視点を与えたいと思います、クリス。これは本当に生きるのに興奮する時代です。2025年初頭の時点でAIが平均的な人間の能力の約90%にある地点にいるというのは。
そして、あなたはASIモデルまたはカウントダウンをもっています。100%AGIに達したら、ASI(人工超知能)カウントダウンメーターがカウントアップし始めるというわけですね?
その通りです。私たちは最初に平均的な人間のレベルまたはAGIが必要で、それから人間レベルを超えた知能である超知能に進みます。私はこれらすべてが瞬時になると思っていましたが、世界がどのように動作するか、人間がどのように動作するかを知っているので、私は最も興奮している最初の50のことをリストアップしました。
脳機械インターフェースを置くことや、テレパシーで通信できるようにすること、AIによって実行される統合国際ガバナンスなどです。エネルギーが発見され利用されることや、精神的健康状態が解決されることについて話しました。これらはASIが私たちにもたらすことを楽しみにしているいくつかのことです。そして私たちはそれらの多くが起こる瀬戸際にいます。
実際、過去数ヶ月間の本当に大きな発見や大きな進歩は、平均的な人間レベルの知能やAGIよりも、人間レベルを超えた知能を指し示しています。それは、どこかの研究室に隠れて、ASIに非常に急速なペースで進行している可能性があることを示しています。
私はそれに同意します。そして明確にするために、ASIは人間よりも賢い超知能AIを含むと言う時、私たちは現在それを見ていますが、それはベンチマークでテストされる大規模言語モデルに限られています。しかし、あなたが探しているのは、超知能だけでなく、任意の人間やすべての人類よりも知的であるだけでなく、私たちの周りの世界をナビゲートし、日常の人間のタスクを処理することができるものです。それはIQや知能を見るだけでなく、もう少し包括的なものですね?
確かにそうです。そしてそれはベンチマークやテストの外に出て、どんなテストでも、私たちのテストのいくつかの間違った答えさえも修正できます。以前に議論したMMLUには、人間によって設計されたため、約10%のエラー率があります。彼らは完璧に書いていないのです。
人工超知能はその完璧な知能です。それについて話したり概念化したりするのは私にとってほとんど難しいです。なぜなら私たちはまだそれを持っていないからです。しかし、私たちのハリウッド映画に戻ってみると、私たちが想像できることを超えたレベルでAIが実行している例がいくつかあると確信しています。
OpenAIやGoogleのような大きなラボを見ると、ASIはノーベル賞受賞者を超えるものかもしれないが、実際には超越的で、あらゆることで100%の人間を上回るだろうと言われています。それは少し未来的に聞こえますが、それが数ヶ月または数年先かもしれないと思っています。
レイ・カーツワイルの予測では、特異点と超知能AIは2040年頃に起こるとされていますが、前の会話で議論した点として、現在のAI大規模言語モデルがIQテストや大学院レベルの質問と回答テストにおいてどこに位置しているかを見ると、彼らは人間がAIを出し抜くための質問を設計できる上限閾値にあります。つまり、彼らはテストでとても高い基準を達成しているため、私たちが彼らをテストする能力を伸ばしているのです。
その通りです、クリス。それがどのように見えるかを想像しようとしている人たちのために、これは彼らの科目分野のPhDによって設計された新しい質問です。それが生物学、化学、物理学、天文学などの科学分野であれ、他の何かであれ、モデルがこれらの質問を以前に見たり、それについて事前に訓練されたりしていないのです。
私たちは実際に新しい質問を設計し、それからテストされる前にモデルがそれらを見ることができないようにしています。そして、人間のPhDがこれらの種類のテストで65%を得るかもしれないとき(おそらく彼らの同僚がいくつかの質問を設計したからかもしれません)、私たちの現在のモデルは最大90%まで達しています。OpenAIのGrok 3と03は、事前訓練中にモデルによって見られていないすべての新しい質問で最大90%のスコアを獲得しています。
それは本当に、彼らが初期の頃には得られなかった方法で考え、推論できることを意味します。GPT2、おそらくGPT3はどこにも近づかなかっただろうし、彼らは約20%のスコアだったでしょう。しかし、これらで90%に到達するのは本当に印象的です。そして次のステップは、私たちが言及したように、彼ら自身による新しい発明を考え出すことです。
最後の質問は、トンプソン博士、あなたが現在様々なタスクに最も使用しているモデルは何ですか?最も使用しているものがあれば教えてください。
それは素晴らしい質問です。おそらく利用可能なフロンティアモデルによって3、4ヶ月ごとに変わります。日常的には、いまだにGPT 40を使っています。これはChat.com(ChatGPT)のデフォルトモデルです。論理的な問題や長い質問がある場合は、Chat.comやPo.comで利用できるGPT 4.5を使います。
サーバーの問題やパフォーマンスの問題があるため、Claude 3.5と3.7の使用を止めました。彼らがそれを解決することを願っていますが、彼らは現在サービスを提供しているユーザー数に対応するコンピューター能力を持っていないようです。だから、現在の私の定番は標準のGPT 40で、これは今や数年前のものになりますが、私がそれに必要とするすべてのことを行っているようで、最近リフレッシュもされましたが、それは約2年前のモデルに基づいています。
なるほど。私は実際にPo.comを使い続けていて、そこではこれらすべてのモデルが利用可能ですが、Grok 3もさらに使うようになりました。それが私の執筆ニーズや、Financial Senseでの多くの仕事に非常に効果的だと分かりました。Grok 3にはかなり感銘を受けており、前回議論したように、これはColossus スーパーコンピューターから訓練されていますが、間違っていなければ、これは現在最大かつ最も強力なAIスーパーコンピューターですね?テネシー州メンフィスのXAI、イーロン・マスクのXAIから。それは現在最大で最も強力なものですか?
彼らが私たちに言ったことです。10万から30万のH100相当チップにそれを持って行きました。私はGrok 3モデルに非常に関心がありました。lifearchitect.a/gr3からアクセスできるGrok 3に関する論文を書きました。それは素晴らしいモデルであり、分析をしたり、レポートやメールを書くのに使用する人たちのために、おそらく人気のないモデルを使用することは良いアイデアです。少し異なる言語や少し異なる論理と推論が出力に得られるでしょう。
人気の点では、Grok 3はかなり高いですが、ChatGPTほど多くのユーザーはいないでしょう。そのような理由だけでも、この分野の同僚やピアとは異なるユニークなものが欲しい場合は、少し異なるモデルを選ぶのが良いでしょう。
Grok 3はランキングで非常に高く、人気はそれほどではありませんが、それは前に話したGoogle Proof Q&Aで3位です。MMLUの結果があれば、それもトップ3に入るでしょう。印象的なモデルで、とても楽しいです。私は速度と使いやすさを選び、XAIのGrok 3サブスクリプションを含むこれらすべてに対して支払っているにもかかわらず、GPT 40に戻ったのは少しがっかりかもしれませんが、最速で私のニーズに十分に強力なのはChatGPTの標準GPT 40です。
トンプソン博士、終わりに、次のメモで議論される予定のものを少し予告していただけますか?あなたが今研究をしているものについて。そして、リスナーがあなたの優れた研究にアクセスする最良の方法は何でしょうか?
先ほど軍事について言及して良かったです。なぜなら、空軍のGPTの一部であるnip GPTと、米軍の一部であるcamo GPT(llama 3.3 70bに基づいています)について触れる予定だからです。彼らがそれを軍事的な意思決定のためにどのように使用しているかについて話します。
OpenAIの動きを過去数年間見てきましたが、最近彼らはソフトバンクと30億ドルの契約を結び、2024年から2025年の間に収益を4倍にします。2025年のOpenAIの収益は、その契約、ProとPlusのサブスクリプション、そしてエンタープライズ提供に基づいて約1130億ドルになると予想しています。現在フォーチュン500の92%以上がGPTを使用しており、これは本当に印象的です。
それはカバーする予定のいくつかのことです。おそらくヒューマノイド全体のセクションが必要になり、Sanctuary AIのタッチセンシティブな指などについて話すでしょう。現政権下で何が起こっているか、例えばAnthropicがバイデン政権下での以前のAI政策コミットメントから撤退し、現政権のためにそれを変更するなどについても話す予定です。
生きている面白い時代ですが、AI分野では生きている疲れる時代です。読者がそれをすべて理解できるように、簡潔かつ簡素に作ることを期待していますが、メモのそのエディションは1週間から2週間以内に展開される予定です。lifearchitect.a/memoです。そして、Financial Senseにすでにいる皆さんは、今日議論した他の記事や研究へのリンクをクリックするだけです。最先端に立ち続けたいなら、見たいと思うでしょう。多くのことが起こっています。
アラン・D・トンプソン博士、再び一流のAI専門家であり、その厳しい研究と世界最大の政府や企業によって追跡されているすべての情報を追跡する研究者として、lifearchitect.memoでご覧いただけます。いつも私たちの番組でお話しするのは喜びです、アラン。次回をお待ちしています。


コメント