
10,562 文字

まず1つ目のニュースとして、中国の新しいヒューマノイドロボットについてお伝えします。中国は非常に急速なペースでこれらのロボットを開発しており、ロボットをより柔軟にする様々な方法が見え始めています。2025年までにロボット工学分野でリーダーになるという中国のイニシアチブがあることは周知の事実です。今日、2022年に設立された深センを拠点とするスタートアップのLimb X Dynamicsが、Boston Dynamicsと競合することを目指す新しいヒューマノイドロボットで成功を収めています。
このロボットが現在見せているポーズについてご存知ない方のために説明すると、これは有名なBoston DynamicsのAtlasロボットがデモ動画で披露したものを再現しようとしているものです。アメリカで開発されているものを素早く再現できることは非常に興味深く、技術の急速な進歩を考えると、このような海外展開は当然の流れと言えるでしょう。
2025年には物理シミュレーションの効率が格段に向上することで、ヒューマノイドロボットは大きな飛躍を遂げることが予想されています。これまでに見たことのないような動きを見せるようになるでしょう。中国の非常に効率的な製造能力を考えると、これらのロボットを量産し、工場で実際に稼働させ始めることは非常に興味深い展開となるはずです。
ポイント2として、最近のAIコミュニティで注目すべき点があります。人工超知能(ASI)についての議論が、より現実的な文脈で語られ始めているのです。もはやそれは誇張された用語やクリックベイトではなく、将来のAIシステムの実現可能な可能性として捉えられています。GoogleのAIプロダクトリードであるLogan Kilpatrickは、ASIへの直接的な道筋が月を追うごとにより確実になってきていると述べています。
これは非常に重要な発言です。以前は、人工超知能について公に語っていたのは主にIlya Sutskeverだけでした。AGIに関する発言でさえ、AIバブルに踊らされている人々の言葉として無視されがちでした。しかし今では、他の研究所や個人も超知能について語り始めています。
これはElkのミッションに関連しており、人工超知能を指しているのですが、IIya Sutskeverが追求しているものを考えると納得がいきます。Googleが最近、テストタイム計算を活用した新モデルをリリースしたことを考えると、ASIが視野に入ってきているという彼らの発言は、私たちが全体として一つの方向に向かっていることを示唆しています。
彼はさらに説明を続け、人工超知能への直接的なアプローチを目指して会社を設立したことや、当初はモデルのファイアウォールを回転させることで実際のムーブメントを構築できると考えていたことを語っています。しかし、Ilya Sutskeverが早期に兆候を察知していたテストタイム計算のスケーリングの成功は、単純にスケールアップを続けるという直接的なパスが実際に機能する可能性があることを示しています。
彼は、AIは依然として実現するだろうが、4年前のコンセンサスとは異なり、歴史的な転換点というよりも、短期間に多くの反復と小さなオプションを伴う、ただの製品リリースのように見えるだろうと述べています。
2025年に何が起こるのか気になる方のために、Samの予測についてのビデオを作成しましたが、さらに詳しく主要なテーマを見てみましょう。彼は人工汎用知能(AGI)について言及しており、これはSam Altmanがポッドキャストで2025年に実現すると明確に述べたものです。これは確かに魅力的なものとなるでしょう。
また、GPT-5を心待ちにしている人々のために、はるかに優れた4.0アップグレード、より優れたメモリ機能の実現についても言及しています。より長いコンテキストウィンドウは、より多くの入力を可能にし、様々なタスクに効果的です。実際、Googleの200万トークンのコンテキスト長は、様々なタスクにおいて驚くべき性能を発揮しています。
ディープリサーチ機能も興味深い点です。これはGoogleの主力製品とは言えませんが、現在最も過小評価されているAIツールの一つです。私はこれについてのビデオを作成し、スーパープロンプトを作成しましたが、これは2025年最大のツールの一つになると思います。なぜなら、これは基本的にAIエージェントがあなたの代わりに研究を行うものですが、人々はまだそれを知らないからです。それは単にディープリサーチと呼ばれているだけです。
OpenAIがこれをリリースした際には、非常に素晴らしいものになるでしょう。もちろん、より優れたSoraも期待できます。これは興味深い点です。なぜなら、Soraがリーディングモデルだった時、OpenAIには何か優れたものをリリースする圧力はありませんでしたが、今やリーディングモデルではないため、SoraがV2より優れているかどうかを確認する必要があります。これは非常に困難な feat となるでしょう。
Soraがリリースされる際には、Googleのvo2よりも優れている可能性が高く、これは動画制作業界にとって何を意味するのか考えると、絶対に信じられないほど素晴らしいものになるでしょう。
また興味深いことに、Altmanは「来たるべき多くの素晴らしいアップデートについては、全く言及されていないか、ほとんど触れられていない」と述べています。これは非常に興味深い点です。つまり、2025年のOpenAIのロードマップには多くの驚きが含まれているということです。おそらく、私たちが必要としているが、まだリクエストしていないツールや製品、サービスによって、また驚かされることになるでしょう。
これはOpenAIを成功に導いている重要な要因の一つだと思います。彼らは単にAIを作るだけでなく、それを本当に優れた製品に仕上げているのです。例えば、ChatGPTを使用する際のユーザーインターフェース、さらにはSoraを使用する際も、他のどのAIツールよりも顕著に効果的です。これが、この会社が今後も成功し続ける理由だと考えています。
しかしOpenAIにとって残念なことに、会社の成功について語る際、AIの父と呼ばれるJeffrey Hintonの発言を見てみましょう。彼はElon MuskのOpenAIに対する訴訟を支持しており、OpenAIが完全な営利企業になることを阻止するための予備的差し止めを求めています。
ニュースをご存じない方のために説明すると、OpenAIはミッションを推進するために営利企業になろうとしていますが、元々はチャリティー組織で、Elon Muskは何百万ドルもの寄付を行いました。そのチャリティー組織が寄付金を営利企業に転換しようとしていることに、彼らは当然ながら不満を持っています。
これはElon Muskが単にOpenAIが先行していることに嫉妬して、彼らの速度を遅らせようとしているだけかもしれません。しかし、AIの父が今これを支持しているのは非常に興味深いことです。
彼は次のように述べています:「OpenAIは明確に安全性重視の非営利組織として設立され、憲章で様々な安全性関連の約束をしました。また、非営利のステータスから税制上やその他の利点を得ていました。それが不便になった時にすべてを破棄することは、エコシステム内の他のアクターに非常に悪いメッセージを送ることになります。」
これは非常に正しい指摘です。チャリティーとして始まった会社が、時間の経過とともに「営利企業になろう」と決めることができるのであれば、それは企業にとって非常に悪い先例となります。他の個人もこの構造を利用して、自社の成功を確実にしようとするでしょう。
したがって、OpenAIが営利転換を許可された場合、非常に技術的な対応が必要になります。なぜなら、様々な個人が非営利組織を立ち上げ、それを営利企業に転換するという道を開くことは望ましくないからです。私は法律の専門家ではありませんが、特定の事柄を許可すると、他の人々も同じことを試みようとする先例となることは知っています。ランドマークケースは常に参照されるものです。
この決定については本当に確信が持てませんが、非常に興味深い展開になるでしょう。おそらく両社とも最高の弁護士を揃えているでしょうから、OpenAIがどのような結果になるのか、非常に興味深いところです。
次に、MicrosoftのBiシリーズモデルに携わったSebastian Buckの話を見てみましょう。これらは、トレーニングデータの重要性を示した小規模なモデルでした。このインタビュークリップで彼は、私が以前取り上げた最近の研究について語っています。その研究では、o1が特定の分野での診断において医師を上回ることが示されました。これはGPT-4からの驚くべき進歩であり、将来に向けて非常に興味深い示唆を与えています。
もしこれらの診断ツールが人間よりもはるかに優れているとすれば、AIツールを使用しないことが無謀になる時点はいつなのか、という疑問を投げかけざるを得ません。
最近の医療診断に関する研究で、人間の医師とGPT-4を比較したところ、人間の医師の正答率は75%、つまり4問中3問の正解でした。一方、GPT-4は10問中9問正解しています。これは現実世界で私たちが気にかけることです。GPT-4は既に人間の能力を超えています。
同じ研究では、o1についても予見されており、人間の医師が50%の正答率である場合に、o1は90%の正答率を示すケースがあることが報告されています。これは本当に信じられないことです。
医師の推論タスクにおける大規模言語モデルの超人的パフォーマンスに関する論文を見てみると、4つのカテゴリーでテストが行われています。o1プレビューの結果を見てください。これはまだo1プレビューに過ぎません。モデルの2回目の反復ではありません。o1の3回目、4回目の反復では、テストタイム計算を使用した場合、特に医療診断に特化して微調整された場合、どれほど正確になるでしょうか。
特に興味深いのは、AIが合成データを生成し、それを学習できる場合です。非常にまれなケースでも、AIは実世界には存在しない学習データから引き出すことができ、医師を困惑させるような症例にも対応できるでしょう。これは本当に静かな革命が進行していると思います。
スコアを見ると、医師とGPT-4の結果に対して、o1プレビューは100点満点中はるかに高いスコアを達成しています。画期的な診断症例においても、o1プレビューはほぼ100%の性能を示しています。これは本当に信じられないことです。
これは健康問題を抱える人々にとって良い兆しだと思います。現在は診断だけですが、最終的には今後の10年間で、おそらく重要な医学的ブレークスルーが得られるでしょう。これは優先順位を付けるべき興味深い時期になると思います。
興味深いことに、Deep Seek V3というモデルがありました。これはAIコミュニティを震撼させたものです。なぜなら、このモデルは現在の多くのLLMと同等のパフォーマンスを示しただけでなく、はるかに低いコストでそれを実現したからです。このモデルのコストはGPT-4の約20分の1だと聞いています。
私の情報源によると、多くの人々が現在、APIの使用をこのモデルに切り替えています。コーディング能力に関してはClaude 3.5 Sonnetが依然としてナンバーワンですが、多くの人々がGPT-4アプリケーションについてはこのモデルに切り替えていると聞いています。
これは良いことです。なぜなら、AIアプリケーションを構築したいと思っていても、APIコストが障壁となっていた場合、Deep Seek V3は高額な推論コストを気にせずに、急速なプロトタイピングを可能にする非常に安価な代替手段として登場したからです。これは市場に大きな変化をもたらすでしょう。
また、このモデルに関して少し物議を醸す情報もありました。このモデルに自身が何であるかを尋ねると、「私はChatGPTによって開発された大規模言語モデルです」と出力するのです。もちろん、Deep Seek V3であれば「私はDeep Seekによって開発されたDeep Seek V3です」と言うべきところです。
これについて、OpenAIの利用規約に反してOpenAIのモデル出力で学習を行ったのではないかという情報が出回りました。ただし、企業がそのようなことを行っているのをOpenAIがどのように認識できるのか、私には分かりません。高度な方法はあるでしょうが、現在のAIの状況を考えると、OpenAIがこの問題を追求したいとは思えません。
ベンチマークを見ると、様々な指標でGPT-4.0を上回る性能を示しているようです。正直なところ、現在のGPT-4.0は、使用可能なLLMとしては最高のモデルではありません。Googleの新しいモデルの方が優れており、私は毎日Googleのモデルを使用しています。コーディングに関してはClaude 3.5 Sonnetが優れています。
つまり、より安価で同等レベルのモデルがあることで、OpenAIのリーダーシップは議論の的となっています。人々は常にコストを削減する方法を探しており、このモデルを使用することで節約できるのであれば、それを選択する人も出てくるでしょう。
ただし、OpenAIは高度な音声モードや他の様々な機能を提供しており、依然として非常に優れた製品であることから、わざわざDeep Seek V3のアカウントを作成する手間をかける人がどれだけいるかは分かりません。市場にこのような変化が起きているのは非常に興味深いことです。
さらに、「reproduce」と呼ばれるものがあります。これは、OpenAIの推論能力を一から再現する方法を段階的に示したブループリントです。論文では、強化学習を使用してo1モデルを再現するためのロードマップが提示されており、ポリシーの初期化、報酬設計、検索、コンポーネントに焦点が当てられています。
これは非常に興味深く、おそらく明日ビデオで取り上げる予定です。もしこの秘密が明らかになれば、それはAGIの秘密が明らかになることを意味し、そうなれば世界的にAGIを手に入れることになります。そしてもし世界的にAGIを手に入れることになれば、これまでに見たことのない加速が始まることを意味します。なぜなら、どの国もAIの競争で負けたくないからです。
大規模言語モデルと異なるアーキテクチャ、特にo1アーキテクチャについて話すと、Metaから「LCM(Large Concept Models)」という興味深い論文が発表されました。これは基本的に、人間の思考方法でモデルに考えさせようとするモデルです。
つまり、大規模言語モデルがトークン化された方法で考えているのに対して、AIの研究者は次のように説明しています:「トークン化は消えていくと確信しています。人間はトークンで考えないからです。トークンはLLMにおけるハードコードされた抽象化であり、奇妙な振る舞いを引き起こします。LLMは博士レベルの数学の問題は解けるのに、9.9が9.11より大きいかどうかを答えられないのです。」
そこでMetaは、LLMからLCMへとシフトし、次のトークン予測から次の概念予測へと変更しています。概念は文として扱われ、アイデアや抽象的なアイデア、行動を表現します。これは他のアーキテクチャに組み込まれた場合、非常に興味深い展開になると思います。
トークン化の特徴、というよりアーキテクチャの一部は、以前から問題を引き起こしてきました。Metaが他とは異なる方向から問題に取り組んでいるのを見てきました。もしMetaがこの方向性を推し進めれば、AIの研究において本当に素晴らしい分野が開かれるでしょう。現在ほとんどの人が注目していない分野に踏み込むことになるからです。
本当にスマートなシステムを作るためには、異なる方法で、あるいは私たちに非常に似た方法で考えさせることが重要になるでしょう。
また、Twitterでかなりの話題を呼んでいるクリップがあります。元OpenAIの従業員であるDaniel Kokotajloが、AGIがリリースされた時にどのような姿になるかを説明しているものです。これは非常に興味深いインタビューです。というのも、フロンティアラボの人々がこの1分程度のクリップで語られているような情報を公開することは、あまりなかったからです。
また、これは興味深いことに、Sam Altmanが以前に述べたことと一致しています。彼は基本的に、AGIが登場しても、一般の人々にとってはただの普通の一日になるだろうと言っていました。彼が言っていることを聞いてみましょう:
「最終的に見えてくるのは、非常にエキサイティングな発表と、非常にエキサイティングな製品が世界にロールアウトされることです。しかし、配管工のロボットが歩き回るのを目にする頃には、AGIの研究は1年以上も自動化されており、データセンターに存在するものは超知能となっているでしょう。文字通り、あらゆる面で、質的にも量的にも、最高の人間よりもはるかに優れたものになっているのです。
そして、彼らはロボット配管工を設計しているだけではありません。100万人規模で働いており、同時に多くのことに取り組んでいます。ロボット配管工もいれば、新しい武器、新しいドローン、あらゆる種類の新しいソフトウェア、新しい基礎科学も解明されているでしょう。新しい物理学、新しい化学、新しい生物学など。
これは、科学革命と産業革命を合わせたような、素晴らしい新技術の巨大な爆発となるでしょう。1500年から2000年までの500年間に起こったような知的進歩と科学の爆発的な進展、そして機械や技術、ツールなどの物理的な進歩を考えてみてください。私は同様の爆発的な進展が2年ほどの間に起こると想像しています。おそらく1つのAIプロジェクトの管理下で。」
AIがどのようにしてここに到達するのか気になっている方々にとって、これは非常に興味深い内容です。もちろん、AIが到来した時の生活がどのようなものになるのか、私も知りたいと思います。このチャンネルでは多くの推測を行っていますので、彼の予測が実際に的中するかどうか、様々な発明や製品がリリースされ始め、AIの研究が自動化されているかどうかを実際に判断できるようになるのは、非常に興味深いことです。
興味深いことに、2025年に向けて、GoogleのCEOであるSundar Pichaiは従業員に対して、「賭け金が高い」大きな2025年に向けて準備するよう伝えています。これは非常に興味深いです。なぜなら、2024年の最後の四半期で、Googleは依然としてAIの王者であることを誰もが認めるような形で示したからです。
これはAI業界の多くの人々にとって驚きでした。なぜなら、以前のGoogleは製品を急いでリリースし、ずさんなリリースや遅延したリリース、さらにはまったくリリースされなかったものもありました。GoogleのIOカンファレンスでは、実際の製品リリースよりも「今年後半に登場予定」という言葉の方が多く聞かれました。
しかし、最近のGoogle vo、新しいモデル、新しい思考モデルにより、まさに異なる製品の嵐となりました。ディープリサーチを含め、素晴らしい製品ばかりでした。Googleは使いやすさの面で、間違いなく業界標準を引き上げたと思います。彼らが今後どのような立場を取るのか、非常に興味深いところです。
この記事をさらに読み進めると、2025年が重要な年になること、この動きの緊急性を内在化し、会社としてより速く動く必要があること、賭け金が高く、2025年は破壊的な瞬間となること、この技術の恩恵を解き放ち、実際の問題を解決することに徹底的に焦点を当てる必要があることが述べられています。
これは私たちにとって良いニュースです。なぜなら、素晴らしい製品が登場することを意味するからです。先ほど述べたように、彼らがリリースしたものの多くは、私の生産性と実際にできることの面で、本当に素晴らしいものでした。ディープリサーチが素晴らしい機能であることや、エージェントブラウザのデモを見た時の印象についても話しましたが、それで節約できる時間は計り知れません。
2024年が凄かったと思っても、2025年が重要な年だと彼らが言っているのは、非常に興味深いことです。Googleのファンであれ、OpenAIのファンであれ、Googleから目を離さないことをお勧めします。多くの製品がリリースされる予定だからです。
ここで彼らは、2025年にギャップを埋め、リーダーシップの地位を確立するために取り組む必要があることを認識していると述べています。さらに、「2025年には一進一退があると予想していますが、最先端を維持できると思います」とも述べています。
つまり、Sundar Pichaiは基本的に、2025年には全体的な市場シェアとあらゆる面での優位性において、彼らが第一位のAI企業になると述べているのです。実際、2024年末の時点で、Googleが1位だと主張することもできます。ベンチマークや製品リリースを見ると、彼らの成果は本当に印象的でした。
ここで彼らは、Googleが追いつく必要があったことを認めていますが、「歴史的に見て、必ずしも最初である必要はありませんが、製品として本当にベストインクラスであり、うまく実行する必要があります。2025年はそれが全てです」と述べています。
消費者の皆さんは、まだGoogleデバイスを手放さないでください。きっと大きなアップデートが予定されているはずです。また、これに関連して、AlibabaでQuantumモデルを構築しているJiang Lingという人物が、あるツイートに反応しています。
誰かがChatGPTのような小規模な大規模言語モデルで、Sonic レベルの70Bモデルが欲しいと言ったのに対して、彼は「私を待っていてください」と答えました。より小規模なモデルにより多くの知能を詰め込むことができるかどうか、非常に興味深いところです。
70BのClaude 3.5 Sonicレベルのモデルを作ることができるかどうかは分かりません。なぜなら、いくつかのことは単にスケールによって達成されると思うからです。どれだけ効率的にしようとしても、そのサイズのモデルからその種の知能を引き出すことはできないかもしれません。
しかし、様々なものがより効率的に、より高速になるのを見てきました。AIは指数関数的なトレンドを示すので、2025年末には驚くほど異なる状況になっている可能性があります。それに対して賭けることは避けたいと思います。過去にそれを試みましたが、うまくいきませんでした。
また今週、興味深いことがありました。ついにAGIの定義が示されたのです。これは非常に良いものでした。OpenAIがAGIを「1000億ドルの利益を生み出すことができるシステム」と定義したからです。
これは特定のAGIの定義というよりも、Microsoftの人々を喜ばせるための企業的なクッキーカッター用語だと思います。なぜなら、MicrosoftとOpenAIの契約は、起こっているすべてのことを考えると、不安定な状況にあるからです。
彼らは契約を交渉しており、MicrosoftはもちろんこれらのAIの一部に対する支配権を維持したいと考えています。多くの人々が言い始めているように、MicrosoftとGoogleを比較すると、Microsoftは独自のモデルを持っていません。OpenAIとの契約が終了した時、彼らは企業として実際に何をするのでしょうか。
これはもちろん疑問を投げかける問題ですが、それほど大きな問題ではありません。きっと何らかの合意に達するでしょう。
最後の話題の一つは非常に興味深いものです。Matrix 1が公開したヒューマノイドロボットの動画についてです。これは非常に興味深く、他の企業もこれを参考にできるかもしれません。
この会社について私は名前しか知りません。おそらくMatrixという名前だと思いますが、このロボットについては1本の動画しか見ていません。画面に表示されているキャプションは私が作ったものではなく、Twitterで見つけた動画のものです。オリジジナルの動画は見つけられず、このロボットについてGoogleで検索しても、まだ何も出てきません。
しかし、このロボットの技術は未来的で、非常に高度に見えます。このようなヒューマノイドはほとんど見たことがありません。これに似たロボットを最後に見たのは、おそらく20年以上前のホンダのASIMOだったと思います。
このロボットは文字通り未来から来たように見え、指は非常に柔軟に見えます。実際、SpaceXの宇宙服のように見えると言えるかもしれません。
これがどれほど素晴らしいタスクを実行できるのか、見るべき情報はあまりありませんが、非常に効果的に見えます。もちろん、このような製品がどれくらいのコストになるのか気になりますが、TwitterのアカウントCyber Roboでその進捗を追うことができます。そのリンクも残しておきます。
皆さんが素晴らしい一週間を過ごし、2025年に向けて素晴らしい新年を迎えられることを願っています。


コメント