
9,468 文字
今週のAIニュースは実はロボット工学から始まります。ご覧のように、Clone Roboticsという会社が筋骨格系アンドロイドのバージョン1を開発していますが、この合成人型ロボットは他のどの会社が作っているものとも全く異なります。彼らはついに全身の映像を公開しました。正直に言うと、こんなに早く公開されるとは思っていませんでしたが、この会社がいかに迅速に動いているかを示しています。
彼らが開発しているロボットは、ほとんどのロボットが使用する金属モーターを使用せず、実際には人工筋肉、つまり「マイオファイバー」と呼ばれるものを使用しています。これらは実際の人間の筋肉のように機能しようとしています。伸縮し、実際に物を持ち上げることができます。これは非常に驚くべきことです。なぜなら、彼らは本質的に「ウエストワールド」のロボットを構築しようとしているからです。これは、AIの分野でどの立場にいるかによって、非常に恐ろしいことか、非常にエキサイティングなことかもしれません。
基本的に、骨と筋肉、流体で動く循環システム、そしてAI頭脳を持つロボットであり、実際の人間のように反応して動くことができます。今私たちが目にしているのは、このロボットが実際に動くという実証実験です。筋肉が収縮し、機能するのを見ることができます。超高速AIが搭載され、話し、反応し、歩き回ることができるようになった時、どんな未来が待っているでしょうか?今はまさに過渡期にあり、Cloneのような会社は、この映像を見せなければ50年先のことだと思われていたものを開発しています。
このロボット全体には人間と同じように206個の人工骨があり、正直なところ、彼らがどうやってこれを実現しているのか分かりません。人型ロボットは非常に難しいことは分かっていますが、彼らがこれを実現すれば、市場は彼らのものになるでしょう。
他の人型ロボットに関しては、HMN D01があります。これはおそらく「Humanoid 01」を表しています。これはアーキム・ソフが2024年に設立した英国のAIロボティクススタートアップが開発した英国の人型ロボットです。この会社は、産業オートメーションを強化し、労働力不足や高齢化などの労働力課題に対処するためのモジュール式の空気駆動ロボットの作成を専門としています。
このロボットは175cm(約5フィート9インチ)の高さで、重さは約70kg(154ポンド)です。特定のタスク向けにハードウェアとソフトウェアのカスタマイズを可能にするモジュール式アーキテクチャを特徴とし、41自由度を持つ人間の解剖学を模倣することで高い移動性と正確な操作を可能にしています。
また、時速1.5m(5.4km)で動作でき、ペイロード容量は15kg(33ポンド)あり、交換可能なバッテリーを持っているため、ダウンタイムが最小限に抑えられ、24時間365日稼働できるとのことです。このロボットはピック・アンド・プレース作業、材料の取り扱い、複雑な環境でのナビゲーションに優れており、リアルタイムの意思決定、98.7%の精度での物体認識、不均一な表面への適応のための高度なAIを使用しています。
全体として、このロボットは物流、製造、小売、倉庫などの産業を対象としており、商品の取り扱い、仕分け、包装、キッティングなどのタスクを実行できます。つまり、別の会社が人型ロボットを構築した状況です。このモジュラーバッテリーを備えたロボットが未来だと思います。多くの会社が最終的に人型ロボットプラットフォームの構築を始めており、人型ロボットが潜在的に将来の経済の一部になり始める可能性があります。
これらのロボットが機能し、実際にデモを見れば、これが確実に未来であることが証明されるでしょう。経済を指数関数的に拡大させるなら、実際の人間の数ではなく、効果的な人口を倍増させる必要があります。もちろん、労働力不足の産業や危険すぎる作業がある産業、自動化されるべき多くの仕事のためです。これは、コストの一部で自動化でき、人間には独自の能力セットがあり、他の場所で活用できるため、大きな後押しになるでしょう。
このロボットは私が期待しているものです。英国からあまり多くの企業が出てきているとは思えないので、このスタートアップは注目していきたいと思います。もし視聴者の方で関係者がいれば、工場を訪問させてください。あなたたちが何を作っているのか見てみたいです。
他のロボットに関しては、実際に工場で使用されているHelixを見てみましょう。ビデオを再生するかもしれませんが、まずは私の意見を述べさせてください。このロボットはインターネットを席巻しませんでした。それは前回のデモほど良くなかったからではなく(良くないというわけではなく、これは間違いなく最大のロボット工学のブレークスルーですが)、一般の人にはあまりアピールしないからです。
このデモでは、Figureロボットが任意のアイテムを識別し、それを見たことがなくても拾い上げることができるのを見ることができました。これがどれほど驚くべきことか分かりますか?これはロボットが長い間苦労してきたことで、見たことのないものを見て、それを実際に使い、拾い上げて冷蔵庫に入れることができるというのは実世界のユースケースなのです。
LLMでさえ、トレーニングデータの分布外に一般化できるのかという議論がありますが、これらのロボットは初めて見るアイテムでも文字通りピック・アンド・パックができるのです。つまり、彼らが構築したオンボードシステムは信じられないほど優れています。
このオンボードブレークスルーは非常に優れていたため、OpenAIとのパートナーシップを終了することを決定しました。私の推測では、OpenAIが独自の人型ロボットを構築していることを考えると、秘密のソースを競合する可能性のある会社と共有したくなかったのでしょう。アルゴリズムを開発したので、OpenAIさようなら、と。他の音声AI会社を使用できます。なぜなら、多くの他の会社がOpenAIの高度な音声モードに追いついているからです。
これは絶対に素晴らしいことです。今日、おそらくもっと印象的なデモが公開されるでしょう。退屈な解説なしでこの一部を再生して、何が起こっているのか理解してもらいます。AIの世界がいかに速く動いているかは本当に驚くべきことです。
(デモの一部が再生される)
AIの世界が速く動いている中、DeepSeekもより多くのものをオープンソース化しています。今週、彼らはより多くの情報をオープンソース化する予定です。「私たちはどこにいるか:DeepSeek、AIを探求する小さなチーム」と書いてあります。これはOpenAIにさらなる圧力をかけています。彼らはオープンソースウィークに向けて準備しており、いくつかのことを行っていますが、基本的に5つのリポジトリをオープンソース化する予定です。これらは驚くようなLLMではなく、AIの中でさまざまなことを行う小さなリポジトリです。平均的な人はこれを使用しないかもしれませんが、DeepSeekが何かをオープンソース化するので確認してみてください。
DeepSeekがOpenAIに圧力をかける中、OpenAIは賭けを引き上げ、GPT-4.5をリリースしました。このビデオをリリースする時点でGPT-5.5が出ているかもしれませんが、最近彼らはGPT-4.5とGPT-5のサーバー容量を準備しています。サム・アルトマンは最近、このモデルが数週間のうちにリリースされることを認め、今週おそらくモデルをホスティングする予定です。今日、「GPT-4.5リサーチプレビューを試してみてください」という情報も得ました。
また、サム・アルトマンは「GPT-4.5はハイテスターの間で予想以上にAGIの感触があった」と述べました。この発言は思っている以上に大きいかもしれません。AGIの感触というのは通常、モデルが何らかの能力を示したときに起こることで、それは予見できなかったわけではありませんが、「わぁ、これは未来を感じる」と思わせるようなものです。私たちは高度な音声モードやGPT-4、GPT-4oでそれを感じました。これはほとんどの人が考えるよりも大きいものになるのではないかと思います。
これは単なるLLMのアップグレードではないと思います。一部の人々はこれが何らかのマゼンティックフレームワークだと言い、他の人々は新しい驚くべき音声モードだと言っています。現在、多くの憶測があります。タイムラインでは多くのことがありましたが、私はこれに興奮しており、木曜日か金曜日に来るかもしれないと思います。彼らがリリースしなかった唯一の理由は、彼らが言うところの「今夜のショーを盗むのは良くない」からでしょう。これはもちろんGrokのツイートに対する返答です。
そのため、潜在的に彼らは昨日Claudeをリリースし、その数日前には他のAIリリースがあったため、リリースしなかったのだと思います。彼らは自分たちのカバレッジを十分に確保したかったのだと思います。AIがどれだけ注目を集めているかは本当に驚くべきことです。
ロボットに戻ると、実際にこのクリップがバイラルになっていました。これはかなり面白いので、ビデオに含めています。基本的に、人々はInstagramやTwitterで「この人型ロボットが女性を攻撃した」と騒いでいました。面白いことに、攻撃しているように見えますが、そうではありません。これはUnitreeのロボットで、H1という彼らの初期プラットフォームです。
これがユニタリーH1であることをGoogleで確認できます。H1は黒いもので、体の動きの面ではG1モデルよりも柔軟性が低いです。これはロボットのデモンストレーションの一種だったのではないかと思います。ロボットはドレスアップされているように見えますが、ちょっとした誤動作だったのでしょう。将来的にこのようなシナリオが発生しないことを願っています。
最近、手術から戻り、私のAI GGD Academyを再開しました。現在、そこに投稿を再開し、AIエージェントで18ヶ月以内に100万ドルを達成する計画全体を文書化しています。最近、私の計画全体をClaudeと共に概説しました。私のコミュニティと共有する予定の、AIエージェントで100万ドルを達成する方法についての適切な計画があると思います。
それは非常に大げさに聞こえるかもしれませんが、挑戦する価値のあるものであり、その過程で学ぶすべてのことは間違いなくそこで共有されるでしょう。来週、実際にこの会社の配信を構築し、基本的にこれを宣伝するソーシャルメディアチャネルを自動化できるAIエージェントをいくつか作る予定です。
もしあなたがAIを構築しようとしている人で、私が何をしているのか知りたいなら、これは私が毎週、毎日個人的に取り組んでいることであり、何らかの価値があるかもしれません。そのリンクは説明欄にあります。
未来の驚くべきものについて話すと、GoogleのAI科学者もいました。これは絶対に狂っていると思います。これが全く真実ではないと言うデバンキングビデオを見ましたが、これが科学的発見に向かう方法だと思います。このAI共同科学者システムは、研究、新規仮説の生成、研究提案、実験プロトコルの面で科学者を支援するという点で非常に素晴らしいです。
これはGemini 2.0に基づいており、基本的にはAIエージェントというよりは協力ツールとして機能します。これは仕事を完全に奪うのではなく、仮説を生成し、研究し、詳細な概要を作成します。個人的には、これはかなり過小評価されていると思います。私のチャンネルでは多くの視聴回数を得られませんでしたが、これは研究業界の人々のためのものだと思いますので、彼らの世界を揺るがしたと思います。
これの広範な応用を心から待ち望んでいます。私がいつも考えるのは、10億の異なるブレークスルーが必要なわけではなく、大きな進歩の波をもたらすためには1つか2つの小さなブレークスルーだけが必要だということです。つまり、パラダイムをシフトさせるためには1つのことだけが必要で、その上に複数の発明や他のものが構築されるようになります。
AIが新しいものを見つける日が来ることを願っています。それは非常に重要な日になるでしょう。人々が「もしこれが新しいものを見つけたなら、もっと真剣に受け止めるべきかもしれない」と考える日です。
また、Googleに関する記事がありました。これは基本的にこのシステムがどのように機能するかについて説明しています。「微生物学者が10年かけて解明した複雑な問題が、Googleの新しいAIツールによってわずか2日で解決された」とあります。ホセ教授とインペリアル・カレッジ・ロンドンのチームは、一部のスーパーバグが抗生物質に耐性がある理由を解明し証明するために何年も費やしてきました。
彼はGoogleが作成した共同科学者ツールに、自分が調査していた中心的な問題について短いプロンプトを与え、48時間で同じ結論に達しました。彼はBBCに対して、彼の研究は公開されていなかったため、AIシステムがパブリックドメインで見つけることはできなかったにもかかわらず、それが何をしたかを知ったときの衝撃について語りました。
「誰かと買い物をしていて、『1時間一人にしてください、このことを消化する必要があります』と言いました。Googleに『あなたは私のコンピュータにアクセスする権限がありますか?』とメールを書きました」そして、テクノロジー巨人はそれがないことを確認しました。
全体として、基本的にこの人が行った10年の研究は、AIが48時間以内に同じ結論に達することができたため、矮小化されました。もしサム・アルトマンとダリオ・アモデイが基本的に「研究問題を解決するのにかかる時間は短くなる」と言っていたことを覚えているなら、これは基本的にその最初のデモンストレーションであり、10年後、20年後の研究の進展を考えると、それは非常に驚くべきことです。
また、マイクロソフトリサーチがBio Emuを導入しました。これは基本的に1時間に数千のタンパク質構造を生成でき、創薬と研究における科学者のための新しい可能性を解き放つものです。これらのストーリーは全国的な見出しを飾ることはないかもしれませんが、バックエンドでこれらの企業がLLMに焦点を当てる一方で、社会全体を助ける実世界のユースケースを持つものを構築することに焦点を当てていることを示すために重要です。
これが何をすることができるのかに詳しくない方のために説明すると、タンパク質は基本的に私たちの体内にある小さな機械で、筋肉を作ったり病気と戦ったりするなど、あらゆる種類の重要な仕事をします。しかし、それらは一つの形状にとどまるわけではなく、必要に応じて曲がったり、ねじれたり、変化したりします。そしてそれらの形状変化を理解することは、より良い薬を開発するために非常に重要です。
問題は、伝統的な薬は分子動力学シミュレーションのようなタンパク質の動きを研究する必要があり、これには膨大な計算能力が必要なため、とても時間がかかることです。マイクロソフトのBio Emu1では、深層学習を使用して1時間でタンパク質構造を数千個予測することで、プロセスを高速化するAIモデルです。
遅いシミュレーションを実行する代わりに、既存のタンパク質データから学習し、タンパク質がさまざまな状況でどのように振る舞うかについての正確なモデルを生成します。これは、科学者がタンパク質ダイナミクスをはるかに速く、安価に研究できることを意味し、創薬や医学研究のブレークスルーにつながる可能性があります。もちろん、マイクロソフトはこれをオープンソースにしているので、世界中の研究者がこれを使用できます。
AlphaFoldとBio Emuの違いを見てみると、いくつかの明確な違いがあります。AlphaFoldは基本的に、タンパク質の最終的な安定形態がどのように見えるべきかを予測できるものです。一方、Bio Emu1は、タンパク質が実際にどのように動き、相互作用するかを理解するのに適しており、これはタンパク質の行動に影響を与える薬を設計するための鍵です。
簡単に言えば、AlphaFoldはタンパク質の高品質なスクリーンショットを提供する一方、Bio Emu1はタンパク質が実際にどのように動くかの完全なアニメーションを作成します。違いに混乱している場合は、これをスクリーンショットしてください。
次に、マイクロソフトのMuseがありました。これはゲームプレイとデジタル環境シミュレーションに革命をもたらすように設計された生成AIモデルです。基本的には、AIによってリアルタイムで生成されるAI生成ゲームです。これはマイクロソフトリサーチがNinja Theoryや他のXboxゲームスタジオチームと共同で開発したもので、世界と人間の相互作用モデルに基づいています。
広範なトレーニングデータに基づいてゲームビジュアルとコントローラーアクションを分析および生成するための高度な深層学習技術を使用しており、ゲーム開発、保存、インタラクティブシミュレーションの新しい可能性を提供します。
Twitterでは、伝統的なゲームよりもはるかに劣っているものを開発するために何時間も何百万ドルも費やしたという多くの議論を見ましたが、これらの初期の探索が将来的に非常に興味深いものにつながると思います。完全にAI探索されたゲームが得られなくても、異なる種類のVR世界や何か同様のものが得られるかもしれません。
これらのイノベーションが他の多くの異なるものにもたらされる可能性があるため、新しい技術について懐疑的で従順になりすぎるべきではないと思います。入力に基づいてゲーム内のグラフィックと対応するアクションを作成できるというのは、時間の経過とともにこれがより良くなっていくことを考えると、かなり驚くべきことです。将来がAI生成のゲームになるのか本当に疑問に思います。
AI生成の未来について話すとき、私たちは常に集合意識を持っています。つまり、今皆さんはおそらくTVショーを見ています。例えば、現在「Severance」というTVショーが人気があり、数年前には「Breaking Bad」のような他のショーが人気がありました。もし全てがAI生成ならば、人々はまだ同じバブルの中にいたくないのでしょうか?
コミュニティがそれを使用しているから特定のものから価値を得られるように、例えばこのゲームはAI生成で、私の体験が完全に私だけのものなら、私はまだコミュニティの一部となり、それは人々が望むものなのでしょうか?おそらく一部の体験では非常に有用だと思いますが、全てがAI生成になるわけではないと思います。多くの人々はまだコミュニティの一部でありたいと思い、皆さんが話し合える集合的な体験を共有したいと思うでしょう。
ここにはあまり誰も話していなかったAIセーフティに関する興味深いニュースがあります。AIセーフティは退屈なものに思えるかもしれませんが、AIで起こっている驚くべきことを見始めるまでは。正直なところ、何かが起こっていると思います。研究論文を読み、研究所の人々が言っていることを見てきました。他の国からの競争のために、これらのAIシステムを急いで出すよう強制されている方法を見てきました。AIセーフティは非常に後回しにされています。
最近、米国AIセーフティ研究所が解体されるというAxiosの報道がありました。「バイデン政権のAI規制に関する大統領令を撤回し、複数の政府機関で職員を解雇した後、トランプ政権は次に米国AIセーフティ研究所の削減を準備している」。水曜日、Axiosは、AIセーフティを収容する国立標準技術研究所の見習い職員が間もなく解雇される準備をしていると報じました。情報源はAxiosに対し、497の役職を解雇する準備をしており、これは基本的に彼らを崩壊させるだろうと述べました。
このものはAIモデルのテストを監督・実施し、規制努力に関して開発者と協力するために作られました。多くの企業が署名しましたが、今ではそれが終わりになるかもしれません。これは良くないことです。なぜなら、これは米国政府のAI開発を監督・規制する能力を弱めるからです。これは企業が安全イニシアチブに沿って行動することを確実にするために作られたものでした。
CIPのジェイソン・グリーンが指摘したように、これは国家安全保障、特にAI関連の核・生物学的リスクの監視に影響を与える可能性があります。AIセーフティと半導体生産プログラムの両方への削減は、特に中国との関係において米国の競争力に影響を与える可能性があります。これは米国政府のAI支配を達成するという目標と矛盾しており、AI安全研究と規制に関する官民協力のギャップが生じることになります。
「政府がAI安全に取り組み始めたのはごく最近なので、NistのAdvanced AIによってもたらされる壊滅的なリスクを理解している専門家のほとんどは最近民間部門から来たばかりです。彼らを政府から追い出すことは、AIがこれらのリスクを引き起こす可能性を特定するために必要な目と耳を奪うことになります。節約はわずかですが、国家安全保障へのコストは膨大になるでしょう」
また、「企業は独自のテストを行っているではないか」と言う人たちに対して、「民間部門は政府の関与なしには国家安全保障に関連するほとんどの分野でテストできません」というツイートもありました。これは、政府の情報自体が機密指定されているためです。政府が構築したルールで国を保護するテストを確実に行うには、政府がこれらの企業と協力する必要があります。
これはもちろん全く良くないことです。この話がどのように展開するか非常に興味深いでしょう。前に言ったように、AIセーフティは競争が進む中で後回しにされると思います。神のために、どこかに「ウルトロン」のような何かを構築している人がいないことを願っています。
それからAdobeがついにFirefly videoモデルをリリースしました。これはクリエイターにとって本当に役立つものです。生成ビデオを実験できます。これは非常に大きな進展を遂げるだろうと思います。
AIビデオがビデオエディター内の実際のワークフロー内でどのように変換されているのか疑問に思っている方のために、これは試してみたいものです。今は無料かもしれませんが、長い間チェックしていないので、それについては引用しないでください。ワークフローベースのものを探している方には、Adobe Fireflyが間違いなく最適な場所です。現在、Photoshopの生成フィルを頻繁に使用していますが、これは間違いなく使用すべきものです。


コメント