中国が人間のような物理的直感を持つ自己進化型AIシステム「WOW」を発表した。これは世界初の自己進化型マルチモーダル世界モデルであり、ロボットに因果関係を理解させ、試行錯誤を通じて学習させる画期的な技術である。同時に、わずか1370ドルという世界最安値のヒューマノイドロボット「Boommy」が北京のスタートアップNotix Roboticsから登場し、教育・家庭用途での普及を目指している。さらにUnitreeのG1ロボットは、自重の40倍となる1400キロの車両を牽引する驚異的なバランス制御能力を披露した。中国のロボット工学は、ソフトウェアとハードウェアの両面で急速に進化しており、2026年には家庭内で自律的に活動できるロボットが実現する可能性が高まっている。

WOW
中国が画期的なAIシステム「WOW」を発表しました。これは世界初の自己進化型世界モデルで、ロボットに人間のような直感で実際に考え、動くことを教えるものです。北京のスタートアップNotix Roboticsは、家庭や教室向けに設計された1370ドルのヒューマノイド「Boommy」を発表しました。
そしてUnitreeのG1ロボットは、1400キログラム、つまり3100ポンドの車を引っ張ることで驚異的なバランス能力を披露しました。中国のロボット工学はまた新たなレベルに到達したのです。では、これについて詳しく見ていきましょう。
中国のロボット技術が新段階へ
さて、中国は現在、ヒューマノイドロボットとAIに関して本気のモードに入っています。わずか数か月で、彼らは研究室での研究段階から、考え、動き、そしてほぼ人間のように行動できるロボットへと進化しました。すべて次世代レベルのモデルによって動かされています。
これまでで最も魅力的なものは、「世界全知世界モデル」、略してWOWと呼ばれるものです。これは世界初の自己進化型マルチモーダル世界モデルシステムと呼ばれています。そしてその機能は実に驚くべきものです。これは北京ヒューマノイドロボットイノベーションセンターが清華大学および香港科技大学と共同で開発したものです。
理論上は、物理シミュレーションモデルとビジョン言語モデルの組み合わせです。これは基本的に、WOWを使用するロボットが想像し、検証し、自己修正できることを意味します。言い換えれば、人間が因果関係を理解するのと同様の物理的直感を構築できるのです。
その背景にある考え方は、現在のビデオモデルやシミュレーションモデルは世界を受動的に観察するだけだということです。何が起こるかは見ることができますが、なぜそれが起こるのかを本当に理解しているわけではありません。WOWはこのアプローチを反転させ、モデルが環境と能動的に相互作用し、そこから学習し、試行錯誤を通じて理解を洗練させることを可能にします。
これは140億パラメータの生成モデルで、私たちと同じように物理学を学習します。つまり、実際に行動し、失敗し、時間をかけて改善していくのです。
WOWの革新的なアーキテクチャ
WOWの背後にいるチームは、彼らがSophiaパラダイムと呼ぶものの上にこれを構築しました。これは大規模言語モデルと拡散トランスフォーマーを組み合わせて、言語ガイダンスの下で物理的に正確な結果を生成するものです。ですから、もしあなたがロボットにテーブルの端からカップをこぼさずに移動させるように指示した場合、WOWは単に言葉やアニメーションを出力するだけではありません。
何が起こるかを予測し、推論を通じて結果をチェックし、そして次の動作をより現実的にするために理解を洗練させます。基本的には予測し、批評し、洗練させるというループです。そしてこのループは、ロボットの行動が本当に賢く、物理的に一貫性のあるものになるまで続きます。
これらすべてをテストするために、彼らはWOWベンチと呼ばれる全く新しいベンチマークを作成しました。これはAIシステムが知覚を理解し、予測について推論し、決定を下し、それらを一般化された方法で実行する能力を測定します。これまでのところ、WOWはそのベンチマークで最先端のスコアを記録しています。物理的妥当性、時間的一貫性、複雑な指示の理解に関しては、他のモデルを上回っています。
研究者たちが実証した最もクールなことの一つは、WOWが新規視点合成や軌道誘導ビデオ生成などの分野でどのように使用できるかということです。基本的に、このモデルは、オブジェクトが別の角度からどのように見えるか、または実際の物理的なシーンでどのように動くかをシミュレートできます。すべて一貫したロジックに基づいています。
彼らはまた、WOWがシミュレーションされたフィードバックを提供することで、ビジョン言語モデルの計画能力をどのように向上させ、タスクをより効率的に計画するのに役立つかも示しました。
物理的常識を持つAIへの道
論文の著者たちは、これが本物の物理的常識を持つAIシステムを構築するための重要なステップであることを明確にしました。ロボットが単なるビデオやテキストではなく、大規模な実世界の相互作用データにアクセスできるようになると、因果関係の理解がはるかに根拠のあるものになります。それが今日のチャットボットと明日のエンボディード・インテリジェンスの間の欠けているリンクなのです。
世界を見て説明するだけでなく、実際にその中で生活し、そこから学習し、独立した決定を下すロボットです。
さて、中国がソフトウェア側でロボットの知能の境界を押し広げている一方で、ハードウェア面でも真剣な動きを見せています。特に価格に関してです。この国は世界最安のヒューマノイドロボットと呼ばれるものを発表したばかりで、それはおもちゃでも概念実証でもありません。
世界最安のヒューマノイドロボットBoommy
これはBoommyと呼ばれる本物の歩いて話すヒューマノイドで、Notix Roboticsという名前のスタートアップによって作成されました。Boommyの価格はわずか9998元、つまり1370ドルで、高さは3フィートをわずかに超える約94センチです。重量は約12キロ、つまり約26.5ポンドです。UnitreeやUBTECHなどの実物大ロボットと比べると小型ですが、それがポイントなのです。
Notixは大型の産業用機械と競争しようとしているわけではありません。彼らは全く新しいカテゴリーを開拓しているのです。教育や家庭用に作られた、小型で軽量で手頃な価格のヒューマノイドです。
驚くべきことは、サイズと価格にもかかわらず、Boommyは歩き、バランスを取り、さらには踊ることさえできることです。そしてそれらすべてを驚くほど滑らかに行います。初期のビデオでは、1400ドル未満の製品からは期待できないレベルの安定性で動いている様子が示されています。これはフラッグシップのiPhoneやハイエンドドローンよりも安いのです。
同社によると、これは1万元未満で価格設定された初の消費者向けヒューマノイドであり、業界全体にとってターニングポイントとなる可能性があるとのことです。歩行や動的な動きが可能なヒューマノイドロボットのほとんどは、中国でも数万ドル、欧米ではさらに高額です。
Boommyの低価格は、巧妙な設計の選択、軽量複合材料、社内モーション制御システム、そして修理やカスタマイズが容易なモジュール構造から生まれています。重量物の持ち上げや産業タスクよりも、エンゲージメントと学習に重点を置いています。
彼らの以前のモデルであるNotix N2はすでに2500台以上を販売し、今年初めにはヒューマノイドロボットのハーフマラソンさえ走りました。考えてみれば驚きです。その成功により、彼らは中国で最も急成長しているロボティクススタートアップの一つとして位置づけられました。そしてBoommyで、彼らは明らかに大量採用を狙っています。
このロボットは48ボルトのバッテリーで動作し、容量は3.5アンペア時以上で、1回の充電で約1〜2時間の動作が可能です。ドラッグアンドドロップのグラフィカルプログラミングをサポートするように設計されているため、子供や初心者でも簡単にコーディングできます。
音声インタラクションもあるので、パーソナルアシスタントのように動作したり、簡単なコマンドに応答したり、学習コンパニオンとして機能したりできます。
Boommyの市場投入戦略
Notixは、中国のダブル11とダブル12のショッピングフェスティバルの間、つまり11月11日から12月12日の間に予約注文を開始する予定です。これは国のピークショッピングシーズンを考えると賢い動きです。彼らはスマートフォンの発売で見られるような誇大宣伝を目指しています。ただし今回はロボットです。
スタートアップ自体は新しいものです。清華大学と浙江大学出身のチームによって2023年9月に設立されました。2年足らずで、彼らは学術的なプロトタイプから1500ドル未満で購入できる実際の製品へと進化しました。
この種のスピードは、中国のロボティクスエコシステムがいかに競争力のあるものになったかを示しています。独立系ロボティクスメディアアウトレットであるRoboHubは、Boommyが踊ったり歩いたりするクリップさえ共有しました。大型モデルと同じ器用さや上半身の制御はありませんが、そのクラスでは信じられないほど滑らかな動きであることがわかります。
もし彼らがこれをスケールできれば、ショールームや研究室だけでなく、教室や家庭向けに設計されたヒューマノイドロボットの第一波を見ることになるかもしれません。
Unitree G1の驚異的なパワー
しかし、小型で親しみやすいロボットから、純粋な強さと精度を示すものへと少しスケールアップしましょう。北京人工知能アカデミーで、研究者たちはUnitreeのG1ヒューマノイドに挑戦を与えました。車を引っ張ることです。
そしておもちゃの車ではなく、本物の車です。G1の重量はわずか35キロで、高さは約132センチです。しかし、1400キログラムの重さの車両を平らな表面で引っ張ることに成功しました。確かに、車は滑らかな地面の上にあったので摩擦は低かったのですが、それでもそれに必要なバランスと制御は次のレベルです。
印象的なのは、ロボットが車を動かせたことだけでなく、どのようにそれを行ったかです。ビデオでは、それが鋭く後ろに傾き、トラクションを維持するために足を素早く動かし、直立を保つために常に調整しているのがわかります。そしてすべて自律的に行っています。
自重の約40倍の荷重を牽引しながら動的にバランスを保つことができるという事実は、彼らのモーション制御とフィードバックシステムがどれだけ進化したかを示しています。
そしてこの種の動的バランスは、人間の環境で働くヒューマノイドロボットにとって鍵となります。倉庫、工場、あるいは救助任務を考えてみてください。G1のようなロボットは、不均一な地面を横切って機器を運び、瓦礫を乗り越えたり、倒れたり制御を失ったりすることなく物体を動かす手助けができます。
Unitreeは派手なデモを披露することで知られています。宙返り、スプリント、地面に押し倒された後の回復などです。しかし、このテストは実用的な制御を本当に示しています。もはやショーのためだけではありません。彼らのモデルが信頼できる機械に求めるような方法で実世界の物理を扱い始めていることがわかります。
残る課題と未来への展望
もちろん、まだ課題はあります。これらすべての進歩があっても、ほとんどのヒューマノイドロボットは手の器用さに苦労しています。歩いたり、走ったり、バランスを取ったりすることはできます。しかし、シャツのボタンを留めたり、壊れやすい物体を拾い上げたりするような繊細なタスクは、まだ完璧には程遠いです。
開発者たちは、これらの動きをより自然で作業環境に安全なものにすることに注力していますが、日常の職場で広く展開されるのを見るまでには、おそらくまだ数年かかるでしょう。
しかし明らかなのは、中国が誰もが予想したよりも速く動いているということです。そしてこのペースが続けば、2026年は本当にロボットが家に入り、食事を作り、後片付けをできる年になるかもしれません。誰かがすべての動きをプログラムしたからではなく、彼らが実際に自分が何をしているのかを理解しているからです。
今回は以上です。ご視聴ありがとうございました。次回またお会いしましょう。


コメント