
5,420 文字

ほとんどのスマートグラスは実際よりも格好良く聞こえるものですが、メタの新しいAria Gen 2グラスは本当に別格です。マーク・ザッカーバーグとメタの素晴らしいスタッフたちが何を成し遂げたのか、そしてなぜこのグラスがゲームチェンジャーなのかを見ていきましょう。
メタのAria Gen 2は本当に異なる感覚をもたらすグラスのようです。単に顔に装着するだけではなく、目や手、さらには心拍までも追跡するセンサーを搭載しています。その背後にある技術は絶対的に驚異的ですが、素晴らしいのは研究者たちがこれらを使ってAIとロボティクスの未来を形作っていることです。このグラスを装着することで、私たちは5年先の未来に飛んだような感覚になります。
このグラスの本当に印象的な点の一つは、従来の意味でのAIではないという点です。基本的にはChatGPTや仮想アシスタントのようなものではなく、実際にはそれよりもはるかに優れています。高度なセンサーとオンデバイスAI処理能力を搭載しており、あなたの視点から見ているもの、聞いているもの、そして動き方まで、膨大な詳細情報を収集します。
SLAMと呼ばれる同時位置推定と地図作成技術や、視線追跡、音声認識などの技術はすべてグラス自体で直接処理されるため、インターネットに接続する必要がありません。研究者たちはこの詳細なデータを取得し、AIモデルを作成したり、AIロボットを訓練して、より自然に世界に反応し相互作用できるようにします。
これらのグラスは基本的に持ち運び可能なエアリサーチラボのようなもので、科学者や開発者に新しいアイデアを実験し、ロボットを改良し、よりスマートなAIシステムを構築するためのツールを提供します。
「プロジェクトAriaでは、あなたが認識するように認識できるセンサースイートを備えたウェアラブルデバイスを再考し、それによってあなたが誰であるかをよりよく理解する新世代の人工知能の開発を可能にし、ロボット工学における新たな進歩を実現しています。」
「プロジェクトAriaは当初から、常時オンの人間中心のコンピューティングの革命を始めるために設計されました。私たちはこの旅の次のステップ、第2世代のAriaグラスを発表できることに興奮しています。Gen 2グラスでは、私たちは環境と文脈をより深く理解するAI機能を構築しています。Aria Gen 2はAIとARの境界を押し広げる研究者にとって完璧なツールです。」
「ここで見ているものはこれと同じです。私たちはセンサースイートを強化した位置特定と身体追跡のための追加のコンピュータービジョンカメラを搭載しています。重量を増やすことなく、バッテリー容量を40%以上増加させました。このデバイスは接触マイクと特殊マイクを特徴とし、あなたの声と傍観者の声を区別できます。Aria Gen 2は屋内外の両方であなたの位置を特定します。高度な視線追跡カメラはあなたの視線を追跡して何を見ているかを理解し、あなたの手を追跡して操作している物体を識別します。さらに心拍数をモニタリングして、あなたの生体状態を包括的に理解します。」
「私たちはデバイス上でリアルタイムに多くの信号を処理する能力を導入しました。そうすることで、データ収集と後処理の文脈から離れ、ユーザーと対話し始めることができます。可能性を研究するだけでなく、実際に体験し、支援することができるのです。『赤玉ねぎを取るのを手伝ってください』『赤玉ねぎへ案内します。赤玉ねぎはここです』。」
「プロジェクトAriaの非常に重要な部分は、私たち自身を超えて広がる企業や学術研究ラボとのパートナーシップを構築することでした。私たちは情報を保護する研究プロセスへのコミットメントを続けています。第2世代グラスの旅はほんの始まりに過ぎません。機械と人間の知覚の間のギャップを埋めるデバイスを持って研究コミュニティが何を達成できるか想像してみてください。一緒に、私たちが現実を経験することの意味への理解を解き放つことができます。」
メタが十分な評価を受けていないこと、または単にサービスを提供している会社が恵まれない人々に提供しているというエリアで活動している会社が評価されていないことの一つは、もちろんこのグラスが実際にある種の障害を持つ人々にどのように使用されるかということです。このEnvisionという会社はAria 2グラスを実際に活用し、視覚障害のある人にとって非常に有用なものにしています。
Be My EyesとChatGPTによるこの種の初期の例はすでに見られましたが、AIの主要なポジティブな使用例の一つを実際に見ることができるこのデモンストレーションは、私が非常に印象的だと感じたものです。特にセンサーやそれらのものがどのように連携して働き、この女性が店内を歩き、本質的に空間の実際の感覚を持てるように支援できたことが素晴らしいです。
これは企業が初めて行ったことではありません。Lumenという別の会社もこれにかなり似たことをしているのを見たことがありますが、これはAI業界にとって非常に重要なことだと思います。ChatGPTやその他のものは興味深いですが、これが一般の人々にとって大きな価値創造がなされる場所です。
「失ってみて初めてわかるものというのがありますが、それは31歳で視力を失ったときの私の視力にも当てはまりました。私たちが直面する課題、単に視覚的なナビゲーションだけでも、それによって一定レベルの独立性を失います。視覚障害を持つ多くの人にとって、独立性はほぼ常に情報へのアクセスを意味していました。Ariaは人工知能や空間オーディオなどの技術を組み合わせ、視覚障害のある人々にとって視覚的な世界をアクセス可能にします。」
「私たちの多くのフィードバックがAria 2デバイスの構築に取り入れられ、アクセシビリティを焦点の一つとして維持していることを見るのは素晴らしいことでした。これはEnvision、Lighthouse San Francisco、そしてメタの間の真の協力的な取り組みです。私たちは本当にコミュニティと一緒に設計し、彼らの経験から学ぼうとしています。彼らは実際にこれらの技術を試したいと思っており、とても興奮しています。シャロンはこれらの機能をテストし、早期のフィードバックを提供してくれました。」
「GPSは屋内では機能しません。私たちは異なるマッピングとナビゲーション技術が必要です。通常、ヘッドフォンで音を聴くと、頭の中から聞こえるように感じますが、空間オーディオは実際の場所から聞こえるかのようにヘッドフォンで音を再生できる技術です。あなたがすべきことは、その音に従うことだけです。グラスを装着して、友達に話しかけるように話しかけるだけです。『ヘイ、メタ、リンゴを取るのを手伝って』『もちろん、店内のリンゴの場所を見つけるために音に従ってください』。」
「グラスが使用されるにつれて、実際にマッピングができます。異なるポイントを割り当て、そこにあるべきアイテムでラベル付けできます。『リンゴはこちらです』。どんな種類の質問もできます。『どんなリンゴがありますか?』『グラニースミス、コズミッククリスプ、ハニークリスプがあります』『グラニースミスのリンゴを取ります。赤玉ねぎを取るのを手伝ってください』『赤玉ねぎへ案内します。赤玉ねぎはここです』『これは赤玉ねぎですか?』『はい、あなたの手にあるのは赤玉ねぎです』。」
「食料品店に入って欲しいものへナビゲートする自由を持つだけで、それは効率的で速く、ただ素晴らしいことでした。『今日はこれだけです。レジへ連れて行ってください』『もちろん、レジへ案内します』。これはすぐに出荷される準備ができているわけではありませんが、興奮するのは、多くの人にとってこれが本当によく機能しているように見えることです。これらのパートナーなしでは、今日私たちが行ったことはできなかったでしょう。『ありがとう、良い一日を』。」
シャロンのような人が自分で欲しい食料品を選ぶ姿を見ると、その感情は信じられないほど素晴らしいものです。
メタのファンなら、最近のグラスのアップデートについても知りたいでしょう。彼らは実際にRay-Banのものをアップデートしました。私も実際に一組持っていて、とても便利です。彼らがどのようにAIをそれらに組み込んだかを見てみるといいでしょう。これについて話している理由は、これは実際に購入できるものだからです。Aria Generation 2はまだ消費者向けには利用できませんが、こちらは現在購入可能です。
「ヘイ、メタ、音楽をかけて」
「ヘイ、メタ、これを見て翻訳して」
「WhatsAppでLauraに音声メッセージを送って」
「やあお父さん、何してるの?」
「ちょうどあなたに連絡してるところだよ。できるだけ早く戻ってきて」
「みんな料理してる?お母さんによろしく」
「やあ、みんな、どこにいると思う?」
「フェスティバルよ、見て、誰がいるか」
「素敵に見えるわ」
「ヘイ、メタ、ビデオを撮って」
「ヘイ、メタ、カップに何スプーンあるの?」
「ヘイ、メタ、見て、これはどんな蝶か教えて」
メタの他のグラス、Orionグラスについても言及しないのは公平ではないでしょう。これらは他のものとは異なり、メタコネクト2024で発表された高度なARグラスです。これらは非常に興味深いもので、異なるプラットフォームですが、リリースされれば主流になると思います。2027年、つまり今から2年後のリリース日と価格目標があります。しかし、特にこのような薄いグラスでARを正確に実現するのは非常に難しいと思います。
「約10年前、私はこれらのグラスを作るために世界最高の人々のチームを結成し始めました。要件は実際にはかなり単純ですが、それらを作るための技術的課題は途方もないものです。これらはヘッドセットではなく、ワイヤーなしで100グラム未満のグラスである必要があります。広視野角のホログラフィックディスプレイを備え、詳細を捉えるのに十分に鮮明で、さまざまな照明条件で見るのに十分に明るく、コーヒーショップや飛行機など、どこにいてもシネマスクリーンや複数のモニターを表示できる大きさである必要があります。」
「そして、それらを通して見ることができる必要があり、人々もあなたを通して見て、あなたとアイコンタクトを取ることができる必要があります。これはパススルーではなく、ホログラムが重ねられた物理的な世界です。誰かがあなたにメッセージを送ると、あなたはそれを見て、電話を取り出す代わりに、ちょっとした微妙なジェスチャーで、その瞬間から引き離されることなく返信できます。または、遠く離れた誰かと一緒にいたいなら、彼らはホログラムとしてあなたのリビングルームにテレポートし、まるであなたのすぐそばにいるかのようになります。指をタップして、カードやチェスやホログラフィックな卓球など、一緒に楽しみたいゲームを出すことができます。働いたり、遊んだり、何でもできます。」
2030年のグラスの未来について疑問を持っている方のために、GoogleのGeminiの共同リーダーであるNom Shayが言うことを見てみましょう。2030年までに、リアルタイムでアドバイスや問題解決を提供するAIアシスタントがグラスに搭載されるでしょう。私もそれがデフォルトのフォームファクターになると思います。Alexaのようなものと同様に、毎回電話を取り出すのは非常に不便で、グラスはすでに基本的なアイテムとして着用しているものだからです。
「2030年には、常により多くの方が良いと思います。世界のGDPのどれくらいの割合をAIに使おうと人々が決めるか、そしてAIシステムはどのように見えるかを考えてみてください。おそらくそれはあなたのグラスの中にあるある種の個人アシスタントのようなもので、あなたの周りのすべてを見ることができ、あなたのすべてのデジタル情報と世界のデジタル情報にアクセスできます。」
「たとえば、あなたがジョー・バイデンで、リアルタイムで何でもアドバイスしてくれる内閣のイヤピースを持っていて、問題を解決してくれたり、役立つポインターを与えてくれたりするようなものかもしれません。あるいは、それと話すことができ、あなたの周りに見えるものを分析して、あなたに対する潜在的な有用な影響があるかどうかを知りたいと思っているかもしれません。」
「そして、それがあなたの個人アシスタントや個人内閣のようなものだとして、コンピューティングに2倍のお金を使うたびに、そのものが5〜10 IQポイント賢くなるとします。1日に10ドル使って助手を持つのか、1日に20ドル使ってより賢い助手を持つのか、どちらがいいでしょうか。それは人生の助手であるだけでなく、仕事をより良くこなすための助手でもあります。なぜなら、それはあなたを10倍のエンジニアから100倍のエンジニアにするからです。」
AIの統合についてどう思うか教えてください。この動画を楽しんでいただけたら幸いです。次回お会いしましょう。


コメント