この AI は「あなたの心を読める」?!

AIハード・GPU・RAM
この記事は約9分で読めます。

この動画では、MITから生まれたAlter Egoという革新的なウェアラブルデバイスを紹介している。このデバイスは音を出すことなく内部で発話した内容を検知し、骨伝導でAIと会話できる画期的な技術である。カメラも内蔵されており、周囲の環境をリアルタイムで理解しながらユーザーをサポートする。さらに他のAlter Ego装着者との無音での会話や、リアルタイム翻訳機能も備えている。当初は言語障害者支援のために開発されたが、現在では人間とコンピューターを seamlessly に統合する次世代インターフェースとして発展している。

This AI Can READ YOUR MIND?!
MIT’s AlterEgo started as a wild research project, and now it’s becoming a real startup. This wearable AI headset can li...

Alter Egoの基本機能とコンセプト

Alter Egoには小さなカメラが組み込まれており、私の視点から周りの世界を理解することができます。ここに絵葉書がありますが、何か興味深いものを見つけたときに、特定の部分を指差して見ているものについて質問することができます。これはヨーロッパを表すエウロパがアメリカと握手している場面で、初の大西洋横断電信ケーブルを祝っているものですね。

それはクールですね。これがAlter Egoです。基本的に話すことなく話すことができるウェアラブルデバイスです。音も出さず、唇も動かさず、何もありません。ただ内心で言葉を言うだけで、デバイスがそれらの神経信号をキャッチし、骨伝導を通してあなたに話しかけてくるのです。まるで自分自身と会話しているようですが、実際には強力なAIアシスタントと話しているのです。

リアルタイムで周りの世界を見ることができるだけでなく、他の誰にも聞かれることなく文字通りあなたに話しかけてくることができるのです。これらの驚愕的なデモに入る前にコンテキストを説明すると、Alter Egoは実際には2018年にMITでのプロジェクトとして始まりました。もともとはALSやMSなどの言語障害を持つ人々を助けるためでしたが、現在では人間とコンピューターをシームレスに統合するシステムを構築するという、より広範な目標を持つ実際の企業に発展しています。

彼らは本質的に次のパラダイムのインターフェースを構築しようとしています。現在、私たちがAI、インターネット、さらには携帯電話と相互作用するときは、主にタイピング、タップ、スクリーンを通してです。しかし、Alter Egoのビジョンはそれよりもはるかに大きいものです。彼らはコンピューティングを背景に溶け込ませ、心の自然な延長のように感じさせたいと考えています。

Alter Egoチームによる技術説明

彼らはこのように説明しています。こんにちは、私はArnellです。今日、私たちが取り組んでいるもののプレビューをシェアしたいと思います。これは私たちのテクノロジーとの相互作用、お互いとの相互作用、そして私たちの周りの世界との相互作用の仕方を変える可能性を持つ革命的な突破口だと信じています。コンピューティングやAIとの現在の相互作用方法は、スクリーンやキーボードでタップやスワイプできる速度に限定されています。

知能時代においては、ゼロから構築された全く新しいインターフェースが必要です。人間の心の自然な延長のように感じられるものが必要なのです。これを実現するために、私たちは完全に新しいものを発明する必要がありました。そして今日、それを紹介します。それはAlter Egoと呼ばれるもので、私たちにとってはself の拡張を意味します。

Alter egoはテレパシーの力をあなたに与えますが、共有したい思考に対してのみです。Alter Egoを使えば、音を出すことなく普通に話すように話すことができ、思考の速度でのプライベートコミュニケーションが可能になります。これは、話すことを決意したときに脳が発話システムに送る最も微細な信号を受動的に検出することで機能します。

これは完全にあなたのコントロール下にあり、あなたがコミュニケートしたいもののみを拾い上げます。私は実際に今これを着用しています。どのように機能するかお見せしましょう。このデモで私の後ろに見えるもの全ては、alter egoがリアルタイムで検出できる言葉です。これは通常サイレントスピーチと呼ばれています。しかし、私たちはさらに進みました。

私たちはサイレントセンスと呼ぶ画期的な技術を発明しました。サイレントセンスは信じられないほど敏感です。発話の全スペクトラムを拾うことができ、好きなだけ大きく、または静かに話すことができます。では、これをオンにしてみましょう。どのように機能するかお見せします。ここでもう一度お見せしますね。これは本当に狂っています。それはあなたの思考を直接読み取っているわけではありませんが、言葉を口の形にしたり声に出したりしなくても、あなたが言おうとしていることを拾い上げているのです。

実用的なデモと使用例

これを着用していると、基本的にデバイスやAIとの常時双方向コミュニケーションが可能になります。リマインダーを設定し、メモを取り、アプリを使うことさえ、頭の中で静かに自分に話しかけるだけでできるのです。クレイジーに聞こえるかもしれませんが、考えてみると、これは現在私たちが持っているものとNeuralinkのようなもの間のステップなのです。

Neuralinkは実際にあなたの思考を読み取りますが、頭部に埋め込まれる必要があります。alter egoとは異なります。さらに驚くべきことに、ヘッドセットには実際にカメラが付いており、周りの世界を見て感知することができます。つまり、サイレントで話しかけることができるだけでなく、リアルタイムで環境のコンテキストを理解することもできるのです。これを見てください。

ここに付箋があり、Alter Egoにこれをキツネに折るのを手伝ってもらいましょう。分かりました。まず紙を斜めに半分に折ってください。次に上の角を取り、下の端の中央点に合うように斜めに折り下げてください。次に、下の角を上に折ってキツネの耳を作ってください。次のステップの準備はできていますか?

はい。今度は反対側でも同じことを繰り返してください。できましたね。良く見えます。今度は平らな面にキツネの口と目を描いて仕上げてください。ひどいですね。これで簡単にこの潜在的な使用例を想像できますね。あなたの環境とコンテキストを常に認識し、リアルタイムでプライベートに実際に話しかけることができるAIシステムを持つことは、まさに完全なゲームチェンジャーです。

つまり、これはMetaがAR+AIグラスで実現しようとしていることや、Sam Altmanがジョニー4で取り組んでいることと全く同じです。しかし正直なところ、Alter Egoが彼らを出し抜いたかもしれません。フォームファクターがちょうど理にかなっています。他の明らかなオプションは何らかのAIグラスやカメラ付きイヤピースくらいで、これは基本的にそれと同じものです。

デバイス連携とワークフロー改善

そうですね、Altmanと私が何を思いついたかは見てみましょうが、広くアクセス可能な脳コンピューターインターフェースを持つまでは、これが向かう方向性のように感じられます。次のデモでは、Alter Egoがデバイスと直接接続し、実際にワークフローを高速化できることを示しています。タブを切り替えたり、調べ物をしたり、ChatGPTにコピーペーストしたりする代わりに、頭の中で言うだけでそれが起こります。見てみましょう。

記事を読んでいて概念について質問があるとしましょう。集中を切らして新しいタブを開いて検索する代わりに、画面上のテキストをハイライトしてサイレントで質問することができます。素晴らしいですね。作成にも役立ちます。ここで共同創設者のMaxにメールを書いています。文章がちょっとおかしく見えます。

しかし、書くことから構築することまで、さらに進むことができます。スケッチから簡単なアプリを作成するようにAlter Egoに頼んでみましょう。そして、それができました。ここでの通常のワークフローを考えてみてください。アイデアがあり、キーボードに切り替え、そのアイデアを完璧なテキストプロンプトに翻訳しようとします。エンターを押して、待ちます。

ここでは、翻訳はありません。キーボードもありません。意図から創造への直接的なパスがあり、創造的なフローの中にとどまることができます。話すことはタイピングよりも約4倍速いことが分かっています。そしてこれが実際の様子です。ワイヤーフレームが生成される場所です。アプリがここにありますね。これは素晴らしいです。ここからさらに狂ったことになります。

テレパシー的コミュニケーション機能

Alter Egoはデバイスとのコミュニケーションを可能にするだけではありません。他の人とも機能します。完全にサイレントで、クリスタルクリアな会話をほぼリアルタイムで行うことができます。ノイズなし、唇の動きなし。基本的にテレパシーです。これを見てください。ここで本当に興味深くなります。

Alter egoは他のデバイスと機能しますが、alter egoを着用している他の人とも機能します。ほとんどテレパシーのように感じられます。このデモでは、私たちのalter egoから聞こえるものを聞くことになりますが、世界の他の部分にとっては、これは全て私たち2人の間でサイレントで起こることになります。今、これはちょっとばかげています。私たちは目の前に座っていて、ただ話すことができるからです。

しかし、一瞬、Maxが世界の別の場所にいると想像してみましょう。準備はいい、Max?やってみよう。デモはここまでどう思う?かなり良い感じ。まだ大きな不具合はない。この後、ランチはどこで食べたい?タイ料理がいいかもしれない。それは完璧に聞こえる。ArnovとI がどこにいるかは関係ありません。騒がしい環境でも静かなオフィスでも。

直接的な会話は一言も発することなく可能です。Alter Egoが検出する信号は環境ノイズに影響されません。風洞や建設現場の横を歩いていても、言いたいことは常に伝わります。無限のノイズキャンセレーションを持っているようなものです。それで十分クレイジーでなければ、Alter Egoはライブ翻訳もできます。

あなたは自分の言語で考え、相手は自分の言語でそれを聞き、自分の言語で返答し、あなたは自分の言語でサイレントでそれを聞きます。これがすでに現実のものになっているのは実際にクレイジーです。旅行している場合、あなたのサイレントスピーチは任意の言語に変換されます。では、Scott、私の中国語はどうですか?ScottはI が食べ物が好きだということを知っています。ありがとう、Scott。

総括と将来への展望

そうですね、Alter Egoは言語障害を持つ人々を助ける方法として始まりましたが、今では私たちが見た中で最もクレイジーな新しいインターフェースの1つに形作られています。AIと話し、デバイスをハンズフリーで使用し、人々と話し、言語間で翻訳することさえ、全てサイレントで、全てプライベートに可能なウェアラブルです。再度言いますが、これは基本的に今日私たちが持っているものとNeuralinkのような本格的な脳コンピューターインターフェース間のステップです。

では、コメントで教えてください。実際にこのようなものを着用しますか?そしてより広く、これについてどう思いますか?これはXで話題になっており、人々は一般的にこれがどこまで進んでいるかに感銘を受けているようです。非侵襲的でありながら、文脈認識、現実世界での支援、ワークフローの高速化など、人々がAIに本当に求めているものを提供するという事実。

それを単なるコンセプト以上のもののように感じさせています。まだ発売されていませんが、彼らのサイトでウェイトリストに登録することができます。下にリンクを載せておきます。正直なところ、これが離陸すれば、ChatGPTモーメントや潜在的にはiPhoneモーメントのような、大きなプラットフォームシフトモーメントの1つになる可能性があります。過大評価しているかもしれませんが、ぜひ下に思いをドロップしてください。

そして、この報道を楽しんでいただけたなら、いいねを押し、まだの方は登録してください。そしていつものように、次回皆さんにお会いしましょう。

コメント

タイトルとURLをコピーしました