本動画では、脳コンピュータインターフェース(BCI)の最前線について、神経科学者デビッド・イーグルマンがUCデイビスのセルゲイ・スタビスキーにインタビューする形で解説している。BCIとは、脳の電気信号を直接読み取り、それをコンピュータカーソルやロボットアーム、音声合成装置などに変換する技術である。現在、ALSや脊髄損傷によって身体機能を失った人々のために、運動意図や発話意図を脳活動から解読し、コミュニケーションや運動機能を回復させる医療応用が進んでいる。スタビスキーらの研究では、わずか30分間の訓練データで被験者の発話意図を99%の精度で解読し、さらに本人の声で即座に音声化することに成功している。技術的には256本の電極から数百個のニューロンを記録し、機械学習によって音素や単語を再構築する仕組みだが、課題は長期安定性、信号対雑音比、プライバシー保護など多岐にわたる。将来的には完全埋め込み型でワイヤレスのシステムが実用化され、5年以内に医療機器として承認される見込みである。さらに50年後には、数百万個のニューロンとの高帯域接続が実現し、義手での繊細な感覚フィードバックや無声での会話が日常となる可能性がある。しかし同時に、脳データの所有権や思考のプライバシー、倫理的境界線についての社会的合意形成が不可欠となる。

- イントロダクション:脳コンピュータインターフェースとは何か
- 脳を読み取る技術の歴史と現在
- 脳コンピュータインターフェースの原理と応用
- 技術的課題と実用化への道のり
- セルゲイ・スタビスキーへのインタビュー
- 動物実験から臨床応用へ
- 最初の臨床成功:マット・ネーゲルの事例
- 機能的電気刺激とループの閉鎖
- 発話解読のための電極配置
- 実際の臨床試験:ケーシーの事例
- 初期の成功と課題
- 30分間の訓練で99%の精度を達成
- 長期的な安定性と精度の向上
- 音声合成とプロソディの再現
- 脳から音声への直接変換の課題
- 表現力の実証:強調と歌唱
- 将来の展望:アルゴリズム、電極、そして脳の理解
- ワイヤレス化と完全埋め込み型デバイスの実現
- 将来の非医療応用の可能性
- 脳プライバシーと倫理的考察
- 失語症患者のための言語BCIの可能性
- 5年以内の実用化予測
- インタビューの結論と今後の展望
イントロダクション:脳コンピュータインターフェースとは何か
脳コンピュータインターフェースとは何でしょうか。この分野はどれくらい進んでいるのでしょうか。私たちは脳に盗聴し、動く能力を失った人がその脳を使ってコンピュータのカーソルやロボットアームを制御できるようにすることができるのでしょうか。話す能力を失った人が脳信号をデコーダーに送り、再び自分の声を聞くことができるのでしょうか。私たちは自律性と尊厳を回復し、最終的には技術が消え去り、人間が再び現れるほどシームレスにそれを実現できるのでしょうか。
将来、機能の回復と私的な思考への盗聴との間の倫理的境界線はどこにあるのでしょうか。そして、あなた自身を表す神経データの流れは誰が所有するのでしょうか。インナー・コスモスへようこそ。私はデビッド・イーグルマンです。私はスタンフォード大学の神経科学者であり作家です。これらのエピソードでは、私たちの3ペタバイトの宇宙の深くまで航海し、なぜ、どのように私たちの人生が今のように見えるのかを理解します。
脳を読み取る技術の歴史と現在
今週は脳を読み取る技術について話します。私が魅力的だと思うことの一つは、古代文化は脳についてまったく気にかけていなかったということです。彼らは一般的に検死の際にそれを捨てていました。なぜそうなのか理解できます。それはただ巨大なぐにゃぐにゃしたクルミのように見え、感じられるだけだからです。もしあなたが動いている脳を座って見つめることができたとしても、何も起こっているのを見ることはできないでしょう。
ですから、実際のところ、脳は多くの小さな細胞、顕微鏡的に小さな細胞で生き生きとしており、これらの細胞は各細胞について毎秒数十回から百回も電気信号を伝達しているということを認識するのに、何世紀もの時間と多くの技術が必要でした。そしてあなたは860億個ものこれらの細胞を持っています。つまり、この大きなぐにゃぐにゃしたクルミは地球上で最も忙しいもののひとつなのです。
しかし、それは非常に脆弱であるため、母なる自然は脳を装甲化された防護壁、つまり頭蓋骨で囲んでいます。そしてそれは、もしあなたがそこに入って細胞が何をしているのかを盗聴したい場合、大きな挑戦を提供します。では、なぜあなたはこれらの細胞をスパイしたいのでしょうか。
あなたの思考が言葉が口を出るのと同じくらい簡単に頭蓋骨を出ることができたらと想像してみてください。私たちは常にこれをある意味で行っています。私たちはキーボードやタッチスクリーンや音声アシスタントを使いますが、それらはすべて回り道です。それらは脳に意図を筋肉を通してルーティングすることを強制します。そして、それはあなたの筋肉が機能している場合は問題ありません。
問題は、多くの人々、私たちの隣人や友人の何百万人もが、脳や脳の経路や筋肉について何かが機能していないため、脳から情報を取り出す方法を持っていないということです。したがって、彼らの脳は何をしたいのか、何を言いたいのかを知っていますが、その情報を取り出す方法がありません。
脳コンピュータインターフェースの原理と応用
そして、これが脳コンピュータインターフェースのアイデアが登場する場所です。BCIと呼ばれるものです、脳コンピュータインターフェース。BCIのアイデアは、動くことや話すことや選択することを意味する神経パターンを直接聞き取り、それらのパターンを外の世界での活性化に直接翻訳するために何らかのデバイスを使用することです。
これは、意図から動きへの経路が病気や怪我によって中断されたすべての人々にとって大きな問題です。意図はまだ皮質で生き生きとしており、BCIは戻る架け橋です。それらは無言の計画をテキストや音声やカーソル制御や手を伸ばして掴むことに変えます。
しかし、少なくとも理論的には、この物語は医療を超えて到達します。なぜなら、この言葉を言うとか、そのキーを押すというプログラムを読み出すことができれば、今や生物学的組織とシリコンの間のコミュニケーションチャネルを構築したことになり、それは私たちの種がまだ想像し始めたばかりの新しい形の相互作用を開くからです。
さて、まだ先走らないようにしましょう。なぜなら、今日見ていくように、私たちはまだこの技術の最も初期の段階にいるからですが、これが私たちが最後に話すことです。
さて、あなたはBCIを多くのフレーバーで構築できます。いくつかは頭皮の上に置かれます。他のものは脳の表面に置かれます。他のものは電極と呼ばれる小さなワイヤーを脳の表面に突き刺すか、あるいはいくつかの目的のために脳の深部にまで突き刺します。これらのBCIのいくつかは電気活動のみを読み取ります。他のものは脳が触覚や音や視覚として経験する電気パターンでも書き込みます。
すべての場合において、原理は同じです。脳は命令を発し、それらは電気スパイクの非常に速く複雑な内部言語です。これは私たちがまだほとんど解読していない言語です。しかし、機械は多くの試行錯誤を通してその言語を翻訳することを学ぶことができます。膨大な数のニューロンの集団が何らかの交響曲を演奏しており、これらのデコーダーは音楽を聞き、命令をカーソルやスピーカーやロボットアームなどにルーティングする方法を学びます。
技術的課題と実用化への道のり
さて、私たちがそれについて話すとき、それはすべて非常に簡単で容易に見えます。しかし、実際にそこに入って、これらの顕微鏡的に小さな細胞から記録できる技術を取得し、これらの小さな変化を数十ミリボルトの電気電位で持ち、持続するシステムを作り、それからすべてのデータをまとめて、この非常に小さなニューロンのサンプリング、おそらく数千億個のニューロンのうちのせいぜい数百個を理解することは、実は大規模な工学的挑戦であることがわかります。
そして、実用的な質問が百万個あります。これらのシステムは研究室の外でどれくらい信頼できるのでしょうか。それらは感染や信号のドリフトを生き延びることができるのでしょうか。バッテリー寿命はどうでしょうか。手術のリスクは何でしょうか。保険がこれらをカバーするのはいつでしょうか。つまり、美しい原理実証と毎日生活を変えるデバイスとの間には大きなギャップがあります。そして、そのギャップを越えることが今のこの分野の本当の仕事です。
さて、2つ目の問題もあります。脳を読み取ることについて話し始めるとすぐに、質問が浮上し始めます。正確には何を読み取っているのでしょうか。それは意図された動きでしょうか。それは一つのことです。それは内なる言葉でしょうか。それはあなたが注意を向ける場所でしょうか。あなたは誰もに知られたくないことがある状況を想像できます。
私たちは頭蓋骨が何らかの神聖さを持つことに慣れています。では、機能の回復と私的な思考への盗聴との間の倫理的境界線はどこにあるのでしょうか。あなたの机の上ではなく頭蓋骨の中にあるインターフェースの場合、文字通りあなたであるデータの流れを誰が所有するのでしょうか。インターフェースが頭蓋骨の内側にある場合、同意とセキュリティと尊厳をどのように保証するのでしょうか。
したがって、すべての困難な質問が迫ってくる中でさえ、すでに可能なことに畏敬の念を感じないではいられません。体の中に閉じ込められていた人々が再びコミュニケーションを取っています。彼らは何年かぶりに愛する人々と話しており、技術は毎月改善し続けています。より賢いアルゴリズム、より良いセンサー、よりクリーンな信号、そして重要なことに、病院から自宅へ移行するデザインです。
セルゲイ・スタビスキーへのインタビュー
それで今日、私はそれがどのように見えるか、私たちがプロセスのどこにいるか、そして物事がどこに向かっているかを探求したいと思います。それで私は同僚のセルゲイ・スタビスキーと座りました。セルゲイはUCデイビスのニューロプロテーゼ研究室にいて、彼は神経外科医のデビッド・ブランドマンと共同でそれを指揮しており、彼らの協力者たちと共に活動しています。
彼らはコミュニケーションを回復するBCIに取り組んでおり、日常生活に実用的で、速く、表現力豊かなシステムに向けて推進しています。それでは、セルゲイ・スタビスキーとの私のインタビューをお聞きください。
脳コンピュータインターフェースは、技術と脳の間で相互作用するデバイスです。脳があり、情報を出し入れする何らかの方法があり、そして何らかの計算が起こっています。その計算は体内で起こっている可能性があります。つまり、脳内ですべてを行うチップである可能性があります。または、その情報を人の隣のラップトップ、あるいはさらなる計算のためにクラウドに送信している可能性もあります。
さて、あなたの興味の一つは、一世紀以上前に人々が電極を脳に浸すことができることを発見したということです。細いワイヤーです。そして、細胞は小さな電気信号で伝達しているので、あなたはそれを盗聴でき、また細胞を刺激して何でもさせることができます。それでは、この歴史について教えてください。人々が脳に盗聴してそれを何かに変えようと考えてきた経緯について。
動物実験から臨床応用へ
1960年代、70年代、特に80年代から、動物モデルで働いていて、人々は脳に電極を入れることができ、個々の脳細胞、ニューロンのすぐ隣に近づくことができることに気づきました。そして、そのニューロンが発火しているとき、それは大きな電場、いや、小さな電場を生成していますが、そのすぐ隣の電極に対しては大きいのです。そして、私たちはそのニューロンが発火していることを知っています。
それから、何十年もの間、システム神経科学があり、それは活動のパターンを動物が行っていることに関連付けていました。80年代からの古典的な例は、サルが腕を上下左右に動かしているというものです。そして、腕が左に動いているときにニューロンがより多く発火するのを見ることができ、そのニューロンは左向きの好ましい方向を持っていると言えます。私たちは脳活動が動きにどのように関連しているかについての心的地図を構築し始めています。
もちろん、それははるかに複雑であり、神経科学の分野全体が、個々のニューロンと数百個のニューロンとニューロンの大きな集合体全体がどのように行動を生成するかを理解しようとしています。
2000年代頃から、この分野は運動が脳でどのようにエンコードされているかについての初歩的な理解が十分にあり、これが医療応用に使用できると感じていました。そして、私の世界では、それは麻痺のある人々に運動を回復させることに焦点を当ててきました。
2004年は大きなランドマーク的イベントでした。それは元々のBrain Gate試験でした。これはブラウン大学とマサチューセッツ総合病院のジョン・ドノヒューとリー・ホックバーグによって主導されました。彼らはマルチ電極アレイと呼ばれるものを入れました。つまり、あなたが最初に言及した単一のワイヤーの代わりに、今度はそれらの小さなワイヤーの100本がすべて一緒に積み重ねられて、約100個のニューロンから記録しているところを想像してください。
そして、彼らはこれらのアレイが麻痺のある人に入れることができることを示しました。そして、その人が10年間動いていなかったとしても、最初の男性は20代の若い男性で、バーの喧嘩からのナイフの傷のために首から下が麻痺していたと思います。
最初の臨床成功:マット・ネーゲルの事例
彼は何年も何年も動いていませんでしたが、彼らはその電極アレイを運動皮質、通常は腕に命令を送る脳の部分に入れました。そして、彼が腕を動かそうとしたとき、なんと、それらのニューロンが激しく発火しました。それで、主要なリスクの一つが解決されました。それは、脳がまだ動きを生成しようとするのかということでした。なぜなら、使わなければ失うという考えがあるからです。人が麻痺している場合、なぜ彼らの脳がまだ運動命令を生成するのでしょうか。
幸いなことに、それはまだ生成します。そして、人々はそれらの信号を解読することができました。そして、皆さんへの簡単なリマインダーとして、脳は「私はあなたにこれらの動きをしてほしい」と言っており、それから脊髄を下り、末梢神経系に出て筋肉を動かします。そして、この場合、あなたは元の命令を聞いていますが、脊髄を下って出る道路に何らかの断絶があり、体が信号を正しく受け取らないのです。
正確にはその通りです。私たちは怪我をバイパスしています。私たちは命令がどこから来ているのかという源に行っています。これは2004年のことでした。彼の名前はマット・ネーゲルでした。研究者たちはニューロンが何を意図しているのかを聞くことができ、それ以来この分野は本当に離陸しました。
過去20年間で、たとえば運動動作について、最初はコンピュータ画面上だけでした。カーソルを動かすことができました。しかし今日では、人々はエクソスケルトンを使って腕を物理的に動かすことができるかどうかを考えています。あるいは、それらの麻痺した筋肉を刺激することさえできます。
機能的電気刺激とループの閉鎖
機能的電気刺激システムや硬膜外脊髄刺激など、歩行と腕の両方のためのものがあります。だから、本当にループを閉じることができます。人が行おうとしている動きを解読できます。ああ、彼らは何かをつかむために腕を前に動かそうとしているのだと。そして、それをロボットアームを動かすことができます。エクソスケルトンを動かすこともできます。
または、もし彼らが筋肉に行くワイヤーまたは脊椎の外側に行くワイヤーと共に皮膚の下に埋め込まれた刺激装置も持っている場合、体を刺激して実際にその人自身のかつて麻痺していた筋肉にその動きをさせることができます。それは健康な人が腕を動かすレベルではありませんが、それは機能します。そして、過去10年間にそれを行ういくつかの本当に素晴らしい研究がありました。
そうですね。まさにその通りです。さて、それが人々が脳コンピュータインターフェースを使って麻痺した体を動かしてきた方法です。さて、近年いくつかのグループが興味を持っていることは、もし誰かがもはや話すことができなかったらどうかということです。
では、まず第一に、誰かが話すことができない理由は何でしょうか。一般的なものの一つは、ALSのような神経変性疾患です。ALSは筋萎縮性側索硬化症という恐ろしい病気です。その通りです。そして現在、治癒法はありません。薬や他の療法でそれを止めることはできません。ルー・ゲーリッグ病としても知られています。その通りです。
そして、ALSを持つほとんど全員が徐々に体を動かす能力を失いますが、それはまた、私たちが音声調音器官と呼ぶものを意味します。つまり、唇、顎、舌、横隔膜です。そして、彼らの発話は理解するのがますます難しくなります。そして最終的には、ロックドインと呼ばれる状態になります。つまり、本当にまったく動くことができないのです。
もちろん、これは恐ろしい状況です。そして、もしコミュニケーションする能力を回復する方法があれば。今までのように腕の動きや脚の動きを解読するのではなく、彼らが作ろうとしている言葉や、彼らが作ろうとしている調音器官の動き、彼らが生成しようとしている音を解読すれば、この人は再びコミュニケーションを取り、望むならコンピュータを通して再び話すことができます。
発話解読のための電極配置
誰かが何を言おうとしているのかを理解したい場合、電極はどこに置きますか。それが大きな質問です。多くのアイデアがありました。一つのアイデアはブローカ野で、これは発話を計画すると考えられていました。別のアイデアは運動皮質で、これは最後の計画から命令の生成のようなものです。つまり、本当に筋肉に信号を送っている脳の部分です。
それから、言語ネットワークと呼ばれる脳の広い部分があります。これは側頭葉です。それは典型的には言語を知覚するために考えられていますが、言語を生成することにも大きく関与しています。だから、多くの可能な選択肢がありました。
発話神経プロテーゼを開発するための課題の一つは、動物モデルがないことです。この分野が人々に再び歩かせたり、人々に再び腕を動かさせたりしようとしていたとき、私たちは大きなヘッドスタートを持っていました。なぜなら、ラットやサルや他の動物の歩行や腕の動きをどこで解読できるかと言えるからです。まあ、動物は話しません。彼らは言語を持っていません。
ですから、私たちにはそのような指針がありません。そして、私たちが持っているのは、他の人間からのより精密でない測定です。過去10年から20年間の本当に重要な仕事の多くは、皮質脳波記録法で行われました。てんかんを持つ人々はしばしば、神経科医が発作がどこから来ているかを特定するために、頭蓋骨の下に、通常は脳の上または脳内にさえ電極を入れられます。
しかし、これらの人々はその後数週間病院にいます。そして、これは人間の神経科学にとって金鉱です。直接の脳記録とそれらが人間特有の行動、それが発話であろうと言語であろうと想像であろうと記憶であろうと、あるいは気分であろうと、これらすべてのことにどのように関連するかについて私たちが知っていることの多くは、この種の日和見的な記録から来ています。病院にとにかくいて、彼らはちょっと退屈していて、神経科医が十分なデータを持つのを待っているので、彼らに「画面から文章を読みたいですか」と頼むのは非常に簡単です。
そこから、私たちはすでにこの感覚運動皮質、つまり運動皮質と感覚皮質が主要な領域であることを知っていました。そして、私たちのBrain Gate臨床試験では、そこに電極を入れることになりました。つまり、基本的には通常筋肉に命令を送る脳の部分です。
実際の臨床試験:ケーシーの事例
つまり、筋肉に向かって突き進む前の最後の駅のようなものです。さて、あなたはそこで盗聴していて、これらの小さな電極アレイ、それぞれに64個の電極があるこれらの小さな正方形のジョブを突き刺しています。そして、それが4つあります。私たちは4つ使いました。そうですね、この中心前回に沿ってすべて4つです。
あなたはこれらのニューロンを聞いていて、そこから人が何を言おうとしているのかを解読しようとしています。そして一つの質問は、最初に十分なデータではないかもしれないと心配していましたか、それとも256個のニューロンで調音しようとしていることに関して何が起こっているのかを理解できると感じていましたか。
プロジェクトを始めたとき、私はかなり心配していました。これまでの仕事は、脳の別の部分、運動皮質の手の部分に約100個の電極があれば、発話を解読できることを示していましたが、非常に不十分でした。そこでは、私は記憶が正しければ、アメリカ英語の39個の音素の間で分類していて、約33%の精度でした。それはチャンスよりはるかに良いです。情報があることを示しましたが、それは誰かが言っていることを理解するのに十分ではありません。
音素とは何か教えてください。音素は音声の構成要素です。ほとんどの人は音節に精通していると思います。音素をそれよりも少し小さいものと考えてください。つまり、B、G、D、A、Eですね。子音があり、母音があります。異なる言語は異なる音素を持っていますが、英語では方言やアクセントによって39から41の間です。
これらは英語を分解する典型的な方法です。了解しました。つまり、あなたはこれらのニューロンから記録していて、人が今どの音素を言おうとしているのかを理解できるかどうかを言っていたのですね。そして今、この神経活動の配列を見るだけで。まさにその通りです。
そして、その少し前に、スタンフォードの私の同僚たち、そしてそれは私がポスドク研修を行った研究室でもありました。それで私はそのプロジェクトを始めて、それから移りました。彼らはALSを持つ女性の運動皮質に128個の電極を埋め込み、それによって彼女が言っている言葉を125,000語の大きな語彙で約75%の精度で解読することができました。
初期の成功と課題
これはこの分野にとって本当に本当にエキサイティングな瞬間でした。なぜなら、それは一般的なコミュニケーションに有用なものを作ることの扉を本当に叩いていたからです。さて、4つのうち3つの単語が正しいというのは素晴らしいことです。それは以前に行われたどんなものよりもはるかに良かったです。しかし、そのやり方では会話をすることはできません。それはあまりにもイライラします。間違いが多すぎます。
間違いの種類についての感覚を与えてください。つまり、人は脳という言葉を言おうとしていますが、神経活動はコンピュータによって解読され、コンピュータは「ああ、彼はパンダベアか何かを言おうとしている」と言います。まあ、パンダベアかもしれません。もっともらしいのは。だから、より良い例を選びました。
これらのシステムが機能する方法は、まあ、私たちのシステムが機能する方法の一つは、神経活動から音素に解読し、それらの音素が辞書と言語モデルを使って単語に組み立てられます。そして実際、辞書を見ると、ほとんどの人は使わない音声表記がありますが、単語を実際にどう発音するかを理解したい場合は、それを見ることができます。
だから、それがより起こりやすい間違いの種類は、似たような音の単語です。だから、誰かが脳と言おうとしている場合、おそらく納屋と取得するかもしれません。そして、いくつかの文脈では、理解できます。ああ、私は納屋を傷つけました。あなたは多分、事故にあって、脳を傷つけたと思うかもしれません。しかし、それらが十分にあると、それは単に壊れてしまいます。
そして、私が与える類推は、スマートフォンで入力しているとき、私たちのほとんどは少し不器用です。多くのタイプミスをします。オートコレクトはある程度まで助けることができますが、あまりにも多くのタイプミスをしていると、オートコレクト、言語モデルはついていけず、突然、ただのデタラメが出てきます。
それが状況でした。デタラメではありませんでしたよね。それは誇張していますが、日常的なコミュニケーションには達していませんでした。それで、あなたは45歳の男性と一緒に働きましたね。私の記憶が正しければ、彼はALSを持っていて、約5年間調音していませんでした。そうですよね。
彼はひどい構音障害でした。つまり、ほとんどの人は彼を理解できませんでした。そして、彼はこのBrain Gate 2臨床試験に志願しました。私たちは4つのサイトの1つでした。つまり、多くのテストと画像スキャンとその他のことの後、それが良い適合であり、前進するのが安全であると判断すると、彼は手術を受けました。
私の協力者であるブランドマン博士が、これらの4つのマルチ電極アレイを彼の発話運動皮質に入れました。すべてが治癒するまで数週間待って、それから私たちの機器がすでに事前に配置されていた彼の家に行きました。文字通り彼を接続しました。このシステムは有線なので、まだワイヤレスではありません。
30分間の訓練で99%の精度を達成
そして、私たちがそれを始めた方法は、機械学習の意味でトレーニングデータと呼ばれるものが必要でした。だから、アルゴリズムが彼が単語を言おうとしている多くの例を見て、それから神経活動がどのように見えるかを見る必要がありました。
そして、これが部屋で実際にどのように見えたかは、車椅子に座ってコンピュータ画面を見ている人を想像してください。私たちはランダムな文章のように見えるものを表示しました。テキストが現れ、それが緑色になり、彼は話そうとして、それから止まりました。そして、私たちは約30分間これを続けました。
そして、当時の大きな質問の一つは、これを機能させるためにどれくらいのデータが必要かということでした。そして、従来の知恵はそれが多くのデータを必要とするだろうということでした。以前の研究では、誰かが何を言おうとしているのかを解読しようとする前に、何週間も何週間も待っていました。
私たちが道具を借りているAI分野、たとえばスマートフォンに話すときの自動口述筆記、それらのモデルは何百万時間で訓練されています。だから、巨大なデータセットをスクレイプして、音声を理解できるようにしています。
しかし、音声運動を制御している脳の部分に電極があったため、それは非常に高い信号対雑音比と呼ばれるものを持っていることがわかりました。体が行おうとしている動き、したがってそれが生成しようとしている音について、本当に明確な信号があります。
それで、彼がこれらの文章を読んでわずか30分後、私たちはコンピュータの側面にある小さなダッシュボードを見ていて、それは単語誤り率または音素誤り率と呼ばれるものを示していました。どれだけの単語または音素が誤って解読されているか。そして、私たちはそれが、さて、このことが実際に機能できる点にあるのを見ました。
それで、私たちは言いました。さて、今、私たちは非常に特別なことをするつもりです。いわばスイッチを切り替えるつもりです。そして今、あなたが話そうとすると、願わくば画面の下部に単語が現れるのを見るでしょう。そして、私たちはこれのクールなビデオを持っています。
それで、皆が息を殺して非常に興奮していました。そして、プロンプトが現れ、彼は話そうとして、最初の2つの単語が正しく現れました。そして実際にその時点で、皆が涙と笑いと拍手に包まれました。
私たちは実際に数分間一時停止し、抱擁をしました。彼の家族がそれを見るためにそこにいました。それは本当に素晴らしい瞬間でした。それから私たちは、さあ、仕事に戻りましょうと言いました。そして私たちは続けました。そして、その日、私たちは比較的控えめな目標を設定していました。
私たちは50語の語彙と呼ばれるものを使っていました。つまり、それで言える文章は50語に制限されていました。そして彼は、まだいくつかのことを言うことができます。そして、それは明らかに実用的には有用ではありませんが、それは単に始めるためのものでした。この50語の語彙を使って、1%未満の誤り率でした。つまり、ほとんどすべての単語が正しかったです。それは巨大でした。
だから、私たちはすでに、他の以前の臨床試験参加者のように、彼が話そうとしているとき彼の脳がまだ活動していることを確立していました。だから、大丈夫です。それは大きなリスクの一つでした。これらの電極アレイから良い神経信号を得ていましたか。はい、私たちは美しい神経信号を得ていました。実際、私のキャリアで見た中で最高のもののいくつかです。
それから、大量のデータが必要でしたか。そして答えはノーでした。私たちは、これらの機械学習アルゴリズムを訓練して神経活動パターンを単語にマッピングするのに十分なものを得ていました。
長期的な安定性と精度の向上
さて、リスナーのために、私は家族が泣き始めたときのビデオをリンクします。それで私はそれを非常に感動的だと感じました。それで、これらの電極はどれくらい持続し、ケーシーのためにそこから良い信号を得ることができるでしょうか。
それは重要な質問です。そして答えは、私たちは単に知りません。現時点で、彼はこれを約2年間持っています。数ヶ月前にプレプリントがあり、650日を過ぎてもシステムはまだ順調に機能していることを示しました。
これは巨大です。なぜなら、これらの電極が数ヶ月後にニューロンを記録するのを停止するかもしれないという懸念が常にあったからです。そしてなぜそれは、電極の周りに瘢痕組織が蓄積するからです。多くの潜在的な要因があります。
そうですね、脳に異物があるときはいつでも、体と脳はそのものを望んでいません。だから、瘢痕組織が形成され、それは電極の先端の周りのミクロスケールである可能性があり、個々のニューロンを記録するのが難しくなります。
それはあなたが聞いている誰かから遠ざかっているように考えてください。または、あなたと彼らの間にパディングがあります。それは信号をこもらせます。それはマクロスケールのようなものでもあり得ます。そこでは実際に電極を脳から引き出すことができ、それは他のいくつかの研究で起こっています。
あなたの皮膚がとげを押し出す方法のように。そうですね、それは良い類推だと思います。それは生物学的反応についてです。また、これらは電極です。だから、材料は時間とともに失敗する可能性があり、絶縁は時間とともに失敗する可能性があり、金属は削られたり食い荒らされたりする可能性があります。ワイヤーは切断される可能性があり、多くの潜在的な故障モードがあります。
しかし、この場合、記録は本当に本当に励みになります。だから、2年が経過して、それは素晴らしく機能しています。精度は実際に私たちのプレプリントで良くなっています。現在99%正確です。両方とも、より多くのデータがあり、アルゴリズムを改善して新しいことを試し続けるための時間がより多くあったためです。そして、彼は今これを彼の主要なコミュニケーション手段として使用しています。
音声合成とプロソディの再現
それで、いくつかのことですが、一つは、神経活動を解読するとき、それを画面上の単語として印刷することができますが、あなた方はさらに一歩進みました。そうですね。それで、最初の数ヶ月で、私たちが行ったことは、テキスト読み上げと呼ばれるものです。だから、単語は最初に画面上にテキストとして現れ、それから全体の発話または文章、または段落全体である可能性があるとき、彼は目を使って画面上のボタンを見て、基本的に完了ボタンがあり、完了ボタンを押した後、コンピュータは彼が言ったことを声を出して読みます。
そして、私たちは基本的に彼の声のディープフェイクを作りました。だから、それは彼がALSになる前のように聞こえます。それは完璧ではありませんが、本当に彼にとてもよく似ています。そして、その技術は過去2年間でさえ大きく進歩しました。ほとんどの場合、人々は誰かの声を偽造することのすべての悪用について心配しますが、これはおそらく実際に本当に素晴らしいことである数少ないケースの一つです。
それで、あなたは若い頃、ALSが発症する前のビデオから彼の声を得ました。そうですね、私たちは彼と彼の家族に尋ね、彼らは私たちに多くのものを提供してくれました。そして実際、彼は以前にポッドキャストを行っていました。だから、私たちは本当に良い素材を持っていました。
それで、彼が文章を考えるとき、神経活動が解読されます。文章が再構築され、それからあなたはそれを彼の声に変えます。はい。さて、それがあなたが2024年に示したことです。そして、あなたはつい最近、5ヶ月ほど前に論文を発表しました。それについて教えてください。
そうですね。以前のすべてのものは、声を出して言うことができたとしても、最終的には情報はテキストの形です。そして、私たちは皆、テキストだけでは多くのものが失われることを理解できると思います。イントネーションはありません。あなたが皮肉を言っているかもしれないということを示すことはできません。
それは表現力が低いですよね。私たちが皆、声で伝える豊かなニュアンスが多くあり、テキストを通してそれは失われます。そして、もう一つの問題は遅延または即時性です。だから、もし私があなたに話していて、私が書くことしかできなかったら、あなたが誤って私を中断するか、または私が文章を終えてそれを声を出して話すためのボタンを選択するまでに、多分あなたはすでに次のトピックに移っているので、私が言葉を挟むことができないのが非常に簡単でしょう。
もし部屋に他の人々がいたら、彼らは話していますよね。だから、これらすべての理由で、私たちは本当に私たちが脳からテキストと呼ぶものではなく、脳から音声と呼ぶものをやりたかったのです。そして、それは神経活動から音にすぐに行くことを意味します。
脳から音声への直接変換の課題
これは多くの理由で難しい問題です。その一つは、それが非常に速く行われなければならないということです。約30ミリ秒以内に音が起こることを望みます。それは脳から筋肉を動かして誰かが聞くことができる空気を振動させることの自然な遅延にマッチしています。
そのため、まず第一に、これらの神経信号を非常に迅速に解読しなければなりませんでした。それは使用できるアルゴリズムの種類を制限します。作業するデータが少なくなります。未来を見ることはできません。オートコレクトはありません。
文章全体を見て、文脈に基づいて理解することはできません。ああ、私はコットを撫でるために手を伸ばしました。いいえ、彼はおそらくキャットを意味しました。なぜなら、あなたは通常コットを撫でないからです。もし脳から音声をやっているなら、それをすることはできません。あなたがIと言おうとするとすぐに、I、R、reachedという音を持つ必要があります。それは単に絶えず流れなければなりません。
しかし、私たちは多くの複雑なエンジニアリング作業を通してそこにかなり遠くまで到達することができました。そして、あなたが言及しているその論文での最先端は、それは非常に即時的です。だから、遅延は30ミリ秒未満です。そして、それはほとんど理解可能ですが、一貫して理解可能ではありません。だから、約56%の単語が誰かによって理解されることができました。
それは大きな前進ですが、日常使用には十分ではありません。私はすでに以前に、4つのうち3つの単語では十分ではないと言いました。だから、2つに1つの単語は絶対に十分ではありません。それで、間違いがあるとき、それはどんな種類の間違いですか。それは脳のための納屋で、したがってある程度理解可能ですか、それともそれよりも悪いですか。
そうですね、それは不明瞭な発話のように聞こえる傾向があります。または、誰かがもごもご言っているかのように。だから、時々あなたはその要点を得ることができます。長さは同じである傾向があります。なぜなら、それはまだ私たちが発話のエンベロープと呼ぶものを捕らえているからです。だから、もし彼が短い単語または長い単語を言っているなら、それは非常に明確に伝わりますが、音素のいくつかは少し乱れているかもしれないので、何が言われているのか正確にはわかりません。了解しました。
脳がエンコードしている各音素について、あなたはそれをすぐに翻訳しています。30ミリ秒後、それがスピーカーから出てきます。そうですね。私たちは十分な信号対雑音比を持っていません。十分な精度を持っていません。だから、それは本当に悪いデジタルカメラ、本当に粒状のカメラを持っていて、シーンを解析しようとしているようなものです。時々あなたは何が起こっているのかを見ることができますが、他の時はあなたは単にはっきりと判別できません。それは人ですか、ボールですか。それは、何と、その単語は何と言っていますか。それが本当に粒状なら、あなたは単によく見ることができません。
そして、私たちは256個の電極を持っていますが、それは多く聞こえますが、脳は約1000億個のニューロンを持っています。おそらく数十億個が発話と言語だけに関与しています。だから、ある意味では、これがまったく機能するのは奇跡です。私たちがこのように少数のニューロンからサンプリングしていて、人が作ろうとしている音を再構築できるということは。
そして、もし私の記憶が正しければ、その論文では、あなたは短い歌唱も示しましたね。そうですね。だから、私たちはこのアプローチが単に言葉を伝達する以上のことができることを実証したかったのです。なぜなら、私たちは脳からテキストでそれをすでに持っていたからです。今、それは即座にそれを行うことができました。だから、それは中断されるか、すぐに聞かれる問題を解決します。
表現力の実証:強調と歌唱
しかし、私たちはこれが表現力豊かでもあり得るという概念実証を提供したかったのです。だから、それを実証したいくつかの実験がありました。その一つでは、彼は質問または陳述として文章を言うように求められました。そして、英語では質問をするとき、私たちは最後にピッチを上げます。だから、彼はそれをすることができました。
私たちは彼に特定の単語を強調させました。そして、あなたが言っていることの意味を変えるためにそれを使います。だから、別の研究からのこの古典があります。7つの異なる方法で言うことができる文章で、「私は彼女が私のお金を盗んだとは決して言いませんでした」。
さて、私は「私は彼女が私のお金を盗んだとは決して言いませんでした」と言うことができます。「私は彼女が私のお金を盗んだとは決して言いませんでした」と。ですよね。私はどの単語を強調しているかによって、含意を少し変えています。それで、私たちは彼がその文章をすべての異なる単語を強調して言うタスクを持っていました。
そして、なんと、はい、神経活動から、彼がどの単語を強調しているかを特定できました。それで、私たちは別のタスクを持っていました。そこでは、単語を大文字にした文章を彼に与えます。そして、彼はそれを強調することになっていました。
そして、最後のものはあなたが言及していたものです。私たちは単純な歌唱タスクと呼んでいます。だから、それはわずか3つの音符でした。基本的に彼は言いたいことを何でも言うことができましたが、3つの異なるピッチレベルで。だから、彼はバ、バ、バ、または、あなたが知っているように、マ、ラ、ダと言うことができました。
だから、そのタスクで彼はかなりうまくやることができました。彼はまだオペラで歌うつもりはありませんが、それは前進する道を示しており、私たちの研究室と他の多くの研究室が今取り組んでいるのは、どのようにこれに基づいて構築するかです。
つまり、それはより良いアルゴリズムを意味しますか。人工知能の世界と、これらの信号を理解するための神経科学には常に新しい革新があります。それはより多くの電極を入れることを意味しますか。確かに、それは興味深く、そこには本当にエキサイティングな作業が行われています。
それは脳の追加の部分に電極を入れることを意味するかもしれませんか。だから、単純なレベルでは、人々は左脳対右脳が何らかの違いを持つと考えています。おそらく、これらの音声の傍言語的要素と呼ばれるもののより多くが脳の右側により多くエンコードされています。
それは私たちが見つけたいことで、将来的にはそうすることを望んでいます。または、発話ネットワークの他の部分にそれを入れる必要がありますか。
将来の展望:アルゴリズム、電極、そして脳の理解
ちなみに、リスナーのためにそれを具体化するために、左側の脳には、言語に多く関与しているものがあります。人々がそこにダメージを受けると、たとえば、文章を作成する能力、文章を理解する能力を失います。
しかし、人々が右側の同等の領域、鏡像のダメージを受けると、失音楽症と呼ばれるものになる可能性があります。それは音楽をもはや理解できなくなることです。なぜなら、あなたが言うように、そこにイントネーション、言語のプロソディがエンコードされているように見えるからです。
良いです。これは未来への良いセグエです。まず第一に、あなたが提起したばかりの答えは何だと思うか、私は興味があります。それはより良い電極、より多くの電極を取得することですか、それはより良いアルゴリズムを取得することですか、改善を得るための最も低いぶら下がっている果実はどこにあるのか、信号対雑音比に制限がありますか。
私はD、すべてを選ぶことができますか。私たちはこれらすべてのものが必要だと思います。すでに私たちは、より良いアルゴリズムと脳が何をしているかのより良い理解だけで、同じ電極でより多くの情報を絞り出すことができていることを私たちのデータとこの現在の参加者で見ています。
多くのことが起こっています。それは動きだけではありません。私たちは神経エラー信号のようなものを見ています。プロソディとイントネーションがエンコードされているのを見ていますよね。これらすべてのことは、私たちが測定しているこれらの脳信号の中で混ざり合っています。
そして、それらを解きほぐし、それらが何を意味するかを理解することには多くの科学があります。特定のアプリケーションのために何に注意を払おうとしていますか。だから、それはすべて前進しています。そして、だから、私たちは人間の脳が発話をどのように生成するかについて非常に多くのことを学んでいます。なぜなら、私たちは以前にこの精度でこの機会を持っていなかったからです。
今、話そうとしているときに個々のニューロンを測定する電極を持っている世界全体でほんの一握りの人間しかいません。だから、私たちは多くのことを学んでいますが、確かにより多くの電極がより良いです。
だから、私たちの試験では、前進するにつれて、より多くの電極を入れるつもりです。今、ニューロンのすぐ近くに行く同様のタイプの電極ですが、完全に埋め込まれた皮質内電極を構築している複数の会社があります。だから、それらはすべて1000以上の電極または記録部位を持っています。
だから、私たちは電極の密度またはカウントにおいて少なくとも4倍、それ以上ではないにしても改善について話しています。そして、私はそれがすべてをずっと良く機能させると思います。
ワイヤレス化と完全埋め込み型デバイスの実現
そしてもちろん、会社はこれをワイヤレスにするためにも取り組んでいます。Neuralinkが、私が思うに、それを行った最初のものですが、他の会社もその方向に進んでいます。だから、完全にパッケージ化されたものを持つことができ、人がワイヤーが垂れ下がることなくただ話すことができます。
そうですね、それは非常に重要です。だから、私たちが今持っている有線システムは、それらは利用可能なものです。それらは研究にとって良いです。それらはある意味でよりシンプルです。それらはかなり長い間安全であることが示されていますが、それらは制限的ですよね。
完全に埋め込まれたものが進むべき道です。そして、私たちは他の医療機器を見ることができます。だから、50年代のペースメーカーのこれらの野生の写真があり、それは基本的にカートの上の車のバッテリーのようなもので、アンプとある種の原始的な、コンピュータではなく、電子機器があります。そして、誰かの胸に行くワイヤーがあります。
それは彼らを生き続けさせ、それがこれが機能することを示しました。しかし、もちろん、今日、何百万もの人々が非常に健康に、小さくてチタンまたは他の非常に不活性な安全な材料にパッケージ化されたペースメーカーを持って歩き回っています。それらはバッテリーを持っています。それらのいくつかは今ワイヤレスで充電することができます。
だから、私はこれが歩き慣れた道だと思います。そして、私たちは脳コンピュータインターフェースでこれを絶対に見ることになります。それらは完全に埋め込まれるでしょう。それらはワイヤレスになるでしょう。データは無線またはレーザーまたは他の手段を通して出てきます。脳からデータを取り出すために。そして、電力は入ります。そして、それは素晴らしいでしょう。
素晴らしいです。さて、これを聞かせてください。多くの人々はNeuralinkに非常に精通しています。彼らはそれについて聞いたことがあります。私が言及したように、脳から記録するというこのアイデアは非常に長い間起こっているにもかかわらず。
Neuralinkがやっていることは、非常に小さな電極をロボット的に埋め込むことで、それは完全に埋め込み可能です。そして、それが有名である理由の一部ですが、また有名である理由の一部はそれがイーロンだからです。
そして、それについての神秘があります。いつか誰もがNeuralinkを手に入れるというある種のアイデアです。さて、それがロボットであったとしても、それはまだ開頭手術だからです。しかし、話すことや動くことに問題がない誰かが脳コンピュータインターフェースを持つことはどんな用途があるのかという点で、未来を見てみましょう。
そうですね、私はそのアプリケーション、いわゆるキラーアプリはまだ発見されていないと思います。ベッドに横になっていて、電話に手を伸ばさずにテキストメッセージを送ることができたらいいのにと思う時がありますが、それをするために脳手術を受けるつもりはありません。私は単に電話に手を伸ばします。
だから、私たちが見ることになると思うのは、医療応用の拡大です。だから、脳技術で対処できる医療ニーズがはるかに多くなると思います。脳卒中であろうと、長期的に記憶を維持することのようなもの、ですよね。加齢に関連する衰えやアルツハイマーにさえ対処することです。
だから、異なる問題のために異なるタイプのBCIがあるでしょう。しかし、本当に健康な人々のための完全に埋め込まれた侵襲的なBCIに関して言えば、まだ誰も価値があると私が思う利益を示していません。
将来の非医療応用の可能性
さて、私は想像できますか。確かに、人は想像できます。だから、もしあなたが脳にデバイスを持つことができたら、たとえば、それはあなたがよりアラートに感じることを可能にするか、またはより少なく眠ることを可能にするでしょうね。だから、ある種の概日リズムまたはエネルギーレベルまたは注意を調節することです。
人は、それがパフォーマンス向上薬のように、それが神経技術または神経インターフェースで行うことができることを想像できますが、まだ誰もそれを説得力のある方法で行っていません。
人々は、それが脳のある種の共同プロセッサのようなものになることができるかと話しています。あなたが物事を知っているようなものです。それはスマートAIアシスタントを持っているようなものですが、それはあなたの心の中にあり、それははるかにシームレスです。しかし、それは本当に遠い道のりです。
つまり、私たちは粗雑な視覚を得るのに苦労しています。人々が今ページを読むことができるように。つまり、それは驚くべきことです。それは最先端のようなものです。または、誰かが脊髄損傷を持っている人がゆっくり歩くことができます。または、誰かが話すことができますが、ALSまたは脳卒中の前ほど雄弁ではありません。
だから、私たちが今いる場所を考えると、情報をビームで入れるというようなことからはかなり離れていると思います。ああ、私はあなたに完全に同意します。しかし、私は25年後、たとえば、どうなるかと思います。もしあなたが単に近道を取ったら、「さあ、見て、私はあなたの隠れた発話、あなたが声を出して言っていないことを聞きたい、それから答えをあなたの聴覚皮質にあなたがそれを聞いているかのように直接プラグバックしたい」と言ったら。
そして、25年後の今存在するOpen AIか何かにワイヤレスでビームします。質問をして、そのように答えを聞くことができるかという質問です。私の予測ははいです。私はそれが行うことができると思います。つまり、正直に言うと、私はそれが次の5年間で行うことができると思います。
それは正確に行われるために手術を必要とするだけで、だから誰かがそれを望みますか。私たちは社会としてそれを許可することを選択しますか。人々の健康に対する彼らの主体性についての議論になります。それについて道徳的または倫理的な質問はありますか。
私はこれらが単に一般的な医療的および社会的な質問だと思います。私たちは人々が医療リスクを取って、そうでなければ彼らが持たない特定の能力を得ることを許可しますか。
脳プライバシーと倫理的考察
問題の一つは脳のプライバシーについてですよね。たとえば、私は私の隠れた思考を記録している何かをやっているとしましょう。それによって私は、私がまだ実際にそれを言うために運動皮質に押し出していない、考えていることを意味します。
誰がそれにアクセスできる会社ですか。私は誰かにそれにアクセスしてほしいですか。私はそれは本当の懸念だと思います。私たちはまだそこにいません。明確にするために、隠れた思考をまだ解読できるBCIはありません。
正確に。私は25年後について話しています。そうですね。つまり、これはこれがどこに向かっているかについての難問の一つです。まあ、私たちはすでにその兆候を扱っています。だから、たとえば、私たちのシステムでは、私たちの参加者が日常生活にこれを使用しているためです。
たとえば、私たちが実装したことの一つは、もし彼がボタンを切り替えると、それはもはやそのデータを保存しないプライバシーモードでした。これは学術的臨床試験です。一般的に、私たちはどんなデータもあきらめることを本当に嫌がります。
つまり、それは非常に貴重であり、これらの人々は科学に対してこれらのコミットメントをしていますが、私たちはまた、彼が本当にプライベートな会話をする必要があるかもしれないことを尊重したいと思います。そして、私たちはそれにアクセスする能力さえ持ちたくありません。
だから、それは学術医療センターからの医療試験の文脈で私たちがすでに扱っていることです。私は、これはそれをまだ持っていないけれども、それを持つ可能性がある人の高い信頼のシナリオだと思います。もちろん、これらを構築している会社がある場合、私たちは考えたいと思います。その場合、患者または顧客がデータに対してどんな権利を持っているか。
データはアルゴリズムを改善するために使用できますか。その利益を誰が所有しますか。政府がそれを召喚したらどうなりますか。今、私たちは声道麻痺のある人々のためのこの発話BCIを持っています。つまり、彼らは自分が何を言おうとしているかを正確に知っているということです。言葉は彼らの心の中で明確に形成されています。彼らはそれを話そうとしています。それらの命令は筋肉に到達していません。
さて、私たちはそこに非常に説得力のある治療があることを示しました。産業が入ってきてそれを製品化するでしょう。私はこれが次の5年間で医療機器になると思います。
しかし、脳卒中による失語症のはるかに大きな患者集団がいます。だから、そこでは問題は一歩さらに上流です。失語症とは、ちなみに言語を話すことができないことです。失語症。そうですね。まあ、異なるタイプがあります。だから、時々失語症を持つことはそれが彼らが言語を理解できないことを意味します。
しかし、表出性失語症を持つということは、多くの患者のケースで、彼らはコミュニケーションを取りたいと思っています。彼らは本当に意味の意味で何を言おうとしているかを知っていますが、それのための適切な言葉を見つけることができません。
それはほとんど、あなたが知っているように、時々私は単語を思い出すことができませんが、それは稀で、通常私はそれを思い出すか、他の単語を説明できますが、もし私がほとんどの単語を思い出すことができなかったら、それは本当にイライラして衰弱させるでしょう。
失語症患者のための言語BCIの可能性
そして、脳卒中を起こして部分的に回復したが、完全には回復しなかった何百万人もの人々がいます。彼らは言語障害を持っています。彼らの多くは、完全に正常な知性を持っており、彼らの人格は保存されており、他のすべては
そこにありますが、彼らは単に言葉を形成することができません。私たちは彼らを助けることができますか。そして、これは私たちの研究室と他の多くの研究室が考え始めていることです。
アイデアは、基本的に私たちが発話BCIで行ったこのことを行うことができるかということですが、今度は言語BCIを作ります。言語ネットワークのどこかに電極を入れることができますか。そして、それは脳の多くです。それは良いことでもあり悪いことでもあります。
しかし、私たちは意味を解読できますか。そして、これは思考というアイデアに近づいていますが、それは非常に明確に定義された用語ではありません。しかし、私たちは彼らがコミュニケーションしようとしていることの意味的な意味を解読し、たとえば、彼らの前にタブレットを持つことができますか。あなたに会えてうれしいとか、水をいくつか渡してくれますかとか、鼻がかゆいとか、気分が良くないという文章を印刷するか、文章を話します。
その思考、そのコミュニケーション意図は、これらの患者の多くにまだあります。私たちは彼らを助けるための医療技術を開発しようとしていますが、それは心読みのように聞こえることにかなり近づき始めます。
そして、だから、そうですね、私は倫理的な質問として、この医療プロジェクトが成功した場合、これは潜在的に今後数年間で関連するようになると思います。
それは興味深いです。なぜなら、私たちは心読みによって異なることを意味するからです。それにはこれらすべての異なるレベルがあります。だから、誰かが言おうとしていることでさえ、しばしば彼らが考えていることを隠します。
私は詩人のオリバー・ゴールドスミスからのこの引用を思い出そうとしています。彼は言語の本当の目的は意図を伝えることではなく、それを隠すことだというようなことを言いました。
とにかく、だから誰かが「ねえ、あなたに会えてうれしい」とか、何でも彼らが言っていることを言った場合、それは彼らの思考が実際に何であるかであるかもしれないし、そうでないかもしれません。それは単に彼らの言語です。
そうですね。だから、私たちはまだ私が話しているのはコミュニケーション意図の解読です。そして、それはある種、私が少し安心できると思うのは、それは能動的なプロセスだからです。今、私たちがどこにも近くないというわけではありません。
誰も、あなたが知っているすべてのものを読むことができるデバイスを作る方法の兆候さえ持っていません。あなたはそれについて積極的に考えていませんが、それは単にあなたの幼年期全体とあなたのすべての最も深い秘密を知っています。そして、あなたの周りの誰についてあなたが考えることを知っています。それを始める方法さえ私は知りません。
しかし、あなたが積極的に考えていることやあなたがコミュニケーションしようとしていることを考えることは、もっともらしく見えます。そして、誰かがコミュニケーションしようとしていることを解読できるチャンス以上のことを行うイメージングを使用したいくつかの研究があります。
私たちはいくつかの予備データを持っています。他の人もそうです。だから、私はそれが起こるかもしれないと思います。それでは、いくつかのことを聞かせてください。麻痺はいつ解決されますか。
私は麻痺のための承認されたBCIが約5年以内にあると思います。それは彼らがどこでも利用可能になるという意味ではありません。彼らは特定の市場でのみ利用可能かもしれません。おそらく、いくつかの病院だけが最初にそれらを提供するでしょうが、私はそれが急速に成長すると思います。
それは麻痺が治癒されることを意味しますか。私はそれはあまりにも強い用語だと思います。それはゆっくり歩くことができる、腕を動かすことができることを意味するかもしれませんが、最初は靴ひもを結ぶことができないかもしれません。コンピュータのカーソルを本当によく動かすことができますが、それはピアノを弾くのと同じではありません。
だから、私は能力が良くなり続けると思います。そして、ALSと構音障害を持つ人がよく調音できない場合、私たちは何を見ていますか、あなたの予測は。
5年以内の実用化予測
実際には同じです。私は発話脳コンピュータインターフェースが非常に速く動くと思います。私は、カーソルがおそらく最初の承認されたシステムの一つになると思います。人々がロボットアームや麻痺した四肢を動かそうとしてきた期間がはるかに長いにもかかわらず。
だから、もしあなたが誰かが何を言おうとしているのか、またはコンピュータのカーソルを動かそうとしているか、またはキーボードを書こうとしているのかを解読しようとしているなら、彼らが制御しようとしているものはコンピュータです。
そして、それらは遍在しています。それらはどこにでもあります。それらは安いです。それらは本当によく機能します。もしあなたが誰かが腕で動かそうとしていることを解読しようとしているなら、ロボットアームを動かす必要があります。ロボットアームは難しいです。それらはしばしば壊れます。それらは人々ほど精密ではありません。
それはどこに行きますか。それはあなたの車椅子に乗っていますか。それはシャワーであなたと一緒にそこにありますか。もしそれが、たとえば、切断がある場合、それはあなたの切り株またはあなたの肩に取り付けられていますか。それは難しいです。そこには多くの課題があります。だから、読み出し部分は発話にとって非常に難しいです。なぜなら、それは非常に速いからです。毎秒多くの情報があります。
しかし、それを解決したら、それを利用することは実際には本当に簡単です。あなたは単にテキストを彼らのコンピュータまたは電話に送信するか、タブレットに音を出させます。そして、それはあなたがいつも持ち歩くことができるものです。そして、それは本当に信頼できます。
だから、これらすべての理由で、私は発話とコンピュータ使用BCIが願わくば次の5年間で市場に出始めると思います。
素晴らしいです。そして、50年後について考えるとき、あなたが引退して分野を見回すとき、何を見ますか。
私はBCIが、まあ、その用語は何も意味しないかもしれません。なぜなら、それは非常に広くなるでしょうから。私は今日私たちが苦労している多くの病気が頭の内部の何らかの技術または頭と相互作用することで治療されると思います。多分それは何らかの方法で非侵襲的です。
それが麻痺であろうと、それははるかに速くなると思います。または、私たちの気分を調節するのに役立つシステムを持つでしょうか。それらは精神的な問題を治療しますか。それらはおそらく、加齢または損傷または怪我または脳卒中のために切断された脳の部分を再接続しますか。
もし私たちが50年について話しているなら、50年間で多くのことが起こり得ます。技術は非常に速く動いています。インターフェースは良くなるでしょう。だから、今、1000個のニューロンから記録することに興奮しているという話をする代わりに、50年後には、10万または100万個のニューロンとインターフェースすることができるでしょうか。私はそれが本当にもっともらしいと思います。
小さな、ナノワイヤーまたはバイオハイブリッドまたは、焦点を当てたビームを通して、非侵襲的です。50年間で多くのことが起こり得ます。私たちの神経科学ははるかに進歩すると思います。私たちは今に制限されません。私たちはほとんど周辺を理解しています。
私たちは動きを理解しています。私たちは感覚を本当によく理解しています。なぜなら、それらを実験的に操作するのは本当に簡単だからです。中心、認知、知能に入るとすぐに、私たちはどのように問題を解決しますか、創造性ですか。私たちは本当にそれをよく理解していません。しかし、50年後には私たちは理解するでしょう。
そして、その一部は、これらの医療システムを作るにつれて、人間の脳へのアクセスを持つことになるからです。だから、これをはずみ車として考えてください。だから、たとえば、誰かが数千個の電極を持っているとしましょう。なぜなら、彼らは脳卒中を持っていて、コミュニケーションを取りたいからです。
おそらく、これらはいくつかの異なる脳領域に広がっています。なぜなら、あなたはそれの異なる部分を得るからです。あなたが知っているように、多分あなたは主にある領域でプロソディを得て、運動皮質で彼らが言おうとしていることを得ますが、側頭葉からいくつかの計画の利益と言語の利益を得ます。
さて、4、5、6つの領域から記録しているとしましょう。まあ、今あなたは他のことに使用できる豊富な情報を持っています。だから、これらの患者の一部は時間とともに認知症を発症するか、彼らは落ち込んでいるか、強迫性障害を持っているかもしれません。
そして、新しいすべての新しいリスクを伴う新しい脳インプラントを行う代わりに、あなたはすでに収集しているデータを見て、彼らの気分やどこを見ているかに関連させようとすることができます。彼らは何を覚えようとしていますか。ああ、彼らは鍵をどこに置いたかを覚えようとしています。
ねえ、実際には、側頭葉に電極があるので、海馬に近いです。皮質です。それは記憶システムの一部でもあります。すべてが広がっています。まあ、多分今、私たちはその記憶プロセスのいくつかの神経相関を見ています。
私たちは刺激してその記憶を高めようとすることができるかどうかを尋ねることさえできるかもしれません。それを正しく記憶されるように何らかの方法でそれを刺激してみることを試みます。私は50年について話しているとき、それが起こると思います。
そして、このプロセスを通して、私たちは人間の心がどのように機能するか、したがってそれを修正する方法についてはるかに多くを学ぶつもりです。
インタビューの結論と今後の展望
それはセルゲイ・スタビスキー、UCデイビスの神経科学者であり、神経プロテーゼ研究室の共同ディレクターとの私のインタビューでした。
私たちはBCIが何ができるか、それらがすぐに何をするかもしれないか、そして彼らが提起する人間の質問をどのようにナビゲートするかについて話しました。私たちが今日話したことは、人の意図がどのように世界に戻る道を見つけることができるかということでした。
体が機能を失ったとき、脳コンピュータインターフェースは新しい車線を開いています。今、これらの技術はある意味では粗野ですが、それらは毎年速くなっています。それらは毎年少し速く、より表現力豊かになります。
だから、これはBCIが自律性と親密さと尊厳を回復する方法です。そして、それが正しく行われたとき、あなたは技術をまったく見ません。あなたは単に人を再び見るだけです。
それで、私はこれが私の見方です。次の5年間で、BCIは研究プロジェクトのように見えるのではなく、家電製品のように見え始めるでしょう。私たちはコミュニケーションのための完全に埋め込み可能なシステムを持つつもりです。言い換えれば、将来のある時点で、私たちは小さな手術、入る無線パック、そして時間ではなく分かかるセットアップを見ているでしょう。
あなたは発話BCIまたはコンピュータカーソルを制御するBCIをオンにするでしょう。そして、重要なことは信頼性です。これらのデコーダーは何年も安定して保持されるでしょう。そしてまたアイデンティティ。声はあなたのように聞こえるでしょう。あなたのリズム、あなたのプロソディ、文章の最後のあなたのユーモア。
多分リハビリチームは、補聴器専門家が人工内耳をチューニングする方法であなたのデコーダーをチューニングする神経療法士を持つでしょう。そして、もし私が推測しなければならないなら、これはすべてニュースに値するというよりも正常になるでしょう。
さて、約10年後、私たちは両方向に動く信号の良いフィードバックを得るでしょう。だから、麻痺に苦しんでいる人は、たとえば運動皮質の電極を通して手を制御し、情報を入力している別のインターフェース、たとえば体性感覚皮質の電極を持っていて、電気的に誘発された触覚で押し戻しを感じ、そのループが動きを滑らかで自動的にします。
これはすべて小さくより良くなり続けます。すぐに手術の足跡を減らすための薄膜オプションを持つでしょう。デコーダーは自動較正するでしょう。それらは言語モデルからトリックを借りるでしょう。そして、それらはあなたが疲れているか、ストレスを受けているか、カフェインでブーストされているときにあなたの神経ダイナミクスに調整する方法を理解するでしょう。
最終的には、あなたのBCIはあなたの電話やホームデバイスと同じAPI言語を話すでしょう。だから、あなたは四肢を動かすことなく、または音を立てることなく、テキストを送信したり、ライトを調整したり、家電製品をオンにしたりできます。
そして、重要なことに、プライバシーアーキテクチャは進化するでしょう。内なる言葉はデフォルトでオフリミットのままで、あなたの神経ストリームは同意ゲートの後ろに住んでいます。私たちは心のための飛行機モードのようなものが必要になるでしょう。
さて、もし私が今から四半世紀を推測するつもりなら、私が考えているのは、非常に高帯域幅のアレイです。これらはマイクロニードルまたは柔軟なメッシュまたは血管の内側に住む電極スタンスかもしれません。
技術が何であれ、それは自然な手の制御の器用さに近づくカバレッジを私たちに与えるでしょう。これらの一つでピアノを弾くことを想像してください。義肢とエクソスケルトンが機械のように感じることが少なく、自然な四肢のように感じることを想像してください。なぜなら、脳はそれらを体の一部として見て感じるからです。
そして、コミュニケーションのために、私たちは自然な言葉の完全な豊かさを得るでしょう。BCIを持つ人と話すことを想像してください。あなたは言葉の強調の上下を聞きます。そして彼らの笑い声と人々がターンテイキングを交渉しているときの小さな半分飲み込まれた音節と歌唱です。
そして、すぐに、私は確かに私たちの生涯で、これらすべてのサイエンスフィクションの端は輝き始めるでしょう。だから、このようなシーンを想像してください。多分35年後に列車に乗るとき。人々はそこに座っています。それは混雑していて、彼らは皆どこか他の場所にいる友人に私的なメッセージを話しています。
音はありません。列車は静かです。各人のデコーダーは彼らの試みた言葉にロックされており、彼らのアイドル思考ではありません。そして、すべてのメッセージはその人の神経キーから来たことを証明する暗号化透かしで署名されています。
だから、あなたは静かな列車の車両を見ていますが、それは会話で満たされています。または、もっとシンプルなものを想像してください。ここに手を失った大工がいますが、彼は触覚情報を脳にストリーミングする義手で仕事に戻っています。
圧力と温度、しかしまた彼は木目の詳細を感じることができます。彼は感覚で満たされたロボットの指をそれに走らせるだけで、松とオークの違いを見分けることができます。そして、重要なのは、彼がデバイスについてまったく考えないことです。彼はあなたが自分の手の高帯域幅感覚デバイスを使うように、そしてあなたはめったにそれについて立ち止まって考えないように、ただ構築します。
最終的には多くの立法が施行されるでしょう。なぜなら、私たちが社会として越えないことを選択する厳しい線があるからです。すべての思考がデジタル化されるべきではありません。私たちは歯を持つニューロライツが必要になるでしょう。
私たちはデータをローカルに保つオンデバイス処理が必要になるでしょう。多分あなたはあなたの脳の中であなたと一緒に住んでいる現代のLLMの子孫を持っています。どんな場合でも、私たちはおそらく私たちの脳と私たち自身について哲学的な質問を尋ね続けるでしょうが、私たちは今持っているよりもより良いツールでそれを行うことができるでしょう。
そして、私はこれが意味することは、私たちは今から1世紀後の私たちの子孫よりも1000年前の私たちの祖先とより多くの共通点を持っているということだと思います。
より多くの情報を見つけて、さらなる読み物を見つけるためにeagleman.com/mpodcastに行ってください。質問や議論でpodcast@eagleman.comに私にメールを送ってください。そして、各エピソードのビデオを見てコメントを残すために、YouTubeでInner Cosmosをチェックして購読してください。
次回まで、私はデビッド・イーグルマンです。そして、これはInner Cosmosです。


コメント