彼らはやってのけた：Metaが思考を読み取るAIを発表—世界は二度と同じではなくなる！

5,049 文字

https://www.youtube.com/watch?v=ko9IOF3o-qk

今夜は、人工知能技術が私たちの世界を変えている特定の方法についてのニュースをお届けします。それは絶対に驚くべきものです。次のブレイクスルーはさらに深遠なもので、脳の組織にまで及びます。研究者たちはAIを使って脳スキャンをテキストに変換しました。Metaは思考を読み取る人工知能を発表し、テクノロジーと医療の世界を変革しています。この信じられないイノベーションは、神経学的な状態にある人々に新たな可能性への扉を開くことで希望をもたらします。このAIがどのように人々の生活を変え、未来に何をもたらすかを一緒に探っていきましょう。
Metaの新たな開発について。現代の神経補綴装置は、話せない、または動けない人々がコミュニケーションを再び取れるよう支援できますが、これらの装置は手術を必要とし、リスクが伴うことがあります。しかし、ここでMetaの出番です。脳の活動を観察することで、どのように文章が形成されるかを理解する、より安全で非侵襲的な方法を提示しています。彼らは35人の健康なボランティアでこの方法をテストし、うまく機能することを発見しました。そこで、脳活動を用いて文章を解読できる「Brain to QWERTY」という新しいディープラーニングシステムを作り出しました。
参加者がQWERTYキーボードで覚えた短い文章をタイプする間、脳波計（EEG）または脳磁図（MEG）のいずれかを使用します。Brain to QWERTYは、EEGまたはMEGによって捉えられた脳活動に基づいて文章を理解できる特別なニューラルネットワークです。研究では、参加者が記憶した文章をQWERTYキーボードでタイプしている間、彼らの脳活動が監視されました。この新しい方法は、外部のものに集中したり、動きを装ったりする必要がないため、以前の方法とは異なります。代わりに、Brain to QWERTYはタイピングに関連する自然な動きを利用し、脳が何をしているかをより簡単に理解できるようにします。
脳磁図を使用して、Brain to QWERTYシステムは脳コンピュータインターフェース技術において大きな進歩を実証し、印象的な平均文字誤り率32%を達成しました。この性能は、67%というより高いCER（文字誤り率）を持つ脳波計と比較して著しく優れています。モデルの最もパフォーマンスの高いインスタンスでは、CERは19%にまで低減可能で、脳信号の解読において高い精度を持つ可能性を示しています。
Brain to QWERTYのパフォーマンスの注目すべき点の一つは、トレーニングデータに含まれていなかった文章を正確に解読する能力です。これは実用的な応用にとって重要な一般化のレベルを示唆し、モデルが明示的に学習したもの以上の幅広い思考や表現を理解し解釈できることを示しています。間違いを起こす可能性はありますが、間違いの性質もまた、より複雑な推論機能の関与を示しており、タイピングという行為が単なる機械的なタスクではなく、より高いレベルの思考と計画を必要とするものであることを示唆しています。基本的に、このモデルは一人当たり15時間以上のデータでトレーニングされ、MRIスキャナーに座っている時の脳活動を取り込み、彼らが聴いているストーリーを出力します。
Brain to QWERTYを開発する前に、Metaは国際的な研究者と野心的な共同研究を開始し、2つの重要な研究を通じて人間の知性に関する画期的な洞察を明らかにしました。これらの研究は、タイプされた文章を再構築するための脳信号を解釈し、私たちの思考を話し言葉や書き言葉に変換する推論プロセスをより深く理解するための高度な人工知能モデルの開発に焦点を当てています。
これらの研究の最初のものは、パリにあるMetaの基礎的人工知能研究所がスペインのサン・セバスチャンにあるBass脳言語認知センターと共同で実施されました。この革新的な研究は、侵襲的な処置を必要とせずに脳の記録から直接文章を解読する驚くべき能力を実証しました。研究者たちは、35人の健康なボランティアが文章をタイプするタスクに取り組んでいる間、脳磁図や脳波計などの洗練された技術を用いて脳活動を監視・分析しました。
この研究を通じて開発されたシステムは、画像エンコーダー、脳エンコーダー、画像デコーダーという3つの不可欠な構成要素からなります。画像エンコーダーは、脳の入力とは独立して画像の詳細な表現を生成し、効果的に視覚的フレームワークを作り出す役割を担っています。続いて、脳エンコーダーは参加者の脳活動から捉えられたMEG信号と、以前に生成された画像表現を関連付ける重要な役割を果たします。この相関関係により、特定の脳信号がどのように特定の思考やアイデアに対応するかについての理解が深まります。
最後に、画像デコーダーは処理された脳信号を取り込み、それらを現実的な画像に変換し、参加者が表現しようとしていた思考を効果的に視覚化します。この先駆的な取り組みは、脳活動と言語処理の間の複雑な関係に光を当てるだけでなく、人間の推論を理解するためのAIの潜在的応用を探求するための新しい道を開きます。神経信号と言語表現の間のギャップを埋めることで、Metaとその研究パートナーは、神経科学と人工知能の両方における将来の進歩への道を切り拓いており、私たちがコミュニケーションし、テクノロジーと相互作用する方法を革命的に変える可能性を秘めています。
この画期的な研究から得られた知見は本当に注目に値します。研究者たちによって開発されたAIモデルは、脳磁図を用いて脳活動が監視された個人がタイプした文字の約80%を解読する印象的な能力を実証しています。この精度レベルは、脳活動測定の標準となっている従来の脳波計システムの少なくとも2倍です。この研究の意義は深遠であり、革新的な非侵襲的脳コンピュータインターフェースへの道を開く可能性があります。このような技術は、話すことができない個人の生活の質を大幅に向上させ、再び効果的にコミュニケーションを取る手段を提供する可能性を持っています。
最初の研究に加えて、2番目の研究の取り組みは、私たちの脳が思考を話し言葉や書き言葉に変換する複雑なプロセスを探求しています。参加者が文章をタイプする間に記録されたMEG信号を分析するための高度なAI技術を用いることで、研究者たちは抽象的な思考が具体的な単語、音節、文字に進化する正確な瞬間を特定することができました。研究のこの側面は、言語生成の根底にある推論メカニズムに光を当てています。
研究結果は、脳が一連の表現を通じて機能し、文章の意味の広い理解から始まり、キーボード上での指の協調的な動きなどの特定の行動へとこれらの表現を徐々に洗練させていくことを明らかにしています。さらに、研究は動的神経コードの概念を強調しており、脳はこれをさまざまな表現間の接続を維持するために利用しています。この動的コーディングにより、脳は各表現を長期間にわたって活性化させ、思考から行動への途切れのない移行を円滑にします。
テクノロジーは大きな可能性を示していますが、病院環境で効果的に実装される前に対処すべき多くの課題が残っています。可能な課題と解決策の一つは、テクノロジーが情報をどのように解読するかの現在の限界です。このプロセスはまだ完全ではなく、脳信号の解釈に不正確さをもたらす可能性があります。さらに、スキャン中、患者は外部の磁場をブロックするために設計された特殊な部屋で処置が行われるため、非常に静止したままでいる必要があります。この要件は、子供や運動障害のある個人などの特定の集団にとって特に困難な場合があります。
さらに、脳磁図装置自体は非常に大きく、高額な価格が付いており、多くの医療施設にとってはアクセスしにくいものとなっています。また、地球のより強力な磁場から保護を提供する部屋に設置する必要があり、既存の医療インフラへの統合をさらに複雑にしています。
これらの課題に対応して、Metaは進行中の研究努力でより多くの解決策に積極的に取り組んでいます。彼らは、臨床応用でテクノロジーが信頼されるために重要な解読プロセスの精度と信頼性を高めることに焦点を当てています。さらに、同社は日常的な使用により実用的である可能性のある代替脳イメージング方法を探求しており、日常的な医療行為への容易な統合を可能にする可能性があります。
Metaのもう一つの焦点領域は、複雑な脳信号を解釈できる高度な人工知能モデルの開発です。これらの信号を理解するAIの能力を向上させることで、研究者たちは脳機能に関する新たな洞察を解き明かし、脳イメージング技術の全体的な有効性を向上させることを期待しています。さらに、Metaは研究範囲を拡大して、より広範な認知プロセスを包含することを目指しています。この広範なアプローチにより、医療、教育、人間とコンピュータの相互作用など、多様な分野でのテクノロジーの革新的な応用につながる可能性があります。例えば、人々がどのように考え、情報を処理するかを理解することで、教育ツールと方法を革命的に変え、学習をよりパーソナライズされ効果的なものにすることができるでしょう。
これらの進歩が脳損傷を持つ個人に具体的な利益をもたらす前にさらなる研究が必要であることは明らかですが、進歩は励みになっています。各ステップは、人間の推論により似た方法で考え学習できる人工知能の開発という目標に近づいています。これは最終的に、脳の理解を深めるだけでなく、神経学的状態に影響を受ける人々の生活の質を向上させるようなブレイクスルーにつながる可能性があります。
Metaがまだプロジェクトの強化過程にある一方で、すでに競合他社が存在しているようです。
ニューラリンク脳チップ
ニューラリンクは、起業家イーロン・マスクとエンジニアや科学者の専任チームによって設立された神経技術会社で、高度な脳コンピュータインターフェース技術の開発の最前線に立っています。同社の主な焦点は、人間の頭蓋内に外科的に埋め込むことができる洗練された脳チップの作成です。この革新的なデバイスは、様々な障害を持つ個人の生活の質を大幅に向上させる可能性があり、動いたり、コミュニケーションを取ったり、さらには視覚などの失われた感覚を回復させる能力を取り戻すことができます。
ニューラリンクによって開発された脳チップは、脳信号を読み取り解釈するように設計されており、脳と外部デバイス（コンピュータやスマートフォンなど）間のシームレスなコミュニケーションを可能にします。神経活動を実行可能なコマンドに変換することで、チップはユーザーが思考だけでデジタルデバイスを制御する力を与え、相互作用と独立性の新しい道を開く可能性があります。
ニューラリンクのテクノロジーの最も有望な応用の一つは、麻痺した個人が思考のみを通じてデジタルデバイスを制御できるようにするために現在テストされている特別なインプラントです。この画期的な能力は、脊髄損傷を持つ人々の生活を革命的に変える可能性があり、これまで想像できなかった方法でデジタル世界と関わる前例のない自律性と能力を提供します。
臨床研究の取り組みの一環として、ニューラリンクは脳コンピュータインターフェースの安全性と効果を評価することを目的とした試験に3人の患者を含める計画を発表しました。この試験は、米国政府の臨床試験データベースに詳述されているように、数年にわたる長いプロセスになると予想されています。この研究の成果は、神経技術の将来の進歩への道を開く可能性があり、障害を持つ個人のための生活を変える解決策につながり、人間の脳の理解に貢献する可能性があります。
彼らがどれだけ進歩したかを示すために、昨年ニューラリンクは2人目の患者にデバイスを埋め込むことに成功しました。この患者はビデオゲームをプレイするためにデバイスを使用しており、3Dオブジェクトの作成方法も学んでいます。
ここまでご覧いただいた方は、以下のコメントセクションであなたの考えを教えてください。さらに興味深いトピックについては、画面に表示される推奨ビデオをご覧ください。ご視聴ありがとうございました。