グーグルの新しいAIはイルカと会話できる…

AGIに仕事を奪われたい
この記事は約7分で読めます。

4,096 文字

Googles New AI Can Talk To Dolphins...
Join my AI Academy - 🐤 Follow Me on Twitter 🌐 Checkout My website -

これは今週で最も驚くべきAIに関する話かもしれません。信じられないかもしれませんが、いつかAIは実際にイルカと会話できるようになるかもしれません。本物の、海にいるイルカとキーキー音やクリック音、口笛のような音を使って会話し、AIはそれらの意味を理解し、やがて返事をすることができるようになるのです。
これはSF映画の話ではありません。「Dolphin Gemma」と呼ばれるこのAIは、グーグルがバハマで約40年間イルカの行動を研究してきたイルカ研究チームと提携して開発しているものです。
実際どれほど驚くべきことなのか説明しましょう。とても驚くべき内容になります。イルカはさまざまな奇妙な音—クリック音、口笛のような音、バースト・パルスなどを出すことで知られています。何十年もの間、科学者たちはこれらが単なる音なのか、それとも本当の言語が隠されているのか—システム、構造、あるいは意味さえあるのか—を解明しようとしてきました。
しかし問題があります。イルカの音を録音してGoogleの翻訳サービスに投げ込むだけではダメなのです。彼らのコミュニケーションはそれよりもはるかに複雑です。速くて、高音で、水中で行われるため3D空間の中で行われています。さらに、すべてのイルカは自分の名前—独自の口笛を持っており、実際にそれを使って互いを呼び合っているのです。
そこでグーグルは、AIが非常に得意とするパターン認識の技術で介入することにしました。彼らはDolphin Gemmaという新しいモデルを開発しました。これはGeminiモデルと同じ技術に基づいており、野生のイルカの音の最大のデータセットで訓練されています。このデータはWild Dolphin Projectから提供されました。1980年代から彼らは水中に潜り、イルカの群れを録音し、出会ったすべての個々のイルカを追跡してきました。
彼らはイルカがどんな状況で音を出したのか—子供と再会したときか、サメを追いかけているときか、あるいは別のイルカに恋の駆け引きをしているときか—を記録しています。言い換えれば、彼らはイルカの社会データベースを構築してきたのです。そして今、AIはついにそのデータを有効活用できるようになりました。
では、これは実際にどのように機能するのでしょうか?Dolphin Gemmaは「Soundstream」と呼ばれるものを使用しています。これは特殊な音声ツールで、イルカの音をAIが理解できるパターンに分解します。その後、Chat GPTがあなたの文章の次の単語を予測するのと同じように、どの音が互いに続く傾向があるのかを理解します。ただし今回はテキストではなく、口笛や鳴き声、バズ音です。
さらに驚くべきことに、このAIは今や科学者が観察してきたコミュニケーションパターンに実際に適合する、新しいイルカのような音を生成することができるのです。はっきり言っておきますが、まだイルカ語を流暢に話せるわけではありませんが、文法、音楽性、リズム、会話の流れを組み立て始めています。
ここでの目標はシンプルです。もしイルカの音を十分に理解できれば、おそらく私たちも返答できるようになるということです。ここで「CHAT」と呼ばれるものが登場します—Citation Hearing Augmentation Telemetry Systemの略です。これは水中で着用できるコンピュータで、Pixelスマートフォンと連携して、科学者が作り出した口笛と、浮遊する海藻や遊びのスカーフなど、イルカが好きな実際のオブジェクトを関連付けることができます。
彼らのやり方はこうです。新しい口笛を再生し、イルカにスカーフを与えます。これを数回繰り返すと何が起こるでしょう?時々、イルカは同じ音を使って口笛を吹き返します。基本的に、イルカはスカーフを求めているのです。
これを拡大すると想像してみてください。それぞれ異なるオブジェクトや、あるいはアイデアに結びついた口笛の完全なセット。これは双方向のコミュニケーションです。そして今、Dolphin Gemmaがイルカが次に言うかもしれないことを予測するのに役立つので、CHATシステムを使用している科学者はより速く応答できます。適切なタイミングで適切なアイテムを提供し、意味を強化し、これをより実際の会話に近いものに変えることができます。
さらに素晴らしいことに、これはすべてスマートフォンで動作します。次期バージョンではGoogle Pixel 9をヘッドセットに接続し、AIモデルを実行してリアルタイムで水中でイルカの模倣を分析するのに十分な処理能力を持っています。つまり、特注のサーバーや巨大な機器は必要なく、AIと防水ケース、そして好奇心旺盛なイルカだけです。
この取り組みの最も素晴らしい点は、グーグルが今年の夏にDolphin Gemmaをオープンソース化する予定であることです。これにより、クジラやバンドウイルカ、あるいは他の種を研究している誰もが、自分たちのデータでモデルのトレーニングを始めることができます。種によって音は異なりますが、フレームワークはすでに存在します。私たちはAIが他の種を理解するのを助ける未来に向かって動いています。単なる翻訳だけでなく、パターン認識、生成、インタラクションを通じてです。
イルカと人生の意味について近い将来チャットすることはできないかもしれませんが、イルカに「海藻が欲しい?それともスカーフ?」と尋ね、口笛の返事をもらうこと—それはもはやフィクションではなく、実際に起きていることです。そしてそれはAIによって可能になっています。
このようなAIとイルカの話題に関連して、「もしかしたらイルカは長い間私たちに話しかけようとしていたのではないか?」という疑問を投げかける人もいます。グーグルが関わる遥か前、1960年代にはジョン・リリーという科学者がすでにイルカの言語に取り憑かれていました。この人は実際に研究者とイルカが一緒に生活できる特別な水中の生活空間を作りました。彼の方法は今日の基準では疑問視されるものでしたが、これらの動物が単に音を出しているだけではなく、コミュニケーションを試みる知的な生き物であるという考えを先駆けました。
正直に言えば、イルカには実際にこれを裏付ける相当な脳力があります。彼らの脳は一部の領域、特に感情処理に関連する部分では、私たち人間よりも大きいのです。彼らには人間にはない余分な脳葉があり、音響情報を非常に正確に処理するため、エコーロケーションを通じて音で環境の詳細な3D画像を作り出すことができます。言い換えれば、彼らは単に音を聞くだけでなく、音を通して視覚化できるのです。
これは興味深い疑問を投げかけます。もしイルカの言語が単にものを表す音ではなく、互いに共有している実際の音響的な「絵」だとしたらどうでしょう?ここでAIは人間より有利です。私たちの脳はイルカのように音を処理するようには配線されていませんが、ニューラルネットワークにはそのような制限がありません。Dolphin Gemmaは、私たち人間が物理的に聞き取れないパターンを聞き取っているかもしれないのです。
そしてそれは、海洋生物学者たちを悩ませる倫理的な疑問へと繋がります。もし私たちが実際に別の知的な種と会話できるなら、何が起こるでしょうか?イルカが初めて、なぜ私たちが彼らの家を汚染したのか、なぜ彼らの食べ物を捕らえるのか、あるいはもっと悪いことに、海洋パークのために捕獲された彼らのいとこについて尋ねてきたらどうなるでしょう?これらはもはや科学的な問いではなく、哲学的なものです。
反面、それと同じくらい意義深いことを想像してみてください。私たちは何を学べるでしょうか?イルカは5000万年以上も海の生態系に適応してきました。彼らは私たちがようやく理解し始めている社会構造をナビゲートし、深海について私たち人間が独自に発見するには何世紀もかかるような知識を持っているかもしれません。
これはイルカだけの話ではありません。一度この技術を完成させれば、同じアプローチが他の発声する種にも適用できるでしょう。象は数マイル先まで伝わる低周波のランブルでコミュニケーションをとり、クジラは世代を超えて進化し、海盆全体を横断する歌を歌います。AIはこれらの会話にも耳を傾けるのに役立つかもしれません。
すでに一部の研究者はそれらの音を収集しています。キャサリン・ペイン博士は何十年もの間、象のインフラサウンド(低周波音)を録音してきました。Interspecies Internet Projectは、人間が大型類人猿や象と、彼らの認知能力に合わせて設計されたインターフェースを通じて交流するためのフレームワークを構築しています。これは単に一つの種の話以上の大きなものです。完全に異なる生物学的経路で進化した心の間の生物学的な隔たりを橋渡しすることです。
本当の問いは、これがコアな技術デモから実際のコミュニケーションへと移行するのはいつなのかということです。研究者たちは過度の約束をしないよう注意しています。深い意味を持つ真の双方向の会話は、まだ何十年も先かもしれません。私たちはまだものを指さして名前を付ける段階にいます。これは基本的に幼児に基本的な語彙を教えるようなものです。
しかし、すべての技術革命は最初はかなりシンプルに見えるものです。最初の電信メッセージはただのビープ音、最初の電話の通話は「ワトソン君、こちらに来てくれ」というだけでした。最初のテキストメッセージは単に「メリークリスマス」でした。現在の私たちの位置を見てください。今から20年後、私たちはCHATとDolphin Gemmaを、最初の原始的なステップとして振り返るかもしれません。私たちが海は単に他の動物で満たされているだけでなく、他の知性と他の文化も存在することに気付いた瞬間として。

コメント

タイトルとURLをコピーしました