
15,402 文字

ほな、想像してみてくださいな。AIの技術を使うて、揺れまくるプラスチックカップに入ったビールを、室内を飛んで酔っ払いに届けるドローンがあるとしましょ。これこそ、人間の最もややこしい状況をナビゲートするAIですわ。
こっちは、AI動画が想像した、15億頭の牛が毎日おならをして出すメタンガスの様子でっせ。
ほんで、これはリプサM5いうAI搭載の自律型戦車。自走する10トンの兵器ですわ。
こっちは、AI駆動のコンピュータービジョンを搭載した4本足のロボット。毎年捨てられる4.5兆本のタバコの吸い殻を拾うのを手伝うんですわ。1台で1000本拾うとして、45億台のロボットが街中を歩き回る必要があるんやね。タバコ税で賄うかもしれんし。
2035年頃には、みんなヘリコプターサイズのドローンを所有するかもしれまへんな。今後10年ほどで家を買う予定があるなら、大きな飛行ドローンを充電できるヘリポートがあるかどうか考えた方がええかもしれまへんで。
グーグルのディープマインドが、AIの世界でまた画期的な瞬間を生み出しましたわ。このDOOMのゲームは、拡散モデルを使うて全てリアルタイムで生成されてるんです。後で詳しく話しますわ。
コンピューター科学者たちが、熱が量子もつれ情報を破壊することを証明しましたわ。
新しいAI技術で、麻痺した人の考えを97%以上の精度で音声に変換できるようになりましたな。前回チェックした時は90%くらいやったから、ほぼ完璧に近づいてますわ。
カリフォルニア州知事の机の上に、新しいAI安全法案が載ってますわ。カリフォルニアのほとんどのAI企業はこれに反対してるみたいですが、イーロン・マスクは賛成してるようですな。ツイッターに影響するかもしれんのに変な話ですが、ツイッターをカリフォルニアから移転させてるから、競合他社の足を引っ張るためかもしれまへんな。それとも本当にAI安全法案が必要だと思ってるんかもしれん。あの人のことやから分かりにくいですわ。
大規模言語モデルが「strawberry(イチゴ)」の中に「r」が何個あるかという質問にうまく答えられへん理由について話しますわ。これがトークンの断片化と関係があるんかもしれまへん。
世界市場シェアから見ると、テスラはいくつかの面でかなり追い詰められてるみたいですな。数年前はまだ業界の中でダントツに進んでると思ってたんですが、世界が急速に追いついてきてる感じがしますわ。
ほな、まず飛んでくるビールの話からせなあきませんな…
飛んでくるビールの話ですが、酔っ払いがおるパーティーで、ひじとか体がぶつかってくるのを想像したら、ぶつからずに届けるのは難しそうですな。でも、時間が経つにつれてAIはどんどん上手になって、マイクロ調整を重ねていくんでしょう。ビールを配るたびにデータが増えて、どんどん上手くなっていくわけですな。
そう考えたら、近い将来、パーティーでビールが飛び回るのも現実になるかもしれまへんな。パーティーでビールが人から人へ飛んでいくなんて、想像もつかんかったですけど、こうやって実現しそうですわ。
面白いのは、手を伸ばしてビールを取ろうとする時の重さの変化をAIがどう理解するかですな。普通、人にビールを手渡す時って、相手がちゃんと持ったかどうか確認しながらゆっくり離すもんですわ。もし相手がうまく持ててないと感じたら、すぐに持ち直せるように準備しとくわけですな。
でも、このドローンの場合は違いますわ。ビールに対して上向きの力を加え続けんといかんのです。ビールを取る時、ドローンは下に留まろうとするから、人が上に持ち上げるのが見えますな。この部分の調整には時間がかかるかもしれまへんな。
それに、人にぶつかることもあるでしょうね。ぶつかっても、ビールがこぼれんように保てるんかどうか。まあ、ただの平らな台やなくて、カップがきちんとはまるホルダーみたいなんを作るかもしれまへんけどね。ビール配達のエンジニアさんたちが、きっと全部解決してくれるはずですわ。
コメント欄見てたら、みんな飛行車より先に飛ぶビールができて喜んでるみたいですな。まあ、それはそれでええんちゃいますか。
でも、チップの問題はみんな気にしてますわ。「あんなもんにチップ払うかい!」っていう声が多いですな。まあ、自動化したんやから、チップはなしでもええんちゃうかな。
「かわいこちゃんに配達してもらう方がええわ」っていう声もありますね。まあ、人間的な触れ合いは大事ですからな。
「途中で横取りされるんちゃうか?」って心配する人もおりますな。確かに、ビールが飛んでる途中で誰かが取っちゃう可能性はありますわな。maybe顔認識使って、指定した人以外には逃げるようにするんかもしれまへんな。
さて、次は牛のメタンガスの話ですわ。ニュースで時々、牛が出すメタンの話を聞きますやろ。今、世界中に15億頭の牛がおって、1日に500リットルのメタンを出すんですわ。これが地球温暖化の約15%を占めてるんです。牛のおならから出るメタンは、人間や他の哺乳類が出す二酸化炭素の25倍も温室効果が強いんですわ。
でも正直、牛を見ても問題やとは思えへんかったんです。農場を車と同じような汚染源やとは考えたこともなかったですわ。でも、AIがこういう架空の映像を作って、現実世界への影響を視覚化すると、ちょっと違う見方ができるかもしれまへんな。
例えば、銃の方が蛇より危険やのに、蛇を見たら飛び上がるけど、銃を見ても「ああ」くらいにしかならんのと似てますわ。車に乗っても、そんなに危険やと思わんし、ハンバーガーを食べて病気になるのも、日々の生活では実感しにくいもんです。
だから、こういうAIの視覚化が、本当のリスクを感じ、理解するのに役立つんちゃうかなと思うんです。将来、超知能AIが子供たちに、現実のリスクプロファイルに合わせて考え方を教える時に、こういう方法を使うかもしれまへんな。蛇みたいに進化の過程で身についた恐怖とは違う、新しい種類の危険を理解させるのに役立つかもしれまへん。
まあ、ただの遊びかもしれんし、私が真面目に考えすぎてるだけかもしれまへんけどね。
次は、もうちょっと真面目に考えなあかん話題ですわ。米軍向けのAI搭載戦車、リプサM5についてです。
これは人間が乗らずに環境に送り込めるタンクで、360度全方向を見渡せるんです。さらにドローンや高所カメラを展開して、周囲の状況を把握できるんですわ。装備は30mmチェーンガンにジャベリンミサイル。普通の戦車より軽量で、ヘリコプターやC130輸送機で運べるくらい小型なんです。
これで地上戦の様子がガラッと変わるかもしれまへんな。例えば、中国が台湾に攻め込むとか、ロシアとウクライナの戦争が続くような場合、こういう戦車を一番たくさん作れる国が勝つことになるかもしれまへん。
まあ、産業力が戦争の勝敗を左右するのは昔からですけど、今は中国が世界の消費財の多くを作ってるから、一番有利な立場にあるように見えますわ。でも、将来的にはAIとオートメーションを使ったギガファクトリーで、世界中どこでも製造できるようになるかもしれまへん。
ほぼ自動化された工場でこういうAI戦車を作り、その工場がまた別の工場を作って…みたいな感じで、一番多くのAI戦車を持つ国が勝つってことになるかもしれまへんな。めちゃくちゃ効率的で危険な未来になりそうで、正直どう感じたらええのか分かりまへんわ。
次は、タバコの吸い殻を拾うロボットの話ですわ。正直、まだ毎年何兆本ものタバコが吸われてるって聞いて驚きましたわ。もうそんなに一般的やないと思うてたんですがね。
でも、みなさんも道端や浜辺なんかで吸い殻見かけたことあるでしょ。歩道や街並み、ビーチなんかを台無しにしてますやんか。だから、ロボット犬に大きな掃除機つけて、コンピュータービジョンで吸い殻を見つけて拾わせるっていうアイデアは、なかなか革新的やと思いますわ。
これ、ゴミ拾い全般に使えそうですな。将来の都市はめちゃくちゃキレイになるかもしれまへん。今でも街の清掃員さんがおるけど、こういうロボットが5年から10年後には街中にいるかもしれまへんな。
電力節約のために、掃除機は常にオンになってるわけやないんです。周りを見回って、吸い殻を見つけたら掃除機をオンにするんですわ。
コメント欄見たら、「遅すぎるやろ。禁煙させた方が早いわ」って意見がありましたな。でも、このロボット、24時間365日働けるんですよ。充電器に戻って充電したらまた働き続けられる。
「タバコより、ストローやビニール袋を拾わせた方がええんちゃう?」っていう意見もありましたな。確かにそうかもしれまへん。きっと開発者さんたちも考えてると思いますわ。
実際、リサイクル用のロボットとタバコ吸い殻専用のロボットを分けて作るかもしれまへんな。お互いに情報共有して、クラウドにデータを送って、後でプラスチック専用のロボットがタバコの吸い殻の場所を通りかかったら、「ここにタバコの吸い殻があるよ」って教えてもらえるかもしれまへん。でも、今はプラスチックだけを拾いに行くとか。全部のゴミの情報をマスターのクラウドバージョンに送って、適切なロボットが拾いに行くみたいな感じになるかもしれまへんな。
さて、次は中国の自動飛行車のプロトタイプの話ですわ。基本的には大型のドローンで、1人か2人乗れるんです。
デモ映像見てたら、男性が充電してる様子があって、「ほんまに、これが未来のテスラみたいなもんなんかな」って考えてしまいましたわ。今のテスラみたいに自動運転で道路を走るんやなくて、空を飛ぶわけですからね。
家を買うときや建てるとき、屋上にヘリポートを作るべきか考えなあかんのかもしれまへんな。これが主要な移動手段になるかもしれんし。
ソフトウェアのアップグレードは、今のテスラみたいに無線で行われるんでしょうな。年々アップデートされていくイメージですわ。
でも、気になる点もありますな。回転翼の周りにガードがないのが目につきましたわ。将来のモデルではきっと、触っても危なくないような工夫がされるんでしょうけど。
騒音対策も必要ですな。めちゃくちゃうるさそうですわ。でも、これもイノベーションで解決されていくんでしょうな。
さて、次はAIの世界で本当に画期的な瞬間の話ですわ。ChatGPTの登場とか、囲碁AIのアルファ碁とか、IBMのワトソンとか、そういう大きな出来事がありましたやん。5年か3年くらいごとに、タイムラインに載せるような大きな出来事が起こるんです。
今回は、完全に人工知能が作り出したビデオゲームの話ですわ。見た目も遊べる内容も、実際のビデオゲームと変わらんのに、全部リアルタイムで生成されてるんです。拡散モデルっていう、写真や動画を作るのと同じ技術を使ってるんですわ。
このゲームをプレイした人の半分くらいは、本物のDOOMなのか、AIが作ったバージョンなのか区別がつかへんらしいです。しかも、このゲームには終わりがないんです。無限に遊べる。リアルタイムでニューラルモデルが全部シミュレーションしてるんですわ。
これは人工知能が次の大きな領域に足を踏み入れた瞬間やと思いますわ。5年か10年後には、終わりのないバーチャルリアリティやメタバースの世界に迷い込めるようになるかもしれまへん。ビデオゲーム業界が完全に変わる第一歩なんです。
例えば、GTA6は完全に作り込まれたストーリーラインを持つ最後のゲームになるかもしれまへん。GTA7は、このAIゲームの進化版みたいな感じで、プレイヤーごとにカスタムストーリーが作られて、街の様子も好きな都市の雰囲気に合わせて生成されるかもしれんのです。
このゲームにはまだちょっと変なところもありますわ。これはあくまで第一歩ですからね。画面下の数字が完全に安定してないとか、キャラクターの動きがちょっとおかしかったりします。これは、ピクセルで生成されてるんやなくて、メニューを安定させるために別のモデルを使ってるからなんです。
HUDっていう、ゲーム画面に表示される情報の部分には、別のデコーダーモデルを使ってるんですわ。これで、ARみたいな効果を減らして、メニューなんかの静的な要素をはっきりさせてるんです。
もうちょっと詳しく説明しますと、最初のフレームでは銃が撃たれてない状態から始まって、だんだん近づいていって、火花が見えるようになる。そこで拡散モデルが次のフレームを予測して、実際の次のフレームと比較するんです。そこでエラーが出たら、そこから学習して、予測の精度を上げていくんですわ。その予測がめちゃくちゃ正確になると、本物のゲームみたいに遊べるようになるわけです。
まあ、科学技術の世界では今、いろんなことが起こってますな。次の話題に移りましょか。
量子マガジンによると、コンピューター科学者たちが、熱が量子もつれを破壊することを証明したそうです。これ、ペニシリンとかポストイットみたいな偶然の発見なんですわ。
この問題に取り組んでた人たち、量子物理学の専門家やないんです。新しい量子アルゴリズムを作ろうとしてた時に、量子物理学に関する大きな発見をしてしまったんです。
量子もつれっていうのは、粒子同士が不思議なつながり方をする現象なんですが、これが特定の温度を超えると完全に消えてしまうことを証明したんです。温度が上がるにつれて弱くなるんやなくて、ある温度に達すると突然消えてしまうんですわ。
研究チームはこれを「もつれの突然死」って名付けました。彼らの数式が、この現象の証明にもなってるんです。
量子力学をよく知らんコンピューター科学者たちが、古典的なコンピューター科学の手法を量子システムに適用したことで、この発見が生まれたんです。これは、別の業界からの新しい視点が、画期的な結果をもたらす良い例ですわ。必要なツールがなかったけど、別の業界にそれがあったってことですな。
ちょっと個人的な話になりますが、エントロピーとか熱力学の第二法則とか、時間が前に進む理由とか、そういうのに関係があるように思えるんです。高度に秩序だった状態から始まって、エントロピーは無秩序の尺度で、熱も一種の無秩序の尺度ですやん。
量子もつれが小さなスケールで奇妙な状態から、だんだん大きくなって、我々が住んでる世界みたいな固体になる。これ、なんかすごく説明力がある気がするんです。何を説明してるのか正確には言えへんけど、宇宙のあらゆるところにあるような気がしますわ。
熱力学の第二法則によると、孤立したシステムでは時間とともにエントロピーが増加する傾向がありますやん。蒸気機関を思い出してください。過去は未来より低エントロピーなんです。未来には無秩序があるから予測できへんけど、過去は起こったことやから秩序があって理解できる。
みんな、量子の世界と大きな世界をどう統一するかって考えてますやん。アインシュタインの相対性理論は、量子の奇妙な現象と同じ式には収まらへん。誰かがそれを統一せなあかんのですが、エントロピーを考えると、大きな宇宙スケールの問題も、小さな量子システムの現象も説明できるんちゃうかなって思うんです。
これって、アインシタインが晩年に解こうとしてた統一理論の一部なんちゃうかなって。熱とエネルギーはかなり交換可能なものやと思うんですが、両方ともシステムをより大きなエントロピーに押し進める特徴がありますやん。情報とも関係があるように思えるんです。
宇宙が我々にヒントをくれてるような気がしますわ。シャーロック・ホームズみたいに、「こういうパターンに気づいてるか?」って言われてる感じです。誰かがこれを組み立てなあかんのちゃうかな。
さて、次は人の考えを読み取る技術の話ですわ。唇を動かさんでも、頭の中で考えただけで言葉を発する技術がまた一歩進歩したみたいですな。
UCデイビス校から新しい研究結果が出てきました。脳の信号を音声に変換する精度が97%にまで上がったんです。これ、今までで最高の精度ですわ。
この装置を重度の言語障害のあるALS患者さんでテストしたんですが、埋め込んだ瞬間からコミュニケーションが取れるようになったんです。話そうとする時の脳の信号を検出して、それをテキストに変換するんですわ。それだけやなくて、AIの声クローン技術を使って、患者さんの発症前の声に似せて喋らせることもできるんです。
ちなみに、これは非侵襲的な方法やないんです。実際に脳に埋め込むんですわ。ニューラリンクのアプローチに似てますな。この研究では、左前頭回に4つの微小電極アレイを埋め込んでます。
左前頭回って、調べてみたら、随意運動を制御する脳の部分で、言語や綴りの機能にも関係があるらしいです。納得ですわ。大体、前葉と後葉の間くらいにあるみたいですな。
次は、SB 147という法案の話ですわ。聞いたことないって思われるかもしれませんが、これ、カリフォルニア州のニューサム知事の机の上に置かれてる法案なんです。アメリカ全体のAIに関する法律のモデルケースになるかもしれへん重要な法案なんですわ。
7、8ヶ月前、サム・アルトマンが議会で規制を求めてたのが、今じゃ一部の企業が「規制が厳しすぎる」って言うてる。まあ、ビジネスと政府の関係ってこんなもんですけどね。でも、誰がどっちの立場に立ってるかってのが、ちょっと意外な感じがしますわ。
イーロン・マスクはこの法案に賛成してて、ニューサム知事に署名してほしいって言うてます。世界の安全を守るのに役立つって思ってるみたいですわ。まあ、他の思惑があるかもしれませんが、後で話しますわ。
見てのとおり、業界3番手のAnthropicもこの法案について意見を述べてます。「提案された修正案が採用されれば、リスク削減の実践におけるイノベーションと実験の時代が始まると楽観視してます。企業が当事者意識を持ち、壊滅的なリスクを実際に防ぐ可能性が最も高い実践を採用するよう動機づけられるでしょう」って言うてますわ。
一方、ChatGPTの親会社であるOpenAIは反対してます。AI安全法案は進歩を遅らせる可能性があるって言うてて、大規模言語モデルの破滅的リスクをテストするのは、大手AI研究所がすでに約束してることやから、改めて法律で定める必要はないって主張してるんです。
イーロン・マスクがこの法案を支持してるのは、ちょっと面白いですな。単純に安全性を重視してるだけかもしれんし、あるいは、今は2位か3位、いや、もしかしたら4位くらいの立場になってることに不満があるのかもしれません。でも、まだTwitterは持ってるし、GPUを大量に買う金もあるから、また1位に返り咲くチャンスはあるんですわ。
それに、6ヶ月の開発一時停止を呼びかけたこともありますが、同時にTeslaからNVIDIAのGPUを買い集めて自分のAI会社を作ろうとしてたんですよ。Teslaから50億ドルを引き出して新しいAI会社に投資したり、AGIを目指すMemphis supercomputer作ったりしてます。
だから、これらの企業をカリフォルニアから追い出して、自分はテキサスで基盤を作って、そのあとテキサスでより厳しい法律を作って競合他社の開発を遅らせようとしてるのかもしれません。あるいは、この法律を気に入って、連邦レベルか少なくともテキサス州でも採用されることを期待してるのかもしれませんな。そうすれば、自分の会社も競合他社も同じ規制の下で競争することになりますからね。
カリフォルニアの市民は、一般的にこの法案に賛成してるみたいですわ。最近の調査では、70%の住民が賛成してるそうです。
じゃあ、この法案の中身はどうなってるんでしょうか。テック業界の内部告発者を保護する条項があります。それに、AI モデルの開発に1億ドル以上使う企業は安全計画を立てることが義務付けられてます。
デジタル・デモクラシーのウェブサイトに法案の全文が載ってますわ。ChatGPTに要約してもらったところ、こんな感じです。
厳格な安全プロトコル、定期的な監査、透明性の確保、サイバーセキュリティの脅威や悪用、危険な技術の開発などのリスクを最小限に抑えるための計画策定を義務付けてます。また、AI安全基準を監督する新しい規制委員会を設立し、倫理的なAI開発を促進するための州運営のクラウドコンピューティングインフラの支援も行います。
州運営のクラウドコンピューティングインフラって、Cal Computeっていうらしいんですが、これは初耳でしたわ。有権者がその費用を払うのか、それともテック企業が共同で作業して州が運営するのか、気になりますな。
もうちょっと詳しく調べてみたら、Cal Computeの資金調達は、政府運営庁の下にあるコンソーシアムが開発するフレームワークに基づいて決められるそうです。このフレームワークでは、クラウドコンピューティングの構築と維持にかかるコストを分析して、資金調達の方法を提案するんですわ。でも、法案には誰が支払うかについては書かれてないんです。面白いですな。
ほな、これが署名されるかどうか見守っていきましょう。たぶん署名されると思いますが、Voxの記事によると「カリフォルニア州知事にAI安全の歴史を作るチャンスが訪れた。ギャビン・ニューサムがAI安全の未来を決定するかもしれないが、億万長者たちの圧力に屈するだろうか」って書かれてますわ。
さて、次は老化と寿命の話題に移りましょか。この話題についてもっと取り上げてほしいっていう声があったんです。
老化には何かしらの加速があると思いません?私には指数関数的に感じるんですわ。若い時は20代30代が一番元気で健康ですが、40代50代でもまだまだ元気。でも60代70代80代90代ってなると、かなり急激に変化してきますよね。90歳から100歳、100歳から110歳になるのはめっちゃ珍しいでしょ。
高齢になると、aging早くなってるのがはっきり分かりますわ。若い時も同じようなもんで、幼児から子供、子供から10代になる時にも、大きな変化がある時期がありますよね。
ほんで、新しい知能がチェイエンにやってきたそうです。ビクター・ミラーっていう人が、GPTチャットボットのVicを作ったんです。人間とAIが協力して、ワイオミング州のために働くんですって。
ミラーさんは大胆な提案をしてます。地方自治体にカスタマイズしたAIチャットボットのVicを導入して、市の運営を手伝わせるんです。Vicがデータに基づいた偏りのない決定を行い、ミラーさんが法的に実行可能かどうかを確認するっていう仕組みです。人間による監督があるわけですな。
面白い実験やと思いますが、適切な人物や時期、モデルなのかはちょっと分かりませんな。でも、こういったツールを政府に導入して、みんなが当事者意識を持って、より速くて国民の意見を反映したものを作る方法を考える時期に来てるんちゃうかなと思います。
もちろん、今までとは全然違うから、ためらう人もおるでしょうね。実際、一部の役人はVicの関与を阻止しようとしたそうです。でも、ミラーさんは選挙運動を続けていて、当選したらAIに意思決定を任せると約束してるんです。
どうなるか見守っていきましょうな。
次は、Vlog Brothersの話です。ハンクっていう人が、AIについてかなり考えさせられる内容の動画を作ったんですわ。
彼らが何年も前からアップロードしてきた動画を、AI企業が将来のAIを訓練するのに使ってることについて話してるんです。クリエイターの立場から見た意見やから、私とは視点が違うんですわ。
私はAIのチャンネルやから、AIが経済やこの世界をどう変えるかって観点で考えがちです。でも、ハンクさんはクリエイターの立場で考えてて、「コンテンツを作って生計を立てたい人たちにとって、これは何を意味するんだろう」って問いかけてるんです。
AIがクリエイターの創造性を助けたり、自己表現を手伝ったり、好きなことで生計を立てるのを助けたりするツールになるんだろうか、って考えてるわけですな。
ハンクさんはこう言うてます。「おはようジョン。ここ数週間、すごくええ調査報道が出てきてな。AIの会社が、独立系クリエイターの所有するYouTube動画や字幕を許可なしに使うて、AIモデルの訓練をしてるっちゅう現実が明らかになってきたんや」
404メディアの調査によると、動画生成AI企業のRunwayが何千もの動画を許可なしに使うて訓練してたらしいんや。SciShowやCrash Courseの動画も含まれとったんやて。
前にOpenAIのCTOが、YouTubeの動画を訓練データに使うてるんかって聞かれた時の表情がなんとも言えへんかってん。あんな顔されたら、ちょっと怪しいよなぁ。
それに、ProofニュースがApple、Salesforce、NVIDIA、ANIに提供された17,353本のYouTube動画の字幕を調査したんや。検索できるデータベースも作ってくれたんやけど、SciShow、Crash Course、Eons、Vlog Brothersの動画、全部入っとったわ。好きなYouTuberの名前を入れたら、たぶん出てくるで。
ハンクさんが言いたいのは、AIが考えられる遥か前から、彼らがコミュニティを作り上げてきたってことなんや。そのコンテンツをAIの訓練に使われるのは、ちょっと気が引けるんやろうな。
ワイは別にかまへんけどな。なんか新しいもんが生まれるんやったら、ええと思うわ。でも、それで報酬がもらえたらなおええと思うな。
GoogleがYouTubeで動画を見せて大儲けしとるし、広告収入のモデルも作ったわけやろ。将来、Gemini Video Creatorみたいなんで大金稼ぐんやったら、クリエイターにも分け前があってもええと思うわ。
ハンクさんは、オプトアウトの選択肢を作るべきやって主張しとるんや。今はそれがない。利用規約があるだけやからな。
動画をアップロードしたら「これは我々のもんや」みたいなこと書いとるけど、AIの訓練に使うとは書いてへんのや。他のいろんな使い方については書いとるから、弁護士さんが「AIにも使えるで」って言うかもしれんけど、はっきりとは書いてへんのや。
だから、みんな「これって公平なんか?」って考えとるわけや。公平にするにはどうしたらええんか、ようけ議論しとるんや。
合法かどうかも、まだはっきりしてへんしな。それ以前に、クリエイターが使うシステムについて、もうちょい発言権があってもええと思うわ。
YouTubeだって、もう金に困っとるわけやないやろ。めっちゃ素晴らしいプラットフォームを作ったんや。ワイも一番お気に入りのアップロード先や。でも、今じゃめっちゃ儲かっとるやん。
しかも、もっとでかい会社に支えられとって、その会社はAIにめっちゃ力入れとるやん。YouTubeのプラットフォームも進化していくやろうし、前例を作ってほしいわ。
今までもYouTubeは何回も同じことしてきたやん。著作権の問題を解決したり、重複コンテンツを見つけるシステムを作ったり、Facebookよりずっとましなサポートシステムを作ったりな。分析ツールだって、他のSNSよりずっと優れとるやん。
TikTokの新しいアップデート見てると、YouTubeに似てきとるやん。だから今度は、AIでもリーダーになって、クリエイターにどんな権利を与えるかの基準を作ってほしいわ。
はい、これでハンクさんの話は終わりや。次の話題に行こか。
ウィル・ロケットさんが、テスラの市場でのリードが完全に失われたって言うとるんや。どういうことか聞いてみよか。
まず、Zeekr 007っちゅう車の話から始まるんやけど、ワイもこの記事読むまで聞いたことなかったわ。見た目はなかなかええ感じやな。
最初に目に入るパネルがかっこええわ。LEDのやつやけど、これだけやないんや。デザインがかっこええだけやないんや。
あ、ありがとう。今、サブスクライブしてくれはったんや。前面に自分でメッセージ書けるんやて。ビルボードみたいなもんやな。
ちょっと脱線するけど、こんなんどう思う?ワイは今、ラスベガスに住んどるんやけど、タクシーに広告ついとったり、ネオンのテレビ画面があちこちにあったりして、運転に集中できへんわ。車にミームとか書かれとったら、それ読まなあかんようになるやん。ラスベガスやったら、みんな自分の電話番号書いて「独身やで、電話してや」みたいなことになりそうやわ。
話を戻すと、この会社が面白いのは、テスラとは違うアプローチでバッテリー技術を開発したことなんや。これが、ちょっと優位に立ってるかもしれん理由なんや。
これはボルボの関連会社で、「Golden battery」っちゅうのを開発したんや。このバッテリーは、テスラのよりめっちゃ速く充電できて、エネルギー密度が高くて、コストも安いんや。しかも、この車の値段は3万ドルくらいやから、Model Yより安いんや。
急速充電ができて、1回の充電で走れる距離も427マイルあるんや。バッテリーの走行距離が500マイルくらいになると、ガソリン車のタンク1杯分くらいになるんや。
テスラとこの車を比べると、加速性能とか乗り心地、無線でのアップデート、自動運転機能なんかはほぼ同じくらいなんや。
数年前、5年前くらいまでは、テスラの車には業界の誰も太刀打ちできへんような特別なものがあったと思うねんけど、今はもう業界が追いついてきたんちゃうかな。
FacebookやMetaが出してるオープンソースのモデルが、GPT-4とまではいかんけど、GPT-3.5くらいのレベルになってきたのと似てるかもな。
さて、次はイチゴの話や。大規模言語モデルに「strawberry(イチゴ)」の中に「r」が何個あるか聞いたら、よく間違えるんや。みんながこれを使うてるの見てたけど、なんでこんなに問題になるんか分からへんかってん。
せやけど、Jim the AI WhispeがMediumで書いたの読んでみたら、めっちゃ面白いことに気づいたわ。トークンの問題やったんや。
AIがめっちゃ速く答えられるのに、こんな簡単な質問で躓くのはなんでやろって思うよな。でも、点と点を繋げていくと、実際のイチゴに隠された秘密があるんちゃうかって思えてくるんや。
QARがイチゴって名前になってるのも、長期計画を考えるのにイチゴの問題を使うてるからかもしれへんな。もしかしたら、AIの世界の中では全部繋がってるのかもしれへん。
まず、イチゴは果物やけど、実は200個の小さな果物が集まってできてるんや。あの小さな種の一つ一つが果物で、イチゴは果物のバスケットみたいなもんなんや。
サム・アルトマンは、ちょっとしたヒントをネットに出して、すぐに消したりするのが好きやからな。これも彼からの隠されたメッセージなんちゃうか?
プロジェクト・ストロベリーは、200個の小さなAIのことなんちゃうか?イチゴみたいに、何百何千ものエージェントが一緒に働いて、一つのものになるってことかもしれへん。
イチゴの新しいアップデートは、自分のデータで自己学習するようになるんかな?合成データを使うエージェントベースのモデルで、長期計画を立てられるようになるんかもしれへんな。
でも、なんで「strawberry」の中に「r」が何個あるか聞いたら間違えるんやろ?何回も深く考えるように言うても、大規模言語モデルの問題の多くは解決できるのに、これだけはダメなんや。
「strawberry」の中に「r」は何個ある?「2個です」って答えるんや。もう一回確認してって言うても、「はい、確かに2個です」って言うんや。「100%確信してます」って。「100万ドル賭けますか?」って聞いても「はい」って言うんや。
でも、なんでGPTはこんな簡単な文字数えで大失敗するんやろ?
実は、AIは人間みたいに単語を読まへんのや。GPTみたいな自然言語モデルは、テキストを基本単位に分解して処理するんや。この基本単位をトークンって呼ぶんやけど、トークンは短い単語だったり、単語の一部だったり、複数の単語がまとまったものだったり、句読点だったりするんや。全部モデルの訓練の仕方次第なんや。
だから、「straw」と「berry」が別々のトークンになってて、「strawberry」っていう単語が組み合わさった時に、「berry」の部分にしか「r」が2個ないから混乱するんかもしれへんな。
面白いのは、新しい単語を作ってみると、ちゃんと答えられるんや。「colarberry」っていう単語の中に「r」は何個あるって聞いたら、正しく答えられるんや。
多分、「straw」と「berry」のトークンがないから、新しい単語は一文字ずつ考えなあかんのやろうな。そうすると、もう一つの「r」も見つけられるんや。
よく見る単語は、なんとなく答えてしまうんやけど、新しい単語やと、人間が筆記体を読むみたいに、もっと注意深く見るんや。新しいものだと、脳がより集中するから、表面的に流すんじゃなくて、ちゃんと処理できるんやろうな。
でも、ちゃんと答えさせる方法もあるんや。「sはrじゃない」「tはrじゃない」「rはrや」って一つずつ教えてから、「じゃあ、rを数えて」って言うたら、「strawberryには3つのrがあります」って正しく答えられるんや。
人間と同じで、ちゃんと注目させなあかんのやな。
さて、次はオメガ3とオメガ6の話や。コメント欄でちょっともめたけど、あんまり深入りせんとこな。
ワイは昔からアミノ酸がたんぱく質になるって知っとったけど、脂肪酸も同じように脂肪の構成要素になるってことは、あんまり考えたことなかってんな。
飽和脂肪酸はこんな感じで、一価不飽和脂肪酸は鎖の中に一つ二重結合があって、ちょっと右に折れ曲がってるんや。オメガ3は鎖の中に3つ折れ曲がりがあって、オメガ6は6つあるんや。
ほんで、なんでオメガ6は悪くてオメガ3はええんやろ?実は、オメガ6を一番少なく摂ってる赤ちゃんが、皮膚炎や異常な便、成長不良になったっていう研究があるんや。つまり、オメガ6も必須なんや。むしろ、多めに摂ると健康になるんやけど、ほんまに少量でええんや。
西洋の食生活やと、必要以上にオメガ6を摂りすぎてしまうんや。そうすると、心臓病のリスクが高まるんや。オメガ6は種子油に多く含まれとって、それがいろんな食べ物に使われてるからな。
オメガ6が多すぎると炎症を引き起こすんや。これが健康に悪影響を与えるんや。だから、オメガ6を避けるんじゃなくて、オメガ3とオメガ6のバランスを取るのが大事なんや。フライドポテトを減らしてサーモンを増やすみたいな感じやな。これで寿命が延びる可能性があるんや。
次は、バーン・ビルドのMediumの記事や。「簡潔さが美しい:完璧な長さのAI生成テキスト」っていうタイトルや。
ワイもよく論文のサマリーを作ったり、記事を簡単に説明してもらったりするんや。「これを3段落で要約して」とか「簡潔に説明して」とか、よく聞くんやけど、どんな長さになるか予想がつかへんかってん。
この人が面白いプロンプトを考えたんや。「あなたは大規模言語モデルです。この語彙を使って、長さを表す10個の形容詞を考えて、短い順に並べてください」って。
これで、短い順に並んだ単語のリストができるんや。短い答えが欲しかったら「brief」を使うとか、そんな感じや。
例えば、DOOMの論文をアップロードして、「give me a brief summary(簡単な要約をください)」って言うたら、135文字くらいの答えが返ってくるんや。平均して50単語以下やな。
「give me a moderate summary(適度な長さの要約をください)」って言うたら、292単語くらいになるんや。
ちなみに、一番短い答えが欲しかったら「concise」を使うといいらしいで。「lengthy」を使うと、平均350単語くらいの長い答えが返ってくるんや。
さて、前回の動画のコメント欄を見てみよか。11,000回も再生されてて、ありがとうな。
その前に、ちょっとお願いがあるんや。このチャンネルの支援をPatreonでしてもらえへんやろか。動画の下に「newsletter」と「patreon」って書いてあるから、そこのPatreonをクリックしてくれたら嬉しいわ。
Patreonで支援してくれたら、質問があればDMで優先的に答えるし、このチャンネルの運営や費用の支払いに使わせてもらうんや。まだ赤字やけど、純粋に楽しんでやってるんや。将来的には仕事にしたいと思ってるし、Patreonはその希望の星みたいなもんや。
どんどん成長してきてて、本当にありがたいわ。
ほんじゃ、コメントを見ていこか。
「映画みたいな夢を見るんやけど、普通なら終わりそうなところで目が覚めるんや」
「私の夢は、ちゃんとした終わり方せえへんな。アラームが鳴った時、いつも途中やわ」
「あの椅子、爆発しそうな素材でできてるな」
「レックス・フリードマンの番組で一番よかったゲストは、サイバー犯罪者のブレット・ジョンソンやった」
おっ、この動画で70ドルも稼げたんや!今まででいちばん稼いだわ。視聴者の平均視聴時間は短かったけど、新しい人にも見てもらえたみたいやな。
「このディランって誰やねん」みたいに思われたかもしれんけど、144人も新しく登録してくれたんや。もっと見たいって思ってくれたんやろな。
ほんじゃ、また次の動画で会いましょう!


コメント