リードが語る:Humane Pin、量子コンピューティング、そして新しいAIツール

AGIに仕事を奪われたい
この記事は約16分で読めます。

9,503 文字

Reid riffs on Humane Pin, Quantum, and new AI Tools
This week, we discuss Majorana 1, Humane Pin, Vibecoding, and more!0:01 Future of Wearables and AI 8:10 AI and Copyright...

Humane Pinというペン型のAIデバイスが最近シャットダウンしました。皆さん企業を批判するのが好きですよね。2億4100万ドルもの資金を調達し、マイクロソフトやOpenAIのCEOであるSam Altmanなど大手投資家が名を連ねていましたが、あなたは異論があるかもしれませんが、彼らは何か大きなことをしようとしていたんです。うまくいかなかったので事業を停止し、HPによって1億1600万ドルで買収されました。多くの人が「ほら見て、ハードウェア分野でウェアラブル領域で何かを試みたけど、うまくいかなかった」と言うでしょう。
未来を予測することがお好きではないと思いますが、もし推測するとしたら、1年または10年という時間軸で、ウェアラブルとAIの商業的ブレイクスルーはどのようなものになると思いますか?人々は「もう終わった」とか「明日にでも実現する」などと理論付けるのが好きですよね。
古典的に言えば、それはメディアやソーシャルメディアでの人々の振る舞い方なのです。基本的には、ウェアラブルが素晴らしいものになり、確実に実現するということは明らかです。例えば、世界を解析し助けてくれるメガネなど、Airbnbの洗濯機を見つめて「これはどう動くの?」と思っているとき、「あなたはこれを見ているようですが、使い方を知りたいですか?洗濯するには、これをして、Dボタンを押せばいいですよ」と教えてくれるようなものです。
それは明らかに非常に役立ちます。通りを歩いていて何かを理解しようとしているときなど、Ray-Banなどのメガネが視覚障害者にとって驚くほど役立つという話を聞きました。ドアがどこにあるかなど、そういった問題解決を手助けしてくれるからです。それは明らかに未来の姿です。
多くのウェアラブルは、最初は専門的な環境で使用されると思います。看護師や医師、消防士や警察官、地域の支援者などが着用することになるでしょう。それによって全体がより良くなると思います。
最後の部分はタイミングの問題で、それはベンチャー投資の問題でもあります。そのため、ベンチャー投資家として、私はソフトウェア分野に深く関わることを重視しています。例えばInflectionやManisの共同創設など、一方は創薬、もう一方はチャットボットですが、どちらも「どのようにビットを活用して原子をより良くするか」という分野に集中しています。直接「原子」の分野に入ることは、投資としても時間的にもはるかに困難です。
80年代90年代の子どもたちは、誰かの親の友人が車載電話を持っていて「あなたは金持ちに違いない」と思ったことを覚えているでしょう。それが20年後には「スマートフォンを持っていない人なんているの?何をしているの?」という状況になるとは思いもしませんでしたよね。「なぜ12歳がスマートフォンを持っていないの?」というレベルにまでなりました。
AIが見ることができるようになった今、スマートフォンやメガネを通して見るにしても、多くのことが可能になると思います。スマートフォンからの方が実現しやすいかもしれませんが、コンピュータビジョンやコンピュータ画面を見ることなど、あらゆる方法で実現できるでしょう。
なお、一つ興味深いのは、メガネをかけると皆「ああ、もし近づいてくる人が1年前に会った人で、名前がジョンだということを教えてくれたら」と考えますが、実は視力の悪い人は顔の特徴をよく見えないため、人を覚えるのがずっと難しいのです。つまり、メガネを通じて実現できるのは単に「人の名前を覚えやすくする」というだけでなく、人々が必要としているものを平等化する効果もあるのです。
最近の進歩で本当に私の心を揺さぶるものの一つは、マイクロソフトが発表したMajiraワンチップです。これは量子コンピューティングで、全く新しい革新の領域です。2025年にここまで到達するとは多くの人が予想していなかったと思います。最近、量子コンピューティングが流行っていて、人々はそれについて常に話しています。量子コンピューティングがなぜ重要なのか、また近い将来私たちにとって具体的なメリットがあるのかを説明していただけますか?
量子コンピューティングが重要な理由は、AIが大いに役立つものの、量子コンピューティングでさらに良く解決できる問題がたくさんあるからです。おそらく量子コンピューティングとAIの組み合わせが最良でしょう。多くの議論では、量子セキュリティの必要性やビットコインへの影響などが取り上げられます。
論理量子ビット(logical qubits)という概念があり、セキュリティ領域に入るには2,000〜5,000の論理量子ビットが必要だと言われています。現在の量子コンピュータは70〜80量子ビット程度なので、まだ遠い道のりがありますが、近い将来それが実現可能だと考える賢い人々もいます。
私はまだ、最も熱心な擁護者たちが言うよりも、あと数年かかると考えています。しかし、150〜200量子ビットになると、従来のコンピューティングでは難しい問題を解決できるようになります。AIはそれを大幅に改善しますが、完璧ではなく、例えば小分子の解析など、薬品や半導体材料などのような分野で役立つでしょう。
AIが非常に興奮させるものである理由はたくさんありますが、アクセスしやすいということも一つです。私は明日AIで新薬を発見することはできませんが、Pi、ChatGPT、Claudeなどを使うことはできます。一般消費者として「AIのメリットは本当に驚くべきものだ」と実感できるのです。量子コンピューティングのメリットを消費者が理解できる方法はあるのでしょうか、それともほとんど科学的領域での加速に限られるのでしょうか?
私にはわかりません。量子版のChatGPTのようなものがあるのか、それはシュレディンガーの猫問題かもしれません。評価するとき、猫は生きているか、まだ死んでいないかのどちらかです。
しかし、例えば派生的なメリットとして、ManisでAIを使って癌治療のための創薬を加速しようとしているように、AIは素晴らしい加速剤になります。量子コンピューティングも別の素晴らしい加速剤になり得ます。両者を組み合わせれば、さらに大幅な加速が得られるかもしれません。消費者は薬の恩恵を受けることになるでしょう。スマートフォンに量子ビットプロセッサを搭載していなくても、量子コンピューティングが癌の治療に役立っていることを知る必要はないのです。
グローバルな文脈でのAIについて考え、多くの人がAIを批判するために戻ってくる質問ですが、あなたは同意しないかもしれませんが、もっと聞かせていただきたいです。イギリス政府は最近、クリエイティブ産業とAI開発者に著作権法の明確性を提供する提案について協議プロセスを開始しました。ビジネス環境には明確性が重要であることに同意します。どのようなルールがあるのかを理解したいですよね。
その中には、商業目的のAIトレーニングのための著作権法の例外も含まれていました。ノーベル賞作家のカズオ・イシグロは、AIの夜明けにおけるクリエイティブな作品に関して「岐路に立っている」と述べています。なぜ、個々の作家、音楽家、映画製作者、アーティストを犠牲にして巨大企業を有利にするために、長年にわたる著作権法を変更することが公正なのでしょうか?
政府はクリエイティブなコンテンツを保護しながら、テクノロジー企業に必要なイノベーションの自由をどのように与えるべきだと思いますか?
明確性については完全に同意します。明確性がないと、あらゆる分野で不確実性が生じます。問題は、これが著作権の下での公正使用であるという非常に説得力のある議論ができることです。例えば、イシグロの作品を取り、『太陽の残照』を誰かに渡し、その人が読んで書くことを学び、そこからアイデアを学び、インスピレーションを得て、他のクリエイティブな作品を生み出すことができます。
機械が読むとはどういう意味なのかという概念について、批評家は「それが複製できるからだ」と言いますが、そもそも複製しない場合はどうでしょうか。ニューヨーク・タイムズの訴訟のように、記事の前半を入力して「これを完成させてください」と言ったときにのみ記事を複製できる場合、「あなたはこの記事を指していると思うので、そうします」と応答させることができます。明らかにそうしないように訓練することもできますが、前提は実際には被害が発生していないということです。記事の前半を持っているなら、おそらく記事全体を持っているはずで、購入するなどして記事を手に入れた方法があるはずです。記事は半分ずつ配布されていないですよね。
何かが学習し、トレーニングしていることは、特定の人からの盗難ではありません。私が『太陽の残照』を読んでいるとき、イシグロから盗んでいるわけではありません。Kindleや物理的なコピーを購入したのですから。
思考実験として、それが完全に合法であり、イノベーションにとって良いことだと考え、LLMがこれらのデータや著作権のある作品を使用できることは良いことだと仮定しましょう。デメリットはあるでしょうか?4〜5年後に心配すべきことはあるでしょうか、それとも批評家の懸念は大げさなのでしょうか?
私が思うに、語られていない根本的な問題は、「私が以前に行った作品によって部分的に可能になった新しい機械によって、多くのものが作成できるようになり、突然私のクリエイティブな作品の価値が下がってしまうのか」ということです。「私のクリエイティブな作品が評価されるのか」という概念は、私たちが上手く対処できない典型的な複雑な問題です。
音楽業界の現在の例では、ストリーミングと環境の変化によって経済状況が非常に異なるため、音楽家の大多数はライブコンサートやグッズなどから利益を得ています。彼らは「CDを販売していた以前の経済状況は本当に良かったので、これは大きな悲劇だ」と言います。しかし、CD販売が永遠に続くべきものかどうかは明確ではありません。変化は起こるものですが、私たちは個人や社会として価値を見出すクリエイティブな産出の流れに対して適切なインセンティブループを持つように、これらの法律がクリエイター尊重することを望みます。
AIツールについて私が考えることの一部は、現在誰もが「ああ、世界の終わりだ」と言っていることですが、『Super Agency』をGregと書いた理由の一部は、実際に起こり始めることは「これによって私はより良く、より速くクリエイティブな作業ができるようになる」ということだと思います。例えば、あなたも私の旅に参加していますが、私はさまざまなAIツールを使って考えているSFを書く手助けをしてもらおうとしていますが、まだあまり上手くいきません。非常に優れたSFライターとの競争的脅威になる可能性はありますが、今すぐではありません。
興味深いことの一つは、それが実現する場合でも、優れたSFライターが書くことで、突然より良く、より速く書けるようになるかもしれないということです。私が本当に気に入っているシリーズについてイライラすることの一つは、最後の本まで読んで「次の本が出るまであと何年?」と思うことです。今その世界にいるのに、と思います。実際にこれができれば、毎月このシリーズの本を一冊作ることができるかもしれません。私はその旅を進めながら、これが一部のクリエイターにとって非常に有益になる可能性があると思います。
しかし、最初の反応として「ああ神様」というのは理解できます。例えば、イシグロのような驚くべき人物は「私はこれらの傑作を作るという本当に難しいことをやってきた、世界で最も称賛されている作家の一人だ。今あなたはゲームを変えている」というような状況ですから。
Gregが一緒にいたら、『Super Agency』の共著者として、音楽に関しても指摘するでしょう。CDは技術であり、それ以前には音楽家として生計を立てることさえできませんでした。それ以前にはラジオが少しありましたが、それ以前は地下室で一人でギターを弾いているだけでした。技術はこの驚くべき創造性の多くを可能にしてきました。印刷機まで遡る必要もなく、CDが新しい世界を開き、着信音が一時的に多くのお金を生み出し、そして今度はより多くの音楽アーティストがどのように生計を立てられるかという問題に移ってきました。
つまり、これは正しい方向であり、人々が正直に自分のキャリアをより良くし、より美しいアートを作り、彼らがやりたいことをすべてできるよう、どのように進めていくかが重要です。移行は痛みを伴いますが、未来を止めることはできません。できることは、より良い未来に向かって進む方法を模索することです。
エピソードの終わりに、今日のpossibleには特別なゲストがいます。parth ptilです。彼はread AIの作成者の一人で、Clubhouseの最初のデータサイエンティストでした。ご存知のように、私たちはReedや多くのゲストとAIについて多く話しており、Parthはそのエキスパートの一人です。Parth、possibleに参加して最近のAIの出来事を分析してくれてうれしいです。
こんにちは、Ariel、ここに来れて嬉しいです。
最近の経験を共有して、あなたの診断を聞きたいと思います。最近、agandiと一緒にいて「deep researchを試したことある?」と聞いたら、彼は「いいえ、何のことか分からない」と言いました。彼が取り組んでいる本について聞くと、麻酔科医についての章があるということでした。そこでChatGPT 01 ProのDeep Researchと、Geminiを開いて質問をしてみました。
私たちが発見したことは非常に興味深く、Deep Researchの現状と今後の展開、そしてこれがどのように機能するかの診断になります。ChatGPTは、「ああ、これは素晴らしい!これは私の研究アシスタントの何千時間もの時間を節約してくれる」と彼が言うようなものを生成しました。それをコピーして彼の研究アシスタントに送りました。そしてGeminiでも試しましたが、それはあまりインスピレーションを与えるものではありませんでしたが、それも送りました。
研究アシスタントが戻ってきたのは、ChatGPTの回答の90%が不正確だったというものでした。例えば、「麻酔科学は私の政策に役立った」という外科医の引用は存在せず、その出典もなく、引用も間違っていたりしました。
しかし、興味深いのは、それが興味深い文書を指し示してくれたことです。私が探したい種類のものを見つけるためにどこを見れば良いかを教えてくれたようなものでした。実際に調査しクロスチェックすることで、多くの時間を節約できました。なぜなら、実際に興味深いものがあった多くの異なる情報源に行くことができたからです。
Geminiには事実の不正確さはありませんでしたが、あまり刺激的でも興味深くもなく、少し平坦でした。ChatGPTのものは、そのまま引用すると「おっと、間違ったことを事実として書いてしまった」となりますが、正しいものへの入り口となりました。
これについてどう思いますか?Deep Researchツールの現状と、人々がそれをどのように使うべきか考えについて教えてください。
私はDeep Researchに似たようなツールを1年以上開発してきました。最初の経験は「わあ、多くの作業ができる」というものでしたが、その作業の質が高くなければ、かえって作業が増えるということに気づきました。なぜなら、それが提供するすべてのことを確認する必要があるからです。
それは特定のタイプの質問をすることの欠点だと思います。回答に事実を期待すべきではなく、LLMは自信を持って情報を提示しますが、現時点では常に注意して受け止めるべきです。確認するのは難しいですが。
一方で、私がDeep Researchを使う方法は、主に主観的な空間の探索、通常は自分自身では時間やエネルギーがないようなものです。例えば、新しいアプリのコンセプトをブレインストーミングしていて、「このファンダムに興味がある人々はどこにいて、何について話しているのか」と思うとき、Deep Researchはインターネット上でそれらの質問の答えを見つけられるかもしれない場所を探してくれます。
あなたの言う通りだと思います。より良くなると思いますが、本当に魔法のような感覚は、それが10分でできることが、私なら数日かかるようなことをやってくれるということです。そのような加速された情報合成は、品質が高まるにつれて本当に価値があります。推論が加わり、レスポンスの質が高まるにつれて。
他の人にあなたのことを説明するとき、「赤い錠剤を飲むだけでなく、赤い錠剤に浸かっている人」と表現していますが、「ああ、すごい、未来はすでにここにあるが不均等に分布している」というような、この1ヶ月であなたの注目を集めたAIの使用例は何ですか?
私にとっては、2年近く取り組んできたアイデアが、今他の多くの人々が「赤い錠剤」の瞬間を経験し始めていることです。karpathyが「バイブコーディング」と呼ぶもので、モデルの指数関数的な成長と一般的な認識に依存し、プログラミングアシスタントとして使用するというものです。「この機能を構築したり、ゲームのアイデアを考えたりしよう」と思い、モデルにコードを多く生成させ、自分は話すことに移行する方法です。
多くの人がsuper whisperを使用し、ボタンを押して欲しいアプリについて説明し、モデルに最初のバージョンを作らせます。最近の出来事としては、Claude 3.7 Sonnetが登場し、現在最高のコーディングモデルの一つになっています。これに気づく人が増えてきており、非技術者が「AIで作ったこのゲームを見て!」と言い、技術者が「でもそれは堅牢でスケーラブルではない」と言うのを見ることができます。
私の考えでは、私たちが説明するだけでソフトウェアを作れるということ自体が魔法であり、モデルは完璧ではありませんが、これはまさに私たちが進むべき方向です。
その理由は、私の母はプログラマーで、15年前に手根管症候群になりました。彼女が押す各ボタンが実際に彼女の手を悪化させ、痛みを伴います。しかしそれが彼女のキャリアです。15年前、彼女は会社にDragon Naturally Speakingという文字起こしソフトウェアを支払わせました。当時、高品質の文字起こしは500ドルと高価でした。
彼女はそれにコードのブロックを与え、「for loopを書いて」や「if文を書いて」などと話し、それらの事前定義されたコードブロックが彼女のコードに挿入されました。それが、コンピュータに話しかけてコードを書いてもらうというアイデアを最初に持った時でした。もちろん当時は言語モデルがなかったので、非常に初歩的なものでした。
しかし今、whisper技術や多くのコードを迅速に高品質で書ける言語モデルがあります。私は戻ってきて彼女に見せ、whisperをコード生成に接続しました。それは100行のコードで、1行あたり51文字、つまり5,000回のボタン押しに相当しますが、今ではプログラムに話しかけるだけでそれが存在します。
だから、より多くの人々が「バイブコーディング」を経験することに興奮しています。それが通常のコーディングと同じではないとしても、ある意味では100倍良いと思います。
コード生成について初めて話したとき、「これが完璧なSQLを書けるということは、会話型データ分析が基本的にここにあるということではないか」と言いました。アナリストが手動でクエリを書く代わりに、分析エージェントに話しかけるべきで、それがクエリを書くべきではないかと。あなたは「それはプログラミングというよりスクリプティングだ」とコメントしましたが、それは当時のモデルが限られていたからだと思います。それ以来、長い道のりを歩んできましたが、コーディングコパイロットとその意味についてどう思いますか?
確かに、今年、主要な企業はすべて、コパイロットのコーディング能力の向上に集中的に取り組んでいます。ボタンを押すだけでソフトウェアエンジニアやエージェントを得るようなものです。人々がよく考えるのは、「これはソフトウェアエンジニアにとって何を意味するのか」ということですが、データサイエンティストと同様に、ソフトウェアエンジニアへの無限の需要があると思います。ただし、彼らが操作する方法としてエージェントのセットを展開するかもしれません。
コーディング能力は向上していると思いますが、あなたの質問が示唆するもう一つのことは、すべてのプロフェッショナルが、彼らがやっていることに取り組むエージェントのセットだけでなく、コーディング能力を持つエージェントも持つようになるということです。スクリプトやその他のものから発展すると、そのコーディング能力は非常に深くなり、最も顕著なプログラミング言語はC++やPascalなどではなく、英語や中国語などになるでしょう。
データサイエンスと同様に、人間の活動の余地がまだあるのは、考え方や行うことの種類によります。「1年以上いるすべてのユーザーがどれだけアクティブかを示すクエリを実行してほしい」と言うのではなく、「チャーンを理解するためのさまざまな方法は何か」と聞くことができます。そうすれば、これらのツールと一緒に働くデータサイエンティストは、一般マネージャーとしてのあなたが正確にどのような質問や分析を実行すべきか知らなかったかもしれない、興味深いものをたくさん生成できると言うでしょう。
大きな進歩を遂げていると思いますが、他のものを書くのと同様に、AIコパイロットから大きなコードブロックを受け取って、それを確認せずにチェックインするべき段階からはまだ離れていると思います。
possibleはWonder Media Networkによって制作されています。ホストはAra FingerとReed Hoffmanです。ショーランナーはSha Youngです。possibleはKatie Sanders、Edie Allard、Sarah Schleifer、Vanessa Handy、Aaliyah Yates、Paloma Moreno Jimenezによって制作されています。Jenny Kaplanはエグゼクティブプロデューサー兼エディターです。特別な感謝をSurya Yalamanchili、Saar Stapel、Thenassi Doosian Alice、Greg Beato、Parth Patel、Ben Reisに。そしてJanet Om、Tiffany Freeze、Malia Agudo、Clean Cuts、Little Monster Media Companyに大きな感謝を。

コメント

タイトルとURLをコピーしました