私はただAIに写真のリネームをしてほしいだけ | The Vergecast

本動画は、Mac用生産性ツールRaycastの創業者兼CEOであるトーマス・ポール・マンへのインタビューを通じて、AIツールの実用的な統合について探求するものである。Raycastは当初、Spotlightの代替となるランチャーとして開発されたが、現在ではChatGPTをはじめとする複数のAIモデルへのアクセス、ファイル管理、アプリケーション操作など、幅広い機能を提供している。インタビューでは、AI機能の開発思想、プライバシーとセキュリティへの配慮、ユーザーの発見可能性の課題、そしてAIが真に価値を提供する領域と過剰適用されている領域の区別について議論が展開される。トーマスは、AIをソフトウェアに組み込む際の実用的なアプローチと、ユーザーが自身のコンピュータ操作において主導権を保持することの重要性を強調している。

- YouTube

YouTube でお気に入りの動画や音楽を楽しみ、オリジナルのコンテンツをアップロードして友だちや家族、世界中の人たちと共有しましょう。

Raycastが実現するAI統合の未来
AIとRaycastの出会い – 自然言語でコンピュータを操作する
AIとの共存 – 段階的アプローチの重要性
プライバシーとセキュリティ – 信頼構築の重要性

Raycastが実現するAI統合の未来

この番組はMongoDBの提供でお送りします。あなたは革新を望む開発者です。しかし実際には、ボトルネックの修正やレガシーコードとの戦いに時間を費やしています。MongoDBがお手伝いできます。これは開発者によって開発者のために構築された、柔軟で統一されたプラットフォームです。MongoDBはACIDに準拠し、エンタープライズ対応で、AIアプリを高速で出荷するために必要な機能を備えています。だからこそ、Fortune 500企業の多くが最も重要なワークロードをMongoDBに信頼しているのです。行と列の外側で考える準備はできていますか? mongodb.com/buildで構築を始めましょう。

Vergecastへようこそ。コンピュータ上のすべてのファイルをAIモデルを使ってリネームすることの、良い面も悪い面も扱うフラッグシップポッドキャストです。私はあなたの友人、デビッド・ピアースです。これはAIについて、より具体的にはAIツールを構築している人々がそのAIツールについてどのように考えているかについて行う2部構成のシリーズの第1回目です。

基本的に、私たちは今、あらゆる種類のアプリ、あらゆる種類のソフトウェア、そして何と言ってもあらゆる種類のハードウェアを作っている人々が、AIをどのように組み込むかを考えようとしている瞬間にいます。あるレベルでは、それは馬鹿げていると思います。実際のところ、ChatGPTを無理やり詰め込んでも何の利益もないものがたくさんあるからです。

しかし一方で、こうしたツールによって実際により良く、より有用で、より機能的になるものもたくさんあります。私がよく考えることの一つは、テキストの文字起こしです。シンプルなことですが、OpenAIがWhisperモデルを発表しました。これは音声の非常に優れた高速な文字起こしを行い、多くのことに対して本当に強力です。Todoistというアプリに機能があります。私が本当に気に入っているアプリです。

これはToDoリストアプリで、Rambleという機能があります。以前にも話したことがあると思いますが、ToDoリスト、考えていること、気になっていること、買い物リストのすべてをただ話すだけでいいんです。

アプリに向かって叫ぶだけで、それをすべて構造化して意味のあるものにしようとしてくれます。そこにはいくつかの異なるレイヤーのAIがありますよね? しかし最初のものは、あなたの声を取り込んで確実に成功裏に文字起こしすることです。それは非常に強力です。また、私が使っているMy Mindというアプリもあります。これはAIを使って本当に素晴らしい検索を行うので、たくさんのメモを作ってフォルダに入れたり、タグを付けたり、整理したりする必要がなく、すべてを放り込んで、必要に応じて並べ替えたり検索したり見つけたりできると信頼できます。こういったものは本当にうまく機能します。

そこで次の2つの日曜日には、AIをうまく活用していると思うアプリを作っている2人の人物と話をします。これらのインタビューの両方で、私が製品を気に入っているように聞こえるでしょうし、実際そうです。だからこそ彼らがここにいるのです。なぜなら、彼らはAIを単にアプリに詰め込んでより多くのお金を請求したり、株価を上げたりするためのものではなく、実際に何かを可能にするものとして考えていると思うからです。

そして時には、それらのことを可能にする方法が、複雑で混乱していて、プライバシーを脅かし、さらにはそもそも構築しようとしているもののバイブを台無しにする恐れさえあるかもしれませんが、物事をより有用で、より楽しく、より発見しやすくするという利点もあります。ですから、そのすべてについて話します。

この最初の回のゲストは、トーマス・ポール・マンです。彼はRaycastという会社の創業者兼CEOです。Raycastは当初Macアプリでした。現在はiOSとWindowsにもあります。私がそれを説明する方法は、ランチャーであり、それ以上のものだということです。Mac上でSpotlightを置き換えるために使います。そしてアプリを起動できます。

テキスト展開のようなものを保存するために使うこともできます。私はホームと入力するとすぐに自宅の住所を吐き出すように設定しています。それはRaycastに存在するものです。コンピュータ上のウィンドウを管理したり、物を動かしたりするためにも使えます。しかし、ますます大きくなっている機能の一つは、AIモデルにアクセスできることです。

Raycast内でChatGPTとチャットするために使うこともできますが、ChatGPTにあなたのアプリを使わせることもできます。ですから、ブラウザで、すべてのタブをCSVとしてダウンロードして、誰かに送信できるテキストファイルに入れてくださいと入力できます。理論的にはそれができることです。

開いて、Finderで、過去24時間に作成したすべてのファイルを表示してくださいと言えます。そしてそれは実際に他のアプリを使用でき、さらにはコンピュータを使用できるAIシステムです。AIブラウザについてたくさん話してきました。追加のコンテキストをたくさん持つこの種のツールについてもたくさん話してきました。Raycastは他のほとんどのアプリよりも多くのコンテキストを持っています。

私はこのアプリを長い間使ってきました。本当に気に入っています。その中のAI機能のすべてをあまり活用していません。ですから、トーマスに来てもらって、彼がこの製品にAIを組み込むことについてどのように考えているか、そして本当にうまく機能し始めたときにあなたのために何ができるかの両方を話してもらいたかったのです。

彼と話すのは本当に楽しかったです。あなたもそれを聞くのを楽しむと思います。短い休憩を取り、それからトーマスとのインタビューに入ります。すぐに戻ります。

この番組の提供はMongoDBです。データベースの制限やスケール時に壊れるアーキテクチャにうんざりしていませんか? 行と列の外側で考える時かもしれません。

革新したい開発者なら、MongoDBをチェックする時です。MongoDBは開発者によって開発者のために構築された柔軟で統一されたプラットフォームです。ACID準拠でエンタープライズ対応、そしてAIアプリを高速で出荷するために必要な機能を備えています。

だからこそ、Fortune 500企業の多くが最も重要なワークロードをMongoDBに信頼しているのです。行と列の外側で考える準備はできていますか? mongodb.com/buildで構築を始めましょう。

AIとRaycastの出会い – 自然言語でコンピュータを操作する

トーマス・ポール・マン、Vergecastへようこそ。招待してくれてありがとう。あなたと私は何度も話したことがありますが、このようにレコーダーに向かって話したことは一度もありません。ここに来てもらえて本当に嬉しいです。

これは私たちがやっているシリーズで、AIを構築し考えている人々や、AIが何ができるかについてです。これはあなたと私が何度もバージョンを変えながら行ってきた会話です。だから今度はまたそれをやります。楽しみです。いいですね。確かに、もう何度かやったことがありますね。さあ、やりましょう。確かに。

まず、Raycastの中でAIについて考え始めたのはしばらく前からだと思いますが、数年前にあなたがAIモデルがRaycastがやっていることにどのように適合するかについて考え始めた初期の頃に巻き戻してみましょう。最初の会話はどんな感じでしたか? はい。

Raycastは、Mac上のこのグローバル検索バーのようなものですよね? そして実際には今、Windowsにもあります。

しかし基本的に、ChatGPTが登場し、突然誰もがプロンプトについて話し、誰もがプロンプトを入力するテキストボックスを探していたとき、私たちはそれに対して本当に良い位置にいることに気づきました。なぜなら、Raycast自体が巨大な検索ボックスのようなものだからです。どこでも開くことができます。だから何かを入力するだけです。以前は非常に静的なテキストでした。アプリやコマンドを検索したり、何かをしたいということでした。

しかし、これを拡張して自然言語、つまりプロンプトを入力するだけというのは、非常に自然に感じられました。だから、ChatGPTが登場した直後に、ちょっと待って、これは私たちに本当に合っていると思いました。最初に統合したモデルはChatGPT-3だったと思います。それは2022年末のことでした。なるほど。その時の考えは、人々がコンピュータと話す方法のいくつかを解決できるということでしたか? 私にとっては、これらのモデルが最初に本当にうまくやった最初の良いことは、コンピュータに英語で話すことを少し簡単にしたことだと思います。それもあなたの考えでしたか? 少しだけ意味をなすようにできると。

そうですね、最初に人々がやったことは質問をすることだったと思います。面白いことに、Raycastを始めた当初、私たちはプログラマーで、時々質問があります。XYをどうやってやるのかといった質問です。その後、Stack Overflowのようなところに行って、それらの質問を見つけました。他の誰かが尋ねた質問です。それを読んで自分で答えを読みます。基本的に、答えにつながる適切な質問を見つけるためのキーワードに非常に優れている必要がありました。しかし今、この全体が基本的にひっくり返されました。だから最初に見たのは、人々が質問をするだけで答えを得て、やっていることを続けるということです。これは小さなことでも楽しいことでもありえます。基本的に情報を得続けるのに役立ちました。

最初の大きな課題の一つは、時々それらのモデルが幻覚を見るということで、それをどう乗り越えるかでした。そして次の波は非常に簡単でした。モデルに私たちがやることをやらせればいい。ウェブを検索して、その情報を取得し、私たちが望むスタイルとトーンで要約する。

それが最初に見た、取り上げられたことで、それ以来どんどん高度になってきました。それからウェブを検索するだけでなく、カレンダーを検索したり、ファイルを検索したり、ファイルを読んだり、Mac上のフォルダやファイルを整理するなどのアクションを実行したりということになりました。すべての新しい技術と同様に、人々は可能なことに適応し、次のステップを踏み出して、少しずつ境界を押し広げていくと思います。かなり高度なユーザーがいるので、彼らはしばしば最前線にいて、本当に限界まで押し進めています。そうすると、彼らが何をしたいのかがわかり、それを統合してさらに多くの人々がアクセスできるようにすることができます。

では、早い段階で、AIのスタックのどれだけの部分に私たちは関わりたいのかという決定をしなければならなかったのですか? Raycast LLMを訓練すべきかという疑問は決してなかったと思いますが、しかし、基本的にChatGPTのテキストボックスを置き換えるだけのテキストボックスを構築することもできたでしょうし、その上に何かを構築することもできたでしょう。APIと統合してそこで開発者になろうとすることもできました。あなたが説明したことを、非常に異なる複雑さのレベルでやろうとする多くの異なる方法があるように思えました。早い段階で、どこに着地すべきかは明白でしたか?

いいえ、つまり、これは一晩で登場したものですよね? 突然そこにあって、かつてはSF映画のようなものだったものが、突然ある程度可能になったという感じです。

しかし、どこかで始める必要があります。だから早い段階で、私たちはAPIで遊んでいて、それらを統合しました。最初はOpenAIだけでした。文字通りそこにあった唯一のAPIだったからです。他には何もありませんでした。だから、他の誰かが現れるまで数ヶ月かかりました。

そして明らかになってきたのは、モデルはすべて少し異なるということです。どれが賢いか、どれが速いかという話ではなく、ニュアンスがあり、人々は個人的な理由でしばしば一方を他方よりも好みます。ああ、このモデルが私に話しかける方法が好きだ、という感じです。

だからすぐに、すべての異なるモデルを統合するのが理にかなっていると言いました。なぜなら、人々は個人的な好みを持ち、特定のケースに対してより良いモデルとより悪いモデルがあるからです。時には完全な知能は必要ありません。このブログ投稿を要約したり、このメッセージを書き直したりするような単純なことをしたいだけです。

それらは最先端のモデルである必要はありません。むしろ速い方がいいです。そして時には、数分間続いて多くの調査を行い、あなたのために大きな研究論文を持ってくるモデルが欲しい時もあります。

そのためにはおそらくより良いモデルが必要です。だから早い段階で、できるだけ多くのモデルと統合しようと言いました。なぜなら、かなり技術的なオーディエンスがいて、彼らはどのモデルを好むかをガイドしてくれるからです。そして数年後の今、新しいモデルが登場すると、誰もが新しいモデルに行き、試してみて、基本的に最新かつ最高のものを欲しがります。そして数ヶ月間それを使い、次のモデルが別の会社から登場すると、次のものに移ります。

だから、それらのモデル間の切り替えコストは現時点では非常に低いです。少なくとも私たちにとって、そして私たちのユーザーにとって。そして、それらのモデルから最大限のものを得る方法を学ぶ、あるいは筋肉の記憶のようなものを構築していると思います。そしてそれらのことは、時々モデルファミリーにもう少し結びついています。

しかし早い段階で、私たちは自分たちのモデルを構築するつもりはないと言いました。私たちがやったのは、プロンプトレベルでいくつかの最適化と、モデルを私たちのケースで本当に優れたものにするためのファインチューニングでした。例えば、多くのエージェント的ワークフローを作ることです。

しかし今日では、多くのモデルが基本レベルですでにそれが非常に得意です。初期の頃、エージェント的なものについてみんなが話す前にそういったことをいじっていましたか? しかし、Raycastの路線にも完璧に合っているようにも思えます。つまり、デバイスやファイルやデータへのこのユニークなアクセスをどう活用するか。このモデルに物事のやり方を教えるにはどうすればいいか。みんながエージェントAIについて話す前の初期の頃でも、そういったことをいじっていましたか?

はい。ですから、かなり早い段階でこれがあり、私たちにとって完全に理にかなっていると言いました。この拡張プラットフォームがあります。だから2,000以上の拡張機能があります。それらは公開されています。RaycastをNotion、Linear、Google Docs、GitHub、何でも統合できます。本当に考えられるものは何でも。そしてローカルコンピュータ上でも、ファイルやカレンダーなどを見ることができます。だから、それらの拡張機能がすべてあり、考えていました。すべてを手動でやる代わりに、何をしたいかを言えば、コンピュータがあなたのためにそれをやってくれる。

そこにたどり着くのは少し難しいことがわかりました。しかし約束の地はかなり素晴らしいです。基本的にそれをひっくり返して、そもそもコンピュータの使い方を変えるのです。なぜなら、私がコンピュータを使っていた方法を考えると、やりたいことのアイデアがあります。

だから頭の中で、それをクリックとキーストロークに変換して、コンピュータをナビゲートしています。しかし今は、それをする代わりに、書き留めるか、数秒間マイクに向かって話すだけで、コンピュータに処理させます。だから、私たちはこのアイデアを早い段階で持っていました。そこにたどり着くのは少し難しかったです。一つは、それらのことが本当にうまく機能することを確認したかったからです。だからそれはそんなに簡単ではありません。二つ目は、UXも考え出さなければならなかったからです。プロンプトで何でも言えるというのは素晴らしいですが、私たちをガイドしてくれる素晴らしいUIもありました。クリックできるボタンがあり、基本的にナビゲートするのに役立ちました。しかし今、突然コンピュータがすべてが可能だと装うと、それは少し嘘です。なぜなら、それはしばしば真実ではないからです。だから、UIが意味を持つときと、オープンなプロンプトフィールドを持つことが意味を持つときの中間点を見つけ出すこと。

それは少し課題でした。それはまた、Raycastの本質的な問題でもありますよね? これはあなたと私が以前に話したことですが、この物が何ができるかをどう発見するかという問題です。なぜなら、開いてみると、ただのテキストボックスだからです。

ChatGPTが持っているのとまったく同じ問題があります。開いてみると、物事ができることは明確ですが、何をすべきか、どのように教えるかはそれほど明確ではありません。そして繰り返しますが、ここですべてのエージェント企業が本当に興奮するのです。なぜなら、彼らは「ただ言えば、私たちがあなたのためにそれを理解します」と言うからです。

私はそれを概念として非常に疑っています。しかし、ここでは発見の問題を発見の問題の上に積み重ねているように思えます。それらのことを乗り越え始める方法はありますか?

そう思います。この新しい技術の使い方を学ばなければなりません。そしてそれは私たちの行動を変えます。

例えばコーダーを見てみると、彼らはおそらくこの採用曲線で少し先を行っています。技術に非常に近いので、そこで本当に速く進歩していると思います。プログラミングはテキストを書くようなものでした。何か間違ったことを書くと、それは悪いことです。そしてある時点で、コンパイラのような誰かがそれは悪いと言い、それを修正します。それから、オートコンプリートができることがわかりました。何が可能かがある程度わかるので、可能性を示してそれを選ぶことができます。それは素晴らしいことです。そして最初のLLMのユースケースは、それらの補完に便乗して、書けることをもう少し長く伝えて、それを提案し、予測することでした。

それは本当にうまく機能しました。そして今では、もうコードを書きません。

やりたいことを書いて、LLMにやらせるだけです。だから、プロンプトファーストと呼ぶパターンが見られると思います。何をしているか知っていて、システムを知っていれば、実際に本当に良い結果が得られます。しかしおっしゃる通り、システムが何ができるかを知る必要がある発見可能性の段階があります。そしてそれはそれほど前ではなかったと思います。音声アシスタントがすべてあったときのことです。

今あるようなものを意味しているのではなく、昔のAlexaのようなもののことです。突然音声インターフェースがホットなものになり、誰もが「なんてことだ、これは素晴らしい。Uberを注文できるし、何でもできる」と言いました。そして誰もがそれらを手に入れて、まあ、それがどうなったかは皆知っています。結局それほど有用ではありませんでした。

だから、技術は明らかに今の方がずっと優れていますが、人々はまだ技術の使い方を学ぶ必要があります。そしてそれは一晩では起こりません。だからプロンプティングはまだスキルのようなものです。しばしばユーザーフィードバックを受け取ります。これはうまくいかなかった、と。そしてそれを見ると、まあ、うまくいかなかったことに驚きはしません。なぜなら、本当にそれを伝えなかったからです。

だから、発見可能性は非常に重要だと思います。それらのシステムがずっと積極的になれば、それは改善されると思います。システムがあなたにこれはどうですか、と提案したり、入力を始めるとああ、あなたが何をしたいのかわかります、システムが何ができるかわかります、だから何が可能かを賢く提案して正しい方向にガイドできます、という感じです。

そのアプローチが本当に有用である可能性があり、もっと多くの人々が試みているのを見ないことに驚いている場所の一つは、あなたが先ほど話していた、多くの異なるスキルを持つ多くの異なるモデルがあるという事実についてです。私たちが必要としているのは、単なるモデルスイッチャーではないと思います。Raycastは多くの異なるモデルへのアクセスを提供しています。すべてのモデルを一箇所に持っているというだけのアプリがたくさんありますが、それは何かです。しかし私が実際に欲しいのは、モデル間のインテリジェントなルーターのようなものです。これは実際により良い画像生成を行うものです、ああ、あなたが私にプロンプトしたのは実際には巨大な研究プロダクトなので、これに流しましょう、という感じです。私たち全員がどのモデルがどのことに最適かを理解しなければならないという考えは、馬鹿げていて、ただの悪いUIだと思います。これはあなたが理論的にはかなり良い位置にあって調整できることのように思えます。

これは可能なことですか? なぜこれがまだ存在しないのですか?

そうですね。実際、それを始めました。基本的に、まず何に対してどのモデルが最適かを理解する必要があります。それらのいくつかは測定できますが、他は個人的な選択でもあります。

しかし、それを始めました。そしてああ、言ったように画像生成や、特定のツールを使ってジョブを完了させるエージェント的ワークフローなど、いくつかのモデルがより優れているものがあることに気づきました。また、画像の認識などが得意なものもあります。

だから、基本的に今それを抽象化し始めました。時間をかけて複雑さを開示することを考えています。最高のエクスペリエンスは、基本的に自動で欲しいことをやってくれる自動モードのようなものだと思います。心配する必要はありません。深い調査が必要な質問をすれば、自動的にやってくれます。画像を生成したければ、それに最適なモデルを選びます。

しかし、より高度になれば、柔軟性が欲しいかもしれません。だからもう一段階深く入って、まだ設定可能性を提供したいと思います。ねえ、自分が何をしているかわかっているので、その特定のモデルにその仕事をさせたい、と言えるようにしたいのです。

だから、設定の中で上下して、欲しいものを選ぶことができます。そして、それは業界で見られることだと思います。ChatGPTで自動モードを出して、もうモデルを選択できないと誰もがパニックになり、それから広げなければなりませんでした。

そして、それはもっと見られると思います。なぜなら、考えてみれば、この大規模にスマートなシステムがあり、まだどれを使う必要があるかを考え出さなければならないのは、あなたが言ったように少し馬鹿げています。だから時間が経てば、それは消えて、欲しいことをやって、それを理解するだけになります。

まだそこには達していません。Raycastはそれをするのにユニークに良い位置にあると思いますか? なぜなら、Raycastについて考えるとき、それは私のすべてのものにアクセスできるただのボックスだと思うからです。そして、一方では、コンピュータ上のすべてのファイルにアクセスできます。これはRaycastにとってある種ユニークなことだと思います。

一方、あなたが言ったように、これらすべての拡張機能と、接続しているすべてのアプリがあります。私はこれらすべてのアプリのAPIキーをRaycastに入力しています。だから、あなたはこのアクセスを持っています。そして第三に、これらすべてのモデルへのアクセスがあります。だから、少なくとも理論的には、私の代わりにこれらすべてのものを調整する必要がないものは何もありません。

ここで私が見逃している大きな障害はありますか、それとも、これをすべて機能させる方法を見つけ出すだけの問題ですか?

はい、私たちにとっては基本的にモノラダーです。おっしゃる通り、基本的に完璧な場所にいます。適切なタイミングで適切な場所にたまたまいました。だから、すべてにアクセスできます。その上、あなたが何をしているかもわかります。一日を通してRaycastを通じて実行するアクション、そしてそれらの使用パターンもあります。だから、それらをつなげることが魔法のセルだと思います。基本的にこれを本当に個人的でユニークで、あなたに結びついたものにするのです。なぜなら、私たちはみんなある程度ユニークで、コンピュータを異なる方法で使い、異なるアプリを使い、異なる書き方をし、異なることに興味があるからです。だから、このパーソナライゼーション層が必要です。

しかし、私たちは一日に何時間もコンピュータの前で過ごして物事を実行しています。だから、それらを収集して分析して、基本的に次にやりたいことを予測できるようにし、時間とともに賢くなり、個人的にこの強化学習を持つことです。

それが本当に違いを生み出すものだと思います。私たちはこれを文脈的AIと呼んでいます。AIについて一般的に多くの文脈について話しますよね。人々にプロンプティングについて話すと、それは大規模言語モデルにコンテキストを提供して最高の結果を出せるようにすることです。しかし、時には関連するコンテキストを持つのは本当に難しいです。しかし、誰かがコンピュータで作業している間、常にそばにいることができれば、多くのことを収集でき、基本的に時間とともに賢くなり、人を正しい方向に導くのを助けることができます。理想的には、コンピュータはあなたと同じことを知っています。あなたが読んだこと、消費したことから。それを時間をかけて構築します。だから基本的に同じリソースを取って、あなたに投げ返し、点をつなげることができます。なぜなら、すべてのものを読んで消費して、それらを結びつけて、あなたがすでに使っているのと同じアプリやツールを使うことができるからです。Raycastにすでに接続されています。

AIとの共存 – 段階的アプローチの重要性

このようなプロジェクトをどこから始めますか? AI開発者や、これらのツールで物を構築している人々が間違ってやっているのをよく見ることの一つは、一度に100%バージョンのことをやろうとすることです。そして、自信を持って言えますが、ほとんどのエージェント的ワークフローは機能しません。ただ機能しないのです。それには多くの完全に正当な理由があります。しかし、このものができることもたくさんあります。

そして、今の苦労は、最終的にこの技術がそうなると思い、望んでいる場所に私たちをもたらすが、今日実際に機能するものをどのようにシーケンスするかを見つけ出すことだと思います。そして私が見るのは、誰もが機能しないものを構築するか、結局ChatGPTのテキストボックスになって、機能するかしないかをChatGPTにオフロードするだけです。

はい。この魔法のようなものにシーケンスする方法を見つけ出しましたか? いつか真実になるかもしれませんが、明らかにまだそうではありません。

そうですね、それが難しい部分ですよね? 立ち上げビデオで輝かしいデモを見ますが、使った瞬間に崩れ落ちます。それは厄介です。時にはそれらのものは出荷されることさえありません。ビデオだけで、決して実現しません。

それはサイエンスフィクションですよね? そして夢です。この瞬間について興味深いことは、人々は夢が何であるかについてほぼ同意していると思いますが、それはまだ夢です。それはもっともらしい未来ですが、まだ未来です。

そして、誰もがそれをもう少し頻繁に覚えておくといいと思います。

そうですね。私は、自動運転車のようになるのではないかと思います。あと1年でそれは自動運転になる、と。そしてそれが10年間続きます。LLMが作った進歩は少し異なる傾向を示しています。傾向は、わあ、非常に短時間に多くの進歩があり、どこにも近いところで止まらないようには見えない、というものです。

しかし、通常のことに帰着すると思います。まずシンプルなことをやる、という感じです。試してみるためです。なぜなら、それは非常に新しい技術なので、何が可能で何が不可能かを理解する必要があります。だから、多くのプロトタイピングをして、何がうまくいくか、何が本当の価値をもたらすかを見ます。そして、おっしゃったようなサイエンスフィクションではなく、10回に1回しか機能しないようなものは有用ではありません。だから、その中間点を見つけるのは非常に難しいです。そして、それらのいくつかが起こっているのが見えます。人々が価値を見る場所は、私たち全員が夢見るSF的なものではないかもしれませんが、ミーティングレコーディングのようなものは、今、基本的に定期的に起こっています。だから、以前は不可能だった本当の価値がそこにあります。あるいは、調査のケース、トピックについての情報を消費して見つけること、そうでなければ調べなかったでしょう。だから、それらの非常に具体的な例がいくつかあります。そして、もっとたくさんあると思います。コーディングは別のものです。短期間に本当に多くの進歩をしています。

しかし、これは超一般的なものではありません。それが私たちにとってある意味では挑戦です。なぜなら、Raycastはこのすべてアプリのようなものだからです。開いて、何かを入力できます。だから、その中間点を見つけることは、私たちにとって時々難しいです。

しかし、オーケー、人々が毎日非常に頻繁にやることを見てみよう、それらのワークフローをどう改善できるかを見てみよう、に戻ります。そして細部を詰めて、プロトタイピングをして、実際に違いを生むものを見ます。そして、そのようなものを見つけたら、それを戻して、ユーザーに戻すことができます。

そして通常、それは共感を呼びます。なぜなら、それが人々が慣れているものだからです。しかし、そうですね、多くの探索があります。そして結局のところ、誰もが同じ水で料理しています。

そうですね。今、製品の中にそれの例はありますか? あなたが正しく行ったか、あるいは正しく行う途中にあるような、その種の中間的な尺度のように感じるものは?

そうですね、奇妙なことに、時々シンプルなことです。開いて、ミーティングで使います。例えば、知らない単語が出てきます。アプリを開いて、答えを得ます。終わりです。これらは、Raycastを何百回、何千回も使うツールとして最適化したものでもあります。多くの小さなことが積み重なって多くのことをします。だから、それらの短いインタラクションのために、人々がいつも使っているのを見るものは、単純なテキストの再フォーマットとスペルチェックです。なぜなら、まあ、私たちは一日中タイピングしていますから。だから、それらのことをより簡単に、より速くします。そして人々はそれに慣れると、もう少し冒険的になります。そして、ああ、たくさんのファイルをダウンロードしたばかりで、別のフォルダに移動して、意味をなすように名前を変更する必要がある、という感じです。そしてそれらのプロンプトを入力して、ああ、これも機能する、と見ます。そして次のステップを踏み出します。

そうですね、ファイルの名前を変更することは、実際に私がRaycast について具体的に話したい種類の完璧な例です。はい。

なぜなら、私たちはこの番組や他の場所で、サティア・ナデラとMicrosoftが今持っている考えについて多く話してきたからです。それは、近いうちに、あなたがコンピュータをほとんど使わず、それが代わりにあなたの代わりに自分自身を使うだろうというものです。自分のカードをテーブルに置くと、それは正しくないと思います。少なくとも、近い将来では。

しかし、タスクをやらずにコンピュータのタスクをやる余地はたくさんあると思います。そして、私たちが20年間小さな小さなユーティリティをダウンロードするために費やしてきたすべてのことについて考えます。たくさんの写真をバッチでリサイズするような単発のアプリのようなものです。簡単な例。

あるいは、撮った時間に基づいて、連続した順序で同じ名前のすべての写真をリネームする。これらは、私たちがコンピュータで多く行うことですが、難しいタスクではなく、特に精神的に複雑なタスクでもありませんが、コンピューティングライフの絶え間ない部分のようなものです。

あなたは、私がただRaycastに言えるはずの位置にいるように思えます。デスクトップ上のすべての写真を、それが何であるか、いつ撮ったかに基づいて名前を変更して、意味をなす順序に並べてください。私のデスクトップをきれいにしてください。はい。そこにほぼ到達していますか? 到達していますか? 全然到達していませんか? どこにいますか?

90%そこにあると言えます。

実際、今日Raycastでこれができます。できます。できないですか、トーマス? 私たちがここに座っている間に、今これを試してみますが、うまくいかず、あなたに腹を立てます。怖いです。

しかし、可能です。そして90%と言ったのは、時々うまくいかないからです。そうですね、トーマス? でも可能ですよね? あなたが言った、この超エージェント的なものについて言及しました。コンピュータがすべてをあなたのためにやってくれる。つまり、その状態に達したとき、私たちはHIについて話しています。そして、なぜコンピュータを開く必要があるのか、という疑問があります。その瞬間、コンピュータとは何なのか、という。私たちがどう考えているかは、インテリジェントなOSとは何か、AI OSのようなものです。だから、すべてがスマートになり得る新しい未来に採用されるように、私たちのオペレーティングシステムがどのように変わるか。必ずしも静的ではありません。あなたが言ったように、何かをするために小さなアプリが欲しいかもしれません。AIに尋ねるだけで、この小さなアプリをあなたのために構築してくれて、それをあなた自身のために持つことができたらどうでしょう。そしてそれを仕事のために使い、仕事が終わったら、捨てられます。それで大丈夫です。だから、この単発のソフトウェア、あなたに個人的なソフトウェア、しかしあなたのチームや会社にも個人的で、使いたいユースケースに非常に合わせられたものです。物事がより賢くなり、ソフトウェアを構築するのがより安くなると、それはかなり魅力的だと思います。オペレーティングシステムが同様になるとき、何か非常に魅力的なものがあると思います。必要なときに短期間、物事をプロンプトで存在させることができます。そして仕事が終わったら、もう使う必要がなくなります。明日は別のものがあるかもしれません。あるいはある時点で、一日を進めるにつれて現れるだけのアプリがあるかもしれません。ああ、デビッドは特定のことをする必要があると見ました。ねえ、これがあなたのための小さなものです。おそらく使えます。

プライバシーとセキュリティ – 信頼構築の重要性

さて、もう一度休憩を取り、それからトーマス・パルムとの会話を終えます。すぐに戻ります。

この番組の提供はMongoDBです。イノベーションは成功への鍵ですが、イノベーションにはそれ自体の課題もあります。

そして、新しい方法を見つけたい、枠の外で考えたい、レガシーコードを超えて考えたい開発者なら、MongoDBをチェックする時です。MongoDBは開発者によって開発者のために構築された柔軟な統一プラットフォームです。MongoDBはACID準拠で、エンタープライズ対応、AIアプリを高速で出荷するために必要な機能を備えています。

さて、戻ってきました。トーマス・ポール・マンとAIについて話しています。それに戻りましょう。

あなたはもう一つのことを持ち出しました。私が疑問に思っていたことです。Raycastが初期にうまくやったことの一つは、Raycastの拡張機能を構築するのを本当に簡単にしたことだと思います。

それはかなりわかりやすいJavaScriptのちょっとしたもので、かなり速く稼働させることができます。だから、ある意味で、Raycastの上にアプリストアのようなものを構築しました。それは本当にうまく機能しているようで、たくさんのものがあり、やるのはかなり簡単です。最終的に、私の代わりにこれらすべてのことをやってくれるだけの十分に優れたエージェントAIを手に入れたら、これらすべては消えますか? 私はもう、誰かがそれをやるのを助ける拡張機能を構築したという中間ステップを必要としませんか? それとも実際に私たちが必要としているのは、たくさんたくさん、私はAIを使ってRaycastのJavaScript拡張機能を構築すべきですか、それともRaycastを使ってJavaScript拡張機能を完全に不要にすべきですか?

そうですね、もっともな指摘です。拡張機能は本当に私たちを地図に載せたものでした。なぜなら、すぐに気づいたからです。オーケー、人々はただ統合したいのです。基本的にすべてとRaycastを統合したいのです。そして、私たちがそれをすべて構築する方法はありません。

だからコミュニティに渡しました。そして、それらを構築するのを超簡単にしました。それにより、ストアに2,000以上の拡張機能を持つことができました。毎日新しい貢献が来ています。しかし、一歩下がると、私たちが本当にやりたかったことは、生産性プラットフォームを構築することです。それが私たちがやりたかったことです。

拡張機能は実装の詳細のようなものです。JavaScript自体もそうですが、拡張機能さえ実装の詳細です。想像してみてください、それらは一瞬存在しないけれど、サービスはまだ存在します。Google DocsやSpotifyや何でも、やりたいことがまだあります。あるいはそのためのファイルです。

だから、アイデアは常に、どのようにそれらのものと本当に簡単に統合できるか、だから私はあなたのために仕事をすることができません。私たちがやった幻想は、人々が拡張機能を構築できる、あなたはそれらを使えます。しかしAIがあなたのために何かそのようなものを構築することもできる、だからあなたはそれを使えます。そしてあなたの拡張機能は異なる動作をするかもしれません。だから拡張機能の概念は少し曖昧になります。それはただ、進化するソフトウェアのようなものです。そして、あなた自身にとってさえ、おそらくただいくつかの拡張機能をダウンロードしているだけで、最初にそれらを構築していません。だから、AIにプロンプトして、あなたのための解決策を持ってくるのはそれほど遠くありません。しかしそれはあなたに合わせられています。重要なことは、すべてをまとまりのあるものにすることだと思います。

すべてが異なっていて、自分自身を見つけられなければ、かなり厄介で有用ではなくなります。だからこそ人々はそもそもアプリを好みます。そしてモバイルフォンでアプリが勝ったのはなぜか。電話用に最適化されているからです。同じUIとUXパターンに従っていて、人々はそれらの使い方を知っています。だから、モバイルウェブもそれに向かって、ますます対応しています。

そして、それは同じようになると思います。本当に有用にしたい。周りのすべてと統合して、その情報を消費するのを非常に簡単にしたいです。そしてソフトウェアがある意味で無料になるので、少なくとも小さなアプリを作ることができます。あなたが消費したい方法でそれを変換できます。それは超エキサイティングだと思います。なぜなら、私たちはみんな少し違っていて、異なる好みを持っているかもしれないからです。私はクラフトのようなものを見たいかもしれないし、あなたは異なる表現を持っているかもしれません。ただ少しのプロンプトでそれを変更できて、自分の方法で持てるなら。それはソフトウェアが可鍛性になり、その場で変更でき、欲しいものになり、あなたへの個人的なタッチになるという点で、本当にエキサイティングだと思います。

そして、それが私が個人的に本当に興奮していることです。そして、オペレーティングシステムが個人的なオペレーティングシステムに進化していくのを見ています。それらはすべて同じには見えません。ソフトウェアはすべて同じではありません。画面の前に座っている人に本当に合わせられています。

そうですね。面白いです。私がAI関連でいつも話していることの一つは、アプリやウェブページをスタイリングするための単純なCSS関連のことです。突然私が持っているのは、このアプリを青にしたいとこのアプリに伝える力で、それができます。なぜなら、それはClaudeコードができることだからです。CSSを変更して青にすることです。それはできることです。そして反対側に必要なのは、基本的にそれを行うツールを与えるフックだけです。そして以前は、オーケー、たくさんの複雑なものを構築しなければならない、カラーホイールの表示方法を考え出さなければならない、という感じでした。それは不可能なことではありませんが、やるべきことです。しかし、ただその方法でプラグインさせるだけなら、はい、あらゆる種類の機会とオプションを与えます。ただ、欲しい方法で構築させることに開放することによって。

そうですね。すべての構成要素があると思います。しかし、拡張機能のことで私が言おうとしているのは、AIについて考えているときに、コンピュータ上のフォルダ内のたくさんの写真をリネームしたいです。

Raycastはそれをするのに非常によく設定されています。

どこからでもRaycastにプロンプトすれば、あなたは多くのツールがあり、私のためにそれをやろうとするエージェント的システムがあります。それとも、ファイルをリネームするRaycast拡張機能に一度だけバイブコーディングして、何度も何度も使うべきですか? 今、私は信頼性があり、堅牢で、安定していて、毎回同じことを同じようにやるものを構築したからです。

そして、これらの多くのAIシステムの問題は、毎回同じことを同じようにやらないことです。そして時にはそれがエキサイティングで興味深く、あなたを異なる道に導きますが、他の時には、ただ写真をリネームしたいだけです。写真のリネームについての新しいアイデアは必要ありません。写真をリネームしてほしいだけです。そして毎回同じ方法で。まさに。

だから、特にこれらのことを考えているときに、オーケー、これらすべてのAIモデルを使って、コンピュータ上で何度も確実にできる硬直した構造化されたものを構築したいのですか? それとも、システムのオープンエンド性が機能であってバグではないのですか? そして、私はそのスペクトルのどこに着地するかをまだ完全には理解できていません。

そうですね、難しいです。しかし、ツールにとって、何か予測不可能なものを持つことは絶対にダメだと思います。例えば、Photoshopのような複雑なものを使っているとして、半分の時間でピクセルが赤くなり、半分の時間で青くなる、ということはできません。動作できませんよね?

そして、それがソフトウェアの強い引数だと思います。だから、ソフトウェアを一度生成できれば、もうAIは必要ありません。ただ動作します。そして完璧に仕事をします。それは機能だと思います。バックではありません。素晴らしいです。だから、そこにもっと傾いていると思います。なぜなら、それが世界が走っているものだからです。ソフトウェアです。

一度書かれて、使います。そして常に適応できます。明日、ああ、ファイルをこのように名前を変更してくださいと言えます。そしてこれを使えます。そして、使えるアーティファクトを取り出せるときは、かなり素晴らしいことだと思います。それが現時点で拡張機能としてあるものです。これらのアーティファクトを取り出して、それらの拡張機能を使って何度も何度も使えます。

私たちが時々苦労するのは、どうやってやるかという、賢くないことです。ただ非常に信頼性があり速く、筋肉の記憶になるので、ある意味でより良いこともあります。だから中間点を見つけたいです。そして、非常に具体的なタスクについては、あなたが言ったように、アプリ、拡張機能、何でもいいですが、仕事をするものが欲しいです。いつも同じ方法でやります。素晴らしい。

そして他のタスクもあり、よりオープンエンドであることが多いと感じます。単一の解決策がありません。ニュアンスがあります。何が欲しいか正確にはわかりません。そしてそれらはAIで本当に優れているものだと感じます。出て行って何かをやってくれて、戻ってきて、ああ、それは考えなかった。クールです。いい解決策です。素晴らしい。

だから、ソフトウェアの具体性について何か素晴らしいものがあると思います。一度書いて、ずっと同じように動作します。

そうですね、それは理にかなります。品質バーは他のものより高くなければなりませんか? あなたがこの種のアクセスをすべてのアプリに、さらにはシステムにさえ持っているからです。私のコンピュータを壊したい、あるいはChatGPTに私のコンピュータを壊させたければ、できます。その意味で、あなたは私のコンピュータへの異常なレベルのアクセスを持っています。この種のエージェント的技術を異なる方法で扱わなければなりませんか?

確かに多くの精査があります。ユーザーが私たちのところに来ると、よくああ、AIはバックグラウンドで動作していますか、何かできますかと尋ねます。だから実際に、多くのUI、コールアウトを製品に入れなければなりませんでした。オーケー、これはセキュアです、トリガーしなければ動作していません、あなたがコントロールしています、と言うために。例えばファイルを削除するような破壊的なアクションがあれば、プロンプトが出されて、はいまたはいいえと言えます。

そして、それは私たちが他のものよりもっとやる必要があることだと思います。他のものは少しYOLOに行けます。そして、あなたが言ったように、このシステムがあるので、あなたのシステムに非常に深い方法でアクセスできます。

だから、この信頼を築く必要があり、それは人々が私たちに期待していることでもあります。何年も使っていて、いつも動作します。常にそこにあり、それがなければ人々はもうコンピュータを使えないと感じるアプリです。だから、超安定にするために多くの努力をしています。ここでも同じで、使えば基本的にいつも動作する必要があります。これは議論したように、本当に挑戦的です。そして、機械学習とAI全般では、決して100%にはならないと思います。これはただそこに到達しない技術です。だから、どこまで押せるかです。

だから、すべてこれらのベンチマークがあり、すべてのモデルプロバイダーがそれらを登ろうとして、お互いの上に立とうとしています。

しかし、決して100%正しくはなりません。そのためには、ガードレールを持つことがさらに重要です。何かがうまくいかなくても、回復できるか、理想的な世界では、決してレールから外れず、基本的にユーザーにコントロールを与えます。これはしばしば、ループの中に人間を持つと説明されます。

それもSF的な用語のように感じますが、人間は。

そうですね。だから、ターンごとに特に注意しなければなりませんか? AIを構築するのをより難しくしますか? AIものを構築したので、多くのことができますが、その方法で予測不可能だからです?

必ずしもより難しいとは言いませんが、最初から考えることです。ねえ、プライベートな会社を構築したい、あなたのデータを収集したくない、そういったことです。だから、それは私たちが信頼を築くものです。何を構築するか、何を構築すべきでないかを賢く知る必要があります。そして構築するときも、エレガントな方法で、ユーザーに基本的に選択肢を与えます。使いたいですか、使うならコントロールを与えます。

いつも私のファイルを削除してください、確認を求めないでくださいと言うこともできます。それは設定のようなものです。しかしデフォルトでは理由があってオンになっていません。そして基本的に柔軟性を保ちます。

まさに。そうそう。完全なスタイリズム。何でも。好きなものを削除してください。さあ。何が起こるか見ましょう。しかし賢くありたいとも思います。元に戻せるリネームのようなものなら。

ユーザーにそれをプロンプトしたくありません。だから、これが複雑さかもしれません。あなたが言及しているものです。ユーザーが時間とともに自信を築くことを確認するために、特定のことについて少し異なる考え方をする必要があるかもしれません。

オーケー。

何か構築しないものはありますか? この種のことがあるので、できることとできないことについて言及しました。あなたにとってその点で明らかに線を越えているように感じるものはありますか?

何を言うか、明らかに注意すべきです。しかし、プライバシーの側面に行くと思います。例えば、かなりクールだと感じたものの感覚を与えます。フォーカスという機能があります。そのアイデアは、基本的にウェブサイトや他のものなどの気晴らしをブロックできることです。そして基本的にそれらを遮断して、そこに行くと警告が見えます。

そして最初に、ねえ、これをスマートにするのはクールじゃないか、というアイデアがありました。何をブロックしたいかを設定する必要さえありません。これがおそらく気晴らしだと検出するだけです。そしてどうやってこれをやるかは、おそらくいつもスクリーンレコーディングをするか、スクリーンショットを撮って、それらを送信して分析して戻ってくることです。

しかし最後に、ああ、これはいつも画面を分析することについて少し行き過ぎているかもしれないと感じました。私たちは本当にやりたくありません。そしてユーザーはおそらく非常に躊躇するだろうと気づきました。そしてそのためにローカルLLMを使うことを考えました。

そして、実際にコンピュータの前に座っている人は、何が気晴らしかをある程度知っています。だから、より良い解決策はおそらく、彼らに定義させることです。退屈に聞こえるかもしれませんが。だから、時々それが正しいことだと感じます。私たちにはまだ知性があり、考えることができます。だから、時々欲しいものを入れることもできるかもしれません。

だから、それは頭に浮かんだことの一つで、最初はああ、これをスーパークールなAIソリューションにしようと始めて、それから自分に3回なぜかを尋ねて、そうですね、多分より伝統的なソリューションが実際にここで十分です、となります。

それは本当に良い例です。なぜなら、最初は、うん、Raycastや私のシステムが、私が時間を無駄にしている場所を理解できれば有用だろうと思うからです。みんなに少しずつ異なるからです。私はRedditで多くの時間を費やしすぎています。あなたはInstagramで多くの時間を費やしすぎているかもしれません。そして、私が時間を無駄にしているすべての場所を削除してと言えて、それができたら。それについてクールな何かがあります。そしてそれについて即座に恐ろしく、不快な何かもあります。まさに。

みんな、多くの企業が永遠に言ってきたことは、私たちはその不快感を押し通し、実際に人々が最終的にそれに慣れると信頼します。それを非常に便利にしたので、このイック要因を乗り越えるだろうと。そして、まず、このものはそれをする十分に予測可能な方法でまだ十分に確実に動作しません。

そして、私が仕事のメールに行って、フォーカスセッションが「ううん」と言ったら、私は終わりです。システムを壊しました。しかし、率直に言って、すべての開発者はここで何らかの責任があると思います。実際にこれに不快でないのはオーケーだと言うこと。そして、これに不快になることを乗り越えさせようとすべきではないかもしれません。

決定を下すように求めるべきかもしれません。なぜなら、あなたは決定を下すことができる人だからです。私があなたのためにそれらを作ることに慣れる必要があるという事実を乗り越えさせようとするのではなく。そして、このAI関連のすべてで100万のバージョンを経験しようとしていると思います。技術が十分に良くなるに賭けて、みんなが慣れるか、しなければならないか、それとも人々に自分の存在の責任者であることを続けさせる努力をすべきか。そして、これはすぐに大きく、重く、実存的になりますが、毎日100万回その質問に遭遇しているように感じます。そして、サティア・ナデラが言ったこのことを考え続けます。人々がほとんどコンピュータを使わず、コンピュータを自分自身を使うように指示するところから、それほど遠くないと。そして、哲学的には、私にとって間違っていると感じる方法があると思います。

常にこの価値交換のようなものだと感じます。何を入れて、何を得るか、ですよね? だから、超価値があるなら、人々は特定のものを喜んで入れます。つまり、人々は今日、チャットボットに多くのものをアップロードしています。そういったすべてです。しかし、彼らはそれから何かを得ています。だから、価値交換がここで何かという質問だと思います。この瞬間、未来を予測するのは本当に難しいと思います。

基本的にこのAI全体の波を始めた2年前を振り返ってみれば、世界が今のようになっているとは思いますか? すべてがAIですか? わかりません。予測するのは本当に難しいです。コーディングがそんなに変わったと思いますか? 何でもいいので、本当にどんなトピックでも選んでください。本当に予測するのは難しいです。そして、古典的な、短期を過大評価して長期を過小評価する、だと思います。この場合、本当にそうだと思います。

次の6〜12ヶ月に何が起こるかわかりません。つまり、すべてが非常に急速に変わりました。一つ明らかなことは、それらのものはここに留まるということです。たとえモデルがこれ以上進歩しなくても、最先端の状態でできることの限界に達していないことがあります。そして、業界のみんなにとってそれは素晴らしいことだと思います。なぜなら、AI前は、正直に言って、技術には少しドライフェーズがあったからです。すべてが超最適化されていて、少なくともソフトウェアの面では、本当に根本的に何も変わりませんでした。そして今、多くのバスがあり、毎週何か新しいものがあります。そして、すべてが停滞しても、過去2年間だけで発明したすべての技術でできることの限界に達していないと思います。

そうですね、奇妙です。みんなが非常に忙しく、つまり自動運転車のことは完璧な例です。みんなが非常に忙しく、この絶対的な最終状態を発明しようとしています。もし社会を再形成したらどうなるか、という感じです。いやいや、もし私の車が自分で駐車したらどうなるか。

素晴らしい。それをやりましょう。私の車がどうやって自分で駐車できるかを見つけ出しましょう。そして私の車がどうやってもっと効率的に動作できるか。そして、経済の働き方を再考することを必要としない、途中で興味深く、エキサイティングで、強力な100万のことがあります。何か潜在的に大きなものへの途中で興味深いものがあるので、すべてのステップをスキップしないようにしましょう。

そうですね、あなたを行かせる前に、あなたがRaycastで、そして一般的にどのようにAIを使っているかについて数分話しましょう。このものは現在、あなたの日常生活やワークフローにどのように適合していますか?

そうですね、私にとって最大の変化は、今はプロンプトファーストです。基本的にやることすべて、プロンプトから始めます。何かを立ち上げます。

オーケー、ブログ投稿を書かなければなりません。マイクに5分間話して、それが私の出発点です。そしてそれを反復します。それらのことの一つです。ああ、メールに答える必要があります。たくさんやります。オーケー、AIでたくさんやります。コードを書きます。同じ方法です。私にとってかなり根本的に変わったことの一つは、バックグラウンドで並行して物事ができることです。たくさんのことを始められます。ああ、Twitterに機能リクエストがあります。オーケー、何かを始めましょう。

そしてすぐにそれに対処します。ああ、ここにも別のものがあります。それもやりましょう。ああ、このアイデアがあります。深い調査を始めて、それに対する良い解決策が何かを見つけ出しましょう。そして、ああ、取締役会のミーティングの準備をする必要があります。ああ、いくつかのことをまとめましょう。

だから、私の脳は完全に再配線されていて、今はプロンプトファーストです。そして基本的にプロンプトで物事を始めて、それから見ます。そこで、それについて手続き的な質問があります。ああ、どうぞ。どうぞ。すべてをプロンプトで始めるなら、目標はすべてをどこかにフィルターすることですか、それとも、これらのLLMのチャットの中でますます多くの人生を生きていると感じますか?

ああ、そうですね、時々Raycastの私たちのAIチャット内にあるだけのものがあります。しかし、出力を本当に生み出すことはありません。たぶん私が何かについて少しチャットすることです。ああ、このトピックがあります。取引を成立させる方法について考えています。これらが私たちが持っているポイントです。会話を続けるエレガントな方法は何でしょう。

だから、どうやって顧客により良く到達するための解決策を見つけられるか。そして、それはほとんど考えるパートナーのように考えています。少しの間、誰かと物事を行ったり来たりして、より速い方法で自分自身を鋭くすることです。それが私が多く使う方法です。だから、私たちの会社でも変化が見られます。より多くの人々が問題から始めるだけです。

会社で見た大きな変化は、すべてのデザイナーが今コードを書くことです。以前は基本的にすべて静的なデザインでしたが、ますますインタラクティブなプロトタイプに直接私たちの製品の中でなります。だから、感じて見て、機能するものが得られて、しばしばエンジニアがそれを潰します。

しかし、すべてのデザイナーは基本的に半分開発者でもあります。それは信じられない変化です。そして、クリエイティブな人々にとっても本当に素晴らしいと思います。なぜなら、いつもああ、数ピクセル描いて、それから誰か他の人がそれらを再構築してインタラクティブにしなければならないという障壁があったからです。だから今、そのバーを越えました。本質的に。

クリエイティブな人で、意志があれば、物事を実現できるという植物のようなものです。コーディングがより多くの人にアクセス可能になる。そして、プログラミングではまだ多くの方法でそれに失敗していますが、私たちの会社で本当に強く起こっているのを見たことです。デザイナーが開発者にもなることです。

オーケー。

そうですね、私が尋ねた理由の一部は、私の脳で最も解放されたことの一つは、Raycastの中の、基本的にアプリの一つをアットメンションできるものでした。ああ、そうです。そしてプロンプトします。そして、それは私にとって、オーケー、今、私たちは一緒に意味をなすことのシーケンスに入っています、という感じです。私は、今、たくさんの非常に特定のアプリが必要ではありません。わかりません、わかりません、たくさんの異なる非常に特定のアプリは必要ありません。

AIモデルに、彼らがすでにアクセスできるアプリと話すように尋ねることができます。時々うまくいき、時々うまくいきません。デスクトップをきれいにすること全体は、私たちがここに座っている間、まったくうまくいきませんでした。ただ何もありません。持っているファイルについていくつかのやや役立つ情報を与えてくれました。改善しなければなりません。ほら、それが道です。しかし、もっとプロンプトできます。

何かを見つけ出します。しかし、オーケー、これらが私に利用可能なことだと見始めると、何かが解放されると思います。そしてあなたはほとんどの人よりもそれらのものをもっと見てきました。

だから、今、プロンプトを通じてコンピュータの活動を常にやっているのか、興味がありました。すべてがプロンプトから始まります。

そうですね、ほとんどそうです。基本的に私にとっては、ブラウザにいることが多いです。いくつかのタブが開いています。基本的にアットブラウザで引っ張ります。すべてのタブを取得します。それから始めます。

それから、ああ、ところでこれをNotionページに入れてと言います。だからNotionページに入って、チームと共有できます。それからNotionページで反復します。そういうことをかなりやります。また、特定のタスクをやってもらうためにコードを書かせます。少し馬鹿げた例ですが、確定申告をやらなければなりませんでした。

まあ、AIで確定申告はやりませんでした。しかし、そのためにすべての給与をダウンロードする必要があり、すべてにパスワードがついていました。だから、AIに尋ねました。ねえ、これらの10個のPDFを取って、これがパスワードです。それを削除してくれませんか、会計士に送れるように? そしてやってくれました。コードを書いてくれました。

コードは本当に見ませんでした。なぜなら、ああ、それがやることだとある程度わかっているからです。そして完璧でした。そうでなければ、各PDFを見て、まずパスワードを削除する方法を見つけ出すのに5分費やしていたでしょう。全然わかりません。だから、それが変化だと思います。かなり満足しています。プログラマーにとって、これは長い間ある程度存在していました。スクリプトと呼ばれるものです。一日に何度もやるさまざまなランダムなもののための小さなものです。このスクリプトがただ自然言語だったら? ただこれを言って、あなたのポイントに、一度問題を解決したら、それを再利用するだけです。何度も使えます。そして、それが大きな違いを生む小さなことだと思います。そして、それがRaycastでやっていることです。

すべての小さなことをスピードアップしたいです。一日に何百回もRaycastを使います。Raycastで次にやるべき100のことは何ですか? それが私たちの考え方です。実際に超頻繁に使う問題を解決できるものは何で、一年に一度だけとかではなく。そして、それが私たちが進んでいる旅です。

それはかなりクールです。

そうですね。そして、コンピュータアクセスを持つと、含まれ始めることができるものの数がただ膨大になります。はい。そしてブラウザへのアクセスがあります。そして繰り返しますが、これがRaycastが非常に魅力的だと思う理由です。なぜなら、あなたは、他のほとんどのアプリにとって非常に難しい方法で全体のスタックを見ることができるからです。

それは、あなたにとって信頼バーが非常に高いことを意味しますが、これらのAIエージェントが必要とするすべてのことを見てできないということについて多く話します。Raycastはある種できます。

そうですね、それが素晴らしい位置にいることだと思います。このすべての種類のことをできる位置にいることです。しかし、まだすべての点をつなげて、あなたが言った発見可能性を構築しなければなりません。人々がそれを得ることを確認し、人々が本当の価値を得ることも確認します。多くのクールなもののデモを見ましたが、それから日々決して使わないか、ほとんど使わないので、本当にうまくいきません。そして、それが私たちにとって本当に課題です。自然言語は素晴らしいですが、発見可能性は難しいです。何が実行可能かわかりません。しかし、これについて興奮しています。

基本的に、同じアプリとツールを使うことによって、コンピュータをよりスマートにするのを助けます。コンピュータ全体の旅を通ってあなたについて回る一つのAIを持つことによって、すべてのアプリにAIがあって、すべてが孤立しているのではなく。アプリでそれを経験してきました。ちょっと厄介です。

そして、すべての知識、記憶、コンテキストが各アプリに住むことを、再び広めたくありません。そして理解できます。それらのアプリのすべての会社はこれを持ちたいです。あなたをロックインして、その単一のアプリに留まるようにしたいです。彼らが欲しい財政的なことです。手放したくありません。

しかし、純粋にユーザーの観点から考えると、AIはオペレーティングシステムレベルにあるべきです。そこにあった方がずっと意味があります。すべてのアプリにあって、すべてのアプリがそれを再構築しなければならないのではなく。たまたまこのゴールドラッシュで、誰もが見ています。しかし、ユーザーの観点から本当に、最良のことは、仕事を成し遂げるのを助けるスマートなオペレーティングシステムを持つことだと感じます。

そうですね、同意します。オーケー、トーマス、これは非常に楽しかったです。やってくれて本当にありがとう。

まあ、呼んでくれてありがとう。長年のリスナーで、ついに何とか一緒にここにたどり着きました。やりました。

オーケー、これで番組は終わりです。再びトーマスに感謝します。そして、見てくれて聞いてくれたみんなに感謝します。

いつものように、質問があれば、教えたいRaycastの拡張機能があれば、これのいずれかについての考え、懸念、感情があれば、すべて聞きたいです。ホットラインに電話できます866 Verge11。メールできますvergecast@verge.com。私はDavid@theverge.comです。連絡してください。

AIがソフトウェアにどのように属するかというこの質問は大きくて魅力的で混乱していると思います。そして、あなたがそれについてどう感じるかを知りたいです。だから、連絡して、すべての質問をしてください。来週もこれらのもう一つが来ます。話すのが非常に楽しみな、非常に異なる種類のアプリについてです。それに入りますが、今のところ、Vergecastはvergeのプロダクションで、Vox Media Podcast Networkの一部です。

番組はエリック・ゴメス、ブランドン・ケフィア、トラビス・ラルークによって制作されています。火曜日と金曜日に、通常の良いVergecast関連のすべてで戻ってきます。それではその時に。ロックンロール。

MongoDBのサポートに感謝します。開発者は開発者が欲しいものを知っています。だからMongoDBを開発したので、あなたを押しとどめているボトルネックとレガシーコードを超えて移動できます。

MongoDBはACID準拠で、エンタープライズ対応、AIアプリを高速で出荷するために必要な機能を備えています。だからこそ、Fortune 500企業の多くが最も重要なワークロードをMongoDBに信頼しているのです。行と列の外側で考える準備はできていますか? mongodb.com/buildで構築を始めましょう。