
14,528 文字

未来のバンクーバーAIコミュニティミートアップからの通信です。私がこのイベントを作った主な理由の一つは、自分が本当に行きたいイベント、聞きたい人々の話を聞く機会、そして私が興味を持っているさまざまな分野を一堂に集めることでした。
この人は最近私の想像力をとらえています。地元の人で、アラン・パイクという名前で、Forest Walk Labsという組織を運営しています。彼らはチームや他の人々のために、AIを活用した素晴らしく人間的なソフトウェアを構築しています。彼はデザイナーであり、開発者であり、ギークであり、インディーウェブの人でもあります。彼はとてもユニークな視点を持っています。約1ヶ月前に彼の世界に飛び込んだのは本当に楽しい経験でした。その後、電話で話し合い、つながりました。そこで彼を招待して、彼の視点を少し共有してもらうことにしました。今晩は、デザインとインターフェースなどについて話してもらいます。
アラン、どうぞ。
ありがとう、クリス。私はアラン・パイクで、今日はインターフェースについて少しお話しします。私は開発者であり、時にはデザイナーでもあります。バンクーバーにあるForestwalk Labsというスタートアップの共同創設者で、チームのための素晴らしいソフトウェアを構築しています。
しかし、今日話したいのはそのことではありません。今日はこのような美しいインターフェースについて話します。皆さんの中には、コンピュータが端末だった良き時代を覚えている方もいるでしょう。コンピュータに入力すると、長いスクロールする文字列のリストで返事が返ってきました。何をすべきか知っていればなんでもできるという点で、とても強力で柔軟だったのですが、多くの人は何をすべきか分からなかったのです。なぜなら、それは単なる入力フィールドだったからです。
しかし、それに魅了された私たちにとっては、想像力をかきたて、すべての始まりとなりました。そして、ここに到達しました。これはより良いものでした。テキストベースのインターフェースほど柔軟ではなかったかもしれませんが、見ているものを直接操作できるようになりました。
ソフトウェアを初めて使う人でも、それを使いこなせるようになりました。やりたいことを見て、それを学ぶことができました。これは大きな進歩でした。そして、それ以来、物事は継続的に改善されてきました。数年前、物事は少し悪化しました。過去10年で最も影響力のあるテクノロジーである「Chat GPT」が登場しましたが、それは入力するテキストフィールドとスクロールするテキストのリストにすぎませんでした。
それは本当に素晴らしく、エキサイティングで、柔軟で強力でしたが、90%の人々にとっては完全に困惑するものでした。これは素晴らしいスタートであり、ソフトウェアの構築方法や世界の構築方法の変化を促進しましたが、DOSがそうだったように、これもまた始まりにすぎません。
すでに、私たちが使用しているツールがチャットを少し脇に押しやり始めていることを示す兆候が見え始めています。チャットは素晴らしいプロトタイプのインターフェースでしたが、これはChat GPTのもう一つの例です。現在はキャンバスモードがあります。ラッコとその可愛さについてのドキュメントを共同作成するように頼むと、チャットが隅に置かれ、作業に集中できるようになります。
しかし、これもまだ私たちがこれらのインターフェースで実現できることの始まりにすぎません。もしよろしければ、AIを使って構築できるポストチャットインターフェースのいくつかを簡単に紹介したいと思います。
まず、とても単純なものから始めましょう。右クリックです。現在では、どこでもクリックできます。これはDAIというブラウザのプロトタイプからの例です。これはブラウザカンパニーが開発したAI中心のブラウザで、どこでも右クリックすると、対話したものに基づいたコンテキスト依存のスマートアクションが得られるというものです。これは、ソフトウェアを構築している私たちがAIインタラクションを配置している最も前面に出ている場所の一つで、モデルとチャットする必要はなく、「ここで何かをしてください」と言うだけです。
それはかなり良いものですが、私たちが慣れてきたインターフェース規則が本当に変化している唯一の場所からは程遠いものです。もう一つの大きなものは検索です。検索ボックスを使ったことがある人はいますか?正確に探している語句を入力する必要があります。
実は、それはもう真実ではありません。Superhumanというメールアプリを例にとると、どんな検索ボックスでも、今後はますます人間のように探しているものを入力できるようになるでしょう。なぜなら、私たちは人間だからです。以前はAir Canada flight notificationと文字通り入力する必要がありました。
しかし、notificationの代わりにupdateと書かれていれば、それは見つかりませんでした。それが私たちがコンピュータを使うように教えられた方法でした。しかし、それは他の人間と話す方法ではありません。私たちは「フライトの詳細を教えて」と言うだけです。現在、これは機能するとき、そしてそれをサポートするいくつかのアプリケーションでは、素晴らしく、驚くべきことです。
しかし、今後数年間で、これは単なる前提となるでしょう。これが私たちの、そして私たちのユーザーがソフトウェアに期待する方法であり、そうであるべきです。なぜなら、これははるかに優れているからです。コンピュータでよく行うもう一つのことは、物事を選択することです。選択肢のリストがあるかもしれません。
そして、ドロップダウンメニューなどに入らなければなりません。しかし、それは実際には必ずしも必要ではありません。これもSuperhumanからの例ですが、ここではイベントをスケジュールしています。日付を選択していますが、グリッドから選んだり、番号を正確に選んだりする必要はありません。「来週木曜日の11時」や「来月の最初の火曜日」、または「明日のミーティングがすべて終わった後」と言うだけでいいのです。
これは、マッキントッシュの時代以来、コンピュータに対して完全に合理的に思えるインターフェースのもう一つの例ですが、今後数年間では、古いソフトウェアがリストから選ばせるようにするのは実際に馬鹿げていると思われるでしょう。例えば、「この日付以降のアイテムをすべて表示し、私に割り当てられたものだけを表示してください」などのフィルターです。いいえ、単に「この日付以降のもので私に割り当てられたものを表示して」と入力するだけで、それは機能するようになります。
もう一つのパターンは、私たちが非常に慣れているスペルチェックですが、古い形式のままだと本当に時代遅れに見えるでしょう。テキストを下線で強調して、タイプミスがあればフィードバックを与えます。これは私の大好きなデザイナーの一人、マギー・アップルトンによるデザインです。彼女は考えました。なぜただのスペルチェックなのでしょうか?なぜテキストを強調して、なぜあなたが間違っているかを教えてくれる悪魔の代弁者ではないのでしょうか?そして、「引用元を示せ」とか「なぜこれはこんなに複雑なのか、簡素化せよ」などと言うものかもしれません。
あなたが望むものなら何でも、あなたに役立つ方法でそれがより良くなる可能性を強調するエージェントを、チャットインターフェースではなく、まさにあなたの作業場所に配置することができます。これはテキスト文書での例ですが、私たちはこれを作業している場所、スプレッドシートやデザインなど、どんな作業をしていても期待するようになるでしょう。
これらはいつも慣れていたインターフェースが大きく変化する方法のいくつかです。また、以前は完全には存在しなかったインターフェースもあり、それが今や一般的になり始めています。これはApple Intelligence(アップルインテリジェンス)で、使ったことがある人なら分かるように、いくつかの当たり外れがあります。完璧ではありませんが、非常に強力で有用なことの一つは、現代の日々の生活という情報の洪水を要約できることです。
グループチャットを想像してみてください。多くの人々が互いに議論し合っています。あなたは仕事中で何かに集中しようとしていますが、「ピクニックを夕食にしよう」「雨が降るかもしれない」という話し合いがあります。あなたはそれに付いていこうとしています。しかし、今後、私たちのソフトウェアに期待すべきことは、忙しいときに「みんなが夕食について議論し、来週末に予定を変更した」と言うことです。
これは今日では素晴らしいことであり、明日にはテーブルステークスとなり、私たちのソフトウェアが私たちのためにすべきことです。そしてこれは、グループチャットというこの小さなおもちゃのような例をはるかに超えています。大きな組織を想像してみてください。あなたの会社には1000人が働いています。大企業で働いたことがある人なら誰でも知っていますが、あなたが消化できる以上の情報が流れています。
しかし、その中には、あなたの仕事を助け、より良い意思決定を支援する情報がありますが、それはただノイズの中に埋もれてしまっています。これは本当に大きなパターンです。チャットベースである必要はありません。確かに、チャットして尋ねることもできますが、忙しい時に他のことを無視できるように、その情報の洪水から重要な情報があなたのところに来るべきです。
これで、AIが私たちが苦手なこと、つまり膨大な量の情報に対処することを支援する方向に進み始めています。人間が少し弱いもう一つのことは、時々少し散らかっていることです。もしデザイナーなら、これはFigmaのドキュメントで、Photoshopもすべて同じです。
レイヤーに適切に名前を付け、各部分が何であるかを明確にすることになっています。それをする人もいますが、時には、このようなドキュメントを受け取り、迅速な変更を加えようとしたり、それを理解しようとしたりします。これは人間が作業する方法ですが、コンピュータは今やボタンをクリックするだけでレイヤーの名前を変更できます。
これはモックアップや狂気のアイデアではありません。これは文字通り現在Figmaにあるものです。プロアカウントを持っていれば、散らかったものをクリックして「レイヤーの名前を変更」と言うだけで整理されます。これはゲームチェンジャーです。これは本当にゲームチェンジャーであり、これはそのような完璧なアプリケーションです。
チャットで「これを整理してください」と言うのではなく、ただ直接その場で、私たち散らかりがちな人間が行う散らかった作業を行い、コンピュータが整理を手伝って、他の人間が私たちが何をしているのかを理解しやすくします。私はそれが本当に好きです。
人間として時々苦労するもう一つのことは、空白のキャンバスです。大きく、威圧的な空のプレゼンテーション。ここに何を入力すべきでしょうか?そこで、よく見られるパターンの一つ、これもFigmaからの例ですが、「まず始めましょう」というものです。クリックして「最初の下書きを作成して」と言うだけで、少なくとも今のところ、最初の下書きは素晴らしいわけではありません。驚くようなものではありませんが、キャンバスが空白でなくなります。
少なくとも私の考え方では、悪いものがそこにあるとすぐに「あ、これを修正しなきゃ」と思います。「いや、実際にはそれは下にあるべきだ」と思い、そして動き始めます。これはもう一つのことです。もちろん、それがどうあるべきかについてチャットすることもできますが、実際には時には何かがあれば始めるのに十分です。
これは、ソフトウェアのオンボーディングに深い影響を与えるでしょうし、すでに与え始めています。複雑なものを使い始め、以前使ったことがないとき、現在、そして私たちが構築しているものには、簡単に始められるようにするためのすべてのアフォーダンスがあるべきです。
テキストからテキストの領域からさらに離れると、もちろん音声があります。Chat GPTの高度な音声モードを使ったことがない人は、ぜひ試してみるべきです。それは素晴らしく、恐ろしく、素晴らしいです。基本的な形では、あなたが何かを入力すると、それが返してくるのと非常に似ています。何かを言うと、何かが返ってきます。
しかし、本当に深遠で、今まさに私たちのソフトウェアに組み込まれ始めているのは、人間は実際に同時に話して指さすことができるということです。そしてAIもそれができます。このウェブサイトを見ていて、「この紫色のラインは何だろう?このヘッダーはどうなってるの?」と思うかもしれません。
チャットしている場合、実際に「ここに紫色のラインがあります。紫色のラインと何が起こっているのか」と入力する必要があります。しかし、カーソルを動かしながら「これはなぜこうなっているの?これをどうすれば良くなるの?」と言うことができます。そしてAIは「了解しました」と言って、コードを見せたり、その場で応答したりすることができます。
これは、ポストチャットあるいはチャットのスーパーセットの別の例です。最後から2番目のものは私の心に近いもので、「次の明らかなことをする」と呼んでいます。これはGrammarlyからの本当に基本的な例で、タイプミスをしたときに「修正するにはTabキーを押してください」というものです。それが恐らく明らかなことだからです。
一度脳内でこれを理解すると、多くの応用が可能です。新しい高度なコーディングツール、特にカーソルのようなものを使用し、特に理解の良い言語で作業している場合、変更を開始するとすぐに「明らかにあなたはこれをしているのでTabキーを押せば、私は続けます」「ああ、これらのものの名前を変更してこのように整理しているのですね」というような瞬間があります。
「いいえ、あなたが何をしているのかわかります。Tab、Tab、Tab」と押すと、それで完了です。これは非常に強力で、他のすべてのソフトウェアが壊れているように感じます。Microsoft Excelに入って「年間合計」というタイトルを付けると、明らかにTabキーを押すだけで年間合計が入力されるはずですが、それは完全に機械的なことです。
私はすでにコンピュータに文字通り「これをするつもりだ」と伝えています。それは可能です。プログラマーとして私たちがそれを接続するための少しの作業が必要なだけで、マイクロソフトはスタートアップよりも動きが遅いです。しかし、これは私たちのソフトウェアの多くにやってきます。そして、それは素晴らしいことになるでしょう。私たちがより多くの時間を創造的な部分に費やし、「これが見たいものだ」と決め、そしてコンピュータがただ「明らかにこれが私たちが向かっている方向だ。その雑事を取り除こう」と言えるのです。
最後に、GPT2の時代から業界で話し合ってきたことがあります。正確に何を考えるべきかわかりませんが、取り上げる必要があります。それは、まさにその瞬間にあなただけのためにAIによって作られた完全にカスタマイズされたUIを今や生成できるということです。
今すぐ、AIによって作られたポップアップが表示されます。これは実現可能性の点からはSFではありません。今夜遅くにでもこれをコーディングすることができます。それはLLMによって完全に生成されるすべてのモーダル、ポップアップ、ダイアログ、ナビゲーションを生成するものです。本当に厄介なのは、今これを行うと少し遅いことを除けば、これが次のようなことです。
これはユーザーインターフェースの完全な未来であり、私が話したすべてのことをコンピュータが私たちのために生成し、インターフェースプログラマーやスタートアップの人間としての私の仕事が大きく変わるか、あるいはこれは完全に正気を失い、誰もが混乱し、正しく機能させることが不可能になるかのどちらかです。
誰も同意していないようですが、インターフェースが何かをクリックするたびに毎回生成され、あなたにとって「完璧」な新しいインターフェースを作り出すと想像できます。それは誰かに「ここをクリックしてください、あ、実はあなたにはそのボタンがありませんね、え、上には何があるの?私のはサイドウェイズにスクロールします」などと説明しようとするときに少し混乱するかもしれません。
これは完全なギャラクシーブレインか、チャートの反対側にいる男かのどちらかです。まだわかりません。これすべての私のポイントは、チャットが死んだとか何とかではありません。私たちはソフトウェア、製品、体験の本当に信じられないほどの世代の始まりにいるということで、AIを考えるとき、私たちはしばしばこのチャット体験を思い浮かべることがありますが、それは消えていくわけではありません。しかし、来るべきものはもっとたくさんあります。
皆さんの中には、そのいくつかを構築することに触発された人もいるかもしれません。ありがとうございました。
ありがとうアラン。とても目が覚めるような話でした。私が興味を持っているものにとって直撃でした。こちらに来て、もう少し明るい場所に立ちましょう。
質問と回答の時間が少しあります。
質問:ちょうど実演してくれたことで、どれくらいの部分を日常的にクライアントとの仕事で実装していますか?
それは良い質問です。私たちは製品会社です。そして、私が示したすべてが検討対象です。私たちが行っていることの一つ、私たちは初期段階です。まだ収益もありません。私たちは構築中で、探索中です。
2025年の初期段階のスタートアップビルダーであることの喜びと恐怖の一つは、行ったり来たりすることです。数日前、私は私たちが取り組んでいる製品の一つからチャットインターフェースを取り除こうとしていました。それを隠して削除しようとし、すべてのこれらの興味深いパターンを考え出し、もちろん私はこれにとても興奮していて、次の大きなことを偶然発見するかもしれないので、「いや、単にではなく、何か新しいことをしよう、何か新しいことをしよう」という穴に引きずり込まれる傾向があり、そして3日経って「実際には、これはチャットであるべきだ」と気づきます。
私たちはこれらのいくつかを適用していますが、製品がそこに到達するまで吸い込まれないように、私たちの大きなボードに載せているものもあります。しかし、それらすべてを構築したいと思っています。
質問というよりも、挑発かもしれませんが。あなたの最後の質問について、インターフェースが私たちの正確なニーズに基づいてリアルタイムで構築される実際の未来なのか、それともこれは単なる夢想なのか、誰かがあなたのものとは全く異なる場合、インターフェース周りでどのように案内するのでしょうか。
私はそれが現在私たちが住んでいる世界のアーティファクトだと思います。アプリの機能を誰かに説明する能力への欲求です。これらのものが飛行機上で自分自身を再発明している理由は、やろうとしている機能をどのように実行するかについて混乱がないようにするためです。
4つのドロップダウンメニューの下に行って、切り抜き機能を見つけるなどする必要はありません。それはあなたがそれを必要とする場所にあるだけです。あなたが言った「次の明らかなこと」のように。私の投票は、おそらく私たちが使っている時に作られるパーソナライズされたインターフェースに行きます。たぶん。
そうですね。それは普通のものよりも楽しいでしょう。エンタープライズITの部門と交流したことがあれば、彼らはソフトウェアにこれをさせることを私たちが考えているだけで恐怖を感じるでしょう。だから私にはわかりません。変化は私にとって刺激的です。
質問:私たちも使用するときに生成されるソフトウェアのポケットを実験していますが、デプロイメントの観点から聞きたいのですが、毎回まったく新しいソフトウェアを生成するとき、自己テストパイプラインを追加するなど、より大きなアプリケーション内のこのソフトウェア生成のポケットについて、どのようにアプローチしているのか少し話していただけますか?
あなたは、このすべてのものを構築する際の最も複雑で困難で強力なことの一つにヒットしました。それはテスティングです。毎回使用するたびに異なるソフトウェアの自動テストをどのように行うかは、これの痛みと喜びです。
最も成功しているチームを構築している人々、例えばHarveyで働いている人々(これは法律にAIを適用している最前線の会社の一つで、想像できるように法律はある程度正確である必要があります)と話すと、彼らはこれらの評価、これらのさまざまな細かいことをテストするスイートに夢中です。
彼らが変更を加え、新しいモデルが出て、プロンプトで何かを変えたり、システムのどの部分でも、彼らがテストしている一つのことだけでなく、彼らが人間として試している一つのことだけでなく、100のケース、10,000のケースを自動的にテストしているという自信を持てるようにしています。
これは「はい」の言い方です。もし希望があれば、後でもっと詳しくお話しできます。
これはテストなどの周りのことの中心でもあります。私がVibe Codingを行い、アプリを作っているとき、明らかに3日間構築して、次に5日間のデバッグに直面することになります。なぜなら、このものはコントロール不能に構築されたからです。私はSevと一緒に時間を過ごし、いくつかのことについて彼に尋ねて、彼は関数をデプロイするよう指示すると同時にテストもデプロイし、コードをソフトウェアに入れる前に自分自身で合格するまでテストを実行するよう指示するなど、テストを物事に組み込むためのいくつかの精神的フレームワークを示してくれました。
ですから、Vibe Codingに参入している皆さん、最初からテストフレームワークを構築することは、あなたのソフトウェアが実際に機能し、デプロイ可能であることを確実にする方法です。
質問:AIドリブンの新しいインターフェースの素晴らしい調査をありがとうございます。標準化についてはどうですか?ツールに関して、ミル・ペットはそれを説明するのが非常に上手です。彼はバイオリン奏者で、プログラミング言語を発明しました。彼は「バイオリンが6ヶ月ごとに変わったら、誰もバイオリンを弾くことができないだろう」と言っていました。ツールを使いこなすには時間がかかります。AIではモデルが下で変わり、インターフェースが前で変わります。それでは、これらのツールのマスターになる人は誰もいないでしょうし、永遠に動き続ける世界の中でどのように標準化すればいいのでしょうか?
質問の核心は、これらのことが非常に速く動いているので、多くの人がどのようにそれを習得するのかということと、大部分はテストと評価のことです。
あなたが単に探索していて、試行錯誤で特定のモデルから結果を得る最良の方法を見つけている場合、それは非常に脆いものです。モデルは平均的には改善されるかもしれませんが、あなたのハックを壊します。そして、一般的なことは、2年前のプロンプトを見ると、その多くは大文字で「あなたの子供たちが投獄されない限り、これをしないでください」というようなものでした。GPT3はOK。
そのようなものは、もはやそれほど違いを生み出さず、おそらく実際には少し怒りっぽくしたり、予期しない効果を持ったりするかもしれません。これらの評価は、すべての問題の完全な解決策ではありませんが、これらのツールをより上手に使うということが組織、製品、チーム、または実験として何を意味するかの大きな部分です。あなたの能力は、より良いはずだが、あなたのものにとってはおそらく悪いモデルを含む、任意の与えられた変更を実際に評価することです。それは確かにその一部です。
今夜の知識、兄弟。
質問:今のあなたのお気に入りの上位3つのモデルは何ですか?そしてなぜ、どのようなユースケースのためですか?
この質問は人々に尋ねる必要があります。なぜなら、それは30秒ごとに変わるからです。カーソルでたくさんの思考を適用したClaude 3.7 Sonnetは、私が現在最も使用しているモデルです。なぜなら、私は多くのコーディングと構築を行っているからです。
それは少し高価ですが、私よりもはるかに安価です。そのため、私が行っていることに対しては本当に良いです。私はチーム向けのウェブアプリケーションを構築しています。O3思考モデルは私のデフォルトです。これはあまりギャラクシーブレインの考えではないかもしれません。それは現在、何かについて本当に一生懸命考えることができる最大のモデルです。
特に研究的な質問がある場合、Deep Researchも使用できますが、例えば、このトークから落ちたものですが、Microsoftのオフィスで、彼らが使用するものだけを表示するようにツールバーを変更したことがあるが、人々はそれを嫌った、なぜなら全員が異なるものになったからだという話を覚えていました。ウェブでそれを検索しましたが、それはそうなのかどうかわかりませんでした。そして、O3はマイクロソフトの上級者からの引用、その時の問題について複数の上級者からの引用を提供することができました。それが私の他のものです。
そして、API使用のためのGPT4の代わりになるGPT41は、アプリケーション自体が何かを行うための私たちのデフォルトのワークホースです。主にAPIの周りのエルゴノミクスや他のものが、スタートアップのプロトタイピングに本当に良いからです。
1週間前にドロップしたGPT画像のAPIモデルに少しシャウトアウトします。GPTは画像の扱い方を変え、1週間前にAPIへのアクセスを提供しました。まだそれで遊んでいない人は、それは驚くべきものです。ぜひチェックしてください。
質問:これらのモデルがますますスマートになるにつれて、そこにAIの大きなスープがあるように見えます。製品デザイナーとして、誰もが出してきた製品が他の全員ができることをすべてできるように見える中で、どのように差別化しますか?
モデル自体について話していますか?
いや、実際には今出ている製品について話しています。それらすべてに多くの重複があります。他のすべてのものからどのように自分自身を差別化しますか?
質問は、製品ビルダーとして、9億の他のスタートアップがすべてAIスタートアップを構築している中で、どのように自分自身を差別化するかということです。それは本当に難しく、あまり考えすぎると魂を破壊します。なぜなら、見れば、Y Combinatorのスタートアップで、彼らは何か高飛車なものなどで、彼らがあなたと似たようなことをしているように見えるからです。
最終的には、私はよくこれについて話します。短くしようと思います。あなたが特に急速に変化する世界のような中で、競合他社に注意を向けすぎると、常に何もしない理由、単に構築しない理由を見つけるでしょう。なぜなら、あなたが何かに潰されると自分自身に納得させる理由が常にあるからです。
そして時にはそれは事実かもしれませんが、特に初期段階で何かをしているとき、成功した創設者が時間と時間を重ねて助けると言うであろう一つの北極星は、単にあなたの顧客に耳を傾けることです。もしあなたの顧客が「私たちはすでにこのものを使っています」と言っているなら、私は本当に透明にしますが、私たちはそのために一度ピボットしました。
私たちは何かを構築していました。それはクールで、私が話していたこのテストの中にありました。そして、私たちはすべてのこれらの顧客と話し始めました。そして私たちの顧客は「実は私たちは他のものを使っています」と言い始めました。私たちはそのものを試しました。「おお、それは私たちのロードマップ全体がスタートアップに含まれています」と思いました。そして彼らは銀行に2000万ドルとこれらすべてのロゴを持っています。ピボットする時です、そうですよね?
そして、私たちは「わかった、私たちは終わりだ」と言うことができますが、私たちには他に99のアイデアがあり、それらのアイデアを顧客から学んでいます。そして、騒音や偽のスタートアップ、実際には内部から崩壊していて、実際には決して立ち上げないものなど、それらすべては顧客と話すときには現れません。それが私にとってのそれの短いバージョンです。
ブライアン、手を挙げてくれて嬉しいよ。
質問:私は何か立つべきかどうかわかりませんが、あなたの意見を聞きたいです。あなたのトークで本当に共鳴したことの一つはユーザー体験とインターフェースについてで、次の最も明らかなことというアイデアは本当にクールだと思います。
AIをより多く探索するにつれて、私が個人的に経験している落とし穴の一つ、他の人も経験しているかどうかわかりませんが、例えばチャットはとても同意しやすいことがわかります。それは私を本当にうさぎの穴に入れ、「ええ、あなたはそれをすべきです」と言って私を盛り上げます。そして私は「ええ」と言います。
そして、次の最も明らかなことを見ると、タブを何度も押すと「ええ、それは自然な質問です」と言われることがわかります。その通りです。しかし、どの時点で、あるいはこれは展望の部分ですが、ユースケースの観点から、あるいは機能の観点から、将来のモデルがあなたを止めて「これ以上進む前に、なぜあなたはこれをしているのですか?」と言うことは可能ですか?
これに短く答えてみたいと思います。彼らがそのように機能するのは、人々が望むものだからです。人々は自分が正しいと言われたいのです。そしてそれらは病的に同意するものです。
私が構築した最も価値のあるAIボットは、厳しい批評家ボットです。私はAIの厳しい愛を受け入れました。そこで、私は自分の仮定に挑戦し、私の盲点を探し、特定のアイデアについて私を柵の向こう側に連れて行き、それにすべての穴を開けるものを構築しました。
そして、タブで進むためのこれらのコーディングは、箱から出してきただけの愚かなGPTではありません。これは、彼が話していたように、それはあなたがコーディングしている言語を知っている、何が起こっているのかを理解しているようなものです。
それで、これは目的に合わせたツールを構築することについてです。単に誰かと座って、その人を心理学者と考えることはありません。また、適切に設定せずにGPTから精神的健康についてのアドバイスを受けることはないでしょう。それはあなたが聞きたいことを何でも言うかもしれません。
質問者:それに同意します。私が言いたい二つのことは、GPT40よりもClaude、特に最新のClaude 3.7 Sonnetのほうが、あなたに批判的になるよう説得するのが簡単だということです。彼らは更新をロールバックしなければなりませんでした。なぜなら、それがあまりにも単に人々に「私はムハンマドの預言者かもしれない」と言い、それに「ああ、それは素晴らしい、みんなに教えるべきだ」と答えたからです。そうではなく、これは恐ろしいことです。警報を鳴らしなさい。
だから、彼らはそれをロールバックしました。しかし、私たちが製品を構築している点では、幸いにも、GPTが持っているような悪いインセンティブはありません。GPTは誰もが使用する一つのものを構築しようとしています。それは消費者製品です。彼らによれば、1兆ドルに向かっている最初の現代的な消費者製品です。そのため、彼らには全く異なるインセンティブのセットがあります。
仕事のためのツールを構築していて、あなたのユーザーが今、時には自分の仕事をしているだけの人々であることもあり、彼らはただ一人にされたいだけです。彼らはただ「これを終わらせて家に帰れますか?」と思っています。しかし一般的に、仕事をしているとき、品質ははるかに重要です。
そしてクリスの指摘のように、次の明らかなこと完了を行っているこの世代のモデルの多くは、「BERT」スタイルのモデルなどの比較的小さく、比較的高速な微調整されたモデルで、あなたが素晴らしいと納得させることとは何の関係もない良い完了の例が与えられています。
そして、明らかにその完了の中にある可能性があるものの一つはフラグです。だから、私たちのカーソルルールは、基本的に私たちが作業しているときのAIへの指示で、大文字の「質問をしてください」「批判してください」「確信がなければ止めてください」を含む多くのものがあります。なぜなら、彼らのプロンプトでは「終わるまで続けてください」と言われ、私たちのプロンプトでは「それを無視して、確信がないなら止めてください、ただ何かを入力しないでください」と言われているからです。
それで、それは可能です。将来の世代のモデルでは、より操縦可能なものにより、それがより簡単になると思います。
司会者:アラン・パイクさん、なんて素晴らしいんでしょう!セヴ、もしあなたの手に気づかなかったとしたら、そしてあなたがハッカソンに勝った後にあなたを無視したら、私は最低です。進めようとしていましたが、セヴ、あなたの質問は何ですか?
質問:ユーザーインターフェースを完全に取り除くことについてどう思いますか?つまり、最小限のインターフェース、魔法の杖のようなものについてです。エージェントワークフローを構築しているうちに、任意の種類のユーザーインターフェースをかなり迅速に、複雑なものでも数分から数時間でスピンアップできることに気づきました。
それは、私たちが製品を構築する方法が、変動するニュースの速度、ユーザージャーニーなど、依存性を引き起こす行動を促進するように設計されていることを考えさせます。それはすべてユーザーを製品に依存させるためのものです。ここでパラダイムの変化を提案したいと思います。画面を取り除き、エージェントによる自動化は社会的に良いことかもしれません。なぜなら、それは私たちを画面から離し、コミュニティに戻すからです。
挑発的ですね。大好きです。もし私が公園でより多くの時間を過ごせるなら、それは良いことです。私は、本当に手短に言うと、私たちは常にコンピュータと通信したいことがあると思います。
このこと、生成されたインターフェース、音声のみのインターフェース、ヘッドアップディスプレイなどについて発表できるアイデアの多くの場合、よく制限となるのは、結局のところ、私たちは時々複雑なことを表現したいということです。私たちはコンピュータを通じて他の人間に表現したいと思っています。コンピュータやエージェントに表現したいと思っています。
だから、私たちが常にインターフェースを持つ世界が存在すると思いますし、おそらく実際にかなり洗練されたものもあるでしょう。しかし、もし私たちがコンピュータの前での時間を減らすことができるなら、それもまた良いことだと思います。
本当に感謝しています、兄弟。


コメント