ChatGPT Atlas の紹介

WWW、Webブラウザ
この記事は約20分で読めます。

OpenAIが新しいAI搭載ウェブブラウザ「ChatGPT Atlas」を発表した。このブラウザはChatGPTを中核に据え、従来のブラウザ体験を根本から再設計したものである。主要機能として、ウェブ上のあらゆる場所でチャット機能が利用可能な「チャットエニウェア」、ユーザーの行動を学習してパーソナライズされた支援を提供する「ブラウザメモリー」、そしてユーザーに代わってブラウザを操作し実際にタスクを実行する「エージェントモード」の3つが搭載されている。デモンストレーションでは、コードレビューの要約、映画レビューの検索と分析、メール文章の編集、さらにはオンライン食材注文やプロジェクト管理タスクの自動化など、多様な用途が紹介された。macOS版が全世界で本日リリースされ、エージェントモードはPlusおよびProユーザー向けに提供される。OpenAIはこのブラウザを通じて、インターネット利用の在り方そのものを変革しようとしている。

Introducing ChatGPT Atlas
Introducing our new browser, ChatGPT Atlas.Sam Altman, Will Ellsworth, Adam Fry, Ben Goodger, Ryan O’Rouke, Justin Rushi...

ChatGPT Atlas – AI搭載ブラウザの新時代

おはようございます。本日、私たちは新しいウェブブラウザ、ChatGPT Atlasをローンチします。これはChatGPTを中心に構築されたAI搭載のウェブブラウザです。私たちが長い間、非常に興奮しながら懸命に取り組んできたもので、今日皆さんと共有できることを本当に嬉しく思います。

AIは10年に一度という稀な機会を提供していると私たちは考えています。ブラウザとは何か、どう使うか、そしてウェブを最も生産的かつ快適に使う方法について根本から考え直す機会です。タブは素晴らしいものでしたが、それ以降、ブラウザのイノベーションはあまり見られませんでした。ですから、私たちはこれが何になり得るかを本当に再考する機会に大変興奮したのです。

以前の人々がインターネットを使っていた方法では、ブラウザのURLバーと検索ボックスが素晴らしいアナログでした。私たちが将来人々がインターネットを使うことを望んでいる方法、そして実際に見え始めている方法は、チャット体験とウェブブラウザが素晴らしいアナログになり得るということです。

そこで私たちは、この種の体験を中心に設計されたブラウザの開発に取り掛かりました。ブラウザはすでに膨大な仕事や生活が起こる場所です。そして、ChatGPTをその使用を支援する中核的な方法にすることで、ページとチャットしたり、ChatGPTを使って物を探したり、ブラウザ内でChatGPTのエージェントモードを使ったりできます。

これからお見せするもっと多くのことや、後で試していただけることがあります。私たちはこれをかなり遠くまで進めることができます。ですから、デモに飛び込むことに興奮しています。ここに何人かの同僚がいます。まずBenから紹介を始めて、それから私たちが持っているものをお見せします。

コア機能の紹介

ありがとう、Sam。私はBenです。Atlasのエンジニアリングを率いています。Atlasは一つの質問から始まりました。ブラウザとチャットできたらどうだろうか、と。そのアイデアから、私たちは体験全体を再構想し、長年の乱雑さと複雑さをシンプルな会話に置き換えました。

私たちは、Atlasが単にチャットボタンを取り付けただけの古いブラウザのように感じられないようにしたかったのです。代わりに、ChatGPTをAtlasの鼓動する心臓にしました。それは常にあなたのそばにいて、ウェブを移動する際に助ける準備ができています。私自身がAtlasを使っているとき、より好奇心が強くなり、より多くの質問をするようになったと感じています。それが私をより好奇心旺盛で、より良い情報を持った人間にしてくれたと思います。

また、私たちはAtlasが十分に高速で柔軟であり、これからお見せする素晴らしい新しい体験をサポートできるようにしました。これはウェブの次の時代のための新しい種類のブラウザであり、それができることをお見せするのが待ちきれません。では、Adam、機能のいくつかを説明していただけますか。

はい、私の名前はAdam、Atlasのプロダクトリードです。SamとBenが少しAtlasを構築した理由について話しましたので、私はAtlasが何であるかについて少しお話しします。

まず、Atlasは非常に馴染み深く感じられるはずです。すべてのタブ、ブックマーク、パスワードの自動入力など、慣れ親しんだすべてのものがあります。そして、Ryanがこれから説明するAtlasの3つの特別なコア機能があります。

最初は、ウェブ上のどこに行ってもチャットが付いてくるということです。もはやメールや文書を書いているときにタブ間でコピー&ペーストする必要はありません。そのウェブサイトを開いているとき、それを呼び出せば、あなたが取り組んでいることのコンテキストを持っているので、より役立つことができます。それがウェブ全体でのチャットエニウェアです。

2番目の大きな機能はブラウザメモリーです。私たちはこれを構築する際に多くのことを話し合いましたが、メモリーは今日人々やユーザーが愛しているChatGPTの非常に重要な機能です。なぜなら、ChatGPTをより多く使うにつれて、それはよりパーソナライズされ、より良くあなたを助け、あなたをよりよく理解するようになるからです。今、それがAtlasのブラウザでウェブ全体を移動する際に起こります。そしてそれはあなたによりパーソナライズされ、より役立つものになるはずです。

そして3番目、これは私たちが本当に興奮しているもので、Justinが後でお見せしますが、エージェントです。AtlasではChatGPTがあなたのために行動を起こすことができます。実際に何かをすることができるのです。実際に小さなカーソルが現れてクリックし始めます。予約やフライトを取るのを手伝ったり、あるいはあなたが取り組んでいる文書を編集することさえできます。これをお見せできることを本当に楽しみにしています。では、Ryan、プロジェクトのリードデザイナーがAtlasのツアーをお見せします。

デザインウォークスルー

ありがとう、Adam。それでは、Atlasのコアフローのデモをさせていただきます。ここに表示されているのはホーム画面です。これは、アプリを初めてダウンロードして開いたとき、または新しいタブを作成したときに表示されるものです。

私たちは、従来のブラウザから来た場合に完全に馴染みのある体験を作りながら、ChatGPTのすべてのパワーが組み込まれている体験を作ろうとしました。そのため、画面の中央には、通常のようにチャットに質問できるコンポーザーがあります。すべてのツール、モデル、そしてすべてのチャット履歴が含まれているサイドバーにアクセスできます。

しかし、これはブラウザなので、もっと多くのことができます。Hacker Newsと入力してみます。チャットが私をそのURLに連れて行きます。ブックマークを人間の言語で参照できます。そうすると、このギャラクシー差分のためのコミットが開きます。

ブラウザメモリーを使って、以前に見たことは分かっているけれど正確にどこにあるか分からないもののウェブ履歴を検索できます。Atlasのコア設計に関するドキュメントをウェブ履歴から検索してみましょう。どこかで作ったんです。ブラウザメモリーを検索しています。

ほら、私が話しているドキュメントを見つけたようです。それは私のGoogle Docsにあります。タップすると、そこに開くのが見えます。最後の機能のためにホームページに戻りましょう。

Atlasのコンポーザーの下には、提案が表示されます。これらの提案は、Atlasにおけるパーソナライゼーションの最初のバージョンのようなものです。これは、Atlasがあなたが何をしていたか、または次に何をしようとしているかについて理解していることに基づいて、あなたのために生成されます。

それは、あなたが興味を持つかもしれないニュース記事のように単純なものから、あなたのためにデリゲートし、タブをクリックしていくエージェントタスクのように高度なものまであります。Atlasを使えば使うほど、これらの提案は良くなります。そして繰り返しますが、これはパーソナライゼーションのバージョンゼロですが、ブラウザのホームページがこれからどこに行くのか、非常に楽しみにしています。

さて、それがホーム画面です。今度はそのGitHubの例に移って、私の個人的なお気に入りの機能をお見せします。ここに今朝取り組んでいたコードがあります。小さなギャラクシージェネレーターのシェーダーです。右上に「ChatGPTに聞く」ボタンがあります。これは訪れるどのウェブサイトでも見ることができます。そしてクリックすると、コンパニオンサイドバーが作成されます。

これは基本的に、ChatGPTをあなたのインターネットの一角に招待することです。ChatGPTでできると期待するすべてのことができますが、今ではその特定のウェブページが何であるかを見ることができます。シンプルに聞こえるかもしれませんが、実際には私のブラウザの使い方にとって大きなブレークスルーでした。

それは、あなたのために情報を表示することに重点を置いたツールから、表示している情報を理解し、場合によってはあなたのために編集することさえできるツールに変わりました。ここに、この差分の内容を要約するという提案があります。それを求めて、何と言うか見てみましょう。

「さらにギャラクシー」というコミットですね。このパーティクルジェネレーターの動作方法とビジュアルのいくつかを更新しています。これはクールです。でも、本当に知りたいのは、これは今日ローンチするRCにチェリーピックしても安全かどうかです。今日はもう変更しないと言っていたと思いますが。

これはかなり低リスクだと思っているようです。それについてはよく分かりませんが。ええ、私もその点については完全には同意しないと思いますが、単なる視覚的な変更です。それがサイドチャットです。製品を比較したり、自分のインターネットの一角に持ち込んだりするなど、さまざまなケースで使用できます。

私はプルリクエストやSlackで、読んでいたチャンネルを要約したいときによく使います。本当に便利で、皆さんに試していただくのが楽しみです。また、Benが言っていたように、これがそばにあることで、より好奇心旺盛になります。より多くの質問をするようになるので、それが本当に気に入っています。

まったくその通りです。この1回の呼び出し、1回の応答から、探しているものが得られるまでワークショップを続けることができるというパラダイムシフトです。これはチャットに非常に沿っています。私はよく、ブラウジング中にこれを開いたままにして、進みながら質問を流し込んでいます。

まったくです。開いたままにするといえば、検索を見てみましょう。サイドチャットをもう少しお見せします。見たい映画を検索してみます。Atlasを介してアクセスされるChatGPTの検索に、いくつかの大きなアップグレードを行いました。

検索は、インターネットをナビゲートするためのブラウザの中核的なフローの1つだと私たちは知っています。そして、これらの検索の多くは、非常にキーワードベースまたは短いものになる可能性があります。LLMは伝統的にそれに苦労します。素晴らしい答えを提供するのに十分なコンテキストがないからです。

最初に気付くことの1つは、Atlas内で検索するたびに、上部にこれらのタブが表示されることです。ホームタブのコアチャット体験を失うことなく、画像、ビデオ、またはニュース記事を使って、体験を従来の検索エンジンのようなものに素早く切り替えることができます。

ここでスクロールダウンしてみます。いくつかの素敵な画像、これが何であるかについてのいくつかのアップデートがあります。リンクを見つけられるか見てみましょう。このRoger Ebertのレビューにします。4つ星を付けています。

ここで本当に興味深いのは、Atlas内の検索結果からリンクをクリックするたびに、デフォルトでチャットがスライドして、ウェブが分割ビューで開くことです。これが不要な場合は、常にコマンドキーを押しながらリンクをクリックするか、「ChatGPTに聞く」ボタンをクリックして閉じることができます。

でも、インターネットを検索する際にコンパニオンが一緒にいるという素敵な特性があります。ここで別のレビューに行ってみようかな。このYahooのものを試してみます。あなたはもうこの映画を見たんじゃないですか。あなたのレビューは何ですか。

実際に2回見ました。おすすめします。本当に本当に良かったです。このレビューを5語以内で要約してもらいましょう。要点にたどり着けるかもしれません。ここで、この新しい検索モデルが実際に非常に強力だと思います。なぜなら、それはマルチターンの体験のようなものだからです。

ウェブページに送り出されるだけでなく、検索結果とこのようなやり取りができます。これを使って本当に理解することができます。まったくです。素晴らしいレビューですね。PTAのベストです。チェックしないといけませんね。それは高いハードルです。間違いなく行ってください。正直に言って素晴らしいです。

さて、これらのコアフローで最後にお見せするデモのために、Gmailの下書きに移動します。ChatGPTで非常に人気のあるフローは、メモやドキュメント、メールで文章を下書きすることだと私たちは知っています。その文章をコピーして、ChatGPTに持って行き、そこで少しワークショップして、トーンやテナー、言語、スペルチェック、文法など、何でも変更します。

満足のいくものになったら、その出力をコピーして、作業している場所に戻してそこに貼り付けます。Atlasでは、このフローをインターネット上の任意のフォームフィールドやテキストボックスでインラインで実行できるように平坦化しようとしました。

ここに、チームの他のデザイナーの1人に、エージェント用に彼が作業したこの美しいシェーダーについて書いていたメールがあります。テキストを選択してChatGPTのノブを押すだけです。言葉を整理してもらおうかな。最初から私のベストではなかったようです。だからあなたのメールがとても洗練されているんですね。

はい、まあ。さあ、どうぞ。アップデートが得られました。必要に応じて別の編集を求めることもできます。これらすべてをインラインで実行できます。アップデートを押すと、テキスト選択が何であれ、それを置き換えます。非常にスコープされた編集を非常に便利な方法で実行できます。

私たちはこれをカーソルチャットと呼んでいます。人々がこれで何をするのか見るのが本当に楽しみです。それをOmarに送りましょう。素晴らしい。それでは。これらがChatGPT Atlasのコアフローです。素晴らしいですね。皆さん、素晴らしい仕事です。どうもありがとうございます。

それが、ブラウザ内のChatGPTを日々の仕事のより簡単な部分にするものについての少しです。そこで少し見ることができましたが、使用することで本当に伝わってくるのは、これが全体的に素晴らしいブラウザであるということです。スムーズで、クイックで、使うのがとても気持ちいいです。

しかし、今度はより高度な機能、ChatGPTのエージェントモードをお見せしたいと思います。そこで、Pranov、Justin、Willがここでそれをお見せします。

エージェントモード

皆さん、こんにちは。私の名前はWill Ellsworthで、Atlasのエージェントの研究リードです。私の名前はJustinです。Atlasチームのエンジニアです。そして私はPranov、Atlasのプロダクトリードの1人です。

Atlasがエージェントモードでウェブをブラウジングし、あなたのために物事を行う方法をお見せします。正直言って、これを使う方法はたくさんあります。あなたが単にやりたくないタスクを引き渡したいかもしれませんし、見たことのないソフトウェアで何かをする方法を教えてもらいたいかもしれません。

これはプレビューですが、正直に言って、このエージェントがあなたのブラウザとあなたの個人的なインターネットに完全にアクセスできることで、どれほど強力になれるかに私たちはただ驚いています。それは安全性を本当に重要にします。

その通りです。そこで、私たちはモデルから製品体験まで、スタックのあらゆる部分に安全性を組み込みました。それについてPanovがもう少し詳しく教えてくれますが、実際に動いているところを見てみませんか。いきましょう。

さて、私たちはお化け屋敷を計画してきました。これには本当に興奮しています。ええ、私は盛り上がっています。そして何らかの理由で、私はこれのプロジェクトマネージャーになることになってしまいました。そして、タスクを非公式に計画するために使っているGoogle Docsがあります。

何人かの人々が今週のタスクを記入しているのが見えます。そして残念ながら、ここにはいくつかの問題があります。最初の問題は、To-Doで見ることができるように、何人かの人々が今週のタスクを記入していないことです。そこで、記入するよう丁寧に思い出させるコメントを残したいと思います。

2番目は、Google Docsは素晴らしいツールですが、Linearと呼ばれるより正式なタスク管理ソフトウェアもあり、記入されたすべての今週のタスクをLinearタスクに、またはLinearの用語では課題に変換したいと思っています。

ここでの難しい部分は、私がプロジェクト管理の経験がほとんどないことです。Linearの使い方がよく分かりません。なぜ私たちはあなたを担当にしたのでしょうか。ええ、私にも分かりません。

しかし、したがって、これをAtlasのエージェントモードにデリゲートして、私のためにこれを処理してもらいたいのです。そこで、ここでこのエージェントモードをクリックできます。プラスボタンでエージェントモードを選択すると見つかります。これを開始します。

このエージェントモードは、Atlas内で私の代わりに実際に行動を起こしてほしいとChatGPTに伝えます。それで、独自のカーソルがあります。私であるかのようにクリックします。私のローカル認証すべて、私の履歴すべてにアクセスできます。それは本当に私自身の自然な延長のように感じられるはずです。

Justinに引き継ぎましょう。ええ、ええ。チームはここでの製品体験に多くの注意を払いました。それが生き生きとしているように感じられるようにしたかったのです。エージェントが何をしているかを正確に見ることができます。それがあなたが望んでいることをしているという信頼を築き始めることができるように。

でも、ええ、この点を強調しますが、これはエージェントモードのChatGPTがローカルであなたのためにウェブブラウザを使用しているのです。あなたのすべてのものを持っています。あなたのためにクリックしています。見ることも、見ないこともできます。でも、これは本当にあなたのためにインターネットを使っているのです。

その通りです。その通りです。それはあなたのタブの中にあります。そして、それがAtlasでエージェントを使うことの体験のクールなことの1つです。開始しているようです。本当に素敵なのは、座って見ている必要がないことです。バックグラウンドで処理させて、他のことにブラウザを使うことができます。

ここにレシピがあります。ポットラックを計画していますね。ええ。このレシピに本当に興奮しています。そうですね。私の個人的な生活でエージェントをどのように使えるかをお見せしたいと思います。

レシピで私がいつも苦労していることの1つは、何の材料を買う必要があるかを把握することです。それはレシピページのどこかにあります。何人分かのサービングサイズです。すべてを把握する必要があります。そこで私はAtlasを使ってChatGPTに、8人分を料理するのに必要な材料は何かを尋ねるのが好きです。

ChatGPTはウェブページを読んで、材料を把握し、私のために少し計算をして、必要なものを正確に教えてくれます。とても便利です。過去に、買い物を少し楽にするために、買い物リストを食料品店の通路ごとに整理するのが好きだと伝えたことがあります。

これを見て、正直言って、これのほとんどは持っています。肉と農産物だけが必要です。そこで、肉と農産物を注文してもらえますかと言います。ボタンをクリックしてエージェントモードを開始する方法をお見せしましたよね。それに手を伸ばすことが分かっている場合は本当に便利です。

でも、そうでない瞬間には、ChatGPTがこれを達成する方法はあなたのブラウザを乗っ取ることだと判断できます。あなたは常にコントロールしています。常に承認または拒否するオプションがあります。ですから、私は続行をクリックして、タスクをエージェントに引き渡します。

ええ。そして、私はAtlasでエージェントがどれほど協力的かが大好きです。タブを引き渡すことができ、行ったり来たりできます。そして、これらの協力的なタスクでエージェントがより良く、より速くなるように、私たちは本当にエージェントを大幅に改善しました。

そして気づくように、いつでもコントロールを取ることができます。そして、これについて本当に素晴らしいのは、エージェントがすでにJustinがInstacartでSafewayで買い物をするのが好きだということを知っていることです。だから、彼が「これを注文してもらえますか」と言っただけで、どこに行けばいいかを正確に知っています。

そこでInstacartに向かいました。そして検索を始めています。私よりもはるかに速くタイプしているのが分かります。私はタイピング速度に誇りを持っているのですが、これは私を完全に凌駕しています。

その通りです。そして、すでにカートにアイテムを追加し始めています。そこで、この瞬間を使って、実際に、あなたのブラウザをChatGPTと共有することで得られるすべてのパワーと素晴らしい機能にもかかわらず、それはまったく新しいリスクのセットももたらすということについて話したいと思います。

そこで、ChatGPTエージェントは常にあなたのタブでのみ動作しているというような組み込みの保護手段に加えて、コンピューター上でコードを実行したり、他のファイルにアクセスしたりすることはできません。あなたのタブだけです。あなたがアクセスを引き渡すものを正確にコントロールすることも私たちにとって本当に重要です。

新しいタブを開いてこれをお見せするだけですが、ChatGPTエージェントがログインしているかログアウトしているかを常に決定できます。そこで、どのタスクについても、ChatGPTエージェントがあなたのログインしているサイトとデータへのアクセスが必要か、それとも最小限のアクセスでログアウトした状態で実際に問題なく動作できるかを慎重に考えることを強くお勧めします。

そして、このコントロールの原則は、ブラウザ体験全体に引き継がれます。Ryanは、これらの提案を支える素晴らしいブラウザメモリーを先ほどお見せしました。これらは完全にオプションであることも注目に値します。オンボーディングでそれらをオンにするかどうかを決定できます。

メモリー自体を常に見て、設定で管理できます。そして、ChatGPTに覚えておいてほしくないときはいつでも、新しいシークレットウィンドウを作成できます。ライブストリームで手のひらが汗ばんでいるときに何をすべきかなどの質問をするためにこれを行うことができます。

友人のために聞いているんですよね。ええ、もちろんです。そして、みんなにその答えを見られたくないと気づきました。じゃあ、戻ってタスクがどうなったか確認しませんか。いいでしょう。チェックしましょう。

これがInstacartの注文です。素晴らしい。わずか約2分で、エージェントがカートに記入し、このように配達されたカートがあることが非常に便利だということが分かります。購入注文まで行く必要はありません。実際、私にとっては、それが何をしたかをレビューして、購入するか、カートにさらにものを追加するか、または私が必要な他のことを行うかを決定できる方が良いのです。

ええ、100パーセントです。クールです。それではLinearタスクをちょっと見てみましょう。そうですね、これらのタスクをLinearに正常に追加したようです。画面では少し見づらいですが、各タスクに適切な人をタグ付けもしています。

クールな機能の1つは、作業したタブが下部に関連タブとして表示されることです。だから、戻ってGoogle Docsをチェックできます。素晴らしい。To-Doを持っていたすべての人にタグを付けて、これを記入するよう丁寧なリマインダーを与えたようです。たくさんの時間を節約してくれます。

ええ。そして、私の仕事を救ってくれます。なぜなら、私はこのプロジェクト管理の全体に精通していなかったので。私たちは、ChatGPTが実際にAtlasブラウザをコントロールし、あなたの代わりに有用なアクションを実行する方法のいくつかの素晴らしい例を見てきました。

そして、GPT-4oやCodexがバイブコーディングのための素晴らしいツールであるのと同じように、長期的には、エージェントをAtlasに持つことで、バイブライフィングのための素晴らしいツールを持つことができると私たちは信じています。あなたの個人的および職業的生活の両方であらゆる種類のタスクをデリゲートすることです。

OpenAIで働くことの大きな喜びの1つは、私たちが技術をリリースするとき、会社の外の人々が常に、私たちよりもはるかに創造的なアイデアを思いつくことです。多分私たちは超創造的な人々ではないのかもしれませんが、Atlasでエージェントをどのように使えるか、すべての予想外でクールな方法を見るのが本当に楽しみです。そして、これを出荷できることに本当に興奮しています。それでは、Samに戻ります。

ローンチと今後の展開

私たちは確かにこれを出荷することに本当に興奮しています。皆さんに気に入っていただけることを願っています。これは今日、macOS用に全世界のすべてのユーザー向けにライブになりますが、エージェントモードは今のところPlusおよびProユーザーのみが利用できます。

できるだけ早くWindowsとモバイルデバイスにこれを提供したいと思っています。人々が私たちと同じくらいこれを気に入ってくれることを願っています。追加することはまだたくさんあります。これはこのプロジェクトにとってまだ初期段階です。

私たちが興奮しているアイデアは、カスタム指示がウェブ上のどこでもあなたに付いてくることが何を意味するかということです。そして、あなたのために物事を行わせているこのエージェントがあなたをますます知るようになり、あなたのために物事をまとめ、インターネット上であなたが望むかもしれないものを見つけてそれらをまとめて持ってくるとき、私たちが少しお見せしたように、それをかなり遠くまで押し進めることができると思います。

これをチェックしていただければと思います。楽しんでいただけることを願っています。そして、フィードバックをお送りください。どうもありがとうございました。

コメント

タイトルとURLをコピーしました