サム・アルトマンがChromeの代替を目指す(ChatGPT Atlas)

WWW、Webブラウザ
この記事は約19分で読めます。

OpenAIが新たにリリースしたAIブラウザ「ChatGPT Atlas」について、その機能性、プライバシー面での懸念、セキュリティ上の脆弱性を包括的に検証した技術レビューである。一部では「Chrome キラー」として期待される一方、AIスパイウェアとの批判もあるこの新製品について、実際のセットアップ手順から主要機能の実演、エージェントモードの実用性テスト、そしてBraveが指摘するセキュリティリスクまで、多角的な視点から分析を行っている。結論として、現時点では実用性に欠け、少なくとも6〜12ヶ月は実用レベルに達しないという評価を下している。

Sam Altman wants to replace Chrome (ChatGPT Atlas)
Try Vectal for FREE: I'm hiring! Apply here: start a business with AI Agents? Go here:

OpenAIが発表した新ブラウザ「ChatGPT Atlas」

OpenAIが独自のブラウザ「ChatGPT Atlas」をリリースしました。一部の人々はこれが未来だと言っています。AIブラウザがすべてを変える、これはChromeキラーだ、Perplexity Cometキラーだと。しかし他の人々は、これは完全に無用で基本的にAIスパイウェアに過ぎないと言っています。

このビデオでは、ChatGPT Atlasについて偏りのない視点をお届けします。セットアップ方法をお見せし、主要機能について説明し、私がBraveからこの新しいAI搭載ブラウザに切り替えるかどうかをお伝えします。手短に言うと、私はビデオエディターを募集中です。もし私と働きたい方がいれば、ぜひ応募してください。リンクはビデオの下にあります。

こちらがAtlasのメインページです。現時点ではMac OS専用となっています。メインの機能はサイドバーで、これからお見せします。正直に言うと、彼らはPerplexityからインスピレーションを得ています。数ヶ月前にPerplexity Cometに追加された機能の多くを取り入れています。ちなみに、私のチャンネルを見ている方ならご存知でしょうが、これが大企業の戦略なんです。

彼らはAIモデルをAPIを通じて世に出し、それから待つんです。何が機能するかを見極めるために待つ。そして何かが機能し、ある種のアプリケーションに関心が集まると、彼らはそれに飛びつき、自分たちで再現し、すべての収益と顧客を奪っていくんです。これがOpenAIがAIブラウザで基本的にやっていることです。

もう一つは、タブを開いて管理できることです。これは実際に便利ですよね。これについては後ほど詳しく見ていきます。エージェントモードが最も重要な機能ですが、同時に最も可能性を秘めた機能でもあります。なぜなら、ブラウザをあなたの代わりに操作してアクションを実行できるからです。また、Grammarlyのような、でももっと高度なChatGPTハイライトもあります。これも見ていきましょう。

ここで私はおそらくOpenAIに同意できない点があります。あなたがコントロールしているという点です。しかし、ChatGPT Atlasへの切り替えを選択する前に知っておくべきいくつかの問題があります。では、早速見ていきましょう。Mac OS用にダウンロードをクリックします。

セットアップと初期設定

インストーラーをダウンロードしたら、ダブルクリックしてChatGPTをアプリケーションフォルダにドラッグします。それから閉じることができます。次に、Spotlightを開き、Atlasと入力し、開くをクリックすると、ウェルカム画面が表示されます。AI搭載ブラウザやOpenAIについてどう思うかは別として、この会社のデザイナーがエリートであることは認めざるを得ません。

最初にやることは、ChatGPTでログインすることです。ログインすると、まだログインが必要です。インターネットは非常に安全になったので、自分のアカウントにすらほとんど入れなくなりました。二段階認証、パスワードマネージャー、パスキー、生体認証。ここで背景で動いているこの素敵なアニメーションを指摘しておかなければなりません。でも、とにかく、ブラウザがどうであれ、それは重要ではありません。デザインは二の次です。では、個人アカウントで続けます。

別のブラウザからデータをインポートします。Chromeを選択します。スタート。インポート。ブラウザメモリ。これは潜在的にクールな機能のように聞こえますが、ジョージ・オーウェルの最悪の悪夢のようにも聞こえます。「オーケー、David、仕組みを見せてよ」と言うかもしれませんね。

基本的に私がやったのは、ページ全体をコピーして、今からClaudeに要約してもらうということです。なぜなら、明らかにClaudeは別の会社のものなので、OpenAIとChatGPTに対して偏っていないからです。

プライバシーとセキュリティの懸念

主要なプライバシー管理、デフォルトでトレーニングデータはオフ。ウェブブラウジングの管理が含まれ、あなたのブラウジングがAIモデルのトレーニングに使われます。これはあなたがオンにしない限り無効になっています。オーケー、それは本当に良いことです。OpenAIに拍手を送ります。

ブラウザメモリについて見てみましょう。ChatGPTはあなたのブラウジングに関する事実を記憶してパーソナルな応答をすることができますが、機密データはフィルタリングされます。要約は7日以内に削除されます。しかし、彼らがメモリでトレーニングするかどうかは教えてくれません。このビデオのために、私はオンにします。

この部分は非常に便利だと思います。では、続けましょう。そして、まだデフォルトのブラウザとして設定しません。それはその地位を獲得しなければなりません。

オーケー、これは素敵なオンボーディングですね。長期間製品を使用してくれるユーザーに報酬を与えるというのは、非常に非常にクールです。完了。そしてこれがChatGPT Atlasです。実物が完全に利用可能になりました。

そして、お気づきかもしれませんが、オーケー、David、なぜChatGPTで起動するの?と思うかもしれません。実は、これはchatgpt.comではありません。これは空の新しいタブページです。新しいタブを開くと、自動的にチャットベースのインターフェースになっているのがわかります。つまり、何を検索したくても、チャットベースのインターフェースを通る必要があるということです。

これは最大の強みであると同時に、最大の弱点でもあります。なぜ最大の強みなのか?明らかにAI機能を手に入れられるからです。エージェンティックな検索が手に入ります。たとえば、スタートアップに最適な技術スタックと入力すると、それをGoogleに入力するよりも賢くなるわけです。

ご覧のように、ここで多くのソースをチェックしました。20種類、15種類の異なるウェブサイトをチェックして、あなたに関連する会話形式の答えを提供してくれます。これは明らかにGoogleよりも優れています。

問題は、あなたが入力するすべてがチャットを通過することです。たとえば、大手AI企業のどこも触れたがらないトピックがあるとしましょう。論争的なトピックです。中東の特定地域で起こっていることについて何か聞きたいかもしれません。これらのAIモデルの多くは、そのトピックを完全に避けるか、あなたに非常に偏った答えを与えるでしょう。

そして、文字通りこれを回避することはできません。基本的人権として、サンフランシスコで作られたAIモデルに支配されることなく、インターネット上で自分が望むものを何でも検索できるべきです。これはすでに大規模で大規模な問題であり、個人の自由を侵害しています。

しかし、オーケー、基本的人権を脇に置いて、AI機能を見てみましょう。なぜなら、私たちは消費者について何を学んだでしょうか?もし何かが十分に便利であれば、彼らはセキュリティとプライバシーを完全に忘れてしまうのです。

機能テストと実用性の検証

では、このブラウザが十分に便利かどうかを見てみましょう。十分に便利なのか、それともまだ少し早すぎるのか。プログラミングにおける再帰について学びたいとしましょう。再帰とは何か?どのように機能するのか?例を見せてくださいと入力します。

このページはデフォルトページ、つまりホームページで、再びChatGPTとチャットします。左上にモデルが表示されていますが、ちなみに、なぜか多くの機能でモデルすら見ることができません。ChatGPTから期待される答えと同じものが得られました。特別なことは何もありません。

しかし、上部に他のボタンがあり、これが新しいものです。検索結果があり、これはよりGoogleのようなものです。ウェブサイトのリストを表示します。要約しようとはしません。何をしたいか選択できます。Wikipediaに行きたいですか?Code Academyに行きたいですか?Redditでも何でも。これは最初のページのリストのようなものです。基本的にGoogleです。まさにここに書いてあります。

次に画像です。これは大きいです。なぜなら、多くの人が、私自身も含めて、まだGoogleに行って画像を検索していたからです。しかし今、ChatGPT Atlasを使えば、それも手に入ります。次に、動画が手に入ります。再び、特別なことは何もありません。Google、DuckDuckGoなど、すべての検索エンジンと同じように、動画を表示するタブがあります。そしてニュース。再び、クラシックなブラウザの機能です。OpenAIは基本的なブラウザ機能で車輪を再発明しただけです。

では、このブラウザのより高度な機能をお見せしましょう。「Attention Is All You Need」という革命的な論文を読み込みました。しかし、ChatGPT Atlasで作業するときの素敵なUI/UXがあります。リンクが表示され、クリックすると、スライドして開き、同時にChatGPTの会話を続けることができます。新しいタブを開くのではなく、右にスライドして、同じ会話の中でシームレスに続けることができます。これは非常に素晴らしいです。認めざるを得ません。

PDFに行きましょう。明らかに、これははるかに複雑で、これを説明してもらいたいかもしれません。この図を説明してください。何を示していますか?まあ、それは下に書いてあります。だから、それを理解できたとしても、本当に印象的なことではありません。しかし、スクリーンショットを撮ることができます。ウェブサイトを理解できます。あなたが見ているものを見ることができます。

そして、これがまさにAIが最も強力な場所です。自分自身をアップスキリングすること。壊れた時計のように聞こえることは分かっています。私は他のビデオのたびにこれを言いますが、AIを使って自分を改善し、スキルセットを増やし、経験を増やし、より良いプログラマーになり、必要なスキルで何でもより良くなるためのバイブラーニングです。

これは美しい例です。新しい注目の研究論文が出てくるかもしれません。「Attention Is All You Need」はちょっと古いです。だから、この論文を見てみましょう。この論文について何がユニークで興味深いかを聞きます。

これはDeepSeekからの新しい論文で、数日前に出たもので、基本的にコンテキストをピクセルに保存できるようにするものです。非常にエキサイティングなものです。しかし、これはかなり長い研究論文です。それほど長くはありません。20ページですが、それでも、ショートフォームコンテンツと注意持続時間のある今日では、20ページはかなり長いです。

ChatGPT Atlasを使ってこれらのより高度な概念のいくつかを説明してもらうことで、学習を加速できます。DeepSeek OCR論文についてのユニークなポイントはこちらです。スキャンされたドキュメントをテキストからOCRするだけでなく、視覚的に圧縮して少数のビジョントークンにし、それでもLLMがテキストをカバーできるようにします。

テキストトークンとビジョントークンの比率が10倍未満の場合、非常に高い精度97%を達成します。つまり、ほとんどの情報を保持しながら、トークン数を10倍縮小できるということです。これは大きいですよね。

この論文について1つのプロンプトを尋ねるだけで、DeepSeekの人々がどんなモデルのトークンウィンドウとコンテキスト制限を基本的に10倍にする方法を見つけ出したという核心的なアイデアを理解できました。

エージェントモードの実演と限界

オーケー、でもこれはまだアシスタントです。話題になっているメインのものはエージェントモードです。これがChatGPT Atlasがコントロールを取り、ブラウザを制御してあなたのために何かをする場所です。

ここでYouTubeにいて、エージェントモードを有効にして、ChatGPT Atlasのライブストリームを読み込んで、コメントのセンチメントを教えてくださいと指示します。非常にシンプルなタスクで、どんな人間でも10〜20秒でできることです。しかし、そこにあります。今、コントロールを取得しています。この青いコーナーで分かります。

ChatGPT Atlasライブストリームと入力しました。最初がスポンサー付きビデオだと理解するか見てみましょう。右側で推論を見ることができます。推論を見るのは非常に魅力的です。ライブストリームを開きました。コメントをスクロールしています。そこにあります。素晴らしい。コメントを見つけました。今、おそらくスクリーンショットを撮ってコメントを読んでいます。

繰り返しますが、私はキーボードに触れていません。私の手は完全に離れています。それ自体でやっています。どこかスクロールして、人々が言っているセンチメントを探しています。

ライブストリーム動画のコメントセクションには、主に熱意ではなく皮肉的で批判的な発言が含まれています。多くのトップコメントは、ChatGPT AtlasがただのChromeプラグインのように見えるとジョークを言っています。そう、それはChromiumの上に構築されています。だから、OpenAIはここで本当に新しい技術を発明したわけではありません。または、それは本質的にChatGPTをホームタブとするChromeだということです。

何人かのユーザーは、CEOのSam Altmanがデモ中に準備ができていないように見えた、あるいは困惑しているようにさえ見えたと指摘しています。それでタスクを完了しました。10秒でできることをするのに1分かかりました。

問題は、10秒でそれをもっとうまくやれるということです。なぜなら、Samが私たちの誰よりも驚いて見えるとか、これはただのChromeプラグインのように感じるとか、人々が考える生のフィルタリングされていない考えが得られるからです。生の情報が得られます。

これはフィルタリングされています。そして、これは正直なところ、多くの人々がこのフィルタリングされた意見を得るという未来について非常に恐ろしいことだと思います。これはすでにニュースキャスターがやっていることだと言うかもしれません。平均的な人がテレビを見ていて、専門家が何を言っているかを見て、何を考えるべきかを教えられるときのように。

これに似ていますが、AIブラウザはそれを次のレベルに引き上げると思います。AIの最先端にいない人々や、政府やニュースが言うことをすべて信じる人々は、これによって完全にやられると思います。なぜなら、再び、生の入力を得て人々が何を感じているかを見る代わりに、彼らはただChatGPTに尋ね、ChatGPTは水で薄めたバージョン、つまりモデルに組み込まれた根本的なバイアスに適合する政治的に正しいバージョンを提供するからです。

そして、これが再び最大の問題です。AIブラウザを使用すると、インターネットへのアクセス全体、あなたの世界観全体が、その背後にある会社を運営している人々に基づいた組み込みのバイアスを持つ単一の大規模言語モデルによって決定されるということです。だから、慎重に選んでくださいと言いたいです。

エージェントモードでもう一つ試してみましょう。ここでプラスをクリックしてエージェントモードを有効にできます。ChatGPT内には他のすべてのものもあります。しかし、一つ気づいてください。AIモデルを選択できません。モデルセレクターがありません。アシスタント内では分からないんです。ChatGPT Instantを使っているのか、ChatGPT Thinkingを使っているのか分かりません。

しかし、通常は分からないんです。それはワイルドです。絶対にワイルドです。そして、月に200ドルを払っている人として、どのAIモデルが使用されているかをコントロールできないのは許容できません。クレイジーです。

では、タスクを与えましょう。Elon MuskのTwitterアカウントを開いて、彼の最後の5つのツイートが何だったか教えてくださいと。エージェントモードがこれをできるか見てみましょう。そして、OpenAIをからかうためにGoogleを使っています。

さあ、そこにあります。初めてブラウザを取るとき、かなり速いです。遅延はないので、それは良いことです。しかし、通常、アクション間は非常に遅いです。オーケー、Elon MuskのTwitterアカウントを見つけました。今読み込んでいます。スクロールを始める必要があります。オーケー、でもこれは最新のツイートではありません。これらは固定されたものか何かだと思います。

ログイン試行がある場合は、それを閉じて下に戻ろうとします。オーケー、失敗しました。最新のツイートを開くのに失敗しました。代わりに、彼の最も人気のあるツイートか何かを見つけました。

これは実際にエージェントモードの遅さと制限の良い実演です。正直なところ、多くの場合、基本的なタスクをするのに苦労します。Google Docsを操作するのさえ、テキストを入力することさえできません。しかし、良いことの一つは、複数のタブで実行できることです。

もっとスクロールして、コメントの生のテキストを教えてくださいと言えます。できました。ブラウザタブの1つでエージェントモードのタスクを起動できます。別のタブに切り替えて、別のタスクを実行できます。もっとスクロールして、人々が何を考えているか教えてくださいと。

これらの両方が実行されています。このアイコンが見えます。だから、たぶん私はここで再帰について学んでいて、これらすべてがエージェントモードを実行しています。これは本当に強力です。これは、将来あなたがエージェントのチームを管理することになるという明確な指標です。CEOが会社を監督するように、あなたは多数のAIエージェントを監督することになります。

これの問題は、現在のインターフェースです。ブラウザを切り替えて、エージェントが何をしているかを見なければならないようなものです。これは正しいインターフェースではありません。だから、私の予測は、ダッシュボードのようなものを提供するAI搭載ブラウザが登場するということです。コックピットのパイロットのように感じることができます。

何が起こっているか、すべてのAIエージェントが何をしているかを監督できます。エージェントモードが何かで行き詰まっているか、終了したか、何をしているかを確認するためにブラウザを切り替える必要はありません。ブラウザの現在のUIは、AIエージェント時代に最適ではありません。

セキュリティ脆弱性と今後の展望

さて、一つ指摘しなければならないのは、CometやAtlasのようなブラウザを使用することには、深刻な脆弱性とセキュリティ問題が伴うということです。これはBraveからのレポートで、Braveブラウザの背後にある会社です。本質的に、彼らはPerplexity Cometでいくつかの深刻な問題を発見しました。それは基本的にChatGPT Atlasが基づいているものです。OpenAIは多くのインスピレーションを得ました。

Steve Jobsの引用にあるように、優秀なアーティストはコピーし、偉大なアーティストは盗むというものです。Sam Altmanは明らかにSteve Jobsの大ファンなので、それを心に留めて、Perplexity Cometからすべての機能を文字通り盗みました。しかし、彼はUIをより良くしました。少なくともそれはそうです。

とにかく、ここにレポートがあり、実際に私がやろうとしているのは、Atlasに切り替えて、ここに読み込んで、この記事のTL;DRを教えてくださいと尋ねることです。

ChatGPT AtlasがChatGPT Atlasのようなブラウザの問題を要約するのは、ちょっと違法な感じがします。そして本当に、私の意見を言わせてもらえば、セキュリティ第一、プライバシー第一になるまで、AI第一ではなく、私はAIブラウザに切り替えるつもりはありません。

これはプライバシー第一でなければならない領域であることに注意してください。ハードウェア、オペレーティングシステム、ブラウザに関しては、AI第一ではなくプライバシー第一である必要があります。そして、それはこれがインターネットへのあなたのポータルだからです。そして、何を見ることができて何を見ることができないかを決定するAIがその間にいる場合、それは私個人にとって、そしてプライバシーとセキュリティを気にする技術的な多くの人々にとって大きな問題です。特にAI搭載ブラウザに深刻な問題がある場合は。

では、このレポートを見てみましょう。Braveの記事は、Perplexity CometのようなAI搭載ブラウザのセキュリティ脆弱性を報告しています。

主なポイントは、スクリーンショット内の隠されたまたはほとんど見えないテキストが、AIアシスタントに悪意のあるプロンプトを注入できるということです。基本的に、ここで青い背景だと思うかもしれませんが、LLMが簡単に拾うことができる、人間の目にはほとんど見えないテキストがあるかもしれません。そして、それにはエージェントモードが本来すべきでない方法で相互作用する原因となる有害なプロンプトインジェクション命令が含まれているかもしれません。

そして、それはログインを与える場合に特に危険です。だから、ChatGPT Atlasを使って自分でテストしたい場合は、ログインを与えないことを強くお勧めします。パスワードを保存しないでください。クレジットカードを入れないでください。なぜなら、これらのモデルは簡単にプロンプトインジェクトされる可能性があり、特にそれはエージェントモードで特にリスクが高いからです。

通常のウェブページ上の目に見えるテキストでさえ、AI動作をハイジャックできます。このウェブサイトには、そのサイトに行けというような指示があるかもしれず、ChatGPTがエージェントモードにあるとき、そこに行くだけで、ファイルをダウンロードするか、IPアドレスを侵害するかもしれません。エージェントモードにいる場合、あなたはコントロールしていません。つまり、AIモデルがコントロールしています。

ちなみに、それがどのAIモデルかさえ分かりません。それほど賢くないGPT-4o miniかもしれません。

記事は続きます。これらの欠陥により、攻撃者はユーザーのログインセッション、銀行、メールなどを利用して、ブラウザを彼らの代わりに行動させることができます。核心的な問題は、LLMが信頼できるユーザー入力と信頼できないウェブコンテンツを分離できないことです。

Braveは、より強力な安全メカニズムが存在するまで、エージェンティックブラウジングを通常のブラウジングから隔離することを求めています。そして、これが主なポイントだと思います。

完全に愚かでない限り、AIブラウザが未来であることは分かります。2026年はおそらくAIブラウザの年になるでしょう。それはかなり安全な予測です。しかし、何かが未来だからといって、今すぐそれを採用すべきだという意味ではありません。

歴史的な例を見ると、Google Glassは2012年頃で、明らかに正しいことでした。拡張現実と仮想現実は、Metaが新しいメガネで実装しているように、私たちが見ることができる方法です。そして、再び、それはかなり安全な予測で、5年後には、拡張現実のAIメガネがスマートフォンよりも便利になるでしょう。

そして、それは次のスマートフォンです。しかし、2012年に、GoogleはGoogle Glass製品で単純に早すぎました。さらに極端な例として、90年代にはNewtonというタブレットがあり、基本的にタブレットの初期バージョンでしたが、AppleのiPadが登場するまで、ハードウェアがまだそこになかったんです。

だから、正しいアイデアを持っていましたが、20年早すぎました。だから、何かが未来だからといって、それが今すぐ未来だという意味ではなく、今すぐ切り替えるべきだという意味でもありません。

だから、指摘したかっただけです。なぜなら、多くの人々はAIブラウザが未来だと言いますが、それはそれよりもはるかにニュアンスがあるからです。そして、このBraveの記事が指摘しているように、プライバシー第一ではないAIブラウザには注意すべきです。

これが私のChatGPT Atlasのレビューです。全体的に、非常に物足りないデモのように感じます。OpenAIが未来のモデルをトレーニングするための無料データを大量に取得するためだけにやったと思います。人々がインターネットをどのようにブラウズするか、何を検索するか、どのウェブサイトを使用するか、どのようにナビゲートするかを見て、基本的に彼ら自身の強化学習環境のために。ChatGPTの将来のバージョンをトレーニングするために使用される強化環境です。

それはかなり明白で、これが最高のオープンリリースだとは思いません。なぜなら、彼らは自分自身を薄く広げているからです。すべてをやろうとしています。Agent kitはNA10と競争しようとしています。彼らは独自のブラウザをリリースしてPerplexityと競争しようとしています。しかし、それの問題は、彼らがすべてで素晴らしくなることはできないということです。

だから、これがどこに行くか見てみましょう。明らかに、これはまだV1であり、OpenAIが会社としてやるのは良い動きだと思います。しかし、ユーザーである私たち、AIの最先端にいたい人々にとって、個人的には、これは物足りない製品のように感じ、まだ有用になるまで少なくとも6〜12ヶ月はかかるように感じます。それは少なくとも私自身の意見です。

このビデオが価値あるものだと思っていただければ幸いです。もしそうなら、ぜひ購読してください。完全に無料です。では、次の動画でお会いしましょう。またね。

コメント

タイトルとURLをコピーしました