
6,714 文字
皆さん、OpenAIがDeep ResearchをPlusアカウントに解放しています。Alibaba(アリババ)のQwenの新機能や、Perplexityに関する新情報、そしてGoogleのGeminiの新しいリリースについてもチェックする価値があります。一緒に見ていきましょう。
いつも「いいね」をしてくれる皆さん、チャンネル登録してくれる皆さん、そして特に人工知能チャンネルをサポートしてくれているメンバーの皆さんに感謝します。
興味深いことに、ChatGPTの検索機能がアップデートされ、広く利用できるようになりました。OpenAIがメッセージを固定して、「Deep Researchがすべてのチャットユーザー(ChatGPT Plus、Team、Education、Enterprise)に実装されています」と発表しました。これは素晴らしいことですね。
OpenAIは初期リリース以降、検索機能を拡張し、いくつかの改善を加えました。会社によると、この機能は現在、情報源と共に画像を出力に取り込み、アップロードされたファイルの理解と参照も向上しています。
Deep Researchを使いたくても、毎月200ドルの料金を払いたくなかった方にとっては朗報です。正直言って、その料金設定は全く理にかなっていません。人々は毎月Deep Researchを使うわけではなく、時々大学の課題や修士課程、博士課程、仕事の調査、市場調査などで使用するだけです。
使用に応じた支払い方式があるべきなのに、彼らはサブスクリプションモデルにこだわり続けています。
さらに、Team、Enterprise、Educationユーザーは月に10回のDeep Researchクエリを受け取ります。「月に」というところに注目してください。つまり、30日の月の中で、ある日に1回検索し、2日おきに別の検索をするといった使い方ができ、月全体を通して検索を行うことができます。一方、Proユーザーは120回のクエリにアクセスでき、これは基本的に1日6回の質問に相当します。
この機能は2月初めにProユーザー向けに最初に提供され、多様なオンラインソースを検索し、それに基づいて詳細なレポートを生成します。言語モデルに典型的なエラーはまだありますが、Perplexityは毎日5回の無料Deep Researchを提供しており、Grok 3も実装段階でDeep Research機能を開放していることを覚えておいてください。いつまで続くかわからないので、ぜひ活用してください。
Deep Researchは、GPT-4o、O1よりも幻覚が少ないです。OpenAIはDeep Researchの開発、機能、リスク評価について説明するシステムカードを公開しました。幻覚リスク(モデルが偽情報を生成する例)への言及もあります。
Person Q&Aデータセットでのテストでは、精度が大幅に向上しています。Deep Researchは86%の精度を達成し、GPT-4oの50%、Quanの55%、O3 miniの22%よりも大幅に優れています。幻覚率は0.13に低下し、GPT-4oの0.30、O1の0.20、O3の0.15よりも優れています。
OpenAIによると、この率は実際の幻覚を過大評価している可能性があります。なぜなら、不正確とされる回答の中には、古いテストデータに基づいているものもあるからです。つまり、常に幻覚というわけではなく、単に情報が古いだけの場合もあります。
会社によると、広範なオンライン検索が誤りを減らすのに役立ち、トレーニング後の手順が事実の正確さに報酬を与え、虚偽の主張を思いとどまらせるとのことです。今日の人工知能の形態において、事実確認は本当に重要なのです。
しかし、13%のエラー率は、ユーザーがより長い調査レポートで複数の不正確さに遭遇する可能性があることを意味し、このツールを使用する際の重要な考慮事項となります。
Deep Researchは、一般的なトピックや検証された情報源を持つ十分に文書化されたトピック、または生成されたコンテンツを迅速に検証できる主題の専門家によって使用された場合に最も効果的です。
このようなモデルを使用する際に気づくのは、まったく理解していない主題について検索を行い、きれいな調査結果を受け取っても、それが真実かどうかを評価できないということです。
私はGrok 3とPerplexityのDeep Researchでブラジルの州についてテストを行いました。そのデータや情報を見て、それが正確かどうかを判断できるからです。あまり詳しくない主題については、判断が難しくなります。
詳細な構造化レポートに散りばめられたエラー(例えば、数字でいっぱいの表の中の一つの数字が間違っている場合)は特定しにくい場合があります。OpenAIもこのことをよく知っています。
私のところではまだDeep Researchは表示されていません。ウェブ検索ボタンはありますが、Deep Researchはまだです。おそらく数日かけて解放されるでしょう。もしすでに表示されている方がいれば、コメントで教えてください。
次のニュースですが、QwenがQWK Maxプレビューをリリースしました。これは彼らの新しいモデルで、基本的に推論を始めるものです。Qwenにアクセスすると、Qwen 2.5 Maxと、今では推論ができるQWKが表示されます。
「QWK Max Preview、Qwenシリーズの最新の進歩を発表できることを嬉しく思います。深い推論と多目的な問題解決の限界を押し広げるために設計されています。堅牢なQwen 2.5 Maxの基盤の上に構築されたこのプレビューモデルは、エージェント関連のワークフローで優れたパフォーマンスを提供しながら、数学、コーディング、一般的なドメインタスクで際立っています。」
数学やコーディングが必要な場合、これは代替案となります。どのモデルが最も人気があるかについての意見調査を行ったところ、この版のQwen 2.5 Maxがなかったため、多くの人が「Qwen 2.5 Maxを入れてください、使っています」と訴えていました。誰も話題にしていませんでしたが、ここで紹介します。
「私たちの次のQWK Maxリリースのプレビューとして、このバージョンは継続的な改良と共に強化された機能の一部を提供します。PASE 2.0によりライセンスされたQWK MaxとQwen 2.5 Maxのオープンソースリリースが間もなく予定されています。新しい時代の知的推論にご期待ください。」
基本的にはQwen 2.5 Maxを選択し、ここでQWKのthinkingを有効にするだけです。
それでは、コップのテストをしてみましょう。テーブルの上にコップを置き、その中にサイコロを入れ、コップを逆さにしました。サイコロがコップの中にあったので、逆さにすると、サイコロはテーブルの上に落ちます。そして、コップをストーブの上に置きました。サイコロはどこにあるでしょうか?
推論モデルはこの問題を解くことができますが、シンプルなモデルはよく間違えます。QWQの推論モデルがどうなるか見てみましょう。
彼は英語で考えているようです。これは、言語の問題が解決を妨げる可能性があることを意味します。しかし、見ていきましょう。
彼は英語で答えましたが、正解です。サイコロはテーブルの上にあります。彼は「運命はテーブルの上にある」と翻訳しましたが、実際には「die」という単語が混乱を引き起こしています。文脈によって「die」は「死ぬ」という意味にも「サイコロ」という意味にもなります。文脈によって意味が変わるのです。
彼がテキスト全体を理解すると正しく翻訳しますが、一部だけ見ると間違った翻訳をします。多くの情報を見るとき、彼は正しく翻訳し、少ない情報では間違えます。いずれにせよ、彼は質問に正解しました。素晴らしいです。
また、人々は「三目並べもプレイするべきだ」と言っていました。なぜなら、推論モデルでないモデルは三目並べでたくさんのミスをしますが、推論モデルははるかに良く動作するからです。
モデルは様々な可能性を考え、最終的に良い手を打ちました。彼は勝利するのを防ぎ、さらに勝つリスクも作りました。私は4に置くように強制されています。さもないと負けます。
彼が心の中でムーブをシミュレートするのを見るのは非常に興味深いです。彼は1、7、8に置くことを考え、最終的に2に置きました。完璧です。彼は私に8に置くように強制し、防御させています。
現在、誰も勝つことができなくなりました。彼は1か7に〇を置くことができますが、いずれにしても引き分けになります。技術的には、ゲームはすでに終わり、引き分けですが、彼はまだそれを認識するまで少し推論を続けます。
彼は7に置いて、最後の利用可能な位置は1だと結論づけました。「あなたが1を選べば、ゲームは引き分けで終わります。最終決定は?」と彼は言います。
彼は完璧に推論しました。これは良い手で、彼が置いた表情も気に入りました。Qwenを使用したかどうか、そしてこのQWKのthinking機能についてどう思うか、コメントしてください。
次のニュースです。Perplexity Comet、Perplexityによって作られたエージェント検索のためのブラウザが来ています。PerplexityがCometと呼ばれるウェブブラウザを作っているようです。
「AI検索エンジンPerplexityが独自のブラウザを作成していると発表しました。月曜日のX(旧Twitter)での投稿で、同社はまだ利用できないブラウザの登録リストを公開しました。いつ発表されるか、ブラウザがどのようなものになるかはまだ明確ではありませんが、名前はCometだとわかっています。」
「PerplexityがGoogle検索を再発明したように、私たちもブラウザを再発明しています」とPerplexityの広報担当者はTechCrunchに電子メールで述べました。「アップデートをお楽しみに。」
Perplexityを使い慣れていない方のために説明すると、深い検索、R1での推論、A3 miniでの推論などの機能があります。また興味深いのは、毎日5回の強化された検索が残っていることです。毎日少なくとも5回の深い検索、R1やA3 miniでの推論検索ができるのです。
簡単に言えば、他のどのサービスと比較しても最高の検索エンジンです。OpenAI、Grok、他のどの会社もこのような設定や検索オプションを提供していません。彼らは本当に誰よりも理解している分野について話しています。
Perplexityのブラウザは、控えめに言っても非常に競争の激しい分野に参入することになります。Chromeなどのライバルに加えて、数多くのサードパーティの代替ブラウザがあります。The Browser Companyの将来的なブラウザ「Arc」のように、多くはPerplexity自身のものに匹敵するAI駆動の機能を提供しています。
Perplexityは、Cometで検索エンジンのユーザーベースを活用して急速に成長し、この分野で何らかの違いを生み出すことを期待しているかもしれません。
Perplexityの製品ポートフォリオは急速に拡大しています。今月だけでも、同社はOpenAI、Google、xAIのオファーに対抗するDeep Research製品を発表しました。これは1月の2つの大きな発表、AndroidのAI駆動のアシスタントとAI検索のためのAPIの後に続くものです。
彼らは非常に活発に動いており、良いものが出てくるでしょう。Perplexityを使用しているか、どう思うか、そしてDeep Searchの品質についてどう思うかコメントしてください。
OpenAIがDeep Searchを解放してくれて嬉しいです。すでにxAIのDeep SearchとPerplexityのDeep Searchを比較しましたが、今度はOpenAIのものも比較することができます。素晴らしいことです。
次のニュースです。Google Gemini Code AssistはソロデベロッパーがIDEから直接無料のAIコーディング支援を得ることを可能にします。
AnthropicがClaude 3.7 Sonnetをプログラミングで際立たせた直後に、Googleはあまりタイミングが良くないかもしれませんが、彼らのアシスタントも提供し始めています。
「Googleは個人開発者向けにAIプログラミングアシスタント「Gemini Code Assist」を無料で提供しました。このサービスは、月間最大180,000回のコード補完とGitHubでのAI駆動のコードレビューを無料で提供します。」
「無料で、コストなし」という点が再び強調されています。GoogleはAIツールを無料で提供することにおいて最も寛大であり、AI Studioには素晴らしいツールがたくさんあります。多くの人がAI Studioでの深い検索や推論が素晴らしく、他の多くの検索よりもはるかに優れていると評論しています。
「GoogleのGemini 2.0言語モデルをベースにしていますが、実世界のアプリケーションベースのプログラミングタスク用に特別に調整されています。個人向けGemini Code AssistはVisual Studio CodeとJetBrainsのIDEで動作します。このツールは、開発環境内で直接コード行を補完したり、ゼロからコードを生成したり、チャットボットインターフェースを通じてコードを説明したりすることができます。」
これは今日誰もが行っていることですね。ChatGPTやClaudeなどのウェブベースのチャットインターフェースとは異なり、IDEとの直接統合により、ウィンドウ間でコードスニペットをコピー&ペーストする必要がなくなります。
VS Codeに入り、「Gemini」を検索します。Gemini Code Assistが表示されるので、インストールします。すると「Welcome」が表示され、「Get started with Gemini Code Assist」と表示されます。
Googleにサインインするためのアイコンが表示され、Google Cloudでプロジェクトを選択するよう求められます。「Create New」をクリックすると、私のGemini IDプロジェクトが表示されます。
「テトリスゲームを作成してください」と頼みます。特に言語を指定していませんが、彼はPythonでコードを作成しました。コピーして、「tetris_gemini.py」というファイルを作成し、彼が送ってくれたテトリスコードを貼り付けます。
インデントの問題があるようですが、とにかく実行してみましょう。動きました!「テトリス、任意のキーを押してください」と表示されました。しかし、エラーが表示されました。「score.txt」がないようです。エラーを修正するコードを入力します。
「任意のキーを押してください」と表示され、今度は動作しました!気に入りました。Geminiを使って、無料で、超高速で、テトリスゲームを作成しました。
ゲームは少しバグがあり、回転させると正しく回転しませんが、無料のアシスタントオプションを探していた方は、今すぐGeminiを使用できます。
どう思いますか?私は素晴らしいと思います。コーディングを使用して作業するためのもう一つのオプション、もう一つの方法です。見てのとおり、とてもよく機能しました。VS Codeの拡張機能としてGeminiを使用するかどうか、どう思うかコメントしてください。
正直なところ、他の拡張機能と比較すると、Googleは後から参入しているため、レースに追いつくためには速度を上げる必要がありますが、もう一つのオプションがあるのは素晴らしいことです。
このようなビデオをサポートしてチャンネルを応援したい場合は、メンバーになってください。メンバーはWhatsAppグループへのアクセス、先行公開ビデオなどの特典があります。
「いいね」をお願いします。


コメント