
8,377 文字

最近また大きな発表がありました。この2週間、次々と発表が続いていますが、OpenAIがDeep Researchを公開しました。これはOperatorに続く2番目のエージェントですが、このエージェントの強力な点は、彼らの最強の推論モデルであるO3と様々なツールを組み合わせ、特にウェブ検索能力を備えていることです。
Deep Researchは、与えられたテーマについて深い調査を行い、質問に答えるためにウェブを探索し、完全に出典付きの研究論文を作成して返してきます。まるで博士課程の研究者のようですが、ここではわずか数分で行われます。
さらに驚くべきことに、OpenAIのCEOであるサム・アルトマンは、このDeep Researchというツールがすでに経済的価値のある仕事の一定の割合を実行できると発表しました。私は狂っているわけではありません。サム・アルトマンは、このAIが実際に経済的に採算の取れる仕事をしていると発表したのです。数字は後ほど見ていきますが、たとえ少なく見えても、実際には数千ユーロまたはドルの価値を表しています。
「経済的に採算の取れる仕事」という言葉を使ったのは、実はこれがOpenAIがAGIの定義として、AGIがいつ到来するかについての彼らのマニフェストで示したものだからです。では、中国のDipSicの登場以来、この2週間で続いている驚くべき展開の後、ついに今日AGIに到達したのでしょうか?
もちろん答えをお伝えしますが、その前に、まずDeep Researchの詳細について説明させてください。もしまだこのチャンネルをご存じない方は、ここではロボット工学からAI、そしてその他多くの分野まで、あらゆる技術の進歩を毎日紹介しています。技術の進歩に関する最新情報を見逃したくない方は、ぜひチャンネル登録をお願いします。
では、今日何が起こったのか説明していきましょう。まず、OpenAIの研究ディレクターであるマーク・チェンが、彼らのエージェントの究極のビジョンについて驚くべき声明を発表しました。ここでは原典をお見せすることが好きなので、すぐにマーク本人が発表している動画をお見せしますが、その前に少し寄り道をさせてください。
レオポルド・H・M・ブレナーの状況認識に関する論文を覚えているかもしれません。私がここでよく話題にする論文で、彼が「インテリジェンスの爆発」と呼ぶものについて説明しています。これは多くのアナリストが常に参照している論文なので、ここで頻繁に取り上げられても驚かないでください。
インテリジェンスの爆発とは、AGIに到達し、それが新しい知識を発見し、自ら応用できるようになる瞬間のことです。これがこの論文による、この分野で本当に参考にされているAGIの定義です。これは時々、再帰的自己改善とも呼ばれています。
多くの情報源によると、これが起こると、その後まもなく人工超知能に到達するとされています。なぜかと疑問に思うかもしれませんが、それは論理的です。AIが自己改善の方法を見つけることができ、同時に数十、数百、数千、数百万のこれらのエージェントを起動できるとすれば、指数関数的にどれほど早く改善できるか想像してみてください。この段階では、私たちの理解をも超えていると思います。
もちろん、これがSFのように思えたり、とても遠い未来のことのように思えたり、あまり信じられないかもしれませんが、それは違います。すでにここにあるのです。先ほど申し上げたように、OpenAIの開発者たち自身がこの技術のライブデモを行った動画をご覧いただきましょう。一緒に見て、その後で分析していきましょう。
「私たちのモデルが、より長時間、無監視で自律的なタスクを実行し始めることが重要です。これは私たちのAGIへのロードマップの中核です。私たちの究極の願望は、自ら新しい知識を発見し、明らかにすることができるモデルを作ることです。
最初のステップは、利用可能な情報を統合し理解できるモデルを持つことです。Deep Researchは、ChatGPTの冒頭にあるボタンからアクセスできます。そこから、すぐにクエリを入力してDeep Researchに送ることができます。
iOSとAndroidの採用率、新しい言語を学びたい人の割合について調べてください。これらのデータを先進国と発展途上国で比較したいと思います。また、テーブルや明確な推奨事項を含むフォーマットされたレポートでChatGPTの最良の機会についてもこれらの情報を得たいと思います。
この要求は私なら何時間もかかるところですが、Deep Researchなら即座に開始できます。Deep Researchはまず、一連の明確化の質問を返してきます。これは重要です。なぜなら、検索には5分から30分かかるため、最初から正しい要件を持つことが不可欠だからです。
分析者が複雑な要求に直面した時のように、関連性のある質問が投げかけられます。したがって、最初からこれらに対処することが重要です。モデルはエクセルで情報を処理し、より詳細な情報も使用して、その検索ミッションを遂行します。
これらすべてを統合し、検索プロセスを開始します。サイドバーが開いて、すべての推論を表示します。現在、主要な国を特定し、情報を収集し、検索プロセスを開始しています。よく見ると、Deep Researchは情報を検索し、ページを開き、見つけたものを分析しています。
裏側では、モデルが検索を実行し、ページをナビゲートし、画像からPDFまですべての要素を検討しています。」
この動画についてどう思われましたか?事態は加速するばかりですが、待ってください。これから私が見せることは信じられないほど驚くべきものです。私自身、この動画を書いているときに非常に驚きました。
ところで、下のコメント欄で皆さんの意見をお聞かせください。コメントは必ず読んでいます。多くの場合、コメントは私に考えさせ、いくつかの動画のインスピレーションとなっています。コメントを読むのが好きなので、遠慮なく書いてください。
とにかく続けましょう。AI分野の人物であるサイモン・ウィルキンソンは次のような質問を投げかけました。「DipSicはいいけど、2倍速くすることは可能だろうか?」これは正当な質問です。彼はDipSic自身に2倍速くなる方法を見つけるよう依頼し、DipSicは答えを出したという投稿を行いました。
これはかなり驚くべきことです。なぜなら、これを自己改善として見ることができるからです。実際、これがDipSicの核心部分です。自己改善です。もしAIが2倍速く応答する方法を自分で見つけることができるなら、3倍、4倍、5倍速く、あるいはさらに賢くなる方法を見つけることを何が妨げるでしょうか?
実際、自己改善とその力がどのようなものかを実感していただきたいと思います。そう、私も、AIがあらゆる分野で自己改善できるようになる日がAGIになると思います。これは私の意見では、AGIという用語の非常に良い定義です。
これは、ここでOpenAIのDeep Researchで少し見え始めていることです。例えば、博士レベルの研究者がいて、あなたの代わりにウェブ上で深い調査を行い、数分後、あるいは30分後(このモデルは聞いた話では動作にかなり時間がかかり、質問に答えるのに30分から1時間かかることがあるそうです)に、完全に書かれた研究論文を、古い科学論文への参照を含む良い出典付きで戻ってくることを想像してください。
これがOpenAI Deep Researchです。たった2週間前を思い出してください。DipSicも、O3 miniも、何もありませんでした。このチャンネルをフォローしている方なら、現在ニュースが次々と出ていることをご存知でしょう。2週間後にどこまで行くのか、すべてがどれほど加速するのか、私にもわかりません。
近いうちに落ち着くのでしょうか?わかりません。しかし、続く限り、すべての情報を皆さんにお伝えすることをお約束します。もちろん、今後のアクションを見逃さないようにチャンネル登録をお願いします。
フィリップ・ミランというOpenAIの政府市場担当者がいます。彼は、妻がガンになり、Deep Researchを使って、彼女の年齢、健康状態、その他の要素を考慮して、この特定のガンに最適な化学療法を決定するために送ったという話をしています。驚くべき結果が返ってきました。
彼はXで投稿を行い、これについての見解を述べています。これをすぐに読んでみましょう。AIエージェントと、今日のAIが可能にすることに関して非常に適切な内容だからです。彼は次のように述べています:
「今日、OpenAIでDeep Researchを立ち上げました。このツールがいかに驚くべきもので、世界をどのように変えるのかについて、非常に個人的な話を共有したいと思います。注意:がんに関連する繊細な内容です。」
彼は続けます。「10月末、妻は乳がんと診断されました。一夜にして私たちの世界は変わりました。彼女は12月初めに両側乳房切除術を受け、その月の後半に化学療法を開始しました。最近の課題は、彼女の特定のケースについて、化学療法後に放射線療法を受けられるかどうかでした。
私たちは相談し、いくつかの相反する意見を得ました。明確な答えはありませんでした。行き詰まりを感じていました。」
ここで少し休憩して、別の注意点を挙げましょう。世界で最も賢い医師たちが異なる意見を出し、あなたはがんの専門家ではまったくない人として、決断を迫られている状況を想像してください。治療AまたはBを選ばなければならず、専門家でもないのに。正直、これは非常に困難な状況です。
実際、ここでは特定のがんのケースについて話していますが、今日、多くの患者がこれに直面しています。小さな病気でさえ、医師は相反する意見を出すことがよくあり、人々は非常に微妙で複雑な状況に直面することになります。
そしてここで、このDeep ResearchのAIが介入しました。続きを読んでみましょう。非常に興味深いです。
「Deep Researchへの早期アクセス権があったので、試してみることにしました。私たちは彼女の手術病理レポートをアップロードし、放射線療法が有益かどうかアドバイスを求めました。その後に起こったことは驚くべきものでした。
腫瘍専門医が言及したことを確認しただけでなく、さらに踏み込んで、私が聞いたことのない研究を引用し、彼女の年齢や遺伝的要因などの詳細を追加すると、それに適応までしました。私たちは各研究を確認しましたが、それらは完全に正確でした。」
そして彼は、使用した正確なプロンプトを教えてくれました。実際、これは数フレーズだけで、巨大なプロンプトではありません。これがDeep Researchの力です。本当に考えるAIです。
最後に彼は続けます:「まもなく別の専門医に会う予定ですが、私たちは既に決定に自信を持てています。これは単なる技術的なデモではありませんでした。個人的なものでした。最も必要としていたときに、心の平安を与えてくれました。
OpenAI内部では、AGIを感じる瞬間についてよく話し合いますが、これはそのひとつでした。これは世界を変えるでしょう。」
フィリップと彼の家族、そして妻に最善を願います。しかし、これはAIが具体的に人々の人生を、以前にはできなかったレベルで変えている方法についての信じられないような話です。たった6ヶ月前でさえ、このような種類のこと、確かにAIは小さな病気や症状についてガイドはできましたが、今や私たちは非常に印象的なものに近づきつつあります。つまり、AIが病気を診断し、比類のない精度で実際の診断を提供し始めることができるということです。
もしあなたがニュースをフォローしていれば、このチャンネルをフォローしていれば、医療分野でそれができるAIがすでにあることをご存知でしょう。しかし、ここでは別のことを話しています。医師のように本当に考えるAIについて話しているのです。ただし、ここでは人間の知能に制限されることはありません。
これは、AIの巨大な知能が科学文献全体を検索して、最良の解決策を提供するというものです。正直なところ、これは私が最も期待し、最も興奮し、個人的に可能な限り早く実現してほしいAIのアプリケーションの1つです。AIと医療は、私が知る限り最強の組み合わせです。
もしあなたがAIが現在世界を変えている速度について確信が持てなかったとすれば、これがあなたの考えを少し変えるのに役立つことを願っています。なぜなら、はい、今起こっている革命を見逃してはいけないからです。
技術的な詳細に入らせてください。このDeep Researchのパフォーマンスについてお話ししましょう。なぜなら、これは本当に驚くべきものだからです。
これは実際にどのように機能するのでしょうか?Deep Researchは、今日最も強力な推論モデルであるO3を使用しています。これはまだリリースされていません。ChatGPTにはすでにO3 miniがありますが(2日前に動画を作りました)、これは確かにO3モデルで、ウェブ検索を含む高度なツールを使用する能力があります。
これは、エンドツーエンドの強化学習を使用して、様々な分野での複雑なナビゲーションと推論タスクについてトレーニングされました。過去2-3本の動画でRLHFについて話しましたので、ここでは詳しく説明しませんが、これはAIのトレーニングですので、より古典的なものは何もありません。これがこの技術がまだ非常に関連性があることを示しているのです。
しかし、このAIは必要なデータを見つけるために複数のステップで軌道を実行することを学びました。必要に応じて後戻りし、必要な場合はリアルタイムで情報に反応することも学びました。このモデルはまた、ユーザーがアップロードしたファイルを閲覧することもできます。ファイルを与えると、例えばツールを使用してグラフを作成し、反復することができます。
トレーニングは非常に完全なものでした。このトレーニングのおかげで、AIに対して行う複数のベンチマーク、テスト、試験で新しい高みに達しました。
それを見てみましょう。まず、「人類最後の試験」と呼ばれる試験があります。はい、ベンチマークとしてはかなり暗い名前ですが、おそらく私たちはそこにいるのかもしれません。これらの研究者たちのユーモアのセンスが好きです。
このテストは、本当に高度な、本当に専門家レベルの質問で、幅広い主題についてAIを評価します。言語学から航空工学、高度な科学、古典研究、生態学まで、100以上の科目で3000以上の多肢選択問題と短答問題が含まれています。あらゆる分野が対象となります。
GPT-4は3.3%を獲得しました。このテストで3.3%の正答率を得たということです。Claude 3.5 Sonnetを見てみると、4.3%を獲得しました。悪くありません。OpenAI O1は9.1%で、本当に良い成績です。DipSicも9.4%で非常に良い成績です。
次にO3ファミリーがあり、O3 mini、medium、O3 mini highがそれぞれ10.5%と13%を獲得しています。かなり興味深くなってきました。しかし、ここで大きな飛躍があります。OpenAI Deep Researchが26.6%です。
このようなテストでは非常に驚くべき結果です。O3 mini highが達成できるものの2倍です。個人的には、ウェブ検索能力があるからだと思います。これがこのエージェントがそれほど強力である理由のカギです。
もちろん、これが最も強力な推論モデルなので、他のものよりも賢いというのもありますが、リアルタイムでウェブを検索できる能力があることが、多くのことを変えていると思います。
ところで、もしあなたがトレーニングをフォローしていれば、なぜエージェントがそれほど強力なのかを理解できると思います。私たちが一緒に構築したエージェントに、このDeep Researchを組み込むことができれば、すべてが変わる可能性があります。
かなり興味深いものになるでしょう。もっと深く掘り下げて調べてみて、進展があり次第お知らせします。もちろん、新しいレッスンも作成します。
さて、最も驚くべきグラフですが、これは推定経済価値別の専門家レベルのタスクの成功率です。基本的に、これはOpenAIによるAGIの測定基準です。
経済価値が低いタスクでは20%をわずかに下回る19%、中程度の経済価値では17.7%、高い経済価値では15%、そして非常に高い経済価値では9.1%の成功率を獲得しています。
経済的に非常に価値の高いタスクで9.1%を獲得しています。はい、まだ低く見えるかもしれませんが、これは信じられないほど重要な指標です。9%は決して小さな数字ではありません。24時間休むことなく働き続けるAIを考えてみてください。
たとえ1時間あたり1ユーロの収益しか生まないとしても、それは24時間年中無休で働きます。これは労働市場の未来について多くの議論を引き起こします。
では、私たちはそこにいるのでしょうか?AGIに到達したのでしょうか?まず、このモデルにアクセスできるのは誰でしょうか?
プロユーザー、つまり月額200ユーロ以上を支払うプランのユーザーです。なぜなら、このAIは計算量が非常に多いと彼らは言います。おそらく彼らが今まで作った中で最大のモデルと、多くのトークンを使用する推論、そしてウェブ検索を組み合わせているからです。
実際、プロユーザーでさえ、月間リクエスト数が制限されています。現時点では、月額200ユーロのプランを支払っても、月50から100のリクエストしか使用できないと思います。
とにかく、なんと刺激的な時代でしょう。これは決して止まることがありません。そして今、このDeep Researchの発表により、私は本当にそう思います。過去2つの動画でも言いましたが、これはDipSic効果です。
DipSicが何かをリリースし、中国がそれに続いて何かをリリースすると、突然サム・アルトマンが目を覚まし、クレイジーになって、今や途切れることなく驚くべきものを出し続けています。
つまり、彼らが望めば、できるということです。何週間も何週間もかけて磨き上げる必要はありませんでした。彼らは最初からもっと早く進むことができたのです。O3 miniをリリースし、わずか数日後、実際には2日後にDeep Researchをリリースしました。
これは、サム・アルトマンが予告している「もう一つのこと」でさえありません。OpenAIからの別の発表がまもなく予定されています。すぐにそれが何なのかわかるでしょう。
まだの方は、チャンネル登録をお願いします。ここでは毎日、技術と科学のニュースを取り上げています。動画が気に入って、まだ登録していない方は、ぜひ登録してください。
また、ピン留めされたコメントにトレーニングのリンクがすべてあることをお伝えしておきます。AIの使い方を学びたい方は、今がその時です。日を追うごとに、物事がますます加速していくのがわかると思います。
もちろん、ますます多くの人々がAIを使い始めるでしょう。本当にお勧めするのは、AIの使い方を学び始めることです。私はすべての人が手の届く価格で学べるトレーニングを作りました。
なぜなら、私の最終的な目標は、皆さんが日常生活でAIツールとこれらすべてのツールを使いこなせるようになることだからです。はい、それは来ています。数年後には誰もが使うようになるでしょう。だから今、直接ポジションを取っておく方がいいのです。
すべてのリンクは説明欄にあります。もう一度、動画をご覧いただきありがとうございます。次の動画でまたお会いしましょう。
この分析が興味深かった方で、現在の地政学的課題についてさらに深く理解したい方は、私の新しいチャンネル「Vision Actu」をご覧ください。そこでは、この話題やその他、私たちの現在と未来を形作る話題について、より深い分析を見つけることができます。両方のチャンネルを登録して、何も見逃さないようにしてください。新しい分析でまたお会いしましょう。


コメント