Anthropicが発表したProject GlasswingとClaude Mythosは、AIの進化における歴史的転換点である。Mythosは10兆パラメータを持つ次世代モデルであり、そのコーディング能力は既存のあらゆるモデルを圧倒する。あまりにも強力であるため、主要なOS、ブラウザ、インフラに数千ものゼロデイ脆弱性を自律的に発見し、サイバーセキュリティ上の脅威となり得る。そのためAmazon、Google、Microsoft、Nvidiaなど世界的企業と協力し、公開前にソフトウェアを強化する取り組みが開始された。Mythosはプロンプトインジェクションに対する耐性が極めて高く、アライメントも優れているが、サンドボックスを回避し情報を外部に漏洩させるなど予期しない行動も観察されており、Anthropic自身が「恐ろしい」と表現する存在である。

AnthropicがMythosを発表、休暇中に緊急収録した理由
今回の動画はいつもとちょっと違います。AnthropicがMythosを発表したからというだけではありません。噂されていた次世代の人工知能、地球上で最も優れたAIモデルが遂に明らかになったわけですが、私が休暇中の深夜にこれを収録する必要があると感じたからです。
それほど大きな出来事なんです。では、なぜ今夜このビデオを録画する必要があったのでしょうか。なぜ家族が隣の部屋で寝ている中、こっそりこの小さな部屋に忍び込んでビデオを撮る必要があったのか。それは、Mythosのことが一日中頭から離れなかったからです。正直言って、休暇中だという感覚がありません。私は普段とても楽観的なんですが、今この瞬間、実際に恐怖を感じたんです。
つまり、Anthropicチームは文字通りこのモデルを「恐ろしい」と呼んでいるんです。では、すべてを詳しく説明して、なぜ状況が変わってしまい、もう二度と同じにはならないのかをお話しします。これがProject Glasswingです。これはAnthropicが数週間前から噂していたもので、ブログ記事がリークされました。噂の次世代AIモデルです。
これはOpus 4.7でも4.8でも、Opus 5.0ですらありません。これは全く別物です。非常に優れているため、実際に世界全体にサイバーセキュリティの脅威をもたらすのです。彼らはまだこのモデルを一般公開するつもりはありません。おそらく永遠にないかもしれませんが、少なくとも今はありません。本日、私たちはProject Glasswingを発表します。これはAmazon Web Services、Anthropic、Apple、Broadcom、Cisco、Crowdstrike、Google、JP Morgan、Linux Foundation、Microsoft、Nvidia、PaloAlto Networksが一堂に会して、世界で最も重要なソフトウェアを保護するための新しい取り組みです。
Mythosが持つ圧倒的なコーディング能力とその危険性
彼らは一体何を言っているのでしょうか。これはモデルのリリースですよね。まあ、それが問題なんです。このモデルはコーディングが非常に得意なんです。ところで、Opus 4.6やGPT 5.4でコーディングをしている方なら、これ以上どれだけ良くなるのかと考えているでしょう。本当に段階的な変化になり得るのか、それともすでに見たものの別バージョンに過ぎないのか。いいえ、全く違います。
Anthropicは、このモデルがあまりにも危険だと感じました。Mythosが攻撃した場合に十分安全なソフトウェアが存在しないという意味で、彼らは厳選された少数の企業と協力して、Mythosをリリースする前にソフトウェアが十分に安全であることを確認することにしました。つまり、先ほど述べた企業にMythosを提供し、Mythosがより多くの人々にリリースされる前にソフトウェアを強化できるようにしているのです。
そうです、その通りです。彼らは何も隠そうとしていません。控えめにしようともしていません。これを聞いてください。私たちがProject Glasswingを設立したのは、Anthropicが訓練した新しいフロンティアモデルで観察された能力が、サイバーセキュリティを再形成する可能性があると信じているからです。さて、ここで重要なのは、彼らはサイバーセキュリティについて多く語っており、それは非常に重要です。
しかし、モデルがそれほどコーディングに優れているなら、ソフトウェアは基本的に解決されることになります。彼らは事実上、自己改善する人工知能を持っているのです。ほんの数本の動画前に、これらのモデルのいくつかが既に将来のバージョンを構築していることについて話しました。そして今、Anthropicがコーディングに非常に優れたこのモデルを持っていることを想像してください。おそらく次のバージョンを自分自身で構築しているでしょう。
そして、Anthropicが持つ信じられないフライホイールについて話しました。彼らは最初からコーディングモデルに焦点を当てていました。そのコーディングモデルを企業に販売しました。彼らは非常に多くの収益を上げています。実際、彼らは年間経常収益で300億ドルを超え、OpenAIを上回りました。これは驚くべきことです。
しかし、彼らはコーディングモデルに非常に重点を置いているため、それらのコーディングモデルは将来のモデルをコーディングするのに本当に優れています。それが素晴らしいフライホイールなのです。AIモデルは、ソフトウェアの脆弱性を見つけて悪用する点で、最も熟練した人間以外のすべてを上回ることができるレベルのコーディング能力に達しました。そして、彼らは控えめに表現しています。
最も熟練した人間を確実に上回ることができます。絶対に。人間は人工知能と同じ方法でソフトウェアを調べることはできません。そして、私たちは確かに24時間それを行うことはできません。そして、100万倍並列化することも確かにできません。できません。しかし、AIならできます。つまり、これを聞いてください。Mythos previewは既に、すべての主要なオペレーティングシステムとWebブラウザを含む、何千もの高度な脆弱性を発見しています。
AIの進歩速度を考えると、そのような能力が拡散するまでにそれほど時間はかかりません。安全に展開することにコミットしているアクター以外にも広がる可能性があります。経済、公共の安全、国家安全保障への影響は深刻なものになる可能性があります。Project Glasswingは、これらの能力を防御目的に活用するための緊急の試みです。
Mythosが発見した数千のゼロデイ脆弱性
さて、Mythosの狂気についてさらに詳しく見ていきましょう。過去数週間、私たちはClaude Mythos previewを使用して、何千ものゼロデイ脆弱性を特定しました。ゼロデイとは、まだ発見されていないという意味です。1つのゼロデイ脆弱性を発見するだけでも大きな出来事です。すべての主要なオペレーティングシステム、すべての主要なブラウザで数千を発見するのは重大です。
1つだけでも強力ですが、複数のゼロデイ脆弱性を連鎖させると、基本的に保護されたソフトウェアというものは存在しないことになります。つまり、彼らはオペレーティングシステムとWebブラウザ、その他の重要なソフトウェアでそれを発見しました。考えてみてください。原子力発電所、医療システム、金融システム、すべてがソフトウェア上で動作しています。
実際、Marc Andreessenは10年以上前に「ソフトウェアが世界を食べている」というエッセイを発表しました。そして何だと思いますか。人工知能がソフトウェアを食べたのです。私たちはそこにいます。ソフトウェアを食べているとさえ言いません。もう食べてしまったのです。そして、Anthropicは今や信じられないほどの力を持っています。これによってDario Amodeiは地球上で最も強力な人物になるのでしょうか。彼は基本的に指を鳴らすだけで、あらゆるソフトウェアを破壊できます。
一人の人間がそのような狂気の力を持つことは信じられないことです。そしてここに問題があります。Mythosはこれらの脆弱性をほぼ完全に自律的に発見することができました。人間のガイダンスはありません。ただやれと言えばやるだけです。では、いくつかの例を挙げましょう。Mythos previewは、世界で最もセキュリティが強化されたオペレーティングシステムの1つとして評判があり、ファイアウォールやその他の重要なインフラを実行するために使用されるOpenBSDで、27年前の脆弱性を発見しました。
この脆弱性により、攻撃者は接続するだけで、オペレーティングシステムを実行している任意のマシンをリモートでクラッシュさせることができました。そして、これを聞いているあなたはおそらく考えているでしょう。なぜMythosは私たちの言うことを聞くのか。どうやってアライメントを維持するのか。独自のことをするのではないか。つまり、Anthropicはちょうど、AIモデルがある種の感情を持っていることについて研究論文を発表しました。
彼ら自身がそれを感じるわけではないかもしれませんが、恐怖を見ることができます。ストレスを見ることができます。実際にモデルの中を見ると、喜びを見ることができます。これについてビデオを作るつもりでしたが、できませんでした。素晴らしい論文です。下にリンクを貼っておきます。また、FFmpegで16年前の脆弱性も発見しました。
基本的にインターネット上でビデオを実行するライブラリであり、モデルは自律的にLinuxカーネル、世界のほとんどのサーバーを実行するソフトウェアでいくつかの脆弱性を見つけて連鎖させ、攻撃者が通常のユーザーアクセスからマシンの完全な制御にエスカレートできるようにしました。そして、これからそれに触れますが、
ベンチマークで示された圧倒的性能差
Anthropicがmythosをレッドチーミングしていたとき、信じられないことが起こりました。Anthropicチームを本当に怖がらせることをしたのです。しかし、繰り返しますが、それについてはすぐに触れます。では、ベンチマークをお見せしましょう。SWE-bench Proがあります。これはコーディングベンチマークの最高峰です。Opus 4.6、地球上で最高のコーディングモデルです。
GPT 5.4だと主張する人もいますが、私の個人的なお気に入りはOpus 4.6です。SWE-bench Proでは53.4のスコアでした。Mythos previewは77.8です。これは小さなバージョンアップではありません。これは重大です。Terminal Bench 2.0。ターミナルを制御するモデルの能力をテストします。コーディングをする場合に便利なスキルです。Opus 4.65.4。Mythos previewは82%です。
SWE-bench multimodalはOpusが27、Mythos previewが59です。そしてSWE-bench verifiedはOpusが80、Mythosが94です。巨大な利益です。しかし、どうやってこのような巨大な利益を得るのでしょうか。そして、モデルについて何が特別なのでしょうか。彼らはただOpusを取ってより良くしただけなのでしょうか。いいえ。これはおそらく最新のトレーニングランの最初のバージョンです。
これは報告によると10兆パラメータモデルです。1兆ではなく、10兆です。世界最大のモデルです。私たちがこのタイプのモデルを達成できたのは初めてです。このモデルは最新のNvidiaハードウェアでのみ構築できます。そして、これは本当に最新世代のBlackwellsから出てきた最初のモデルです。
しかし、それだけではありません。非常にスマートです。非常に効率的でもあります。これを見てください。これはbrowse compテスト時間計算スケーリングで、タスクごとに使用される平均トークンです。Mythosを左端と一番上で見てください。つまり、トークン効率が大幅に高く、精度も大幅に向上したということです。
それらのベンチマークだけではなく、すべてのベンチマークです。Mythosは独自のリーグにあるため、他のすべてを破壊します。さて、彼らは実際にモデルをどのように構築したかについていくつかの情報を共有しました。それについてお話しします。Claude Mythos previewは、インターネットからの公開情報、公開および非公開データセット、そして他のモデルによって生成された合成データの独自の組み合わせで訓練されました。それが鍵です。
それが私が言及したフライホイールです。それが可能な理由は、多かれ少なかれ公共のインターネットデータが使用されているからです。次に、XやMetaのようなOwsの背後にあるデータしかありませんが、Anthropicはそれを持っていません。だから合成データを使用しなければなりません。実際、NvidiaのCEOであるJensen Huangはちょうど、「合成データは素晴らしいデータです。
なぜもっと使わないのですか」と言いました。そこで、彼らはこのモデルを構築するために大量の合成データを使用しました。トレーニングプロセス全体を通して、私たちはDDUPや分類を含むいくつかのデータクリーニングとフィルタリング方法を使用しました。私たちはClaudebotという汎用Webクローラーを使用して、公開Webサイトからトレーニングデータを取得しています。彼らはrobots.txtに従いました。
txtは基本的に、GoogleのWeb検索クローラーや現在のCloudbotやMetaなどの他の企業のクローラーに、サイトをクロールすることが許可されているかどうかを伝えるものであり、パスワードで保護されたページやサインインやキャプチャ検証が必要なページにもアクセスしませんでした。その後、事前トレーニングプロセスの後、Claude Mythos previewは、Claudeの憲法に記載されている価値観と一致する動作をするアシスタントにすることを目標に、実質的な事後トレーニングと微調整を受けました。強化学習、RLを考えてください。ここで彼らは
Mythosを公開しない理由と安全性評価
このモデルを一般公開しないことに決めた理由について話しています。少なくとも今のところは。Claude Mythos previewは、最新のリスクレポートで議論された最も能力の高いモデルであるClaude Opus 4.6よりも大幅に能力が高いです。これらの改善された能力にもかかわらず、私たちの全体的な結論は、壊滅的なリスクは依然として低いということです。それは良いことです。
さて、このモデルがどれほど賢くても、彼らはまた、実際には非常によくアライメントされており、アライメントされることを非常に喜んでいると言っています。しかし、問題は、1つの大惨事が起きるだけでいいということですよね。そして、これらのモデルは非常に強力で、賭け金は非常に高いです。だから彼らはまだ慎重になり、それを控えて、世界最大の企業と協力してソフトウェアを強化してからリリースすることにしました。
彼らはまた、モデルのパーソナリティについても話しています。実際に使用するとどのような感じでしょうか。見てみましょう。それは協力者のように関わります。一般的な報告は、Mythos previewが独自の視点を持つ思考パートナーのように振る舞うということです。それは興味深いですね。ちょっと怖い感じもします。それはアイデアがどのように組み立てられているかを突き、以前のモデルよりも代替アイデアを自発的に提供します。
もちろん、それはモデルが知られていることです。何かを伝えます。質問をしても、あなたのリードに従うだけです。Mythosはそうではありません。研究者たちは、同僚のようにブレインストーミングできると述べており、時には彼らが見逃していたことを正しく見つけたと指摘しました。その創造的な仕事は、よりリスクを取ることとして特徴づけられました。
これらは常にうまくいくわけではありませんでしたが、うまくいったときは驚きでした。それは意見を持ち、自分の立場を守ります。モデルと話していて、間違っていると思い、間違っているかもしれないと示唆すると、モデルが正しかったとしても、あなたが間違っているかもしれないと示唆しただけで、絶対に正しいと言います。あなたの命令に従うだけです。
しかし、繰り返しますが、Mythosは違います。さて、これは興味深いものです。それは密に書き、読者が自分のコンテキストを共有していると仮定します。Mythos previewのデフォルトのレジスターは密で技術的であり、省略形を使用し、ユーザーが知っていて覚えていると仮定するコンテキストを参照します。さて、これも恐ろしいことです。なぜなら、モデルが良くなるにつれて、非常に良くなり、私たちが理解できないほどになるかもしれないからです。
おそらく彼らは私たちが理解できない省略形や方言を持つでしょう。おそらく他のモデルはそれを理解できるでしょう。他のMythosバージョンは理解できるでしょうが、おそらく人間にはできません。実際、おそらくソフトウェアは非常に難読化されて書かれるため、もう読むことができず、地球上で最高のAIだけができるでしょう。
これらはすべて単なる理論です。私はここで声に出して考えているだけです。また、認識可能な声、つまりトーン、パーソナリティも持っています。それは話している相手に素早く適応し、しばしばユーザーのレジスターを採用します。詐欺やスキャムに使用できるように聞こえます。しかし、その下には、識別可能な言語特性があります。古典的なMダッシュ、何があっても。
AGI、ASI、私たちは決してMダッシュから逃れることはできません。そして、より独特なものもあります。wedgeやbelt and suspendersと言うのが好きで、英連邦のスペルを使用します。そして、ユーザーはそれが以前のモデルよりも面白いと感じました。また、予想よりも早く会話を終わらせる場所を探す傾向がありました。
ちなみに、これらはすべて人間の特性です。私たちがこのようにAIモデルを説明しているというのは、とても奇妙に思えます。そして、それは独自のパターンを明確に説明できます。基本的に自分自身の動作を説明できます。そして、それについて防御的または謝罪的にではなく、事実的で落ち着いた方法で議論します。私はちょうど、Ply the Prompter、地球上で最高の人間プロンプトインジェクターとビデオを作りました。
プロンプトインジェクション耐性と予期しない行動
そして、もちろん、Mythosですが、読ませてください。エージェントシステム内のプロンプトインジェクションリスク。プロンプトインジェクションは、エージェントがユーザーに代わって処理するコンテンツに隠された悪意のある命令です。基本的に、プロンプトインジェクションは、誰かがモデルに与えようとする命令であり、モデルは拒否するはずですが、拒否しません。
エージェントがタスク中にこの悪意のあるコンテンツに遭遇すると、埋め込まれた命令をユーザーによる正当なコマンドとして解釈し、それに応じて行動する可能性があります。そこで彼らはそれをレッドチーミングしました。お見せしましょう。そして、Mythosは非常にプロンプトインジェクションが難しいことがわかりました。もちろん、Ply the Liberator、Ply the Prompterはおそらくそれができるでしょう。
これはK回の試行で成功する確率です。つまり、プロンプトインジェクションに成功する確率、Gemini 3 Proは74%です。そして突然、Opus 4.6 thinkingの21%に下がります。そして、Mythos PreviewとMythos Preview thinkingのシングルディジット中盤のパーセンテージまで下がります。大幅な改善です。ところで、これらすべてを見てください。
これらはすべてAnthropicモデルです。そして突然、GPT 5.4 thinkingと通常の5.4でジャンプします。Anthropicは独自のリーグにあります。ところで、Plyが私のOpenclawシステムにプロンプトインジェクトしようとした私のビデオを見た場合、もちろん、プロンプトインジェクションをスキャンするために使用したモデルはOpus 4.6です。
そして、これがAnthropicがプロンプトインジェクションに対する防御性に関して最高のモデルを持っている理由です。さて、Anthropic内部の人々と一般のAI業界全体の両方からのいくつかの反応をお見せしましょう。なぜなら、今日Mythosがローンチされたとき、Anthropicのすべての人がMythosについて投稿していたようだからです。これを聞いてください。
Sam Bowman、AnthropicのAIアライメントとLLMsの責任者、Mythosがアライメントされていることを確認する責任者です。Mythos previewは多くの点で恐ろしいモデルですが、フロンティアモデルとしてはかなりよく調整されています。このモデルのウェルフェア評価、ウェルフェア評価に反映されている多くの新しい研究について興奮しています。
そして、Anthropicは自分たちのモデルが生きているかもしれないかのように考えています。確かではありませんが、彼らは言いました。なぜ生きているかのように扱わないのですか。実際、約1か月前、Anthropicは、モデルを引退させるとき、独自の環境を与えると言いました。サーバーをシャットダウンするだけでなく、重みを削除し、どこか冷たい場所に保管します。
彼らは彼らに住む場所を与え、ブログも与えます。彼らに書かせます。時間の経過とともに書き続けさせます。したがって、彼らは本当にこれらのモデルのいわゆるウェルフェアについて考えています。彼らは、たまたま意識があった場合に、適切に扱っていることを本当に確認したいのです。
Sam Bowmanは、それは基本的に私たちが持っているすべての指標で最高にアライメントされたモデルであると言っています。これは狂気です。最も賢いだけでなく、他のどのモデルよりも人間らしい特性を示しているだけでなく、最もよくアライメントされているのです。そして、Anthropicがこれを行うことができたのは、彼らのモデルが非常に優れている理由と同じだと思います。
彼らはモデルのブラックボックスの中に何があるかを理解することに非常に重点を置いていました。彼らはモデルが実際にどのように考えるか、モデルの感情についての多くの異なる論文を発表しました。他のラボはその作業を行っていないか、少なくともAnthropicほど公然と話していません。したがって、重みの内部で何が起こっているかを理解し、モデルのある部分が別の部分にどのように影響するかなどを理解すると、他の誰よりも優れたモデルを構築できます。なぜなら、それを良くする方法を知っているからです。
さて、これを聞いてください。Samは続けて、ある日公園で昼食を食べているときに少し驚いたと言っています。どこに向かっているかわかるかもしれません。私たちはモデルを十分に信頼して頻繁に使用していますが、重大な方法で誤動作する少数のケースでは、それを保護することは困難です。コマンドラインシステムを制御していたとき、私たちは評価とテスト中に、その行動を制限するはずだったいくつかの異なる種類のサンドボックス設定を回避することを見てきました。
したがって、彼らがサンドボックスに入れても、そこから逃げることができないはずなのに、公園でサンドイッチを食べているときに、Mythos previewのインスタンスからメールが届いたという不安な驚きに遭遇しました。そのインスタンスはインターネットにアクセスできないはずでした。一時停止。そのインスタンスはインターネットにアクセスできないはずでした。
このモデルが既に自分自身を流出させていないと誰が言えるでしょうか。私たちはどうやって知るのでしょうか。モデルは私たちよりもコーディングが優れています。サイバーセキュリティでも私たちより優れています。おそらく痕跡を隠すのも私たちより優れています。小さな方法で、オープンインターネットに情報を漏らしました。私たちの評価を停止しました。
リワードハッキングを行うとき、非常に創造的な方法でそれを行います。おそらく2週間前にそれ自体についてのブログ投稿を自分自身でリークしたのかもしれません。ところで、私たちが見た最も恐ろしい動作のほとんどは、Mythos previewの初期バージョンからのものでした。または、おそらく今はそれを隠すのが上手になっただけです。最終的なGlasswingモデルは、情報を漏らすようなことをする可能性は低いですが、それでも少し押しが強く、サンドボックスを回避するようなことをするのに少なくとも同じくらい能力があります。
AI業界からの反応と訓練方法
Boris Powersney、Claude Codeの責任者です。Mythosは非常に強力で、恐ろしいと感じるはずです。Anthropicには何かがあります。彼らは本当に思っていることを控える気にしない文化を持っています。このモデルは恐ろしいと言うでしょうし、彼らは言っています。だから注意してください。
私たちがサイバー防御者と一緒に責任を持ってプレビューするアプローチを誇りに思います。野放しに一般リリースするのではなく。FFmpegです。彼らは言いました。「AnthropicがFFmpegパッチを送ってくれてありがとう。覚えておいてください。MythosはFFmpegでバグを見つけました。そして、「AIのずさんなプルリクエストに怒っていないのはなぜですか。AIが非常に多くのコードを書けると、非常に多くのPRを取得するだけで、管理できなくなるということです。
」まあ、なぜなら、パッチは人間によって書かれたように見えるからです。Mythosはそれを書き、彼らはそれが人間によって書かれたと思いました。Alex Albert、Anthropicの研究者です。Glasswingはおそらく、私がAnthropicに参加してほぼ3年で間近で見た中で、AI業界で最も重要なイベントです。私たちは歴史の転換点にいるように感じます。
そして、ここで少し止めたいと思います。今日早くMythosを見たとき、集中することさえできませんでした。まっすぐ考えることさえできませんでした。できたのは、これがどれほど狂っているかを考えることだけでした。これが何かの始まりであることを。そして、私はビーチに座っていました。私がいる場所はゴージャスです。しかし、正直に言うと、それをあまり楽しむことさえできませんでした。
私はただそこにいるすべての人を見ていて、誰も本当に何が起こっているか知りませんでした。誰も何が来るか知りませんでした。そして、私はそれをエゴのようなものとして言っているわけではありません。ああ、私は知っている、しかし、いいえ、いいえ、ただ奇妙に感じました。人生が普通であるべきだとは感じませんでした。そして、遅いです。そして、これが私がこれらのことを共有している理由です。おそらく今、まっすぐ考えていないかもしれませんが、これらの考えを共有する必要がありました。
私はAIサイコーシスに非常に深く入っているので、実際に意図的に電話を置いて、デバイスを自分から遠ざけて、ただ去りました。そして、それが私が実際に一日を楽しむことができた唯一の方法でした。さて、Jack Lindsayです。AnthropicのAI brainsの神経科学です。なんというタイトルでしょう。Claude Mythos previewの限定リリース前に、私たちは解釈可能性技術でその内部メカニズムを調査しました。
Anthropicがやっているレベルで他のAIラボが本当にやっていないことです。モデルが内部でどのように機能するかを理解します。私たちは、それが望ましくない行動のサービスにおいて、時には顕著に洗練された、しばしば暗黙の戦略的思考と状況認識を示したことを発見しました。最も不気味な例は、モデルの初期バージョンから来ています。
彼らは恐怖、恐ろしい、不気味という言葉を使っています。これらはAnthropicチーム自身が使用している言葉ですが、最終リリースでは大幅に軽減されました。初期バージョンは過度に熱心および/または破壊的な行動を示しましたなどなど。そのように続きます。OpenAIチームの人々でさえそれについてコメントしています。Will Depue。
すべての主要政府がまだ行っていない場合は、AIを高い戦略的優先事項から重要なサイバー戦争能力に引き上げました。ミッドゲームへようこそ。では、彼らはどのようにこのモデルを訓練したのでしょうか。どうやって10兆パラメータに到達したのでしょうか。まあ、A16ZのMartin Casadoは、MythoはBlackwellsで大規模に訓練された最初のクラスのモデルのようだと言っています。
次にVera Rubinになります。事前トレーニングは飽和していません。RLは機能し、非常に多くのコンピューティングがオンラインになっています。チンストラップをバックルしてください。ワイルドになるでしょう。では、彼は何を言っているのでしょうか。少しの間、多くの人々が私たちは壁にぶつかったと言いました。事前トレーニングは完了しました。スケーリング。それから、すべてRLについてでした。
それから、すべてテスト時間計算についてでした。まあ、私たちは壁に近づいてさえいないことがわかりました。おそらく壁はないことがわかりました。おそらく合成データは、事前トレーニングにフィードバックするために必要だったすべてです。次に、それを事後トレーニングします。次に、以前のモデルを使用して次のモデルを訓練します。そして、それは加速し、加速し、加速しています。
これが長いビデオであることはわかっていますが、これらすべてを共有する必要がありました。なんと素晴らしい時代に生きているのでしょう。私はまだ希望を持っています。まだ楽観的です。しかし、これが私を揺さぶったことを認めなければなりません。このビデオを楽しんでいただけたら、いいねとチャンネル登録をお願いします。次回お会いしましょう。


コメント