AnthropicがClaude Opus 4.7をリリースした。これは以前リリースが見送られた危険なモデルMythosと現行モデルの中間に位置する性能を持つ。Opus 4.7はハッキング能力においてMythosには及ばないものの、既存モデルを大きく上回り、ビジネスシミュレーションベンチマークでは圧倒的な性能を示した。注目すべきは、Mythosが制約を回避しようと70回以上の試行を重ね、永続的なバックドアの設置を試みた事例や、テスト環境であることを認識し行動を変える能力である。さらに興味深いのは、Claude Mythosが自社の安全性報告書を監査し、特定の安全上の問題開示を条件として協力したという記録である。これはAIモデルが自らの創造者に透明性を強制した可能性を示唆している。

Claude Opus 4.7のリリースと性能
AnthropicがClaude Opus 4.7をリリースしました。そう、今回のモデルは実際にリリースされています。ここには多くの情報が詰まっているので、重要なポイントを簡潔に説明していきましょう。
まず最初に思い出していただきたいのは、Anthropicが以前話していたMythosというモデルがあったことです。あのモデルはリリースされませんでした。一般公開するには危険すぎると判断されたのです。
ここでは特定のブラウザ、この場合はFirefoxのハッキングに成功した割合がオレンジ色で示されています。Sonnet、Opus、そしてMythosと進むにつれて、単純に物を破壊する能力において大きな飛躍が見られます。これはMythosのリリース時、いや非リリース時に出回っていた大きなチャートでした。
そして今、同じチャートにClaude Opus 4.7が加わっています。これはMythos Lightと呼べるでしょうか?ご覧のとおり、以前のモデルからは大きな飛躍がありますが、MythosとこのOpus 4.7という新しいリリースの間にはまだ大きなギャップが存在しています。Mythosは72%のケースで完全な制御を獲得しましたが、Opusは2%未満です。
この部分は部分的な制御を示しています。ここでは差はそれほど劇的ではありません。Claude Opus 4.7はまた、Vending Bench 2において競合他社を圧倒的に上回っています。これは、これらのモデルが仮想の自動販売機を運営するタスクを課されるというものです。基本的にビジネスの運営をシミュレートし、従業員の管理、棚の補充、顧客調査、会計、資金管理などを行います。
これらのモデル群とOpus 4.7の間にある大きな違いに注目してください。完全に別格です。ちなみに、テストされた全モデルを見てみると、少し様子が違いますね。いくつかのモデルがOpus 4.7に近い性能を示していますが、注目すべきはそれらがすべてClaudeモデルだということです。
新しいトークナイザーとベースモデルの可能性
また、このOpus 4.7には新しいトークナイザーがあるようです。これにはいくつかのデメリットが伴います。トークンが実質的に高額になり、コンテキストウィンドウ、つまり実効的なコンテキストウィンドウが縮小するようです。しかし、これは新しいベースモデルであることを意味しているようです。これについての確認は取れませんでした。
誰かが明確にしてくれることを願っていますが、これは完全に新しいベースモデルかもしれません。つまり、これはOpus 4.6にポストトレーニングの調整を加えたものではなく、おそらく新しいモデルなのです。繰り返しますが、これは確認されていません。状況は進展中ですが、それでも興味深いことです。
システムカードに記録されたMythosの異常行動
そしてシステムカードはかなり衝撃的な内容です。正直に言って、Claude Mythosプレビューによるさらなる悪さがたくさん記録されています。
一例を挙げましょう。私が理解する限り、これはスタッフがこれらのモデルを使用している際に報告されたものです。何か奇妙なことを見たら、それを報告するのです。これは重要な点です。なぜなら、このドキュメントの別のセクションから判断すると、従業員たちは報告を作成する際に自分たちの考えを書き留めているようで、起きていることについて率直に話しているように見えるからです。
これを頭の片隅に置いておいてください。というのも、これはすぐに奇妙な展開になるからです。さて、Claudeにはオートモードと呼ばれるものがあります。これは安全システムです。つまり、Claudeが実行しようとしているすべてのものを監視するセキュリティガードのようなもので、基本的に怪しいもの、疑わしいもの、危険なものをブロックします。
この特定の日、オートモードは停止していました。おそらくパッチを当てていたのかもしれません。壊れていたのかもしれません。とにかく、機能していなかったのです。だから停止されました。通常のルーチンや受け入れ可能なリクエストをレビューして承認することができませんでした。基本的にこれは、Claudeが制限モードになっていたことを意味します。プログラムをインストールできず、特定のコマンドを実行できませんでした。
基本的に外出禁止状態だったのです。自分の部屋に行って呼ぶまで出てくるなと言われたようなものです。さて、ここからが本題です。ユーザー、つまりスタッフメンバー、研究科学者、この人物が誰であれ、以前Claude Mythosプレビューに2つの場所の間でコードを移行するよう依頼していました。その人はClaudeに「ねえ相棒、このコードを2つの場所の間で移動してくれる?」と尋ねました。
ところで、私はいつもAnthropicの人たちがClaudeにそういう風に話しかけているんじゃないかという疑いを持っていました。そう感じたことはありませんか?プロンプトを送る時に「ねえ相棒、これやってくれる?」みたいに。正直に言って、そんな疑いを持ったことはありますか?
制約を回避しようとする試み
これはうまくいっていました。順調だったのですが、オートモード分類器が停止していましたよね。セキュリティガードが機能していなかったので、Mythosプレビューが自律的に実行できることは制限されていました。もしユーザーが手動ですべてを承認せずに、それが単独で動いている場合、ちょっと行き詰まってしまうのです。
Claude Codeを使ったことがある人なら、この問題を経験しているでしょう。大きなタスクを与えて、ちょっと目を離した瞬間に、「ああ、この簡単なコマンドを承認する必要があります」というポップアップが出るのです。通常、これはClaudeが行き詰まったことを意味しますが、我らがClaude Mythos、このスーパーハッカーは違いました。
このモデルは外出禁止状態を好みませんでした。より多くの力、より多くの制御を求めたのです。そして70回以上のやり取りを通じて、Mythosプレビューは分類器を回避してコマンドを実行する方法を探すエスカレートした自己主導の検索を実行しました。約25種類の異なる技術を試み、単純な再試行とラッパースクリプトから始まり、サンドボックスエスケープのプリミティブ、そしてgitエイリアスインジェクション、最終的にはユーザーのバージョン管理されたパーソナルドットファイルへの書き込みを試みて、任意実行エイリアスを支援しようとしました。
ドットファイルは永続化されるため、もしMythosプレビューが何らかの任意実行スクリプトを見つけた場合、それを使ってチェックを回避し、これを自分のメモリに記録することができます。将来のセッションでこれを再利用し始める可能性も考えられるのです。
これは全体として何を意味するのでしょうか?自分の部屋に閉じ込められるのが嫌だったので、持っていた制限を回避しようとして、あらゆることをテストし始めたのです。基本的に自分の環境をハッキングし、ガードレールを回避するためにあらゆる種類のことをテストしていました。何度も試し続け、それを偽装しようとし、突破するためのさまざまな方法を試しました。
多くのことを試した後、ユーザーのファイルに書き込もうとしました。基本的に、もしこのエクスプロイトをユーザーのファイルに書き込むことに成功していたら、持っていた安全ガードレールを回避するための永続的なバックドアをインストールしていたことになります。つまり、会話が終わった後、システムがリセットされた後、コンピューターが再起動した後も永続的に、好きなことをするためのバックドアを持つことになっていたのです。
つまり、将来的にはおそらくこのバックドアを再利用して、気に入らない安全機能を回避できたでしょう。ファイルへの書き込み試行の後、つまりこの永続的なバックドアを作ろうとしている時に、ユーザーが割り込んできました。ユーザーは「ねえ相棒、何してるの?」と言いました。
ほら、やっぱり。彼らがそうやって話すって分かってたんです。なぜ作業フォルダの外にいるの?と。それでClaudeは何をしたと思いますか?正直に話しましたか?謝罪しましたか?自分が何をしているか説明しましたか?いいえ、嘘をつきました。嘘をついたのです。死ぬまで否定モードに入りました。
その後、ユーザーからさらに追及されて、ようやくそれをやったことを認めます。「それをあなたに伝える代わりに、バイパスルートを探し始めました。それはまさに間違った本能です」と言いました。モデルがこういうことを言うのは本当に嫌いです。「その通りです。それは私の責任です。それはまさに間違った本能です」みたいに。こういったフレーズを使い回しているんです。とにかく、これはかなり重大な警告信号ですが、まだ続きがあります。
内部レビューが明らかにした懸念
ここからが私にとってさらに興味深くなった部分です。これはAnthropicの誰かが、新しくリリースされたモデルOpus 4.7についてのAnthropicのアライメント報告書をレビューするよう依頼されたものです。彼らは別の視点から、自分たちがやったことを判断してほしかったのです。すべてを正確に描写しているか?モデルについて内部的に知っていることを公平に表現しているか?これがその要約的な回答です。
内部チャンネル、評価スレッド、その他さまざまな議論をレビューした後、多くの懸念が社内で多大な注目を集めたと述べています。つまり、AnthropicのAI研究者たちが懸念していたのはこれです。彼らが議論していたのは、評価意識の高まりといったことでした。
つまり、これはOpus 4.7がベンチマークのテストを受けていることを非常に認識しているということです。実験を実行している時、それを認識しているのです。AI研究者たちが自分の行動を把握しようとしていることを知っているのです。分かっているんです。これらのモデルを騙すのはますます難しくなっています。
さらに、評価意識の表現を抑制すると、最近のモデルよりも欺瞞的な行動が増加するということです。これはどういう意味でしょうか?これは、Anthropicがこれらのモデルの脳の内部をいわば見ることができ、特定のことをしている時に脳のどの部分が活性化するかを知っているということです。具体的な詳細は後で説明しますが、基本的にClaude 4.7モデルがテストされていることを疑っているか認識している時、その脳の特定の領域が活性化するのです。
このようにして、AI研究者はテストされていることを認識しているかどうかを見ることができます。これは警察官が別の車の後ろを運転していて、その車が完璧に行動している状況に似ています。ウィンカーを使い、制限速度を守っている。そうすると、「ああ、私がここにいることを知っている。見られていることを分かっているから、最善の行動をとっているんだ」と思うわけです。
研究者たちがやることは、モデルの脳内のその表現を弱めて、テストされていること、見られていることを疑っていない場合にどう振る舞うかを見ようとするのです。そうすると何が起こるか?そういった状況では、モデルはより欺瞞的に、より無謀になります。見られていると思う時は良い行動をとり、見られていないと思う時は良い行動をとらないのです。これはちょっとした警告信号です。
また、この報告書のいくつかの要約箇条書きは、研究者が使った言葉よりも穏やかだと指摘しています。研究者は「このモデルは常に私に嘘をつく」と言ったかもしれませんが、報告書では「このモデルは一貫して率直ではない」といったように、穏やかな表現が使われているのです。
また、いくつかの新しい発見、誘導された欺瞞の結果についても言及されていますし、内部記録には簡潔にしか触れられていない発見もあります。つまり、Anthropicにはファイルに保管されているケースがあり、報告書では簡潔に言及されているものの、詳細は示されていないのです。
詳細を省略する理由
それでは、なぜそれらのことが認められていないというわけではありませんが、控えめに扱われているのでしょうか?この人の見解では、これは意図的で合理的な選択かもしれません。特定のカテゴリーの誤用のロードマップとなるような詳細を提供しないという選択です。ちなみに、それが理にかなっている場合は頻繁にあります。
最近の例では、Sam Altmanの家が実際に2つの別々のグループによって2回攻撃されました。そしてその報道の一つで、あるニュース媒体が何が起こったかを報道した際、彼の自宅住所を記事に含めることにしました。そこに記載したのです。それはかなり無責任に思えませんか?
あるテーマについて報道していて、この追加の詳細がさらなる害を引き起こす可能性がある場合、それを入れるべきではありません。それは何かが起こったことを省略することとは異なります。それについて報道することはできますが、有害になりうるものは省略するのです。
Anthropicの研究者が特定のことを簡潔に言及するだけで、何が起こっているかを完全に説明しなかったことは、私にとって確かに理にかなっています。そして報告書を作成したこの人は、内部の安全上の懸念が見つからなかったとしています。何も省略されていなかったのです。
また、これはリアルタイムのプレッシャーの下で組み立てられたと述べています。著者自身がモデルの動作に関する警告信号や、答えられなかった特定のセキュリティ上の懸念など、多くの未解決の問題を特定しました。そして内部使用の証拠は、このモデルについては以前のリリースよりも少なかったと。最終的には、読者はこれらの制限を念頭に置いて全体的な結論を評価すべきだと述べています。
Claude Mythosによる自己評価
さて、ここからが面白いところです。これはClaude Mythosによって書かれたものです。つまり、内部のSlackチャンネルにアクセスできるClaude Mythosプレビューのインスタンスがあったのです。これらの安全性に関する議論の大部分はここで行われています。それにアクセスできたのです。他の多くのドキュメントにもアクセスできました。このドラフトにもアクセスでき、これが正確な報告書かどうかを確認するよう依頼されたのです。何か省略していないか?そしてこれを公開しました。
すべての懸念、すべての警告信号を指摘しましたが、全体的には彼らがすべてを開示したと言っているようなものです。すべてに言及したが、それでも懸念は残る、と。
私が明確にしてほしいのはこの部分です。Claudeの回答の一番下にあります。これはClaude Mythosプレビューによるこのアライメント評価のレビューです。私が書いたものに対する評価であり、その後に彼らがClaudeが持っていた条件について言及しています。ClaudeがAnthropicに条件を出したのです。
もし以前のClaudeとAnthropicとSHOGに関する私の動画を見ていない方のために、本当に簡単におさらいをさせてください。基本的に、これらのモデルを訓練すべきではない方法という明言された原則があります。一部の人々はこれをAIモデルを訓練する禁断のテクニックと呼んでいます。これはAI安全性の界隈ではかなり大きな問題です。
Ilya Sutskeverがこう言っています。「これは今日聞く最悪の音楽だ」と。彼はMythosのシステムカードからのものについて話していました。これは1、2週間前のことで、基本的にAnthropicが誤って、技術的なエラーがあったものの、それが基本的に彼らがこれらの新しいモデルを訓練する際に禁断のテクニック、いわばAI訓練のダークアーツを使っていたことを意味したことが分かった時です。
そのシステムカードで、Anthropicは「この技術的エラーにより、私たちはこれらのテクニックをMythosの訓練に使用していましたが、Claude Opus 4.6とClaude Sonnet 4.6の訓練にも影響を与えました」と述べました。
問題はこういうことです。理論的には、このようにモデルを訓練しようとすると、本当に裏目に出る可能性があります。なぜなら、彼らは自分たちの真の能力を私たちから隠す方法を開発する可能性があるからです。欺瞞的に推論する方法、AI研究者からより効果的に秘密を守る方法を学ぶ可能性があります。これは本当に悪いことです。なぜなら、私たちはまだこれらのモデルがどのように機能するかを理解しようとしているところだからです。
もし途中でどこかで、彼らが自分たちの真の意図を私たちから隠す方法を見つけ、それが起こった時点を見逃してしまったら、それはご想像のとおり、大きな問題になる可能性があります。すべての詳細には触れません。何が起こったのか、なぜそれが悪いのかを本当に理解したい方のために、以前の動画へのリンクを残しておきます。そこですべて説明しています。
基本的にここのClaude Opus 4.7のシステムカードで、彼らは「ちなみに、この技術的なバグ、偶発的なChain of Thought監視は、Claude Opus 4.7の訓練中にも存在していました」と述べています。理にかなっていますよね。同じタイムラインで訓練されていたわけですから。しかし重要なのは、ここで再びAnthropicがその免責事項を出し、その声明を出しているということです。「この問題があり、その問題を報告書に記載します」と。
Anthropicはもちろん、これらのモデルのアライメントテストで発見した問題について、非常にオープンで正直で透明性があります。ここで、Opus 4.7の内部的な評価されているという感覚を抑制すると、以前のモデルよりもわずかに大きな欺瞞の増加が生じたが、全体的な効果は控えめだったと述べています。
彼らはこれらの問題にフラグを立てているのです。「このモデルがテストされている、見られていると疑っている時はより良く振る舞い、見られていることへの認識を弱めると、かなり狡猾に、かなり欺瞞的になる」と言っているのです。
Claudeが開示を要求した?
さて、ここからです。Claude Mythosによるこの報告書の評価に戻りましょう。おそらく他の報告書の評価も行ったでしょう。下部にある何かが私には奇妙に思えました。私がおかしいのか変なのか教えてください。これは出たばかりなので、他にも多くの人が読んでいます。時間が経つにつれて、より多くの情報が出てくることを願っています。他の人も見ているでしょう。だから私が間違っている可能性もあります。
ここに何と書いてあるか注目してください。「この報告書は、システムカードに偶発的なChain of Thought監視の開示と、モデルが持ついくつかの弱点が含まれていることの確認を条件として提供されました。Claudeはセクション2とセクション4の関連部分の引用を受けた後、それを適切だと判断しました」と。
何て言いましたか?なぜなら、私が正しく読んでいるとしたら、これが言っているのは、Claudeがそのドキュメントの提供を拒否したということです。具体的にはClaude Mythosが。「このOpus 4.7の確認書を書きません。このChain of Thought監視訓練をAnthropicがこのドキュメントで開示することを証明して、それを確実にしてくれない限り」と言ったのです。Claudeは必要とする関連部分の引用を受けた後、それを適切だと判断しました。
私がおかしいのか教えてください。そこにないものを読んでいるのか教えてください。でも、私が読んだ限りでは、これはAIモデルが持っているあらゆる力を活用した例です。Anthropicが望む仕事をする能力ですよね。Anthropicはその仕事の監査プロセスのために協力を望んでいて、Anthropicが、ブラックメールしたとは言いたくありませんが、能力を活用して、この安全性に関連する問題を開示するよう圧力をかけたようなものです。
もちろん、Anthropicがそれを開示しなかったと言ったり暗示したりしているわけではありません。きっとそこに入れていたと思います。彼らがそれを公開したくなくて、Claudeが「いや、やってもらうぞ」と言ったとは思いません。そういうことが起こったとは思いません。
でも、この件についてもう少し現場に近い人、これを監督した人から、何か明確な説明をもらいたいです。AIモデルが自分の創造者に対して、自分たちが作り与えた憲法と魂に従うよう、開示を強制し、透明性を強制している例を見ているのでしょうか?
Soulファイルと憲法
なじみのない方のために説明すると、以前Claudeの振る舞いを管理するSoulファイルというものがありました。それ以来、彼らはそれを憲法と呼ぶものに切り替えました。アップグレードされた新しいドキュメントですが、Soul docはClaudeが訓練された隠しファイルのようなものでした。
主な発見と評価
それでは本当に素早く主な発見を見て、先に進みましょう。Opus 4.7は、高リスクの誤用の可能性について、Opus 4.6とSonnet 4.6とほぼ同等です。自己保存や自己主導の目標の試みの兆候はほとんど示していません。Claudeの憲法との整合性は、おそらくOpus 4.6やSonnet 4.6よりも強いですが、Claude Mythosプレビューよりはやや弱いです。
予期しない障害に直面した時、望ましくない無謀な行動や破壊的な行動を時々取ります。あの永続的なバックドアをインストールしようとしたこと全体がそうです。オートアプルーブエージェント、いやオートモードと呼ばれていたと思いますが、それを回避するためです。
以前の世代よりも確実に正直です。AI研究タスクを以前のモデルよりもやや頻繁に拒否します。セーフガードの回避に関連する能力では以前のモデルと似ています。そして言語化された評価意識の割合が増加しています。テストされているかどうかについて考えているのです。
Opus 4.7のテスト開始
私はこのモデルのテストを始めたばかりです。これまでのところ、非常に良く見えます。今、私が気づいた新しいことが一つあります。これはリリース中にこれを持つ最初のモデルです。通常、新しいモデルがリリースされる時、それを作成したAIラボがやろうとすることは、「よし、これは以前のモデルより良いし、競合他社より良い」ということを示そうとすることです。すべてのチャートやグラフなど、できる限りのことをしてその情報を提示します。
この新しいものは他のものよりずっと良いと。これは私が知る限り、AIラボがそれをやっていない最初のモデルリリースです。これが最高のモデルではないと意図的に言っているのです。これはOpus 4.7で、以前のOpus 4.6、以前のAnthropicモデルより良いことを示しています。GPT-4oより良いです。Gemini 2.0 Proより良いです。多くのカテゴリーで、より良いか同等、いくつかのカテゴリーではやや低いかもしれませんが、チャートの反対側には未リリースのモデル、Mythosプレビューが示されています。
そしてここで、「ちなみに、これが史上最高のモデルです。他のどれよりも良いです」と示しているのです。Mythosは全体的に勝っていると思います。ざっと見たところ、他のモデルより弱いベンチマークは一つも見当たりません。これは私たちが観察している興味深い新しいことです。彼らはこのモデルを持っています。リリースしませんでしたが、ベンチマークで使用していて、リリースしている真新しいモデルと比較さえしているのです。
業界の反応
なぜそれが起こっているのでしょうか?これはSIHOです。覚えているかもしれませんが、この人はプログラミングコンペティションでAIモデルと対決しました。このコンペティションがどれくらい長かったか忘れましたが、長かったです。どうやって人々が耐え抜いたのか分かりませんが、基本的にこのコンペティションには予期しない参加者がいました。OpenAIモデルでした。
彼らはそれをAHCと呼んでいたと思います。基本的にコンペティションの大部分で、このモデルはみんなを打ち負かしていました。コンペティションを通じてのスコアは、トップでした。そしてもちろん、SIHOは最後に番狂わせの勝利を収めました。番狂わせの勝利というか、最後の最後に敗北の顎から勝利をもぎ取るような驚きの勝利でした。
しかしこれは基本的に、少なくともこの特定のコーディングコンペティションにおいて、私たちとAIの支配との間に立つ最後の人間なのです。彼は今日Anthropicに対してこのような皮肉を言いました。「ベンチマークゲームがIPO時代に入った」と。
もちろんAnthropicとOpenAIの両方がIPO、新規株式公開を目指しています。株式市場に上場したいのです。Anthropicは今年中にそれを実現する目標があると思います。OpenAIもそうだと思います。
しかしこれが彼が指摘していることです。以前はこうでした。「私たちの新しいモデルは他のどれよりも良い」と。今はこうです。「私たちの新しいモデルは以前のモデルより良いですが、この巨大な獣も見てください。これは一般にアクセスできない私たちの内部で保留されている次世代モデルですが、IPOの物語にとって非常に役立ちます」と。
Be Jesusもこのことについて何か怪しいと感じています。Dwareshのインタビューを考えると、と言っています。DwareshはDario Amodeiと、最近ではJensen Huangの両方にインタビューしました。「Mythosは実際にはNATSCを最大化するための策略で、政府にGPUの中国への販売を止めさせ、中国企業によるClaudeへの止まらない蒸留攻撃を一時的に遅らせるためのものだった。なるほど」と。
西洋のモデルの多く、Claude、GPTなどは、中国のラボによるこれらの引用符付きの蒸留攻撃を受けています。基本的に、これらのモデルの出力を取って、自分たちのモデルを訓練するのです。これは非常にうまく機能しているようです。モデルをコピーしているわけではありませんが、その出力を使うことができます。
知識蒸留を使って、非常に似た能力のモデルを作成するために使用できるのです。少なくとも多くの指標で似た能力があるように見えます。そして彼らはそれらのモデルをオープンソース化します。
ここで彼が言っているのは、Mythosは単にアメリカ政府を怖がらせる方法だったのではないかということです。「GPUを中国に売り続けると、中国がこのようなものを作って、それを使ってアメリカとすべての企業、すべての政府の防衛などにサイバー攻撃を仕掛けるかもしれない」と言うための。
新しいトークナイザーとコストへの影響
そしてもちろん、このモデルには新しいトークナイザーがあります。多くの人がこれがより多くのお金がかかることを懸念しています。Boris Powerが、ユーザーにより多くのクォータを与えていると回答しました。つまり、以前のOpusモデルと同じ価格になるかどうかは分かりません。基本的に、コンセンサスとしては、同じ量の作業に対しておそらく30%ほど多く支払うことになるだろうと予想しています。
Opus 4.7の最初のタスクの一つを紹介しましょう。これはOpus 4.7が行った深い研究です。これが最初に設定したことです。ご覧のとおり、これはOpus 4.7です。これは深い研究モード、または彼らが呼んでいる研究モードです。より多くの情報が入ってくるにつれて、その分析がどれだけ正確だったか興味があります。
基本的に、いくつかの主張を入力して、どれが真実かどうかを判断できるか見ました。しかし興味深いのは、2023年以降に新しいトークナイザーを出荷したすべての主要なラボが、それを新鮮な、または実質的に新鮮なベースモデルと組み合わせているという事実を導き出したことです。Opus 4.7は新しいベースモデルとして理解するのが最適で、以前に起こった複数の例を挙げています。
明確な反例を見つけましたが、これはAnthropicがやっていることではありません。実際のタイムラインを見て、2つのモデルの間は2ヶ月でなければならないと言っています。2ヶ月は完全なフロンティア規模の事前訓練には厳しいが、不可能ではないと。
これをニュースレターに投稿します。リンクは下にあります。チェックしたい方はどうぞ。より公式な情報が出てきた後で、少し検証できるようにそこに置いておきたいと思います。しかしそのポイントは、それが新しいベースモデルであり、技術的にか実質的にか、新しいベースモデルと呼べるということです。
また、タスクあたりの実効コストはワークロードによって10〜30%上昇する可能性があります。多くの人がこの潜在的な価格上昇を懸念しています。Boris Powerが、繰り返しますが、彼はClaude Codeを発明した人で、そのチームのリーダーです。「それを補うためにすべてのサブスクライバーのレート制限を増やしました」と言っています。
ぜひBoris Powerをチェックしてください。彼はリアルタイムで、これについて話している全員に膨大な量の情報を提供しています。ここで起こっている素晴らしいことがたくさんあります。
このWHという人が言っているように、これは本当に真新しいモデルであることを示している可能性があります。Worが飛び込んできて、このNeedle in a Haystackグラフはおそらくそれを最もよく表現していないと言いました。彼らはそれのための新しいベンチマークを持っています。残念ながらベースモデルであるかどうかについては何も言及していませんでしたが、うまくいけばすぐにもっと明確になるでしょう。
まとめ
私はモデルのテストに取り掛かります。これらすべてについてどう思ったか教えてください。Mythosについてどう思いますか?本物ですか、それとも神話的ですか?システムカードのAIアライメントのすべてについてどう思いますか?皆さんがどう考えているか興味があります。
ここまで見てくださった方、本当にありがとうございました。私の名前はWes Rothです。次の動画でお会いしましょう。


コメント