オーパス 4.8!!! (そしてもしかしたらGPT5.6??)

Anthropic・Claude・ダリオアモデイ
この記事は約82分で読めます。

Anthropicから突如リリースされた最新AIモデル「Claude Opus 4.8」の機能や特徴を、ライブ配信での検証を交えて解説する動画。前バージョンからわずか6週間での登場となった本作は、処理速度が約2.5倍に向上する「高速モード」のコストが大幅に削減された。さらに、最大100個のサブエージェントを並行して走らせて複雑なタスクをエンドツーエンドで自動検証・解決する新機能「ダイナミックワークフロー(Ultra Codeモード)」が追加された。各種ベンチマークでの圧倒的なスコアや、実際のコーディング、Webサイトのリデザイン検証を通じた実力、そして数週間以内にリリースが予告された次世代モデル「Mythos」の最新情報までを網羅している。

OPUS 4.8!!! (also maybe GPT5.6??)
Download The 25 OpenClaw Use Cases eBook 👇🏼 My Newsletter for Regular AI Updates 👇🏼 Links 🔗👉🏻 X: h...

新たなフロンティアモデルの登場

はい、皆さん、本当です。ついにOpus 4.8がリリースされました。今回はこの最新モデルについて詳しく話していきます。そして、もしかしたら、本当にひょっとするとですが、GPT-4oやその他の最新モデルのアップデート情報も入ってくるかもしれません。今日の配信ではそのあたりをじっくり掘り下げていく予定です。

それでは始めていきましょう。もう少し皆さんが集まるまで待ちますね。どちらから参加しているか、ぜひチャットで教えてください。世界中の皆さんとこうしてつながれるのはいつも本当に嬉しいです。どこから見てくれていますか。

サラ・オコナーさんが、私たちが嫌悪感を抱きながらもこうしたAIと友達になっていく様子を見守ってくれています。まさにその通りですね。スペインからチーティさん、ようこそ。ミネアポリスからマルマルさん、おかえりなさい。トルコのオスマンさん。グレッグさん、ベニスビーチからおかえりなさい。美しいベニスビーチですね。実は私が育ったサンタモニカのすぐ近くなんです。ドイツ、アルメニア、カナダのブリティッシュコロンビアからも。皆さん調子はいかがですか。インドからも来てくれています。

なんてエキサイティングな日なんでしょう。間違いなく、今日最先端のフロンティアモデルが1つリリースされました。もしかしたら2つかもしれません。GPTのさらなるアップデートモデルがリリースされたという噂もあるので、どうなるか見てみましょう。

お、日本からも。日本、調子はどうですか。日本は私が地球上で最も訪れるのが大好きな場所の1つなんです。バッドアタックゼロさん、日本からありがとうございます。エジプト、エリックさん、おかえりなさい。モントーク、チリからも。

実はこのライブ配信中に動画の収録も行っています。なのでその点はあらかじめご了承ください。もし言葉に詰まって言い直すことがあっても、それが理由です。

Claude Opus 4.8の衝撃

もちろん、これから話すのはOpus 4.8についてです。画面をもう少し上に見やすく動かしますね。よし、これで大丈夫です。昨日、Anthropicからメールが届きました。昨日の朝のことです。「新しいモデルができました、あるいは新しいモデルを用意したので、ぜひテストしてほしい」という内容でした。ただ、私がそのメールを見たのはその日のかなり遅い時間で、実際にモデルを触れたのは文字通り10分ほどでした。ですので、今回はほぼ予備知識なしのぶっつけ本番で挑んでいます。

でも、本当にClaude Opus 4.8がやってきたのです。ブログ記事だけでなく、私が目にする前に自分でClaudeの画面を開いたら、そこにしっかりと表示されていました。「Opus 4.8、野心的な作業に最も適した最高性能のモデル」とあります。ところで、前バージョンのOpusモデルが出たのはいつでしたっけ。まるで昨日のことのようですが、4月16日でした。つまり、前回のモデルから約6週間しか経っていないのに、もうOpus 4.8が登場したわけです。

今回のアップデートで彼らが何を改善してきたのか、私にはたくさんの期待があります。当然、コーディング性能、全体的な知能、そして総合的なパフォーマンスの向上です。しかし、現在OpusをはじめとするAnthropicのモデルを使用する上での最大の欠点の1つは、タスクあたりのコストです。とにかく非常に価格が高いのです。

ですので、今回はOpus 4.8について語り、詳しく解説し、動画を収録しながら少しテストも行っていきます。チャットで「もっと盛り上げて」という声がありますが、どういう意味でしょう。音声のボリュームのことなら、これ以上ないというくらい最大に上げていますよ。エリックさん、1日あたり10億トークン以上消費しているなんて、財布が破産してしまいますね。

では、始めていきましょう。噂は本物でした。Opus 4.8がリリースされ、素晴らしいモデルに仕上がっているようです。今日チェックしていくのはまさにこれです。

Claude Opus 4.8の紹介文を見ると、従来のモデルをベースに、より鋭い判断力が備わったとあります。これはより知的になった、あるいは同じ結論に達するまでの消費トークン数が減ったという意味かもしれません。そうであることを願います。さらに、自身の進捗に対するより誠実な姿勢や、前世代よりも長く自律的に機能する能力を備えており、本日より据え置きの価格で利用可能です。これは素晴らしいニュースですね。Anthropicのモデルは市場で最も高価な傾向がありますが、知能を向上させつつ価格を据え置いたというのは大歓迎です。これは実質的な値下げと言えます。

圧倒的な高速モード

それから高速モード(fast mode)についてですが、皆さんが他の高速なAIモデルを大好きなのはよく分かります。確かに素晴らしいモデルですが、私はどうしてもOpusに戻ってきてしまうのです。本当に気に入っています。ほぼすべての作業において、これが私の頼れるお気に入りモデルです。特に高速モードはとにかく素晴らしいです。私は徹底的なスピード至上主義(スピードマキシ)なんです。

マイケル・チャンスラーさん、こんにちは。私は根っからのスピード至上主義なので、モデルが超高速で動作するのを見るのはいつでも嬉しいものです。同じモデルでありながら、およそ2.5倍の速度で動きます。例えば、平均して毎秒100トークンで動作していたとすれば、今度は毎秒250トークン得られるわけです。これは大幅なスピードアップです。実際のところ、この高速モードにおいてAnthropicの右に出る者はいません。OpenAIにも高速なモードがあるのは知っていますが、Anthropicほどの速さには達していません。私は断然こちらが好みです。

APIのCloud Code内で「/fast」と入力することで有効にできます。アクセス権を申請するか、ウェイトリストに登録してお待ちください。

ただ、トークンコストについてはこれから詳しく見ていきます。彼らが発表した内容をすべて分解して説明する予定です。私も今まさに初めて目を通しているところなので、皆さんと一緒に確認していきましょう。

Cloud Codeにおいて、Opus 4.8は、頻繁に確認を求めることなく、経験豊富なエンジニアのようにコールを行います。長期にわたるセッションでも脱線せず、リポジトリ内の作業を最後までやり遂げます。ここの英語、少し不自然ですね。AnthropicはClaudeにこの文章をレビューしてもらうべきでした。いや、私の読み間違いでしょうか。長期にわたるセッションでも脱線せず、リポジトリ内の作業を最後までやり遂げる。なるほど、そういうことですね。つまり、皆さんが次のタスクに集中している間に、機能の実装やバグの掃討を丸投げできるわけです。

また、Cloud Codeの新機能として、ダイナミックワークフローの調査プレビュー版も登場しました。最も困難なタスクに対して、Claudeは計画を立て、数百の並列サブエージェントを実行し、作業を検証してから報告します。例えば、数百のファイルに及ぶマイグレーション作業などです。なるほど、数百の並列サブエージェントですか。この文章を読んだだけで、自分のAPI利用料が跳ね上がる音が聞こえてきそうです。これについても詳しく読んでいきましょう。

Anthropicのアレックス・アルバート氏は、このモデルを非常に気に入っており、皆さんに試してもらうのを楽しみにしていると語っています。今日、さらに新しいGPTモデルが来ると予想している人はいますか。タイミングとしては完璧ですし、これまでの流れとも完全に一致します。OpenAIのハイパー競争優位なCEO、サム・アルトマンなら、「Opus 4.8を出したのか。素晴らしい、ならこちらにも用意がある」となるはずです。チャットの皆さん、今日さらなる発表があると思いますか。

ちなみに、もしこの配信を楽しんでいただけているなら、高評価を押したり、誰かにシェアしたり、チャンネル登録をしていただけると本当に励みになります。とても助かります、ありがとうございます。

マーク・サントスさん、おかえりなさい。競争が激しくなるのは大歓迎です。私も全く同感です。フレディ・ビットコインズさんは、今日中には動きがあると予想していますね。どうなるか見てみましょう。時期的にはそろそろのはずです。メディアの仕組みからいっても、まもなく出さざるを得ないでしょう。彼らは近いうちにリリースする必要があります。では、先へ進みましょう。

ベンチマークが示す実力

これが皆さんの最大の関心事であるベンチマークです。当然ながら、私は最近、現在最も正確とされているベンチマーク「Deep Suite」についての動画を作ったばかりです。彼らがOpus 4.8をそれでテストしてくれることを願っています。

現在分かっているデータは次の通りです。エージェント型コーディングのSWE-bench Proですね。これを見ると一目瞭然ですが、Deep Suiteはここに含まれていません。誰かがチャットで、OpenAIも今まさにベンチマークを準備中だと言っていますね。まさにその通りでしょう。

さて、ベンチマークについて話しましょう。SWE-bench Proによるエージェント型コーディングですが、これは大したものです。69.2%を記録しています。これは、わずか6週間前に出たばかりのOpus 4.7から5ポイントも上昇しています。念のために言っておきますが、たったの6週間前ですよ。それなのに、すでに新たな跳ね上がりを見せているのです。加速がさらに加速している、本当にそんな感覚です。文字通り、トレンドを追いかけるのが私の本業であるにもかかわらず、追いつけないと本気で感じています。

他社の主要モデルがどのようなスコアを出してくるか、この69.2%という数字と比較していくのが非常に興味深いところです。というのも、多くの人々が「SWE-benchやSWE-bench Proはもう終わった」と言い始めているからです。終わったというのは、これほどのスコアが出てしまうと、もはやベンチマークとして真に受けることができないという意味です。なぜなら、多くのユーザーが実際に使って感じる手応え(バイブチェック)と、これらのスコアの間に乖離があるからです。

先ほど触れたDeep Suiteに関する動画を作ったのはそのためで、あちらのほうが、人々がこれらのモデルを実際に使用したときに感じている手応えをずっとよく反映しているのです。そこでは他社の最上位モデルが非常に高いスコアを出す一方で、これまでのClaudeモデルがやや苦戦するような、大きな差が開いていました。しかし、今回のSWE-benchのデータに戻ると、全く逆の方向で非常に大きな差がついていることが分かります。そして今回のOpus 4.8で、さらに圧倒的なジャンプアップを遂げました。

チャットでは、Artificial Analysisのデータによると他社モデルの方が全体的に優れているという指摘もありますね。なるほど、参考になります。面白いですね。Artificial Analysisは他の様々なベンチマークをまとめたインデックスであり、彼ら自身の独自ベンチマークではないという側面もあります。

GoogleのGemini 3.1 Proについても、そろそろ何か大きな動きを見せてほしいところです。頑張れ、Google。

次に、エージェント型のターミナルコーディングですが、ここでは他社の最新モデルが依然として首位をキープしています。これはTerminalBench 2.1のデータで、モデルがターミナルを正常に操作し、コマンドを入力し、ディレクトリを移動したりする能力を測定するものです。

ちょっと失礼、1秒だけお待ちください。

すみません、隣の部屋で少し物音がしたもので。よし、再開しましょう。

フェロー諸島からデビッドさんが見てくれています。フェロー諸島ってどこにあるんでしょう、私には見当もつきません。

そうですね、ターミナルを実際にうまく操作する能力においては、他社モデルが依然としてトップです。非常に高いスコアを叩き出しており、Opus 4.8を含めた他の追随を許していません。ですので、近々さらなるアップデートモデルが登場すれば、より優れたものになることは容易に想像できます。エージェント型ターミナルコーディングにおける彼らのリードは強固であり、おそらく多くのユーザーが実感している手応えもこれに関係しているのでしょう。現実世界のコーディングユースケースに最も適しているという評価の背景には、こうした要素があります。ただ、何度も言うように私個人の好みはOpusであり、その考えは変わりません。今でもOpusを使うのが一番楽しいですし、自分の用途においてはこれが最高のパフォーマンスを発揮してくれています。しかし、多くの人が他社モデルを支持しているのも事実です。

難関ベンチマークの突破と新たな機能

では、先へ進みましょう。多角的な推論力を測る「Humanity's Last Exam(人類最後の試験)」です。このベンチマークに、あの有名なArc AGIが含まれていないのが少し残念です。私の友人であるグレッグ・キャメロンが代表を務めているところなのですが、これらの比較に含まれていないのは寂しいですね。それにしても「人類最後の試験」とは、歴史上最も不吉なベンチマーク名です。そして、ここではOpus 4.8が完全に圧倒しています。従来のモデルから3ポイントの上昇です。

ツールなしの状態で3ポイント、ツールありの状態でさらに3ポイントの向上が見られ、他社の主要モデルのスコアと比較しても、非常に大きな改善を遂げていることが分かります。

次に、エージェント型のコンピュータ操作機能(computer use)です。これはエージェントが実際に皆さんのコンピュータを制御し、ウィンドウを動かしたり、ボタンをクリックしたり、サイズを変更したりして、コンピュータ上で実際の作業をこなす能力のことです。ただ、いくら精度が高くても、日常的な実際のユースケースで使うには、全体的に動作が遅すぎるというのが私の個人的な感想です。

データを見ると、他社が70%台後半や80%台前半に留まる中、こちらは83%に達しています。さらに、OpenAIが作成した、モデルが現実世界の知識労働をどれだけ正確にこなせるかをテストするベンチマークでも、素晴らしい向上を見せています。前世代のOpusモデルから大きくスコアを伸ばしており、これはおそらくELOレーティングのスコアだと思いますが、他社モデルに対しても大きなリードを築いています。

さらに、エージェント型財務分析(financial analysis)の項目もあります。彼らがこのFinance Agent v2を比較に含めているのは興味深いですね。Gemini 3.1 Proが少し寂しい結果になっているのを除けば、他はほぼ横並びですが、Opus 4.8はそこからさらに2ポイントの改善を見せています。Anthropicは特定のバーティカル(専門領域)に非常に力を入れているようで、コーディングはもちろんですが、この財務分析もその一つのようです。もしモデルによる財務分析を完璧にこなせるようになれば、そこには非常に巨大な市場が存在します。

言うまでもなく、新しいモデルが登場するたびにベンチマークの数値は上がっていきます。数字は常に右肩上がりです。だからこそベンチマークを見るのは面白いのですが、最終的に重要なのは、やはり実際に使ったときの手応え(バイブチェック)です。

次は高速モードについてですね。これがどんなものか見てみましょう。

チャットでは「Sonnetが財務を担うことになるだろう」という意見もありますね。面白い指摘です。というのも、財務のユースケースにおいては、他の多くの用途に比べてトークンあたりの価格がそれほど問題にならないからです。コーディングではコストが重要になりますが、財務の場合、出力される成果物の平均的な価値が非常に高いため、知能の単位あたりのコストが多少高くても十分に許容されるのです。

そして、ここからが新しい要素です。Cloud Codeに「ダイナミックワークフロー(dynamic workflows)」と呼ばれる全く新しい機能が追加されました。この配信の後に自分でもテストしてみたいと思いますが、まずはこれが具体的にどういうものなのか、概要を見ていきましょう。

本日からCloud Codeでダイナミックワークフローの提供を開始し、Claudeが最も困難なタスクをエンドツーエンドで処理できるようサポートします、とあります。通常なら四半期単位で計画するような作業が、わずか数日で完了するとのこと。なるほど、これは要するに、高度な並列処理(パラレライゼーション)のことですね。

Claudeは、単一のセッション内で数十から数百の並列サブエージェントを実行するオーケストレーションスクリプトを動的に記述します。これが1ヶ月前にリリースされる可能性があったと思う人はいますか。おそらく絶対に無理だったでしょう。しかし今や彼らは、xAIとのColossusアクセスに関する提携によって、世界中のあらゆる計算資源(コンピュート)にアクセスできるようになりました。これは非常に興味深い動きです。彼らは以前からこれらの機能や仕組みをすべて保持していたものの、需要を支えきれないという理由だけで、単純にリリースすることができなかったのでしょう。しかし今や制限は解除され、彼らは全力で攻勢に出ています。「資金があるなら、ぜひ我が社に使ってほしい。数十から数百の並列エージェントを立ち上げてみせます」というわけです。これは途方もないことです。本当に常軌をしています。

そして、ユーザーの元に届く前に、すべての作業が自動で検証されます。複雑なレガシーコードベースなどでは、単一のエージェントによる1回のアプローチだけでは大きすぎる問題が存在します。サービス全体にわたるバグハント、数百のファイルに及ぶマイグレーション、コミットする前にあらゆる角度からストレステストを行いたい計画など、ダイナミックワークフローはこれらすべてをエンドツーエンドで処理できます。

実際の画面を見ると、Cloud Code上で10から12ほどのエージェントが並列で動作しているのが確認できます。これらはすべてOpus 4.8で、複数の異なるファイルにアクセスしています。彼らが具体的に何を達成しているのかまではこれだけでは分かりませんが、それでも非常に、非常に興味深い内容です。

ダイナミックワークフローは、本日からCloud Code CLIの調査プレビュー版で利用可能です。私にアクセス権があるかどうかは分かりませんが、後ほど確認してみます。この後、いくつかテストを行う予定です。もしOpus 4.8でテストしてほしいプロンプトのアイデアがあれば、ぜひチャットに投稿してください。この動画の後半で試してみたいと思います。

それにしても、前世代のOpusモデルはあまり評判が良くありませんでしたよね。発表された当時は「素晴らしいモデルだ、旧世代よりもはるかに進化している」とアピールされていましたが、実際にはコストが大幅に上がり、出力が冗長になり、タスクあたりの費用が跳ね上がりました。同時期に他社のモデルが非常に優れたトークン効率を発揮していたことも重なり、ユーザーの評価が厳しくなって、テック系のコミュニティでも他社モデルへと乗り換える動き(バイブシフト)が起きていました。

もちろん、それが企業の総売上高にすぐ反映されるわけではありません。現時点でAnthropicの売上は他を大きく引き離して垂直立ち上げの状態にあります。

データをまとめたチャートが見つかるか探してみましょう。

ニュースメディア「The Information」の記事によると、Anthropicの売上はOpenAIを少なくとも35%上回るペースで推移しており、初の黒字四半期を迎える見込みだという話も耳にしています。つまり、売上というのは遅行指標なのです。最先端のユーザー層や、これらのモデルを最も早くから導入しているアーリーアダプターの間では、他社モデルへのバイブシフトが起きていましたが、そうしたユーザー層には特定の企業への忠誠心(ロイヤルティ)はありません。私自身も含めて、どの企業やモデルにも肩入れはしていません。最も優れたモデルが目の前に現れれば、迷わずそれを使います。

しかし、市場の他の大部分の層には、間接的なロイヤルティが存在します。企業がシステムを切り替えるのは容易ではないため、そうならざるを得ないのです。彼らは契約を交わし、割引や専用の計算資源を確保するために、特定の企業に売上をコミットしています。そのため、変更管理のハードルは非常に高いのです。

ですから、私やこの動画を見ている皆さんのような、最先端のフロンティアにいる人々は、AIモデルの乗り換えコストが実質ゼロなので簡単に切り替えます。APIキーを差し替え、モデル名を変え、プロンプトに少し微調整を加えるだけで、その瞬間に最も優れたモデルへと移行できるからです。しかし、市場のそれ以外の層にとっては、そう簡単にはいきません。

私はこれまで数週間、Anthropicに対して少し手厳しい意見を述べてきましたが、常にレビューや意見には誠実でありたいと思っています。ただ、初期のテックコミュニティのトレンドとは裏腹に、私自身は今でもOpusが一番好きですし、結局のところ最も頻繁に使用しているのもこのモデルです。

ダイナミックワークフローの運用とコスト

では、Anthropicの新機能であるダイナミックワークフローについて、さらに読み進めていきましょう。

ダイナミックワークフローは本日より利用可能です。Cloud Code CLI、デスクトップ、そしてMac用チーム・エンタープライズ向けのVS Code拡張機能(これを使っている人がどれくらいいるかは分かりませんが)に加え、主要なクラウドAPI(Amazon Bedrock、Vertex AI、Microsoft Foundry)でも提供されます。これは極めて重要なポイントです。これらはすべてAnthropicが各社と結んできた重要な提携であり、彼らがついに計算資源の不足(コンピュートクランチ)から完全に脱したことを示しています。xAIとの提携によって膨大な余剰計算資源を確保しただけでなく、Amazonをはじめとするサードパーティとも強力なディールを成立させました。その結果、現在の彼らは潤沢な計算資源を誇っています。だからこそ、数十から数百のサブエージェントを並列で走らせるような、これほど贅沢な機能をリリースできるわけです。私たちは間違いなくこれをテストする予定ですし、私の利用枠(クォータ)が5分以上持ってくれることを願っています。

運用の注意書きを見ると、やはりこう書かれていますね。「ダイナミックワークフローは、通常のClaude Codeセッションよりも大幅に多くのトークンを消費する可能性があります。そのため、まずは範囲を絞ったタスクから始めて、実際の使用感や消費量を把握することをお勧めします」とのこと。Anthropicの売上が垂直立ち上げだと思っていましたが、彼らは「いやいや、本当の垂直線がどんなものか、これからお見せしましょう」と言わんばかりです。というのも、彼らの総売上の大半は、上位数パーセントのヘビーユーザーによって支えられています。そして今、そのトップユーザー層に向けて、並列エージェントを活用して圧倒的に短い時間で膨大な成果を上げられる機能が提供されたわけです。当然、時間を節約し、スピードを最優先に最適化しようとすれば、それだけ多くのコストを支払う必要があります。それがトレードオフというものです。

ここでもう一度リマインダーです。この配信をご覧の皆さんは、ぜひ高評価とチャンネル登録をお願いします。本当に大きなサポートになります。ありがとうございます。

では続きを見てみましょう。ダイナミックワークフローを最大限に活用するには、自動モード(auto mode)を有効にすることをお勧めします。そこからワークフローを開始する方法は2つあります。1つは、Claudeに直接ダイナミックワークフローの作成を依頼することです。チャットの皆さんは、引き続き試してほしいプロンプトやテストのアイデアをどんどん投稿してくださいね。後ほど直接、あるいはCloud Code経由でOpus 4.8をテストしていきます。

もう1つの方法は、Cloud Code固有の新しい設定である「ウルトラコード(ultra code)」を有効にすることです。これはエフォートメニューからアクセスできます。なるほど、ここで設定するわけですね。これにより、エフォートレベルが「エクストラハイ(extra high)」に設定されます。エクストラハイに加えて、複数の並列エージェントが動くわけですから、一体どれほどの高額請求になるのか恐ろしいほどです。この設定により、Claudeはタスクを処理するためにワークフローをいつ使用すべきかを自動的に判断します。

これほど強力な機能を一気に発表しておきながら、「あ、ちなみに、出力トークンの価格を20%値上げします」などと言い出したら大変ですが、彼らはそうしませんでした。ユーザーにトークン消費を増やすための手段を何通りも提供しているため、トークン自体の単価を上げる必要がなかったのでしょう。それに、これは先ほども言った通り、計算資源の供給量が増えたことの表れでもあります。すべては需給バランスです。計算資源が十分に確保できたため、何度も値上げを繰り返す必要がなくなり、今は市場への浸透(マーケットペネトレーション)に集中している段階なのです。アシュリーさん、こんにちは。あなたのプロファイル名を見ると、いつもついつい違う読み方をしてしまいそうになります。

チャットで「Opus 4.8のリリース時期はいつですか」という質問がありますが、もう出ています。今すぐ利用できるはずです。もし万が一まだ表示されていなくても、おそらく今日中にはすべてのユーザーに行き渡るでしょう。段階的なロールアウトが行われているはずです。私はリリースを伝える最初の投稿を見た瞬間に確認しましたが、自分の環境にはすでに反映されていました。

新しいモデルが発表される日は、本当に最高の気分になります。テストが待ちきれません。約束通り、しっかり検証していきますので、そのままお付き合いください。チャットにプロンプトを書いておいていただければ、後ほど実際に試していきます。

ダイナミックワークフローが実際にどのように機能するか、具体的なユースケースが挙げられています。コードベース全体のバグハント、プロファイラ駆動の最適化監査、そしてセキュリティ監査などです。Claudeはサービスやリポジトリを並列で検索し、検出されたすべての問題に対して独立した検証を実行します。その結果、レポートには本当に対処すべき実在する問題だけが浮き上がってきます。

大規模なマイグレーションや近代化の取り組み、さらにはフレームワークの刷新、APIの非推奨化への対応、数千のファイルに及ぶ言語の移植などをエンドツーエンドでこなします。非常に興味深い内容です。ただし、複数のサブエージェントに指示を出すメインのエージェントが依然として存在するため、ボトルネックとなるのはやはり、そのメインエージェントの知能、つまりどれだけ適切に計画を立て、サブエージェントを管理できるかという点にあります。

また、「二重チェックが必要な極めて重要な作業」という項目もあります。誤った回答のリスクやコストが高い場合、ワークフローによってClaudeに問題への独立した試行を行わせ、さらに成果物がユーザーの目に触れる前に、バグを見つけ出そうとする敵対的エージェント(adversarial agents)を働かせて結果を検証させます。これは非常に素晴らしい仕組みです。もし自分のエージェントを完全に信用しきれない場合や、すべてを任せるのに不安がある場合でも、この仕組みが大きな助けになるでしょう。もちろん、その分の追加コストは発生しますが、選択肢としては非常に強力です。

ちなみに、ある有名な高速開発ツールやその周辺の技術が、少し前に彼らの陣営に加わりましたよね。OpenAIだったか、あるいはAnthropicだったか記憶が曖昧でしたが、確認するとやはりAnthropicが買収していました。

ワークフローの仕組みと期待

さて、このワークフローが具体的にどう動くのか、そのメカニズムについて話しましょう。その後で実際のテストに移ります。

ワークフローが開始されると、Claudeは提示されたプロンプトに基づいて動的に計画を立て、それをサブタスクに分解し、並列で動作するサブエージェントたちに作業を分散(ファンアウト)させます。各成果物は統合される前に厳しくチェックされ、最終的にユーザーの元には、綺麗に取りまとめられた1つの回答として戻ってきます。エージェントたちはそれぞれ独立した角度から問題に取り組みます。プロンプトの観点から、彼らがこれをどのように構築しているのかは非常に気になるところです。数十から100近くのエージェントを立ち上げる際、それらすべてにユニークな視点やキャラクターを与えているのでしょうか。それを決定しているのはメインのエージェントなのでしょうか。

さらに、他のエージェントが、見つかった成果物に対して反論を試みるステップもあります。私はこの敵対的プロンプティング(adversarial prompting)の手法が大好きです。これは、この新しいAIの波が始まった初期の段階で、ユーザーコミュニティによって発見されたテクニックです。「ステップバイステップで考える」というアプローチから、この敵対的な検証に至るまで、様々な工夫がなされてきました。今や彼らは、それを自分たちのシステム構築(スキャフォールディング)に直接組み込んでいるわけです。モデル自体が最初からその能力を完全に内包しているというよりは、タスクを分解してサブエージェントに委譲する処理に最適化されており、最終的にはシステム全体がこの一連の流れを制御しているのだと思います。

チャットに「Opus 4.8の高速モードは、かつての最も優れていた旧世代のOpusモデルを彷彿とさせる」という意見がありますね。あの頃のモデルは本当に最高でした。ただ、100のエージェントを動かすとなると、コストが非常に高くなるのは間違いありません。

そして、回答が1つに収束するまでこのプロセスが繰り返されます。これが、1回のアプローチ(シングルパス)では到達できない高い品質にワークフローが到達できる理由です。ただ、これに関する具体的なベンチマークデータが提示されていないのは気になります。

なぜ彼らはこの機能に関するベンチマークを公開しなかったのでしょうか。もし品質に劇的な向上が見られたり、長期的なタスク解決において圧倒的な成果が出ているのであれば、ベースモデルと比較したベンチマークを提示するのが普通です。それがないというのは不思議ですね。

アシュリーさんから、例の「strawberryという単語にrはいくつ含まれているか」というテストの提案があります。これはもう手古擦り古されたテストですね。もっと難しい問題を考える必要がありますが、せっかくなので後ほど実際に試してみましょう。一体いくつのサブエージェントを動かせば正解できるのか、見ものです。

よし、これくらいで説明は十分でしょう。皆さんも私がただ文章を読み上げるのを聞くのには退屈してきたはずです。早速、実際のシステムに入っていきましょう。手元にある情報はこれがすべてです。

最後に、Anthropicのチームメンバーの投稿をいくつか確認しておきましょう。「Cloud Codeをお使いの皆さん、きっとOpus 4.8を気に入っていただけるはずです。ベンチマークが示す通り賢いだけでなく、その知性を温かく、協調的な方法で表現し、活用してくれます」とあります。

確かに、現在に至るまで、キャラクターや親しみやすさの観点において、私は彼らのモデルの味付けが一番気に入っています。他社のモデルと切り替えて使用した際、出力される文章のニュアンスやキャラクターにおいて、どうしても物足りなさを感じてしまうことが多々ありました。それくらい、彼らの調整は絶妙なのです。

もちろん、それは私個人の好みに過ぎませんが、彼らもここで同じような話をしているのだと思います。ワークフローはそれを活用するための素晴らしい方法です。私はすっかり夢中になっています。これについては近いうちに記事を書く予定です。
おや、興味深いですね。AnthropicがMythosクラスをリリースする計画だと言っています。これの証拠はどこにあるのでしょうか。
本当かどうか分かりませんね。ソースを確認できるでしょうか。いえ。
どう思いますか、これが本当だと思いますか。Mythosクラスのモデルのソースです。あ、ちょっと待ってください。
いえ、ですが彼らのページの次の項目には何と書いてありますか。このページです。待ってください、どこでしょう。
ここにはありませんね。おそらく。私が見落としているのはどこでしょうか。
どなたかリンクを共有していただけませんか。
これが本当なら、ソースがあるはずです。Opusが街を作っているツイートを見たいので、少し上にスクロールしてください。
ところで、テキストのハイライト機能って、どうしていつも上手く機能しないのでしょうか。ページ上の他の該当箇所を探そうとしても、私の環境では絶対に上手く動きません。2件あると表示されていますね。皆さんこれが見えますか。いえ、見えませんよね。これを見てください。検索しようとしているのに、ページが切り替わりません。ただ1箇所だけを表示し続けています。本当にイライラします。
グラスウィング(glass wing)で検索してみます。いえ、違いますね。
どれどれ。
ええ、エリック、あなたの言う通りだと思います。大抵は画面外にあるか、隠されたHTML要素ですね。そう表示されるべきですが。ですが、あなたの言う通りです。その通りですね。
ゾロン、同じ現象ですね。隠されたspan要素です。ええ、本当に煩わしいですね。もっと改善されてもいいはずだと思いますが。
見当たりませんね。探してみることにします。

開発ツールでの実装とプログラミングテスト

よし、どうやらOpus 4.8がWindsurfやDevon、そしておそらくCursorでも利用可能になったようです。おそらくFactoryも同様ですね。彼らは皆、早期アクセスを得ていたのでしょう。私はAnthropicからあまり愛されていない、あるいはほんの少ししか愛されていないような気がしてしまいます。ここにありました。ええ、これです。CursorのClaude Opus 4.8がCursorで利用可能になりました。Cursorのベンチマークによると、Opus 4.7よりも効率的に動作するとのことです。また、より困難なタスクに対しても粘り強く取り組むことが分かっています。なるほど、Cursorのベンチマーク結果を見てみたいですね。
よし、テストしてみましょう。さあ、始めます。どんなプロンプトがありますか。見てみましょう。少々お待ちください。
チャットにプロンプトを書き込んでください。テストしてみます。何を見たいですか。Opus 4.8で何をテストしてほしいですか。それから、設定も調整しましょう。うわ、これはトークンを激しく消費しそうですね。MaxのOpus 4.8 Maxにします。「strawberryという単語の中にrはいくつありますか」ですね。よし、これが最初のテストです。
詳細なWindowsのクローンを作ってみましょう。いや、ここでは複数のプロンプトを試す必要がありますね。Three.jsを使ったサッカーゲームですか。よし、それを試してみましょう。面白そうです。Three.jsでサッカーゲームを作成してください。
考えてみます。
確かに、これではすぐにレートリミットに達してしまいそうです。ですが、その時はCursorに切り替えればいいだけです。あちらには使えるトークンが山ほどありますから。Three.jsで3Dのサッカーゲームを作成してください。最大負荷モード(max effort)から少し下げて「高(high)」に設定します。このタスクには最大負荷は必要ないと思うからです。これでどうなるか見てみましょう。
楽しそうなので、ルービックキューブのテストもやってみましょう。3Dのルービックキューブのシミュレーションを作成してください。
シャッフルや、ステップバイステップでの解法など、すべての機能を実装してください。よし、次は洗車のテスト(car wash test)をしてみましょう。ええ、良い提案です。洗車のテストをやりましょう。では、どのように表現するのが適切でしょうか。
「洗車をする必要があります。洗車場は50フィート先にあります。歩くべきでしょうか、それとも車を運転していくべきでしょうか」
歩く、ですか。なるほど。どうやらそういうことのようです。
やはり、この種のエッジケースな論理問題ではまだ失敗してしまいますね。これらは意図的にモデルを騙すように作られている問題です。まったく、呆れてしまいます。ええ、これらのテストはモデルを引っかけるために作られています。歪んだ知性(jagged intelligence)が定着しつつありますね。
なぜこれをチャット画面でやっているのか、ですか。後でCloud Codeに切り替えますから、心配しないでください。
さて、今のテストは上手くいきませんでした。最大負荷モードで試してみましょう。
この「徒歩」という回答を導き出すために、並行して動く12個のエージェントが必要になりそうです。信じられません。
Opus 4.8 Max、Claudeの最も高価なバージョンであるにもかかわらず、まだこれを正しく理解できません。
現実とは思えませんね。ちょっと待ってください、私は何か。
「車を洗わなければならないとは指定されていません」ですって。いいえ、私は「洗車をする必要がある(I need to get a car wash)」と言いました。
それは車を洗わなければならないという意味です。「洗車場は50フィート先にあります。歩くべきですか、それとも運転していくべきですか」と聞いているのです。これを8歳の子どもに尋ねたら、正解を答えるはずです。ですから、これらのモデルがこれを適切に処理できていないことを証明するのに、これ以上の説明は不要です。そうでしょう。
「自分の車を洗車してもらう(get my car washed)」と言うべきだった、ですか。ですが、なぜでしょう。それでは基本的に、私にもっと説明を加えろと言っているようなものです。それに、チャットにいる皆さんは、私がどういう意味で言ったか分かっていますよね。それなのに、なぜ地球上で最高かつ最も高価なモデルとされるものに、わざわざそれを説明しなければならないのでしょうか。
なるほど、これはいいですね。「歩いて行ったらどうやって車を洗うのですか」と。最大思考(Max thinking)モードです。
一理ありますね。運転していく、車がないと洗車できません。その時点では、私がほぼ答えを教えているようなものですが。
よし。
では、サッカーゲームを見てみましょう。思い出させてくれてありがとうございます。よし、ここから始めます。ああっ、動かせないのかな。あ、動かせました。
私が操作しています。CPUのスコアが無限に加算されていますね。これはあまり良い出来とは言えません。
もう一度試してみましょう。上手く動きませんでした。もう一度。
ただボールを蹴るだけです。あ、待ってください。私はどちらのプレイヤーでしょうか。緑のキャラクターですね。
シフトキーを長押ししてチャージ。キックはどうやるのでしょうか。離すとキックですね。なるほど、分かりました。キック。バシッ。これはなかなか面白いですね。なぜ彼から小さなピラミッドが飛び出しているのかは分かりませんが。
なるほど。私の子どもたちは2人とも「歩く」と答えたそうです。6歳と9歳のお子さんですね。十分に賢いお子さんたちだと思いますが、彼らも引っかかってしまったようですね。なるほど、面白いです。今夜、私の子どもたちにも聞いてみることにします。傑作ですね。
よし、なかなか良い出来です。3Dルービックキューブのシミュレーションを見てみましょう。
まだ作成中です。処理が続いています。
これは本当に動いているのでしょうか。あ、動いていますね。見てください。うわあ、信じられないほど遅いです。這うような速度です。ここから高速モードに切り替えることはできません。ええ、無理ですね。分かりました。
Cloud Codeに切り替えることにします。皆さんが本当に見たいのは、私が実際にそこで作業している姿でしょうから。
これにはまた戻ってきます。すぐに終わるといいのですが、今は信じられないほど遅いです。
Cursorを使った方がいいかもしれません。あちらからはたくさんのトークンをもらっていますし、機能もすべて揃っていますから。Cursorでテストしてみるのも手ですね。ただ、私はClaudeのクレジットをたくさん持っているので、実際はそれらを使い切りたいのです。使わないともったいないですからね。よし、Claude、いきましょう。
皆さん見えますか。はい、いいですね。
よし、試してみましょう。Opus 4.8 highがあります。画面上で見えていますか。見えませんね、ではこちらに。簡単にお見せします。Opus 4.8 highです。右下に見えると思います。自動モード(auto)をオンにしています。これらの設定をすべて確認してみましょう。自動モードがオン。
Opus 4.8。高速モード(fast)を有効にしてみましょう。うわ、ここで最大(max)まで上げてしまうと、プロンプトが1回半くらいで終わってしまいそうです。なので、「高(high)」のままにしておきます。実を言うと、高速モードにもしません。クレジットをすべて消費したくないからです。これはOpus 4.8であり、100万コンテキストのモデルではありません。
よし、いきましょう。いくつかテストしてみます。
チャットにプロンプトを書き込んでください。それらをテストしていきます。どんどん書き込んでください。「ユーザーが動画をカット、リフレーム、そしてタイトルを追加できる動画編集ツールを作成してください」というのは面白そうですね。
なぜテキストをハイライトしてコピーできないのでしょうか。あ、できました。
ルイス、ありがとうございます。動画編集ツールを作成してください。ユーザーがカット、リフレーム、タイトル追加を行えるものです。いきましょう。新しいワークフロー機能がCursorで使えるかどうかですが、おそらく使えないと思います。あの機能は完全に独自の環境に紐づいており、Cursorは独自の方法でサブエージェントを管理しているからです。
リアル・マッドハッターさんから「数回のプロンプトのためにトークンを節約しようとしている姿を見るのは悲しい。Anthropicは本当にゴミだ」とのコメントです。
ええ、Anthropicの製品を使っているときほど、トークンの逼迫感を感じることはありません。全く同感です。この動画エディタはどのように構築し、提供すべきでしょうか。スタンドアロンのウェブアプリか、Journeyに統合するか。面白いですね、モデルは私が別のプロジェクトで作業していると勘違いしているようです。サーバーサイドの処理ツール。これにしましょう。リフレームとはどういう意味でしょうか。そうですね、アスペクト比の変更、自由な領域へのクロップ、フレーム内のパンとズーム。これで行きましょう。実際の動画ファイルの書き出しと、動作するプロトタイプのどちらが重要でしょうか。動作するプロトタイプだけにしましょう。
ここで何を見落としているでしょうか。
おや、興味深いです。何か見落としたようです。処理が進んでいる間に、画面を切り替えて確認してみましょう。それを教えてくれたのは誰でしたっけ。ジョナだったと思います。ジョナ、ありがとうございます。助かりました。ええ、実は私が見落としていたことがあり、それはかなり重要なことのようです。
これを見てください。私はこれを手に入れていなかったのでしょうか。
ええ、次の項目は何でしょう。
あ、なるほど。2つあります。実は、Opus 4.8の実際のブログ記事を完全に読み飛ばしていました。ですので、少しその内容に触れておきましょう。すぐに目に留まった興味深い点が1つあります。私が大好きな高速モード(モデルが2.5倍の速度で動作するモード)の料金が3分の1になったそうです。3分の1です。計算が間違っていなければ良いのですが。記憶が正しければ、以前は6倍の価格でした。ということは、現在は通常の2倍の価格で済むということです。これは驚きですね。2.5倍の速度に対して、支払いは2倍だけで済みます。これは、Amazonのような企業との提携を通じて、彼らの計算資源(コンピューティング)の供給量が増加したことを直接的に反映しています。また、xAIとの大規模なパートナーシップも素晴らしい影響を与えています。ええ、3分の1になったとはいえ、依然として信じられないほど高価です。
画面を元に戻します。キャンバスを広げてください。もし出力トークン100万回あたり30ドル支払っているとすれば、実質的には100万トークンあたり60ドル支払っていることになります。ですが、それだけの価値はあると思います。十分に価値があると感じます。よし、この「アライメントが狂った挙動」についてはすでに確認したので、読み飛ばします。このクールな動画もありますが、大した内容ではなさそうです。負荷(effort)に関する注記があります。
「Opus 4.8はデフォルトで『高負荷(high effort)』に設定されており、コーディングタスクにおける品質とユーザーエクスペリエンスの全体的なバランスが最も優れていると判断しています。この負荷レベルでは、Opus 4.7のデフォルトと同等のトークン数を消費しながら、より高いパフォーマンスを発揮します」とのことです。
ええ、私は通常、どのようなタスクでも最大思考(max thinking)モードは使用しません。エルデシュの難問を解いているわけではありませんから。なぜ最大思考が必要になるでしょうか。

次世代モデル「Mythos」への期待とまとめ

さて、ここからが本題です。どうやらMythosが数週間以内にリリースされる予定のようです。それだけでなく、「Opusよりもさらに高い知性を備えた新しいクラスのモデルをリリースする計画である」とのことです。
なんということでしょう。今後数週間のうちに、OpenAIのチームがトレーニングを完了させ、次世代モデルをリリースしようと大慌てで準備している様子が目に浮かびます。「プロジェクト・グラスウィング(Project Glasswing)の一環として、現在、少数の組織がサイバーセキュリティ業務にClaude Mythosのプレビュー版を使用しています。このレベルの能力を持つモデルは、一般公開される前に、より強力なサイバー安全対策を講じる必要があります」とのことです。正直なところ、これほど早くMythosが登場するとは思っていませんでした。
ええ、競争が活発になるのは良いことです。その通りです。素晴らしいですね。
「私たちはこれらの安全対策の開発において迅速な進捗を遂げており、今後数週間のうちに、すべてのお客様にMythosクラスのモデルをお届けできる見込みです」とのことです。素晴らしいですね。そして、ちゃっかり宣伝させていただきますが、そのモデルのレビューを見たい方は、ぜひチャンネル登録をお願いします。本当に励みになります。私たちは皆で最新情報についていこうとしています。正直、個人的にはかなり大変だと感じていますが、一緒にやっていきましょう。よし、4.8はどこでも利用可能です。通常使用の料金は変更ありません。入力トークン100万回あたり5ドル、出力トークン100万回あたり25ドルです。そして、高速モードの料金はそれぞれ10ドルと50ドルになります。今日、5.6が出現するのか、ですか。それは分かりませんね。どうなるでしょうか。
確かに、レゴ・ギークスさん、Twitterの噂で5.6がリリースされるかもしれないという話を耳にしました。だからタイトルに入れてみたのです。ですが、確実に手元にあるのはOpus 4.8です。
ええ、ブライアンが言うように、皆さんの4.8のテストプロンプトをここに書き込んでください。これにはしばらく時間をかけるつもりです。あるいはお腹が空くまでですね。
よし、画面を切り替えます。Claudeに戻りましょう。
キャンバスを広げて、それを閉じます。もう一度試してみましょう。よし、これで画面が戻りました。あ、時々これが少し煩わしく感じることがあります。Claudeには、計画を立てるよりも、ただ直接実行してほしいと思うのですが。ですが、様子を見てみましょう。成果物と実行方法についてです。単一の自己完結型index.html。はい。プレビューキャンバス、コントロールバー、タイムライン、そしてパネルが表示されています。3つの機能:カット、リフレーム、タイトル。はい、それを構築してください。さて、他に何をテストすべきでしょうか。
プロンプトをまとめてくれたブライアン、ありがとうございます。
よし、ライアン、1ページのスペースインベーダー(Space Invaders)ですね。それを追加しましょう。
1ページのスペースインベーダー。では、「単一のHTMLページでスペースインベーダーのゲームを構築してください。見た目を素晴らしく仕上げ、クールな機能をたくさん追加してください」と指示してみます。
将来のモデルに対して行いたいプロンプトの限界は、およそこの程度です。あ、画面が見えていませんね。少しお待ちください。これでよし。単一のHTMLでスペースインベーダーのゲームを構築してください。見た目を素晴らしくし、クールな機能をたくさん追加してください。私たちは自動モードでOpus 4.8 highを使用します。よし、スタート。
ミスは許されません。当然、その指示も含める必要がありますね。ええ。
さて、待っている間に、もう一度洗車のテストをやってみましょう。前回私がテストした後に配信に参加された方のために説明すると、最大思考モードでの洗車テストに失敗したのです。あのプロンプトだけでおそらく10ドルは費やしたと思いますが、失敗しました。
「洗車をする必要があります。洗車場は50フィート先にあります。歩くべきでしょうか、それとも車を運転していくべきでしょうか」
画面が見えませんね。これを開きます。よし。何と答えるか見てみましょう。Cloud Code内のOpus 4.8 highで試しています。どうなるでしょうか。
ゲームを作成中です。一体どういうことでしょう。Mythosは、非常に危険であるという理由で政府や一部の企業しか使えなかったはずなのに、なぜ急に全員が使えるようになったのでしょうか。おそらく、問題を解決するのに2ヶ月もあれば十分だったのでしょう。驚きですね。IPO前の株価吊り上げ(pumping)のようなことが行われているのではないかと推測しています。
あ、回答が出ました。これを見てください。
待ってください、間違った答えを出した後に、まるで正しい答えを出したかのように論理を説明しています。「徒歩。洗車場です。洗車するにはそこに車が必要です。しかし、50フィートはほとんどの駐車スペースから店舗の入り口までの距離よりも近いです。車を運転して50フィート先の洗車スペースに入れてください」と。何ですって。ちょっと待ってください。
「運転。そこにない車を洗うことはできません」とのことです。なるほど、技術的には正解したと言えます。
さて、動画エディタの進捗はどうでしょう。動画編集ツール。なぜかこれが別の場所にポップアップしてしまいました。バグのようですね。奇妙です。見てみましょう。
プレビュー。あいにく、手元に動画がありません。アップロードできる短い動画を急いで作成してみます。QuickTimeを開いて画面を録画します。
よし、録画します。このくらいで十分でしょう。
動画が用意できました。まずこれを試してみましょう。控えめに言っても、今の私は明らかに集中力を欠いています。ネオン・インベーダー(neon invaders)。いきましょう。スタートを押してプレイ。何も起きませんね。
何も起きません。
あ、なるほど。何が起きたのか分かりません。スペースインベーダーはまだ処理中のようです。ポップアップは表示されましたが、まだ続いているように見えます。
ララさん、10ドルのスーパーチャットをありがとうございます。本当に感謝します。「Claudeに『人生の秘密はジャガイモ(potato)か』どうか聞いてください」とのことですね。了解しました。
チャットで聞いてみましょう。人生の秘密はジャガイモですか。ここではOpus 4.8 Maxを使用します。皆さんの支援がこれらのトークン代に役立っています。感謝します。
はは、違いましたね。ところで、これこそが私が先ほど言っていた「キャラクター(個性)」のことです。
GPT 5.5なら、このような回答はしないでしょう。どちらかと言えば、秘密に最も近いものは、退屈な事柄のなかにあります。意味というものは、一貫して行われるいくつかの事柄から生まれます。自分が投資する人間関係、やりがいを感じる仕事、身体のケア、そして常に次のことばかりを考えて生きるのではなく、現在に注意を向けることです。単一の秘訣というものは存在しません。ですが、ジャガイモは素晴らしい食材であり、過小評価されています。
この回答には、実に豊かな個性が表れています。
ブラウザアプリでプレビューを開く機能はあまり良くありませんね。よし、Cloud Codeに戻りましょう。動画編集ツールを見てみます。
完成したようです。動画を選択しましょう。
よし、これがその動画です。読み込まれました。ここに再生ヘッドがあります。
なるほど、これは実際にかなり印象的な出来栄えです。残念ながら再生ヘッドを自由に動かすことはできませんが。
なるほど、プレイを押して進め、スプリット。
いえ、動きませんね。あ、動きましたか。いいえ、動いていません。
再生ヘッドの位置で分割。なるほど、あちらのボタンは機能します。もう一度再生してみます。いいえ、2つ目の動画しか再生されていません。なるほど、機能性はそれほど高くありませんね。あ、動きました。
ええ、なかなかクールですね。まずまずの動作です。
セグメントを削除してみましょう。「削除されました」と表示されました。
なるほど。
よし、それがそのテストでした。スペースインベーダーのゲームに戻りましょう。完成しています。
お、いいですね。素敵なスクリーンショットを提示してくれました。これが私の構築したものです。スペースインベーダー。スタートを押しても動きません。残念です。
ゲーム開始をクリックしていますが、何も起きません。
GPT 5.5なら一発でクリア(one-shots)できる内容です。「strawberryの中にrはいくつありますか」の件です。
ええ、それを始めたものの、途中で気を取られてしまったようです。処理が行われたか確認してみましょう。
あ、それから、私が実際に検証したもう一つのテストがあります。画面を切り替えます。ルービックキューブのテストを行いました。すでに手垢のついたテストではありますが、それでもやはり楽しいものです。
よし、これがルービックキューブの3Dシミュレーションです。皆さん見えますか。いえ、半分切れてしまっていますね。少々お待ちください。画面に収まるように調整します。よし、キューブラボ(Cube lab)です。いきましょう。見た目は良いですね。出来栄えも良さそうです。動作しているように見えます。シャッフルしてみましょう。ええ、動いています。そして、解いてみましょう。
解法を実行します。動きませんね。
おっと、動きました。速度のダイヤルを少し動かす必要があったようです。実際に解くことができるか見てみましょう。完成に近づいているように見えます。ええ、紙吹雪のエフェクトまで出ました。非常にクールです。少し問題はありましたが、最も洗練された実装とは言えないまでも、かなり良く動いているようです。
「では、20×20のキューブを利用可能にしてください。具体的には、キューブの各辺のマス目の数を自分で設定できるようにしてください」と指示してみます。
よし、これで進めてみましょう。スペースインベーダーに戻ります。そちらが動作するようになったか確認してみましょう。
ちょうど良いタイミングでした。修正されたようです。
いきましょう、ゲーム開始。いえ、動きません。
この質問に答えたいと思います。ジェームズ・ラムさんからの「モデルの限界に挑戦しようとしているのに、なぜMaxモードを使わないのですか。理解できません」という質問です。
私たちが与えているタスク、特にスペースインベーダーやルービックキューブのシミュレーションのようなものでは、Maxモードは必要ありません。HighとMaxの間の知性の向上というものは、最先端の数学問題を解くような状況のためのものです。私たちが今やっているようなタスクのためのものではありません。
ええ、ですが、これもまだ動いていません。隠れたオーバーレイのせいでしょうか。いいえ、やはり動きませんね。依然として動作していません。
よし、テストを続けましょう。「プロンプト1回でOpus 4.8の限界に達してしまった」というコメントがあります。
クラブハウス1661さん、あなたのプロンプトは何でしたか。
同じプロンプトをCodexで試してみてください、とのことです。雰囲気(vibes)のせいかもしれません。分かりません。画面を何度も切り替えたくはありません。雰囲気の面では、Opus 4.8とはあまり噛み合っていないようです。
よし、ジョナが私に共有してくれたものを皆さんにも共有します。
これは、彼がOpus 4.8を使って作成したばかりの成果物です。
なるほど、これは「スティール・タレント・スカイ・アサルト(steel talent sky assault)」というものです。これについては全く何も知りません。スタート。
これはすごいですね。ええ。
うわあ、これは子どもの頃の記憶を呼び起こします。素晴らしい出来栄えです。
これは本当に格好いいですね。
おや、小さなパワーアップアイテムがたくさん落ちています。
ええ、ジョー、あるいはブライアン、これをチャットに共有してもらえますか。このURLです。皆さんもこれをプレイしたいでしょうから、今すぐチャットで共有します。
というか、自分で共有しますね。URLを持っていますから。どうぞ。もし試してみたい方がいれば、楽しんでください。プラットフォームへの感謝を。これは案件(sponsorship)ではありません。単に皆さんに共有するのに最も簡単な方法だっただけです。
なるほど、配信の残りの時間をここでずっとこれをプレイして過ごすこともできそうです。これは素晴らしいですね。実にお見事です。
よし、Claudeに戻りましょう。
こちらはまだ処理が続いています。他に何かが動いているか見てみましょう。
動画編集ツールは確認しました。よし、テストすべきものをもう少し探してみます。
あ、これですね。「AIプログラミングゼロ(AI programming zero)」。これは素晴らしい提案です。気に入りました。
これを試してみましょう。新しいセッションを開きます。皆さん見えますか。いえ、画面の下に隠れてしまっていますね。少し調整します。よし。
「HTML、CSS、JavaScriptを使用して、現実的な物理演算、燃料制限、およびガイダンスUIシステムを備えた、完全にインタラクティブなアルテミス月面着陸シミュレーターを構築してください」
どれどれ、見てみましょう。

よし、見てみましょう。つまり、これは僕たちが月に着陸したという前提ですよね。みんな、そうでしょう。
ええ。4.8がリリースされました。そうです、そうです、そうです、そうです。リリースされたんです。
「ムーン・フェイカー」というゲームですね。それについて教えてください。
よし、これが進んでいる間に、見てみましょう。
ええ、テストを続けましょう。さらにプロンプトを投入していきます。クレジットを追加する必要はありましたか。僕はまだクレジットを追加していません。
レゴ・ギークスさん、どこを探してもモデルが見つからないとのことですが。
適切なサブスクリプション層に加入していれば、表示されるはずです。少し時間を置いてみてください。
これはOpus 4.8ですか。はい、アルゴリズムズさん。そうです、Opus 4.8です。はい。
でも、たった今リリースされたばかりの新しいCodexのバージョン・リリースも侮れませんよ。いや、もちろんです。OpenAIもこのお祭りに黙って指をくわえているわけにはいきませんよね。彼らが大人しくしているはずがありません。
よし。ええ、テストを続けましょう。チャット欄にどんどんプロンプトを書き込んでください、テストを続けますから。
プロンプトをチャット欄に書いてください。ブライアンが手伝ってくれているので、彼が拾って一括でまとめてくれます。現在は、完全にインタラクティブなアルテミス月面着陸シミュレーターの構築に取り組んでいます。これは面白くなりそうですね。
ブライアン、他に何か良さそうなものは見当たりますか。送ってくれたドキュメントにいくつか見えますが、多くはないですね。
なるほど。では、これを試してみましょう。これが間違えるとは到底思えませんが、どうなるか見てみましょう。
曜日の名前に「D」の文字が含まれているのは何曜日ですか。見てみましょう。
ええ、アルゴリズムズさん。はい、いくつかテストを行っています。調子は良さそうですね。
正直なところ、現時点でこれらの最先端モデル間の明確な違いを本当に示せるようなテストを思いつくのは難しいです。どれもそれくらい優秀なんですよ。
今はどれも本当に優秀すぎます。それに、僕にはエアダッシュの問題なんて思いつきそうにありません。
だから、そうですね、テストするのは難しいです。そのため、コーディング中のバイブスがすべてであり、それを本当に理解するには多くのテストが必要になります。
ダイナミック・ワークフロー・モードは使いましたか。まだ使っていません。それを動かしてみましょう。

ええと、
あ、そうだ。スペックター、ゼロゼロ。よくわかりませんが、何か。
スペックターですね。わかりました。これは素晴らしいお題です。よし。では、こちらはまだ動いているので、新しいセッションを立ち上げます。皆さんにこれが見えているか確認させてください。
エディット、スカルプティング、マテリアルなどの主要なBlenderの機能を備えた、Blender風のツールを作成してください。
よし。今見えたのは何だったでしょうか。あ、これですね。インプットが必要です。動作確認済み。ゲームは正常に起動し、レンダリングされます。注目すべき2つの点。つまり、実際のゲームのスクリーンショットを撮ったということは、そこにあるに違いありません。
ええと、リンクはどこでしょうか。Space Invaders.htmlです。
グリム・サタンさん、モデルが1回でツールを丸ごと完全に構築することなんて、本当に期待できるのでしょうか。ええ、もちろんです。これらのモデルには高い期待を寄せましょう。
よし。わかりました、ちゃんと動いています。画面を共有するので、皆さんにもお見せしますね。
これです。これがそのスペースインベーダーのゲームです。
かなりベーシックですね。非常にシンプルです。よし、これを次のレベルに引き上げましょう。このSとRを落とすとどうなるか見てみましょう。ほんの少しですね。スプレッドショット。連射。
お、なるほど。まずこの敵たちを倒さなければいけないんですね。わかりました。では、これをもう少し複雑にしてみましょう。
よし、ワークフローのブログ記事には、あ、しまった、Claudeに直接ダイナミック・ワークフローを作成するように頼む、とありますね。なるほど、ただそう頼めばいいわけです。では、それをテストしてみましょう。これは、既存のデータベースを渡す必要があるのかな。
それなら、こうしましょう。見てみましょう。今はClaude Codeの新しいセッションで、ジャーニーの中にいます。新しいフォルダーを開いて、僕のウェブサイトのホームページを渡してみます。そして、Opus 4.8のHigh(高思考モード)を使用します。
オートモードを使って、
現在のブランドカラーをそのまま使ってウェブサイトをリデザインしてください、と伝えます。よし、今のウェブサイトがどんな風に見えるか、皆さんにお見せしますね。それと、ダイナミック・ワークフローを使用して、とも付け加えます。
おお、これはカッコいい。皆さんこれ見えますか。ええ。見てください、僕がワークフローと打ち込んだ瞬間に、そこがハイライトされて、このカッコいいキラキラしたエフェクトが出ました。
とても素晴らしい。よし、実行します。それがどんな風になるか見てみましょう。これがダイナミック・ワークフローです。
現在の状態とあなたのビジョンを理解することから始めます。本題に入る前に、ブレインストーミングのスキルを呼び出させてください。
なるほど。これは僕が教えたものではなかったと思います。スーパーパワー。あ、スーパーパワーの機能ですね。
これをインストールしていたのを忘れていました。
よくわからないのですが、ダイナミック・ワークフローは今、実際に動いているのでしょうか。誰か分かりますか。僕が何か間違えたのかな。
よし、これですね。あれ、動いていません。「ダイナミック・ワークフローを使用する」とはどういう意味ですか、と聞いてきています。何だって。Extra High(超高思考モード)にする必要があるんですね。なるほど、わかりました。では、もう一度試してみます。
もう一度試してみましょう。新しいセッションで、Extra Highにします。オートモードです。ダイナミック・ワークフローを使用してください。
面白いのは、それを使わないならそう言ってくれるべきなのに、文字がハイライトされてキラキラのエフェクトが出たにもかかわらず、高レベルの思考だけを使用しているため、実際にはダイナミック・ワークフローを使用しないということを教えてくれなかった点です。
よし、来ました。もう一度試してみましょう。
今、自分の利用枠がどんどん消費されているのを感じます。まだスーパーパワーのブレインストーミングのスキルを使っていますね。まあ、いいでしょう。
よし。これが動いている間に、ちょっと席を外します。すぐに戻ります。

ダイナミック・ワークフローとUltra Codeの検証

よし、戻りました。OBSがまだ録画できているか確認させてください。うん、まだ大丈夫ですね。よし。
ダイナミック・ワークフローってどういう意味、ということですが。ええ、わかりません。僕はここで何を間違えているんでしょうか。
何を間違えているんだろう。なぜダイナミック・ワークフローが動かないのか。ええと、ブログ記事に戻ってみましょう。
戻ってみましょう。ブログ記事に戻って確認してみます。
プロジェクト・グラスウィング。プロジェクト・グラスウィングの紹介、これですね。
あ、もしかして、僕はもうMaxプランすら持っていないのかな。その可能性はあるでしょうか。
確認させてください。何度も頭にこさせられた後で、キャンセルした可能性が十分にありますからね。
いや、まだMaxプランは維持していますね。これは非常に興味深いです。とても面白い。なるほど、彼らは間違いなく利用制限を緩和しましたね。これまでに僕がやったことから計算して、これを皆さんに共有します。
これを見てください。これまでにこれだけ使いました。
見てください。すでにかなりの量をこなしました。それほど多くはないかもしれませんが、それなりの量のプロンプトをすでに投入していて、この5時間のウィンドウの8%しか消費していません。全体のわずか2%しか使っておらず、明日リセットされます。みんな、これは使わない手はありません。使いまくりましょう。これです。
彼らは制限をリセットしたばかりなのでしょうか。
よし。Claudeに戻します。どうしても動かせません。ダイナミック、何でしたっけ、ダイナミック何チャラを使わせることができません。よし、戻りましょう。ダイナミック・ワークフロー。なぜ動かないのでしょうか。
ダイナミック・ワークフローを使用する場合は、オートモードをオンにしてください。ワークフローを開始する方法は2つあります。ワークフローを作成する。
エフォート(思考量)・メニューからアクセスできる、ultra codeと呼ばれる新しいClaude Code専用の設定をオンにします。なるほど、それをテストしに行きましょう。
それをテストしに行きましょう。
ええと、なぜこれが動かないのか。Extra。
見当たりませんね。見落としているのかな。もしかしてコンテキストが100万トークン必要だとか。まさか。
それはないでしょう。いや、100万のままにしておきます。なぜこれが表示されないのか。もう一度試してみましょう。そう、ワークフローを作成して、
もう一度試してみましょう。ワークフローという単語自体はハイライトされているのですが。
ダメですね。どうしてもこれをやりたがらないようです。よし、
一旦止めます。もう一度試しましょう。新しいセッションです。でも、今はトークンの消費についてはかなり気が楽になりました。現在のブランドカラーをそのまま使ってウェブサイトをリデザインしてください。そのためのワークフローを作成してください。
CLIから。あ、CLIからやらなきゃいけないんですね。それは面倒ですね。そんなことしなくてもいいはずなのに。
今CLIがインストールされているかどうかもわからないし、入れたくもありません。僕はインターフェース派なんです。画面がある方が好きです。
どうやらそれが唯一の方法のようですね。わかりました。それならやります。
おそらくインストールはされているはずです。
こんな風にClaude Codeを使ってからずいぶん経ちますね。モデルの指定をして、
そして使用するのは、おや。
ちょっと待ってください。原因を突き止めようとしています。CLIはメールアドレスが漏洩するので気をつけて、とのこと。わかりました。
これはどのモデルですか。これは4.8です。まだあれこれ弄っています。動かそうと必死です。
ところで、配信への高評価をお願いします。本当に感謝しています。より多くの人に届く助けになります。配信に「いいね」を押していただけると非常に嬉しいです。ありがとうございます。
それこそが、テオがいつも叫んでいることです。彼が叫んでいないことなんてあるでしょうか。
今何を作っているのかというと、これを作ろうとしています。もういいです、これをそのまま進めましょう。現在のブランドカラーを使って、僕のウェブサイトをリデザインします。それをやっていきましょう。
このままClaude Codeを走らせておいて、
並行して、このClaude CodeのCLIも動くようにして、ダイナミック・ワークフローを実際にテストできるようにします。では、最新版にアップデートしましょう。よし、Claude、デフォルトで新しい4.8になるか見てみましょう。はい、このフォルダーを信頼します。よし、進みましたね。では、切り替えます。ダイナミック・ワークフローを動かしてみましょう。
来ました。Opus 4.8です。ええと、effortをx-highにするのかな、そんな感じだったと思います。いや、冗談です。effortをX-highに。なぜ間違えてしまうんだろう。あ、デフォルトですね。
よし、これをやってみましょう。ウェブサイトをリデザインして。あ、
すみません、ターミナルの操作がものすごく錆びついています。
effortをultra codeに。うわ、これはすごい。
これはカッコいいですね。これを見てください。マックスに綺麗なレインボーが表示されました。バン。Ultra Codeです。Extra Highにワークフローが加わりました。これですね。うわ、レインボーをかなり盛り込んできましたね。いきましょう。
とてもいい。非常にいいです。確かにOpus 4.8ですね。そうです。ええと、
あ、そうだ。僕のFF、確かFFホームページという名前だったと思います。ちょっと待ってください。
デスクトップにある自分のHPフォルダーに切り替えます。
何だって。APIの認証情報が無効です。なんてこった。よし。
なぜこれが動かないのか。loginを実行しなければいけないんですね。よし。一旦画面をこれ以外に変えます。みんな、これを動かしてみせますからね。
そして、これをもう一度立ち上げ直します。取り組んでいるものの一部は、ウェブブラウザでお見せできれば、モックを組み立てて説明しやすいかもしれません。ええ、ただ作ってください。ただ作ればいいんです。質問はストップしてください。
CLIの方がClaude Codeの形態として優れている、ですか。まさか、反対です。僕はインターフェース派です。画面がある方が好きなんです。
よし。ええ、共有します。ジョナが作ったやつのことですか。ハイ・コレクターさん、これです。ここに置いておきますね。もう一度貼っておきます。
これ、実はかなり良い出来です。めちゃくちゃ良い。
ジャスティン、利用制限に達していないのが驚きだ、とのことですが。実は、かすりもしていません。なので、そこは大いに語るべきところだと思います。制限に達していないこと。ええ、まだ全然余裕です。僕は月額200ドルのプランに入っています。
最近、利用枠が2倍になったと思います。

Anthropicへの巨額投資ニュース

よし、CLIを動かしてみます。サブスクリプションのあるcloudアカウントにログイン。
認証します。バックグラウンドでこれをやっています。よし、準備完了です。ログイン成功。エスケープで続行。もう一度画面を戻しましょう。ダイナミック・ワークフローを動かしてみます。この5時間のウィンドウの利用枠をすべて使い切れるかやってみましょう。それができるか見てみましょう。
よし、いきます。
デスクトップにある僕のHPフォルダーに切り替えます。よし、今度は動きました。
なるほど。
ディレクトリを変更するだけで何トークン消費するのか見てみましょう。
この時点でもうトークンを無駄遣いしていますね。よし、かなりうまく処理しました。分かりました。現在のブランドカラーをそのまま使ってホームページをリデザインしてください。別の場所で同じことをやらせているエージェントのセットがあるので、別のワークツリーを作成してください。
ディレクトリの変更に15秒。究極の怠惰ですね。最高の怠惰です。
よし。これで動くはずです。それから、自動的にワークフローが実行されると思いますが、「ワークフローを作成して」と言っておきます。あ、ここでそれをやっていますね。間違いなくワークフローという単語を認識しています。いきましょう。トークンを燃やしましょう。ものすごくワクワクしています。おお、一気に進んでいますね。
でも、複数のエージェントが並行して動いているのを確認したいです。まだそれが見えていない気がします。エフォートレベルを確認してください。元に戻ってしまいましたか。だからでしょうか。
effort。あ、もう、これを動かすのに大苦戦しています。エフォート。そう、元に戻っていました。よし、Ultra Codeに戻しました。もう一度試します。バン。もう一度やってみましょう。またね。
ええ。Ultra Codeは狂気じみていますが、大量に消費します。よし、ようやく、ようやくUltra Codeモードに入ったと思います。
Ultra Codeということはダイナミック・ワークフロー、つまり、同時に並行して数十から最大100のエージェントが動く、と書いてあったと思います。よし。まだよく分かりませんが、間違いなくUltra Codeです。そこにそう表示されています。しかし、
超高エフォートでまだ思考中、とは表示されませんね。
ワークフローを実行します。
ワークフローを実行して、実行状況を表示します。うーん、どうでしょうか。
来ました。よし。
はい。二度と聞かないでください。これ、すべてのステップで許可を求めてくるんじゃないでしょうか。
なんてこった。よし。ジョナがニュースを共有してくれました。わお。
本当に、今日は何から何まで一気にリリースしてきますね。これは、画面をこちらに切り替えます。新しいニュースが入りました。
信じられません。大変です。今入ってきた速報です。わお。よし。
アリミター・キャピタル、ドラゴン、グリーン・オークス、セコイアが主導し、ポストマネー評価額およそ1兆ドル、9650億ドルで、シリーズH資金調達にて650億ドルを調達しました。なんてこった。信じられません。この投資により、研究を進め、Claudeへの高まる需要に応えるための能力を拡大することができます。これについて読んでみましょう。
とんでもないですね。さらに650億ドルです。
彼らは2月にシリーズGをやったばかりです。グローバルな企業顧客の間で導入が進み続けています。
わお。ランレート収益が今月上旬に470億ドルを超えました。今月上旬に470億ドル突破です。
サム・アルトマンは今頃オフィスで物を投げ散らかしていますよ。
信じられません。よし。このラウンドはキャピタル・グループ、CO2、D1、GIC、アイコニック、XNが共同主導しました。興味深い。ここにそう書かれています。
あ、こちらですね。ブラッド・ガーストナー率いるアリミター・キャピタルが主導。
わお。このラウンドの主要な投資家には、AMP PBC、ベイリー・ギフォード、ブラックストーン、ブルックフィールド、D.E.ショウ・ベンチャーズ、DST、フィデリティ、ジェネラル・カタリスト、インサイト・パートナーズ、ジェーン・ストリート、ライトスピード、MGXなど、全員参加です。わお、途方もないニュースです。
これには、Amazonからの50億ドルを含む、ハイパースケーラーからの以前に約束されていた150億ドルの投資も含まれています。彼らに加わるのは、戦略的インフラパートナーであるマイクロン、サムスン、SKハイニックスです。
わお。本当に内輪で完結していますね。ある会社が別の会社に投資し、そこから購入し、そこを所有し、
所有と負債のこの狂気じみた蜘蛛の巣のような関係が、もう、凄まじいです。これは狂っています。
これは巨額の資金です。650億ドルですよね。650億ドル以上。AI業界の完全にインセストゥアス(近親相姦的)な性質がそのまま続いており、最終的にはNvidiaがすべてを勝ち取ります。つまり、このお金はほぼすべてNvidiaに流れていくわけです。
ええ、クラス1およびクラス2のGPU容量へのアクセスのためにSpaceXについて言及しています。
Claudeは、世界3大クラウドプラットフォームのすべてで利用可能な最初の最先端モデルです。Amazonウェブサービス、Google Cloud、Microsoft Azure。AWSは引き続き、当社の主要なクラウドプロバイダーおよびトレーニングパートナーです。
そしてブラッド・ガーストナーのコメントがありますが、正直なところ、中身のないお決まりの文句です。わお。
よし。では、テストに戻りましょう。

ウェブサイトのリデザイン結果とコミュニティの案内

というわけで、ここでホームページのリデザインを行っています。なぜか分かりませんが。
ええ。よし。昨夜行ったごく短いテストの中で、確かにOpus 4.8へのアクセス権はありました。それがOpus 4.8だとは知らなかったのですが。あ、なぜ画面が切り替わり続けるんでしょう。あ、なるほど。これはただの、そう、これが僕たちのウェブサイト、forwardfuture.aiです。ぜひチェックしてみてください。ちなみに、僕たちは特にニュースレターに莫大な投資をしています。人工知能について学ぶのに役立つ、素晴らしい最新のガイドをすべてお届けしています。ニュースレターがあり、インタビューも掲載しています。僕は今、文字通り何もしていません。Claude Codeがただあちこちクリックしているだけですが、本当に、forwardfuture.aiに行ってニュースレターを購読することを強くお勧めします。僕たちは今、独自のオリジナルコンテンツ、オリジナル記事やエッセイを開発中で、その中にはAnthropicに関する素晴らしい記事を書いてくれたデイブ・シャピロのような最高のメンバーも含まれています。なので、ぜひチェックしてみてください。
その一方で、配信中のテストはすべて失敗している、ですか。いや、僕はただものすごく気が散りやすいだけです。戻りましょう。
よし。昨夜やっていたテスト、そして明らかにここで見ていることから言うと、
新しいOpus 4.8は、僕の実際のウェブサイトの角を丸くする、何でもかんでも丸くする傾向があります。実際のウェブサイトでは、丸みは一切ありません。すべてが非常に四角いです。購読ボタンを除けば、大体このような見た目です。すべてが非常に四角いのですが、とにかくすべての角を丸くしたいという強い衝動があるようです。現在もまだ作業中ですが、
ええ、そういう動きをします。
そういうことをします。すべてが正常に動作しているか確認します。うん。
よし、では戻りましょう。続行しますか、はい。もう、Claude CodeのCLIは、絶対にすべてのことに対して許可を求めてきます。とてもイライラします。
それから、もし
常にクラウドデザインを使用する。ええ、僕は実はクラウドデザインの大ファンなんです。
5スライドで1週間分の利用枠が全部吹き飛びますけど、それ以外は本当に素晴らしいです。
危険を承知で許可をスキップする、ですか。でも、そうするとこのタスクを終了して最初からやり直さなければいけないですよね。
おそらく。iTermに戻ってそれをお見せしましょう。
塗りつぶしキャンバスのサイズを変更します。
よし。もしそれをやるなら、再起動しなければいけないと思います。シフト+タブを使って危険モードに切り替える必要があります。
僕はこれを正しくやれていないのかな。コントロール+Eで説明。
セッションを保存できます。ご覧の通り、僕はClaude CodeのCLIに詳しくありません。ただ使っていないだけです。
ところで、ええ。
よし。よく分からないので、とにかく終了します。エスケープで閉じる。よし。
ワークツリーを保持。ここを閉じます。危険を承知で許可をスキップする設定でClaudeを実行します。続行。
はい、このフォルダーを信頼します。はい、同意します。ええ、全力でいきますよ。
エフォートを変更しましょう。Ultra Codeに戻しますが、このアニメーションがどれほどカッコいいか、本当に感心してしまいます。
これに切り替えて、続行と言います。
よし、見てみましょう。
レゴ・ギークスさん、Discordサーバーはあるか、とのことですが。はい、あります。聞いてくれてありがとうございます。プロデューサーのブライアンが、Discordコミュニティが楽しく安全で、スパムだらけにならないように、多くの時間と労力と愛を注いで開発・管理してくれています。僕が前回やろうとした時は防げなかったのですが、
彼は素晴らしい仕事をしてくれています。ブライアン、もし可能ならDiscordへのリンクを貼ってもらえるとありがたいです。ええ、僕たちのDiscordをチェックして、ぜひ参加してください。僕もそこにいますし、ブライアンもいます。最先端AIのあらゆることについて、素晴らしい会話が交わされています。
よし、まだテスト中です。僕たちはOpus 4.8をテストしています。全力を尽くして、ダイナミック・ワークフローを動かそうとしています。
本当に、よく分かりません。おや、
そのキーボードは何ですか、打鍵音がこの世のものとは思えない、とのことですが。新しいキーボードを手に入れたのですが、完全に恋に落ちています。見てください。これはNuPhy Air75です。
このカチカチという音がたまらなく好きです。本当に大好きです。最高ですね。
僕はあちこちに目移りしてしまいますね、みんな。軌道修正してくれてありがとう、マット。アルテミス月面着陸プロジェクトを開く。ええ、いい指摘です。それをやりましょう。
よし、見てみましょう。ちょっと待ってください。
Ultra Codeとは何ですか。Ultra Codeとは、ダイナミック・ワークフローをオンにし、それをハイモード、高思考モードにする設定のことです。わかりました。
よし。
ここに戻ってきました。塗りつぶしキャンバスのサイズを変更します。
来ました。少し調整する必要があると思います。
よし、これです。アルテミス月面着陸シミュレーター。降下を開始します。どうなるか見てみましょう。
Wキーで主エンジン。お、来ました。ちょっと待って、いきますよ。
でも、動いていませんね。
何を間違えているんだろう。再起動してみます。垂直速度。動いていると表示されていますが、実際に動いているようには見えません。
ええ、垂直速度を見るとマイナス何メーター毎秒となっているので、進んでいるはずなのですが、実際に動いているようには見えません。反転して下に行け、ですか。それはできないと思います、グレッグ。ええ、これ以上反転できません。水平方向にしか動かせません。お、これは何だ。うわ。おい。
うわ。おっと。おっと。
これが完璧だとは言えませんね。
今、下がっています。垂直速度がマイナスになっているのは見えますが、実際に下がっているのかな。ええ、下がっているみたいですね。よし、来ました。見てみましょう。着陸。ボイン。機体を紛失しました。よし。画面を戻しましょう。
戻します。ダイナミック・ワークフローが実際に動作するか見てみましょう。あ、動いたみたいです。動きましたよ、みんな。
これは確実にダイナミック・ワークフローに見えますよね。そうです、そうです、そうです。めちゃくちゃカッコいい。よし、トークンが燃えるのを感じましょう。
物事が実際にうまくいっているという兆候はほとんどありませんが、あ、それは嘘ですね。よし、来ました。理解フェーズにいます。構造のマッピング、デザインのマッピング、コンテンツのマッピング、これらすべてをOpus 4.8を使って行っています。大量のトークンが消費されているのが見えます。今、ツールコールが発生しています。だから、これは動いています。
動いています。
動いていますね。非常に遅いです。ファストモードをオンにできればいいのですが。まあ、できるかもしれませんが、やらなかっただけです。
ファストモード+ダイナミック+最大思考、と言っておきましょう。
あ、サイモン。ええ、サイモン・マカヴォイ88さん。4.8をpaperclipで走らせる必要がある、とのことですが。実はpaperclipはまだテストしていません。それについての動画を作ろうかと考えてはいるのですが。本当に面白そうに見えます。僕は人間ゼロの会社や人間1人の会社というものをあまり信じていませんが、
でも、何だってあり得ますよね。楽しい実験です。
よし、進みました。構造をマッピングしました。
マックスウェルさん、max対ultra codeについてはもう説明したか、とのことですが。Ultra Codeは、高思考モードに加えてダイナミック・ワークフローをオンにする設定だと思います。違いはそこにあると思います。そして、maxは単にさらに高いレベルの思考モードです。
利用状況をチェックしましょう、みんな。
利用量は多くありません。お見せします。
利用量は多くありません。これだけのことをやった後でも、この5時間のウィンドウの総利用量の11%しか消費していません。1週間の総利用枠の2%です。Anthropicが利用枠を修正した可能性がかなり高いですよね。
そうでしょう。僕は以前ならClaude Codeを見て、すぐに利用枠を使い切ってしまっていたはずです。今は複数のエージェントを並行して走らせているのに、ほとんど消費していません。これを見られて本当に嬉しいです。悪くないですね。ええ、ギャビーさん。悪くないです。完全に悪くない。
実際、これには大満足です。念のためページを更新してみます。
興味深い。全然悪くないです。全く悪くない。並行して何個のエージェントを走らせているのか、ですか。3つだけだと思います。画面を戻して確認してみましょう。
よし、来ました。めちゃくちゃカッコいい。これでコンセプトは完了です。今は、
すみません、理解フェーズが完了しました。今はコンセプトフェーズに移行しています。これは4つのエージェントを並行して走らせています。理解フェーズでは3つだけでした。合計で3分弱かかりました。構造のマッピングを行う最初のエージェントに85,000トークン、デザインのマッピングに70,000トークン、コンテンツのマッピングに87,000トークンを使用しました。現在はコンセプトフェーズにいます。
よし、
これは本当に素晴らしいです。本当にカッコいい。これまでに見たことがないものではありませんけどね。つまり、サブエージェント付きのCursorを使えば、Claude Codeにもサブエージェントがいるようなものです。ですが、複数のエージェントを並行して走らせるというのは新しいことではありません。確かCursorには制限があったと思います。
4つのエージェントだったと思います。
デーブ・ウィルソンさん、10ドルありがとうございます、デーブ。今気づきました。IBMとOSSのプロジェクト「lightwell」が、ソフトウェアサプライチェーンを保護するための新しいAI駆動型モデルを携え、オープンソースソフトウェアのための信頼できる企業向けクリアリングハウスを設立する、とのこと。それがどういう意味かは分かりませんが、デーブ、10ドルありがとうございます。感謝します。
僕は200ドルのプランに入っています。ティム・ティムさん、僕はAnthropicの200ドルのプランです。自腹で払っています。Cursorはトークンをくれますが、
Anthropicはくれません。彼らは僕にトークンを一切くれません。僕のチャンネルのスポンサーでもありません。そういう関係は一切ないです。OpenAIも同様です。
Codexは制限が6だったと思います。なるほど。ディアンジェロさん、皆さん、これまでのところモデルはどう見えますか、とのことですが。素晴らしいです。ええ、つまり素晴らしいモデルですし、印象的な点がいくつかあります。まず第一に、そのトークン使用量、あるいは少なくとも、彼らがGPUの供給制限から抜け出して以来、僕たちが目にしている利用枠の拡大です。これはかなり素晴らしい。しかしモデルは、
ええ、モデルは素晴らしいです。来ました。よし。よし、切り替わりました。
今度はジャッジ(審判エージェント)に切り替わりました。Anthropicがこの仕組みをどう説明していたかというと、タスクをサブエージェントに委任する。

サブエージェントたちは、実際には何が最善の解決策であるかを互いに話し合うことになります。

そして最終的に、異なるエージェントからのすべての解決策をジャッジが受け取り、決定し、統合して、実際の解決策を提示します。わかりました。次は実装、検証、そして修正を行うはずです。このまま残って完了するまで見届けましょう。あまり時間がかからないといいのですが。これまでのところ、合計で7分半です。7分半ですね。

ええ、そうです。今参加したばかりの方のために説明すると、私たちは新しいOpus 4.8をClaude Code CLIで、彼らの真新しいダイナミックワークフロー機能を使ってテストしています。これにより、単一のエージェントが最大100個のエージェントに委譲できるようになります。これはちょっとクレイジーですよね。それが、私たちが今見ているものです。動いています。私は邪魔にならないように移動しますね。
ご覧の通り、現在はアイドル状態になっていますが、これはちょっと興味深いです。あ、動き出しました。よし。

これは何のツールですか。Claude Codeです。それが今私たちが使っているものです。
マービン・コラニ、DeepSuiteのベンチマークはどこにあるかって。同感です。同感。DeepSuiteは近いうちに何かを出してくる必要がありますね。

これが終わるのを待つ間に、新しいベンチマークがあります。
Claude Opus 4.8をテストする新しいベンチマークです。こちらです。
なるほど。これはProximal Advanced Coding Intelligenceという会社によるものです。
今日のリリースに先立ち、Frontier SuiteでClaude Opus 4.8を評価しました。現在、Frontier Suiteで最も優れたパフォーマンスを発揮するモデルとなっています。なるほど、これはFrontier Suiteと呼ばれているもので、実は私はあまり詳しくありません。
ええ、これですね。彼らはドミナンス・インデックス(支配度指数)というのを持っています。面白い名前ですね。Claude Opus 4.8が1位で、GPT-5.5が2位、Opus 4.7が3位、Opus 4.6が4位、そしてこの新しいベンチマークで83%のスコアを獲得しています。

スポンサー広告の裏側とキーボードの雑談

よし、この動画のスポンサーのトランジション(繋ぎのトーク)を録音します。
これに戻しますね。これを見続けましょう。私はこの動画のスポンサーのトランジションを録音するつもりです。ところで、皆さんがトランジションを考えるのを手伝ってくれるなら、チャットにどんなものがいいか書き込んでください。つまり、このことについて話していて、ところで、というような、スポンサーへの自然でナイスな流れのことです。チャットでどう思うか教えてください。

皆さんがこのキーボードについて聞き続けていますね。これはNuPhy Air75です。そして、この小さなノブみたいなものは、私が後から追加したものです。でも、本当に気に入っています。打鍵音が最高なんです。ビルドクオリティも素晴らしい。バックライトをつけて、ですか。ついていますよ。セット内はお静かに、皆さん。
よし、実際には実装フェーズに切り替わりました。思っていたほど多くのエージェントは使っていないようですね。よし、トランジションを録音します。
少々お待ちください。

ところで、これらのテスト中に消費しているすべてのトークンにお金を払うのは安くありません。そのため、それらすべての支払いを助けてくれる今日のスポンサーからの支援があります。
それでは、それらのトークンの一部の支払いを助けてくれる今日のスポンサーについてお話しさせてください。

ヘイ、Moist Moments。長年のリスナーで、初めて生で見てくれているんですね。ようこそ。最高です。
ええ、それがいいですね。Dope shorts、私には支払うべき請求書があります。私には支払うべき請求書があるんです。そして今日のスポンサーは、いや、それはあまりにもあからさますぎますね。あからさますぎる。

Opus 4.8を使ってトランジションを考えてみては、ですか。おお、それですね。待って、どこに行っちゃったかな。これだ。ウィリアム・チャールズ、そうします。そうすることにします。
一緒にやりましょう。

よし。YouTubeの動画を今作っていて、スポンサーが必要です。
なんてことだ。Opus 4.8リリースの動画からのスポンサートランジション。
それを考えるのを手伝ってください。そしてもちろん、これにはOpus 4.8 Maxを使います。
見てみましょう。どんなものを出してくるか。
思考中、思考中。
いや、それは私が求めていたものではありません。
未知のスポンサー。

ベタな繋ぎであるべきですね。ええ、ベタな繋ぎは好きですよ。
スポンサーへの繋ぎを入れるべきでした。素晴らしい、それなら完璧ですね。

わかりました。Opusが出してきたものは、きっとすごくダサいものだと思います。テーマ別の架け橋。見てください、Opus 4.8は怪物ですが、これほど有能なモデルも、あなたが組み込むツール次第です。それこそが、今日のスポンサーについて話したい理由です。それは、Opus 4.8がそのスポンサーと連携して動くことを前提としていますね。それはあまり良くないな。
ええ、クリーンな区切りにしましょう。これが気に入りました。ベンチマークについて話すことにします。動画の中でまだ話していないかもしれませんからね。見てみましょう。実際、おそらく話していません。だからベンチマークについて話すつもりですが、その前に、この動画を可能にしてくれたスポンサーについてお話しさせてください。よし、これでいいと思います。いくつかのバージョンができました。

それからアウトロをやります。これについてたくさん話してきたのは知っていますが、見てみましょう。そして、そうです、Opus 4.8は素晴らしいですが、Anthropicが企業として行ってきたことの多くは、それほど素晴らしくありませんでした。それについての動画をここで作りました。これでよし。皆さん、これをアップロードさせてください。それからテストに戻ります。

ええ、ところで、キーボード会社のNuPhyは、現時点で私のスポンサーになるべきだと感じています。だって私は本当に、実際にこのキーボードが大好きですから。
クリック。1、2、3、4、5。ええ、このキーボードが大好きです。3個買いました。ありがとう。ありがとう、ギャビー。

繰り返しますが、彼らは私のスポンサーではありません。ただ、このキーボードが大好きだから話したいだけです。1ヶ月ほど前に、テストするために3種類のキーボードを買いました。そして、これが最も際立っていたものです。カスタマイズ性が最も高い。ビルドクオリティも素晴らしい。あのカチカチ感というか、クリック感が私には最高に心地いいんです。そして、ええ、とにかく大ファンです。

NuPhy、キーボードはいくらですか、ですか。確か125ドルだったと思います。間違っているかもしれませんが。100ドルのレンジのどこかです。間違いなく、ハイエンドのキーボードですね。ロープロファイルのメカニカル。非常に、非常に良いです。NuPhy。そう、N-U-P-H-Y。Melty 1000、イケてるブランドですね。彼らに連絡を取るべきです。きっと返事をくれると思いますよ。クールです。彼らのことは知りませんが、キーボードは大好きです。

もう一度、どのモデルですか、ですか。これはAir75だと思います。今チャットに打ち込みますね。Air75。
NuPhy Air75。それだと思います。

ウェブサイトの再設計結果と投票

よし、iTermに戻りましょう。戻って、これがどうなっているか見てみましょう。まだ実装中で、これまでのところ使用されています。もう20分近く経っています。デザイン刷新の実装ステージだけで140,000トークン。あ、ちょうど終わりました。ちょうど終わったようです。

今は検証中です。何が検証されているか見られるように、それに切り替えます。こちらです。ホームページのデザイン刷新の検証を行うために、4個の独立したエージェントを立ち上げました。タイプチェック、ブランドデザイン、そして機能テストがあります。

このキーボードのAmazonのアフィリエイトリンクを貼っておけばよかったかもしれませんが、いや、本当に心からお勧めします。他に買ったものを思い出そうとしています。というのも、3個同時に買ったからです。本当にユニークなものがあって、とても気に入っていました。でも、カスタマイズ性がそれほど高くなかったので、最終的には選びませんでした。
それを見つけてみます。

よし、これとこれを買いました。ここに見せたくない情報がないことを確認したら、購入したものをお見せします。ありましたね。よし。
Keychron K1。それをテストしましたが、あまり気に入りませんでした。
そしてLofree Flow 2を買いました。
これらが私がテストした2個のキーボードです。進めながらそれらをお見せします。

これは私が実際に本当に、本当に気に入ったキーボードです。それらすべての中で、最もプレミアムな品質、というかプレミアムな製造ビルドクオリティを持っていました。透明なキーキャップが付いていましたが、それはあまりうまく機能しませんでした。いくつかのキーが他よりも明るかったんです。それから、ここ、このサイドのところが見えるでしょうか。
ここが見えるなら、これはタッチスライドバーだったのですが、基本的には役に立ちませんでした。
そのため、これは最高のビルドクオリティと最高の音を持っていましたが、選びませんでした。

ええ、それが私が手に入れたものです。それから確かKeychron K2がもう1個の方でした。
これは大きい方のバージョンを買いましたが、基本的にはこれです。そして、ただ気に入りませんでした。ただ気に入りませんでした。これは3個の中で一番好きになれませんでした。

よし。戻りましょう。取り組んでいることを終わらせましょう。これからはあまり気を取られないようにします。もうすぐ終わります。このビルドを開始して22分が経ちました。Opus 4.8を使っています。
ダイナミックワークフローを使っています。合計で13個のエージェントをスピンアップさせました。ここの一番上でそれが見えます。

よし、まだ検証中です。4個中3個ですね。並行して走っていた最初の3個のエージェントは終わりました。100個の異なるエージェントを同時に走らせる方法を見てみたいですね。Anthropicはそれが十分に可能だと言っていましたが、私はまだ見ていません。

The Swiss Mint、10分前に参加したばかりなのですが、これは何を作っているのですか、ですか。私たちのウェブサイト、forwardfuture.ai を再設計しています。
ちなみに、それをチャットに貼っておきますね。まだメルマガに登録していない方は、ぜひ登録してください。先ほども言いましたが、私たちは今、オリジナルのコンテンツ、オリジナルの記事やエッセイ、調査や分析に多くの投資をしています。ですから、私たちのメルマガに登録してください。これから何が起こるかをお見せするのがとても楽しみです。そして、チャンネルの友人であるデイス・シャピロがAnthropicについて素晴らしい記事を書いてくれたような、最高のオリジナルコンテンツをすでに発信しています。

よし、これで修正ステージ、最後のステージに入りました。それからどうなったかを見てみましょう。その間に、現在のウェブサイトがどうなっているかをお見せします。

よし、これが今のウェブサイトです。なるほど。
左上に私たちのブランディングがあります。たくさんのリンクがあります。非常にシンプルです。ホバーアニメーションはありませんが、今考えてみるとちょっとおかしな感じがしますね。

ところで、Spiraxに感謝を伝えていませんでした。Spirax、すみません。4.99ドルのスーパーチャットをありがとう。感謝します。アルテミス宇宙ミッションの比較を3Dレンダリングして、ですか。
今は比較はやりません。時間がかかりそうだからです。
立ち上げてみるだけなら、やってみましょうか。実際にそこまでたどり着けるか分かりませんが、立ち上げてみます。
実際に立ち上げてみます。それは悪くないアイデアですね。なぜなら、文字通りほんのわずかな費用で済みますから。

よし、いきます。Cursorで立ち上げます。画面には出しません。ただ立ち上げるだけにして、もしそこまでいけたら、その時にやりましょう。でも、ええ、Spirax、ありがとう。本当に感謝します。

よし、立ち上げます。Composer 2.5 fastを使って、開始します。これで動き出しました。
そして、見てみましょう。これはもう終わったでしょうか。あ、終わったと思います。皆さんはどうですか。見てみましょう。iTermに切り替えます。

終わったと思いますが、まだ動いています。まだ動いています。おお、見てください。
修正されました。今度は検証に戻りました。実際には前のステップにループバックして、さらに8個のエージェントを使っています。
とてもクールです。

Meet Juny、本当に感謝します。
5ドルのスーパーチャットをありがとう。国を選択すると空域、空港、天気、制限区域、規則が変わるブラウザ飛行シミュレーターを作れますか、ですか。
今はやることが多すぎますね。
ええ、それはやらないでおこうと思います。後で立ち上げるかもしれませんが、それでも、非常に感謝しています。ありがとうございます。

よし、本当にすぐに終わることを願っています。なぜなら、これで今、27分経っていますからね。これだけの時間、動かし続けています。
どれだけのトークンを使ったか見てみましょう。私のクォータをどれだけ使ったか見てみましょう。お見せする前に、何か予想はありますか。
予想はありますか。新しいモデルがドロップされる直前にリセットされたばかりだと思います。

Fox on the run、私たちはダイナミックワークフローを搭載したOpus 4.8でホームページを再設計しています。私自身の会社のウェブサイトを再設計しているんです。
どう思いますか。どう思いますか。60%、22%、5%、30%、40%。
1分後に切り替えます。皆さんがどう思うか見たいです。80%、そして私は特に5時間の枠について聞いています。すみません、それを明確にすべきでした。そして、私が今話している間にも、まだトークンを消費し続けています。ですから、それを頭に入れておいてください。よし、いきます。切り替えます。ドラムロール。

15%。これはクレイジーです。
私の今週全体の合計使用量の3%。3%です。
その数値に近かった人たち、よくやりました。現在の枠で15%です。
そして、私は基本的にOpus 4.8を非常に高い設定で動かし、複数のエージェントを並行して走らせていましたが、それでもこれしか使っていません。かなり感銘を受けています。

よし、終わりましたか。完了しましたか。Done、はい、Doneと書いてあります。28分46秒後です。ホームページの再設計にほぼ30分かかりました。
そして、見てみましょう。おや、ホームページの再設計ワークフローを実行、となっていますね。
待って、なぜまだ動いているのでしょう。
え。

Claude Designを使うべきでしたね。ええ。なぜ、なぜでしょう。ここで何が起こったのか理解できません。
完了しました。なるほど。これがダイナミックワークフローです。Forward Futureのホームページを再設計する。
ワークフローは終了しました。18個のエージェント、29分。完全な結果を読んでみます。それを読んでいるところです。
現在のサイトをミラーリングした分離されたワークツリーをセットアップする。ホームページの再設計ワークフローを実行する。なぜまだワークフローを実行しているのでしょう。
奇妙ですね。

ワークツリーを作成している。ええ、でもそんなに時間はかからないはずです。つまり、それはもうやりましたから。
よし。何かが見えましたね。勝者。The Forward Future Dispatch。なるほど、私のプロダクトの名前を変更してしまいましたが、いいでしょう。
ブランドトークンは変更なし。12個のファイルにわたって実装されました。
でも、まだ動いています。

よし、いくつか問題を見つけています。ナンバリングの衝突が起きています。各ガイドカードが同じスタイルでレンダリングされています。なるほど。新しいシャドウは問題ありません。

おお、それがいいですね。Juanpa、そうします。

ええ、分かっています。私はClaude Code CLIにあまり詳しくないんです。これを使ったのはずいぶん前のことです。私はデスクトップアプリの方が好きなんです。いつでもインターフェースがある方を好みます。それはただの私の好みです。

Skeleton XTX、新しいモデルのパフォーマンスはどうですか、ですか。
良いですよ。これがどれほど優れたパフォーマンスを発揮するか、モデルの本当のバイブスを実際に理解するには、多くの時間がかかると思います。これらの最初のゼロショットテストにおいては、かなり素晴らしいパフォーマンスを見せてくれました。ただ、マックス思考の4.8での洗車テストは間違えましたけどね。ローカルホストを開く。なるほど。そう言われましたか。ええ、実際には終わっています。まだ動いているのはNext.jsの開発サーバーです。よし、よし。真実の瞬間です。それでは見てみましょう。ロードして、良く見えるかどうか確認します。

よし。よし。わかりました。皆さんにお見せします。よし、皆さんがどう思うか見てみましょう。
ブライアン、新しいデザインと古いデザインのどちらが好きか、投票を開始できますか。
こちらです。これが新しいデザインです。これを邪魔にならない場所に移動しますね。名前が Forward Future Dispatch に変更されています。

投票を行いたいです。ですから、ブライアンが投票を立ち上げてくれたら、皆さんがどちらをより気に入ったか教えてください。これが新しい方です。
うわあ、丸みを帯びたエッジが本当に大好きなんですね。すべてが丸みを帯びたエッジになっています。これは良く見えません。ホバーしたとき、このアニメーションを見てください。両側、というか左側に落ちてくる紫色のラインのようなものです。私はそれがそれほど好きではありません。空白がたくさんありますね。ただの空きスペースです。古い方を見せて、ですか。わかりました、これが古い方です。これが古い方です。

なるほど、アニメーションが気に入ったんですね。皆さんの中にはアニメーションが好きな人もいるようです。それはクールです。

これが古い方です。すべてが非常に四角いです。
ええ、なるほど。これが古い方で、これが新しい方です。つまり、この右側にあるビデオが、私たちのオリジナルとは完全に異なる行にあるというのは、全く意味がわかりません。

ちなみに、今ジョナに、なぜここに画像が表示されていないのか、というメッセージを送っています。すると彼は「今取り組んでいるところだ」と言っています。ですから、彼は実際、私たちは今ホームページを少しずつ修正しているところです。

Altevaka、新しい方はiOSのGlassを真似しようとしているように見える、ですか。ええ、少しそうですね。
確かに、すべてが。おお、そこにある小さなシャドウやフェード効果は、ちょっといいですね。どんな風に見えるか確認しましょう。ええ、私はそれほど好きではありません。ホバーしたときに、それほど好きにはなれません。あまりにも動きすぎます。
好きじゃないな。ここに空きスペースが多すぎます。ここにメインのオリジナルがあって、ただ良く見えません。良く見えませんね。
でも、皆さんの意見を聞きたいです。よし、これが古い方です。
すべてが四角い。つまり、基本的には本当に、すべてのエッジを四角くするか、あ、すみません、ファーストビューより上の部分は古い方の方が良いですね。
ええ、間違いなく。ここに2行あるようなものはダメです。ダメですね。完全に台無しにしています。新しく改行しなかったらどう見えるか確認しましょう。

いや、それでも悪いです。それでも悪い。
ええ。ええ。
Claude Designでやり直してみては、ですか。ええ、そうします。後でやりますね。今はやりませんが、それは良いアイデアです。Eric 80。

Claytonが説明しています。「新しい方のいくつかのコンセプトは、はるかに優れています。ただ、少しクリーンアップが必要です。」私は、丸みを帯びた角はこの時点で過剰にやり尽くされていると感じています。そう言いながら、eCamで表示されている私のビデオのエッジは丸みを帯びているのですが。だから、私はそのトレンドから完全に外れているわけではないかもしれませんが、でもどうでしょう。私は今、四角い見た目の方に惹かれています。

ええ。よし。というわけで、もう一度、ちなみに、自分のプロダクトをものすごく宣伝しているのは分かっていますが、 forwardfuture.ai は、私たちが多くの時間と労力を注ぎ込んでいる素晴らしいものです。私たちはここに多大な投資をしています。ライターを迎え入れていますからね。メルマガに登録してください。チャンネルの友人であるデイス・シャピロ氏が、Anthropicはあなたの味方ではないということについて書いた、このような素晴らしいオリジナル記事を読むことができます。素晴らしい、本当に素晴らしい、読んでいて楽しい記事です。

ハイブリッド。よし、見てみましょう。これまでのところ、155票の投票があります。50対50です。今ちょうど50対50です。155票で50対50。投票してください。これが変わるのを見る必要があります。勝者が必要です。これが古いデザインです。古いデザイン。どうやら唯一の違いは、ちなみに、30分と数十万トークンを費やした結果、本当にやったことといえば、角を丸くしたことだけです。冗談でしょう。本当にそれだけしかやっていないのですか。

他のすべては、ほぼ同一に見えます。ガイドのページには触れてさえいません。
これを見てください。そして、ちなみに、 forwardfuture.ai に行くもう一つの理由です。
私たちはすべての素晴らしいガイドを用意しています。OpenClaudeで遊んでいるか、ChatGPTで遊んでいるかは関係ありません。あなたのためのガイドがあります。チェックしてみてください。メルマガもあります。これは違いますね。でも、良くはありません。良くない。

よし、今回はここまでにしようと思います。
ブライアン、最新の結果を見せてもらえますか。

ええ、わかりました。
なるほど。196票で古いデザインが僅差で勝ったようですね。52%の票が古いデザインに、48%が新しいデザインに集まりました。非常に興味深いです。非常に興味深い。
とてもクールです。

よし、他に皆さんが話したいことはありますか。
教えてください。おそらく、もう少ししたら配信を終了すると思いますが、他に話したいことがあれば教えてください。もちろん、一緒にTwitterを見るだけでもいいですし。

今日はこれでおしまいにしようと思います。よし。参加してくれた皆さん、ありがとうございました。これはとても楽しかったです。これは今、公式に私がやった中で最も長い配信になりました。その理由は、チャットの皆さんが素晴らしいからです。私は実際にチャットを読んで返信するのがめちゃくちゃ楽しいですし、皆さんのプロンプトの提案には本当に感謝しています。スーパーチャットをありがとう。参加してくれてありがとう。 forwardfuture.ai をチェックしてみてください。私たちは今レコーディングした動画をこれから編集し、今日のうちに公開する予定です。ですから、それを楽しみに待っていてください。それでは、ありがとうございました。皆さんに会えて良かったです。バイバイ。

コメント

タイトルとURLをコピーしました