本動画では、Anthropicが新たにリリースしたClaude 4 Sonnetの早期アクセス版を数日間テストした結果が詳細に報告されている。このモデルはChatGPT-5やOpus 4.1との比較において、特にビジネス文書、プレゼンテーション資料、スプレッドシート、コード生成の各領域で顕著な改善を示している。最大の特徴は「作業の自己チェック機能」の徹底であり、ピクセル単位でのレイアウト調整や数式の検証を自動で行うことで、人間の介入が必要な箇所を明確に示す点にある。66ページにわたる顧客の声から実用的なプレゼンテーションを一度で生成できる能力は、従来モデルでは到達し得なかった実用性の水準である。Anthropicは消費者向けではなく、プロフェッショナル向けAIという戦略的ポジションを明確にしており、本モデルはその方向性を体現している。プロンプトへの感度が低く、カジュアルな指示でも高品質な出力が得られる点、そして単なる自動化ではなく人間の専門性を引き出す「協働的な同僚」としての性格が強調されている。本モデルは生産性の基準をOpus 4.1が確立した水準から、さらに「意思決定支援」の段階へと引き上げるものと評価されている。

新型Claudeモデルの全貌
過去数日間、私は今日リリースされる新しいClaudeモデルへの早期アクセスを幸運にも獲得できました。なぜあなたがこのモデルに注目すべきなのか、他のモデルと比較して何を期待すべきなのか、そしてこのモデルが本当に違いを生み出すのはどこなのかをお伝えしたいと思います。ですから、次の10分か15分ほどお付き合いいただければ、このモデルをどう捉えるべきかを理解していただけますし、あなたにとって有用かどうかを判断できるようになるでしょう。
まず第一に、私の最初の印象と主要なポイントは何だったでしょうか。私はこのモデルをClaude Code内でテストしました。PowerPointデッキの作成でテストしました。スプレッドシートの作成でテストしました。ドキュメントの作成でテストしました。思考能力もテストしました。本当に徹底的にテストを行い、もちろんOpenAIの最先端モデルであるChatGPT-5と、そして今日以前のClaudeの現行最先端モデルであるOpus 4.1とベンチマークを取りました。
私が知りたかったのは、何が際立って見えるかということでした。私はAIモデルに何百時間も何百時間も費やしています。見た目や使用感の違いにはとても詳しいですし、早期に実際に触れて違いを見分けられるかどうかを確かめたかったのです。ネタバレになりますが、大きな違いがありました。
そして私がこう言うのは、モデルを誇大宣伝したいからではありません。完璧なモデルなど存在しません。しかし、このモデルは仕事を成し遂げることを重視する人々にとって、本当に重要ないくつかの方法で前進していると思います。そして率直に言って、これは実際にAnthropicのより大きな戦略と一致しています。
2つの大きなプレイヤー、OpenAIとAnthropicを見てみると、OpenAIは非常に消費者向けに傾倒し続けています。Anthropicはプロフェッショナル向けAIに傾倒するという専門化された姿勢を採用しています。プロフェッショナルが選択してAIと協働し、意図的にAnthropicを選んで仕事を成し遂げるということは何を意味するのか。Anthropicは彼らの仕事の成果物を前進させるのをどう支援するのか。その戦略の特徴はこのモデル全体に表れていました。
数週間前、Opus 4.1がリリースされた際に非常に人気のあるガイドを作成しましたが、そこで私は、実際に使用可能なスプレッドシート、本当に使用可能なPowerPointを作成するところまで到達した最初のモデルだと強調しました。これは以前、AIにとって本当に、本当に達成するのが難しいハードルでした。さて、この新しいモデルはそれを上回ります。この新しいモデルはOpus 4.1を上回ります。
そして私は両者を直接対決させましたが、簡単な課題は与えませんでした。難しい課題を与えました。11枚か12枚のSaaSデッキを作成しなければなりませんでした。AmazonのPRFAQスタイルでドキュメントを作成しなければなりませんでした。本当に徹底的にテストしました。
そして人間の観察者として、職場でこれらのツールが私たちと協働することを望む者として私に際立って見えたのは、この新しいモデルが、私がどこで介入する必要があるかを明確に見えるようにしてくれるということです。
AIが自動化すること、AIが私たちから仕事を引き継ぐことについてよく話します。しかし私は、最も価値のあるAIとは、あなたの領域の優れた人間として、深い経験を持つ者として、いつ仕事に手を加える必要があるかを明確に見せてくれるAIだという考えについて多くを考えてきました。
このモデルはChatGPT-5よりも、Opus 4.1よりも、その物語において十分に明確なので、それが何を目指しているかが本当に明確に見えますし、仕事をより良くするためにどこに手を加える必要があるかも本当に明確に見えます。
ですから、より大きな、例えばデッキ準備ワークフロー、スプレッドシートモデル準備ワークフローの文脈で考えると、このモデルはこれらの重要な作業を完了するのにかかる時間を短縮してくれます。
そしてそれを多くの有用な方法で実現します。そして、あなたが考え始められるように、私が持っている細かい実践的なメモを指摘したいと思います。
このモデルで作業する際の最初のポイントの一つは、物語の明確さ、質のレベルに到達するために、以前のモデルよりもはるかに多く自分の作業をチェックしているということです。
現在のClaudeスタイルの特徴の一つは、どのツールを呼び出しているか、その時点で何を考えているかを示すモデルからの実況解説があることです。それはある種の明示的な思考の連鎖です。このモデルは執着を表現しています、それが正しい言葉だと思いますが、自分の作業をチェックして修正することへの執着です。
PowerPointデッキを作成していたとき、タイトルテキストと特定のビジュアル要素の間のピクセルの重なりを測定し、自己修正して「これは正しくない」と言い、スライドを作り直すのを複数回見ました。私のところに来て私にそれをさせるのではありません。自分で捉えたのです。これは大きなことです。
スプレッドシートで数式をチェックする時間も取りました。作業していたコードプロジェクトを見せてくれたとき、実際にNext.jsフレームワークを通過して、私に「できる」と言って戻ってくる前に、開発サーバーを起動して実行できることを検証していました。
正直言って、ChatGPT-5は「できる」と言うのが好きなだけなんです。つまり、ChatGPT-5には話すことへのある種のコミットメントがあるだけなんです。私はここであなたにどのモデルを選ぶべきかを言うつもりはありません。
このビデオを、私がこのモデルだけで作業するように言っていると解釈しないでください。私たちは複数モデルの世界に住んでいます。このモデルが本当に有用である場所を感じ取ってもらいたいですし、それはAnthropicが進んでいる方向と一致していると思います。
このモデルは、多くの雑然とした入力を待っている作業、複雑なスプレッドシートをどう理解できるか考えようとしている作業、ドラフトを書こうとしているが頭がぼんやりしていてページに言葉をどう載せればいいかわからないが、本当に明確でなければならない作業、単なる古いAIの決まり文句ではいけない作業に費やしてきた地味な時間を劇的に削減するのに有用でしょう。そこでこのモデルは優れた性能を発揮します。
例を挙げましょう。私はこのモデルに66ページのPDF形式の顧客の声の洞察を与えました。つまり、すべて引用のようなものです。順序がバラバラで、どのような方法でも整理されていません。
生の顧客の発言で何をするか見たかっただけです。そして何をしたと思いますか。分析できました。そしてこのモデルは特に、そこから意味のある物語を抽出できました。そしてこれは本当に重要なことだと思います。なぜなら、そのような洞察は自然に生まれるものではないからです。
私はAmazonにいたとき、顧客の声を担当していました。多数の顧客の発言を手動で確認するのは本当に、本当に大変でした。脳内で溶け合い始めてしまいます。物語を得るのは難しいです。特定の洞察に引用を結びつけるのは難しいです。
これは、顧客の引用の大きな混乱から、PowerPointプレゼンテーションでの幹部向けの物語の流れまで、一度でできる最初のモデルです。
さて、それは私が今まで見た中で最も美しいPowerPointでしょうか。いいえ。私が使用可能だと思った4.1よりも優れているでしょうか。実際にそうです。これは、最初から90%準備ができていると呼べるほど完成に近いものを作った最初のPowerPointプレゼンテーションAI作成ツールです。ここやあそこで少し磨きをかければいいだけで、本当にそれだけです。
そしてそれについて便利なのは、わずか数分でそれを行うことで、複数回の反復を行う機会を与えてくれることです。このビデオの前半で、このモデルに興奮している理由の一部は、私たち人間を仕事と再び接触させることだと言ったのを覚えていますか。
その物語の明確さは、AIのスロップを乗り越えて実際に有用なものを見つけるために必要だったものです。
そしてそれはデッキだけでなく、スプレッドシートでのプレゼンテーションの明確さ、Claude Codeでの作業の明確さにも表れているのを見ました。優れた思考パートナーと作業しているような感じでした。一緒に作業するファイル構造を素早く確立できました。まさに夢のようでした。
そしてドキュメント執筆の明確さにおいても、明確な物語のようで、AIの思考を乗り越えなければならない感じはしませんでした。ですから、それについて考え、これを作るのにかかる分数について考えると、良い仕事をすることを大切にし、それをうまくやりたい人間として、自分の時間を倍増させたことに気づきます。
そしてそれは、90%良い成果物をより多く出すために時間を倍増させたということではありません。これを2つか3つ行い、物語を見て形作り、それが言いたいことかどうかを考える中で段階的な入力を行う機会を得たのです。そして30分か40分で、自分が望むものを正確に作り出すことは比較的簡単です。なぜなら、この新しいClaudeモデルでは、各反復が5分か6分で作成できるからです。本当に簡単です。
そしてモデルがどれほどプロンプトに敏感かと疑問に思うなら、これは本当に興味深いです。他のどのモデルでも見たことがありませんし、あなたが試すときの感想が気になります。
私が試したところ、適用したプロンプト構造に関係なく、驚くほど有用であることがわかりました。それで、非常に形式的なプロンプト構造を適用しましたし、2行か3行と大量のデータだけの非常にカジュアルなプロンプト構造も適用しました。
どちらの場合も、非常に使用可能な出力が得られ、健全で、幸せで、オフィスで見せたくなるようなPowerPointでした。素晴らしかったです。問題ありませんでした。そしてそれはスプレッドシートでも同様でした。ドキュメントでも同様でした。
そしてそれが確認されれば、あなたもそれを見ているなら、それが示唆するのは、AnthropicがDocsやDecks、PowerPointのようなオフィスの基本要素について十分な強化学習を行っており、より短く、小さく、よりカジュアルな発言から私たちが何を望んでいるかを理解しているということです。これは本当に大きなことです。
なぜなら、人々をChatGPT-5に対して本当にイライラさせてきたことの一つは、プロンプトに敏感だということだからです。ChatGPTチームがChatGPT-5向けのプロンプトパックをリリースしなければならなかったのは偶然ではないと思います。それをする必要がなかった人を知っていますか。Anthropicです。
モデルがあなたが望む種類の仕事をより良く理解し、それに取り組むので、彼らはそれをする必要がなかったのです。
そしてこれは、私が本当に興味深いと思うより大きなポイントの一つに繋がります。Anthropicは、少なくとも今後数年間の私たちの未来が、今日持っているものとある程度似ているということに賭けています。
すべての大きな誇大宣伝とすべての大きなポイントにもかかわらず、彼らはPowerPointがまだ必要とされる世界、スプレッドシートがまだ必要とされる世界、人間としてClaude Codeを実行し、開発サーバーで起動するものを得る能力がまだ必要とされる世界に投資しています。
そして彼らが賭けているのは、私たちが必要としているのは、より明確でよりプロフェッショナルな出力で、より簡単に理解できるものだということです。そしてそれは順番に、私たちが仕事の地味な部分に費やす時間が減ることを意味します。
なぜなら正直なところ、2020年以前の古いやり方の地味さを、すべてを手作業でやっていた時代と交換して、新しいやり方を得て、それが単なるAIのスロップで、私たちがそれを待っているだけで、それはひどい苦行だなんて、誰も望んでいないからです。
その代わりに、つい昨日、私はChatGPT-5に怒鳴らなければなりませんでした。なぜなら、3つの要素を持つアウトラインを求めたのに、7つで戻ってきたからです。そして私は「あなたは私が頼んだ3つに時間をかけなかった、そしてあなたはとても過剰に興奮して、たくさんの余分なものを持って戻ってきた」と言いました。
そしてそれは小さな物語で、ChatGPT-5だけに限定されているわけではありません。
スロップは、AIワークフローとAI生産性の利益を実現する私たちの能力への脅威です。ですから私が興奮していることの一つは、このモデルによって生成される作業には、コードであれスプレッドシートであれPowerPointであれ何であれ、本当に有用な作品を作り出すことができるある程度の明確さがあり、それからそれらが正しいかどうかに焦点を当て、正しくなければ反復するという点です。
そしてそれは、私が興奮できるワークフローになります。なぜなら、より混乱が少なく、チームがすでに意思決定を行う方法に適合するからです。
また、自分の作業をチェックするという考えは、他のモデルからも見られ始めると思います。いくつかの再帰的なループと作業のチェックがあるツールを使ってモデルがトレーニングされていることは知っています。
このモデルは、これまで私が見た中で、それについて断然最も思慮深く慎重です。このモデルは、あなたのプロンプトが特定の作業にどのようにマッピングされるかを理解することに本当に関心があり、それを正しく行うことに関心があります。
さて、あなたは疑問に思うかもしれません、ネイト、あなたはドキュメントとシート、コード、デッキについてたくさん話してきました。これはそれだけしかしないのですか。そして答えはノーです。
実際、私は会話にも使用しています。その思考と能力の感覚を得るために使用していますし、チャットだけで応答を生成するよう求めた場合にどうなるかも見ています。そして同じ明確さの感覚を得ています。これはノイズを切り抜けたいモデルです。そしてあなたに背骨を与えることができるモデルです。
そしてそれは、作業をチェックする能力にいくぶん関連していると思います。正しさの感覚があります。何が機能し、何が機能しないかの感覚があります。そして何かが正しくないと感じるとき、そう言います。
ですから、あなたが見ることになるより微妙なことの一つは、このモデルは何が正しく何が正しくないかについていくつかの意見を持っているということです。あなたが言っていても、モデルが言っていても。
そしてそれは、モデルをアデラールを服用している過活動のリスのようではなく、思慮深い同僚のようにします。意見を持つ同僚、説得できる同僚、しかし時には押し返して「それはあまり正しくないと思います」と言う同僚です。
そしてそれは非常に難しいバランスを取ることです。
そしてClaudeがこの新しいモデルでそのバランスを取ることができたなら、それは私たちにとって非常に良い兆候です。なぜなら、AIとのよりプロフェッショナルな関係を持つのを助けてくれるからです。怒鳴ることが減ります。集中させて指示しようとすることが減ります。そして一緒に良い仕事をする方法にもっと興味を持つようになります。
そして私はそれに興奮しています。なぜなら、私は正直なところ、AIモデルに「いいえ、あなたはやりすぎました。いいえ、あなたはその方向に行きすぎました。いいえ、やめてください」と言うのをやめたいからです。私はここで完全に正しい唯一の人間でありたくありません。
ですから、私の希望は、この新しいモデルが仕事のための新しい意思決定ベースラインになることです。
少しそれを解きほぐしましょう。仕事を大切にする人々にとって、Opus 4.1で生産性のベースラインに達したと思います。会話だけでなく、ドキュメント、シート、コード、デッキで生産的であることが可能です。Opus 4.1は今日以前のClaudeの以前のモデルでした。
さて、このモデルでは、生産的から完璧へと進むだけではありません。
生産的から意思決定へと進みます。そしてこれは、私がこの全時間言ってきたことの核心に触れます。このモデルは、重要な決定を行うことに時間を集中できるようにセットアップしてくれます。なぜなら、それが生み出す作業が本当に明確だからです。そしてそれは、チャットでも、選択したい任意の出力形式でも同様に真実です。
それが私が興奮している理由です。なぜなら、あなたと並んで働き、まあまあのドラフトを提供する労働者の仲間から、時間を節約し、本当にスマートな決定を行うのを助けるように設計された、よりプロフェッショナルな同僚へと移行しているように感じるからです。
それは私を未来について本当に興奮させます。なぜなら、私はそのようなAIの同僚を持ちたいからです。
そして私は、仕事に近く保ち、質の高い仕事をしているように感じさせてくれるより多くのやり取りを望んでいます。なぜなら、私たち人間はそれに誇りを感じるからです。
このビデオがそこまで行くとは予想していなかったかもしれません。ネイトがAIモデルについて話すだけで、それがどれほど素晴らしいか、どのように自動化するかについて話すだけだと思うかもしれませんし、それは素晴らしく、66ページの顧客の引用から一度でPowerPointにできるなら、明らかに多くを自動化しています。
しかし、それが本当に重要な理由ではありません。人間を仕事に近づけるから重要なのです。押し返し、明確に考え、うまく表現する能力のおかげで、私たちは同僚として一緒に働くことができます。
そして最終的に、仕事自体がより高品質で、はるかに速く、私たちがそれに触れ、独自の視点のスタンプを届けたので、人として誇れる方法で行われます。
私たちが持っている領域経験、私たちが持っている代謝された誠実さの感覚、私たちの特定の領域で専門知識を持つ人々として持っている代謝された本能の感覚。このClaudeモデルは、私たちの専門知識が輝くのを容易にします。
楽しんでください。チェックしてみてください。あなたの考えを聞かせてください。
明らかに私はまだテストの初期段階です。数日間持っています。本当に興奮しています。教えてください。


コメント