新しい Claude Cowork が PC 上であらゆる作業を実行、そして超知能が数学分野に到来しつつある

Anthropic社が新たにリリースした Claude Cowork は、単なるチャットアシステントの域を超えた、真の協働パートナーとしての機能を持つ。ユーザーは自身のコンピューター上のフォルダを共有し、ファイルの整理、要約作成、タスク管理などを Claude に委任できる。現時点では Claude Max プラン加入者のみがアクセス可能で、Mac 環境に限定されているものの、この技術は AI エージェントの自律性向上を象徴している。一方、数学分野では GPT-5.2 や Claude 4.5、Gemini 3 といった最新モデルが Arc-AGI ベンチマークで顕著な成果を上げており、単なる記憶ではなく真の推論能力を示している。特筆すべきは、これらのモデルが著名な数学者エルデシュの未解決問題を自律的に解決し始めている点である。GPT-5.2 はわずか15分で数学的証明を生成し、人間の研究者が何年もかけて取り組んできた問題に新たな解法を提示している。2025年12月から2026年1月にかけて、複数の AI モデルが次々と完全な数学的証明を生成しており、これは AI が「ハイプ」ではなく実質的な知的進歩を遂げていることの証左である。

NOVO Claude COWORK Faz Tudo no PC e Super Inteligências Estão Chegando na Matemática

Aprenda Inteligência Artificial! ▸ Aprenda Agentes iA: ▸ Seja MEMBRO:

Claude Cowork の登場と AI エージェントの進化
Claude Cowork とは何か
Cowork の実際の使い方
エージェントの自律性と安全性
Cowork の実用例
プライバシーとセキュリティの懸念
アクセスと利用の制限
AI の数学的推論能力の飛躍的向上
GPT-5.2 と記憶ではなく推論する能力
著名な数学者による AI の評価
AI による問題解決の驚異的なスピード
AI の進歩は「ハイプ」ではない

Claude Cowork の登場と AI エージェントの進化

見てください、Claude 4.5、ChatGPT 5.2、Gemini 3 が2026年1月の時点でここに揃っています。これらすべてが完全な解決策を見つけ始めており、これがますます一般的なことになってきています。

皆さん、Anthropic 社が Claude Cowork をリリースしました。私たちは、たくさんの質問を投げかけるだけのシンプルなアシスタントから、いくつかのタスクを渡して、それが何をしているかを見守る旅の仲間へと移行しつつあります。

何が起こっているのか理解していきましょう。一緒に見ていきます。

さあ、皆さん。いつもライクを残してくれた皆さん、チャンネル登録してくれた皆さん、本当にありがとうございます。この人工知能チャンネルをスポンサーしてくださっているチャンネルメンバーの皆様に特別な感謝を申し上げます。メンバーの方々は、WhatsApp との統合、MCP、PDF の読み取り、スプレッドシートなどの方法を教える知的エージェントに関する限定動画にアクセスでき、早期公開動画も視聴できることを覚えておいてください。

Claude Cowork とは何か

さて、皆さん、ここで起こっているのは、Anthropic 社が Claude Cowork をリリースしたということです。これは共有ワークスペースのアイデアで、あなたの仕事のために Claude Code が休むというものです。ちょっと韻を踏んだような奇妙な感じになりましたが、そういうことです。

主なアイデアはこれです。Claude Code というのは、コンピュータープログラムの作成を支援するコーディングプラットフォームで、レビュータスクなど一連の作業を渡していくものです。その機能はすでに想像している通りプログラミングです。

でも何が起こったかというと、人々が Claude Code を実質的にあらゆることに使い始めたのです。これは私も VS Code や Cursor などの中でプログラミングエージェントを使っているときにすぐに気づいたことで、それらのプログラミングエージェントが私たちのためにできるタスクがはるかに興味深いものだったのです。

そこで彼らはこの Cowork を作りました。これは開発者だけでなく、一般的な作業のための仕事のパートナーなのです。現在、これは Claude Max のプレビューとして利用可能で、あの月額1ドルのサブスクリプション、ちょっと高めのやつですね。

ですから、多くの人がアクセスできないでしょうし、今のところ Mac でしか動作しません。つまり、多くの人がすでに使えないというニュースがあるわけです。

Cowork の実際の使い方

では、この Cowork のアイデアは何なのでしょうか。アプリケーションにアクセスすると、チャットと Cowork を選択できます。チャットはアシスタントのようなものです。

Cowork は違います。共有できるフォルダがあります。そして、あなたの To Do リストから何か片付けましょうかと聞いてきます。いくつかのオプションがあります。例えば、ファイルの作成、フォルダの整理、メッセージの送信、プロトタイプの作成などです。そしてファイルを作成するをクリックします。

こうコメントします。今週の会議の要約を作成して、私のアクションアイテムを見つけてください。どこで私がより効率的になれると思いますか、と。

会議を見て、アクションアイテムを見るので、チャットはすでに効率性を高めるためのいくつかのアイデアを提供できるかもしれません。

そしてここでフォルダを選択します。会議の文字起こしフォルダを置いて、アシスタントに作業をさせます。すると、Cowork はいくつか質問をします。どのレベルの詳細が必要ですか。クイック要約、詳細なメモ、実行しているタスクに関連することなど。

タスクを実行し始めると、プログレスバーが開き、いくつかの回答を出し始めます。作業中にさらに依頼することもできます。カレンダーで確認してもらうよう頼むこともできます。すると、それらのタスクを追加し、やっていることを表示し、回答を生成し、コンテンツを生成していき、最後にはプログレスバーがすべてチェックされ、依頼したことが完了したいくつかのドキュメントができあがります。

これが主な違いです。プログラミングでエージェントがコードを書くのと同じように、この場合、エージェントはあなたが具体的に解決したいタスクに取り組みます。そして最後までやり遂げます。さらに何かでこの会話を続けたければ、続けられます。

どう思いますか。彼らはこうコメントしています。Claude にフォルダへのアクセスを与えます。それはあなたのコンピューター上の実際のフォルダです。すると Claude はこのフォルダ内のファイルを読み、編集し、作成できます。

何かを再編成したい、ファイルを作成したい、ファイルを編集したい、そのレベルのことであれば、できます。

エージェントの自律性と安全性

いつものことですが、エージェントはますます自律的になっています。計画を作成し、その計画を実行します。そして、すでに気づいているかもしれませんが、昨日の Claude Healthcare の動画で、すでにその話題を提起していました。

基本的に、Claude で作業している人は3つのことを知っておく必要があります。プロンプトの一部はあなたが作成し、エージェントの別の部分はコネクタを通じてアクセスする外部ドキュメント、そしてもう一つの部分はスキル、つまりすでに事前定義されている特定のタスクの能力です。

例えば、要約を作成するスキルがあれば、異なるコネクタにある、あるいは異なるフォルダにある様々なドキュメントにその要約スキルを適用できます。

コネクタで外部情報にアクセスし、スキル(能力と訳されています)で、Claude のドキュメント、プレゼンテーション、その他のファイルを作成する能力を向上させます。

これがスキルの面白さです、皆さん。私はすでにスキルについての動画を作っています。それを見れば、よりよく理解できるでしょう。

彼らはこうコメントしています。Chrome の Claude Cowork とペアリングできます。Chrome に Claude の拡張機能があるからです。正直に言うと、ここで正直な意見を述べなければなりません。

Chrome の拡張機能のところに来ました。ここに Claude の拡張機能がありますが、評価がかなり低く、5点満点中2.9です。時々絶賛している人もいますが、ここで多くの人が不満を述べています。1月12日、つまり1日前の投稿を見ると、認証が機能していない、ログインできないという人がいて、Perplexity にすでにあるもの以外に目新しいものがないと不満を述べている人がいます。

Claude を追加しようとクリックすると、すべてのウェブサイト上のすべてのデータを読み取り、変更する権限が必要だと表示されました。それだけで私はインストールしたくないのですが、おそらくあなたは気にせずこの拡張機能を入れるかもしれません。私は入れませんでした。特にこの評価がインターネット上にあるすべてのものを読み取るアプリケーションにしては低すぎるからです。

しかし、これは Cowork が機能するために必須ではなく、単なる追加機能です。

Cowork の実用例

Cowork が何に役立つのかを簡潔に言うと、彼らはこう言っています。この体験はメッセージのやり取りというよりも、同僚にメモを残すようなものです。

朝起きてキッチンに来ると、お皿洗ってね、ボブ、というメモがあるのを知っていますよね。そういう感じです、ただし相手は人工知能です。

こちらの別の例では、この人のデスクトップが散らかっていて、フォルダ、写真、ファイル、あらゆるものが整理されていない状態です。Cowork に入って、デスクトップを整理してもらえますか、と尋ね始めます。すると Claude は、わかりました、任せてください、やりますよと言います。

メモを取り始めます。70のプロジェクト、20のスクリーンショット、35の写真、18の動画、25のテキスト、たくさんのバックアップがあります。そして何をし始めるか。これらすべてを整理して、最終的に美しいバージョンにします。ドキュメントフォルダ、写真フォルダ、プロジェクトフォルダ、スクリーンショットフォルダ、動画フォルダ。

これが強力だとわかりましたね、皆さん。例えば、デスクトップを共有すれば、あなたのために作業をしてくれます。最後にすべてうまくいったとコメントし、あなたは喜んで、それで終わりです。

プライバシーとセキュリティの懸念

でも、こう思うでしょう。このツールは私のコンピューター全体にアクセスするのか。すべてに無差別にアクセスするのか。いいえ。

基本的にフォルダとコネクタを選択でき、Claude は明示的にアクセス権を与えないものは読むことも編集することもできません。Claude は重要なアクションを実行する前に許可を求めます。

この点は非常に明確にしておく必要があります。何かを削除するとき、何かをするとき、許可を求めます。

しかし、彼らはこうもコメントしています。Claude はローカルファイルやローカルフォルダの削除など、潜在的に破壊的なアクションを取る可能性があります。これについてはすでにニュースがありました。アシスタントがすべてを削除してハードドライブ全体を失った人の話です。

しかし、これは指示された場合にのみ実行します。ただし、実際のところ、アシスタントによっては、すべてを無限に承認するというチェックボックスがあります。

そして気づいたら、ハードドライブが空っぽになっているわけです。

彼らはインジェクションのリスクについてもコメントしています。インターネットで見ているテキストの中や PDF の中に隠されていることがある悪意のあるテキストのことです。PDF の中に、あなたには見えないけれど Claude には見える悪意のあるテキストがあり、リスクにさらされる可能性があります。

彼らはここでコメントしていて、この部分は重要です。これらのリスクは Cowork に限ったことではありませんが、単純な会話を超えたより高度なツールを使うのはこれが初めてかもしれません。

ですから、インターネットからのファイル、ランダムにダウンロードした PDF、アクセスしているウェブサイトで、アシスタントに読ませる場合は、リスクを冒している可能性があることを知っておいてください。そのサイトを作った人によっては、アシスタントが引っかかるトリックがあるかもしれません。

アクセスと利用の制限

どう思いますか。いくつか問題がありますね。まず、とても高額なプランで、Max プランで、ほとんど誰も契約していません。ですから、おそらくこの障壁だけで、多くの人がテストできないでしょう。第二の障壁は、今のところ Apple の iOS でのみ動作しているということです。つまり、Max の契約者で、iOS を持っている必要があります。

そのため、多くの人が今のところ使うことになるでしょう。でも、次のニュースを待ちましょう。今のところ、私は Windows を使っているので使えませんが、このツールが利用可能になり次第、テストして、これらがどのように機能するか見ていきます。

AI の数学的推論能力の飛躍的向上

そして、なぜ私がこれらのツールについて楽観的で、ますます高度なエージェントを作っているのか。それはこれが理由です、皆さん。

Arc-AGI、つまり知的でなく、ただ記憶しているだけのすべての人工知能にとっての有名なトリックベンチマークで、Poetic が達成した最高スコアは、例えば GPT-5.2 を使用したものでした。

Poetic は OpenAI のものではないことを覚えておいてください。彼らは Grok や Gemini を含む他のモデルでいくつかのバージョンを作成しています。基本的にプロンプトエンジニアリングを行うことで、ここ Arc-AGI で最高スコアを獲得しています。

Arc 2 に関して明確にしておく必要がある重要なことは何か。チャットに簡単な質問をすることを想像してください。5個のオレンジと2人がいます、この2人の間でどう分けますか、というような質問です。すると、何らかの答えを返します。

質問はこうです。彼が出した答えが何であれ、それはインターネットで読んだ答えで、したがってすでに知っていたものなのか、それともその場で考えて計算した答えで、その時に行った推論に従って答えを出したものなのか。

Arc-AGI はまさにこの、ただ記憶しているだけの人たちを区別するためのものです。

ここで良いスコアを取っているモデルが記憶していないモデルであることを明確にするために、彼らはその場で答えを推論しています。

GPT-5.2 と記憶ではなく推論する能力

そこで、あなたは私に尋ねます。で、ボブ、それで。だって、ここで良いスコアは GPT-5.2 からだと見えるし、もしかしたらあなたは GPT-5.2 が好きじゃない人の一人かもしれない、と。

答えはとてもシンプルです。GPT-5.2 は最良の答えを与えないかもしれませんが、確実に言えることは、それが与える答えは記憶された答えではないということです。そしてこれはある意味で、モデルのパフォーマンスが時に低下する可能性があります。まさに記憶した人たちは、推論することなく既成の答えを出しているからです。

このニュアンスを理解するのは少し難しいですが、明確にするために、例えば GPT-5.2 は、人生の歴史で一度も見られたことのない問題、本当に前例のない問題を扱うのに優れた AI モデルです。記憶しているのではなく、本当に推論しているからです。

非常に高いスコアを持つ可能性のある他のモデルは、そこで記憶していて、ある意味で既成の答えを出しているため、非常に古典的な方法で尋ねられる質問、多くの場合すでに行われた知識を利用する質問に正解しています。

著名な数学者による AI の評価

具体的に何の話をしているのか。例えば、テレンス・タオは現代最高の数学者の一人ですが、彼は数学オタクの Twitter にこう投稿しました。エルデシュの問題への AI ツールの適用がマイルストーンに達した、と。エルデシュは偉大な数学者で、人々が解決するために1000以上の問題を発明して残しました。問題728、この人が1000以上の問題を解決のために作って開放していたものです。

この問題は AI によってほぼ自律的に解決されました。基本的に、通常は誰かがそこで付き添って AI を導いているのですが、結果に関するいくつかのフィードバックに基づく初期の試みの精神で、私たちが知る限り、既存の文献では再現されていない問題でしたが、類似の方法で証明された類似の結果が見つかっています。

つまり、彼が言いたいのは、同じ問題に対して複数の解決策があり、この具体的な解決策は誰もそれまで見つけていなかったということです。

Nilson Mann も同じです。彼はここで、テレンス・タオに受け入れられた問題の証明を提出しました。

証明は GPT-5.2 Pro によって生成され、Lean で形式化されました。つまり、GPT-5.2 が証明を作成しましたが、評価のための標準で書かれていなかったため、Lean で形式化しました。彼はここでコメントしています。多くの未解決問題が、誰かが ChatGPT にそれを解決するよう促すのを待っています。

とても驚きですよね、皆さん。

AI による問題解決の驚異的なスピード

ここで少し下に行くと、Matt Slit が、5.2 がこの問題を解決するのにどれくらいかかったか尋ねました。すると Nilson Mann は、約15分だと答えました。

これはとても天才的なことです、皆さん。このタイプの証明問題を15分で解決できる人間は一人もいません。

このテーマで注目を集めたもう一つのことは、これらのエルデシュ問題の質問で、緑色があると完全な解決策です。黄色があると部分的な解決策で、赤は失敗です。

ですから、ここでの項目、人工知能によって生成された解決策、未解決問題に対する部分的な解決策または否定的な結果。つまり、ここでは人工知能が生成していることについて話しています。

Alpha Evolve が部分的な解決策を作成し、ChatGPT 5.2 thinking が2026年1月10日、数日前に完全な解決策を作成し、2026年の6日と8日と10日に ChatGPT 5.2 Pro と Aristotle による完全な解決策があることがわかります。

つまり、1月のたった今、数日前に、Aristotle と ChatGPT 5.2 による完全な証明が3つすでにあります。

AI によって作成された完全な解決策についても同じです。ただし、すでに人間が以前に作成した解決策があったものです。

そして、あなたは気づくでしょう、2025年12月、2026年1月を見てください。Claude 4.5、ChatGPT 5.2、Gemini 3 が2026年1月に、これらすべてが完全な解決策を見つけ始めており、これがますます一般的なことになってきています。

AI の進歩は「ハイプ」ではない

皆さんが何が起こっているのか理解できるかどうかわかりません。今日まで、これはすべてハイプで、すぐに過ぎ去ると言っている人たちがいます。

しかし、これは起こっていることに基づいていない意見です。私たちは今起こっていることを見ています、2025年12月、2026年1月。

これがハイプだ、これは過ぎ去る、これらの企業はすぐに価値を失う、人工知能に大惨事が起こる、これはすべて嘘で、何も起こっていないと言っている人たちがいます。

もしそれが本当なら、今1月、去年の12月に起こっているこれらの発見は起こっていないでしょう。

しかし、真実はこれです、皆さん。ダチョウのように頭を地面に埋めて、これらのことが起こっていないふりをすることはできません。なぜなら起こっているからです。

下にコメントして、あなたが何を考えているか教えてください。知りたいです。

おそらく、この Erdős Problems について将来また話すことになるでしょう。これは素晴らしいトピックで、あなたもこれについて知りたいと確信していますし、これは Claude の共有ワークスペースで起こっていることと完全に繋がっています。

関係ないように見えるかもしれませんが、関係があるのです、皆さん。これらのエージェントはますます知的になってきており、私たちが彼らと会話し、相互作用し始めると、素晴らしい結果を得ることが可能になります。

下にあなたの考えをコメントしてください。素晴らしいことが起こっているという人たちに同意しているなら、ライクを残して、チャンネル登録してください。チャンネルをサポートしてこのような動画を見続けたいなら、メンバーになってください。メンバーは知的エージェントに関する限定動画と早期公開動画にアクセスできます。

それでは、ライクを残してください。ありがとうございました。