AnthropicのClaude Code流出が明かす次世代AI:常時稼働型エージェントChyrosと業界の最新動向

Anthropic・Claude・ダリオアモデイ
この記事は約29分で読めます。

AnthropicのClaude Codeのソースコードが流出し、次世代メモリアーキテクチャと常時稼働型の自律エージェント「Chyros」の存在が明らかになった。OpenAIは史上最高額の1220億ドルを調達し、チャット・コーディング・ブラウジングを統合したスーパーアプリ構想を発表。Microsoftは25言語対応の文字起こしモデルMAI Transcribe 1をリリースし、GoogleはVO3.1 Lightで動画生成コストを大幅削減。AlibabaはQuinn 3.5 OmniとQuinn 3.6 Plusを相次いで公開し、エージェント機能を強化している。

AI News: Anthropic Leak is Bigger Than You Think
Here's the AI News you probably missed this week. Try Recraft V4 now and experience an image generation model with excep...

Claude Codeソースコード流出の衝撃

今週も本当にクレイジーな一週間でした。たくさんのことが起きていますが、私の目標は実際のノイズと、多くの人にとって興味深く有用なものを切り分けることです。今週はエイプリルフールの週でもあったので、まあ、本当にノイズが多かったですね。そういう言い方になります。では、実際に重要なことを分解していきましょう。

皆さんの時間を無駄にするつもりはありません。早速始めていきます。今週最大のニュースから始めましょう。それは、AnthropicのClaude Codeが実際にインターネット上に流出したという事実です。これが最初の発見源だと思います。XのFried riceさんがこう投稿しています。Claude Codeのソースコードがnpmレジストリのマップファイルを通じて流出しました。

そして実際にClaude Codeのソースをダウンロードできる場所へのリンクを共有したんです。さて、Anthropicは通常、自分たちが何をしているかをかなり秘密主義で進める会社です。しかし今回これが流出したことで、基本的に人々はそれを元に反復作業を行い、オープンソースとして扱って独自バージョンを作り始めています。

Anthropicは可能な限りDMCA削除申請を行っているようです。これがGitHub上で猛烈に広がったからです。でも私が思うに、この流出から最も興味深いのは、実際にコードを見て学んだこと、そして実際に流出に何が含まれていたかということです。Anthropicが取り組んできたことや、Anthropicの未来に何が期待できるかについて、ちょっとしたスニークピークを与えてくれました。

このVentureBeatの記事が、おそらくコードで見つかったものを最もよく分解していると思います。流出したソースは、従来の全てを保存する検索方式から離れた、洗練された三層メモリアーキテクチャを明らかにしています。このアーキテクチャは自己修復メモリシステムを使用しています。その中核にあるのはmemory.mdで、これは常にコンテキストに読み込まれるポインタの軽量インデックスです。

インデックスはデータを保存しません。場所を保存するんです。一方、生のトランスクリプトは決してコンテキストに完全に読み戻されることはなく、特定の識別子についてgrepされるだけです。さて、grepは基本的に検索を意味する言葉です。grepは正規表現を使って、与えられたパターンに一致する行をテキストから検索します。つまり、Claude Codeと会話しているとき、それはあなたが話している内容について大量の情報を保存し、その全てへの参照をメモリファイル内に保存しています。

そしてそのメモリファイルがコンテキストに読み込まれるものなんです。そしてそれがコンテキストに、基本的にあなたが話していることをどこで検索すればいいかを教えるわけです。きっと私はこれを過度に単純化していると思いますが、この情報から私が理解しているのはこういうことです。でも私の意見では、もっと興味深いのは彼らがChyrosと呼ぶものを見つけたことです。

常時稼働型エージェントChyrosの登場

Chyrosはユーザー体験における根本的な転換を表しています。自律デーモンモードです。さて、デーモンとは基本的にコンピュータのバックグラウンドで実行され、何かが起こるのを待って別の何かをトリガーするものです。このChyrosにより、Claude Codeは常時稼働のバックグラウンドエージェントとして動作できるようになります。エージェントはユーザーがアイドル状態のときにメモリの統合を実行します。

私が見つけたこのXの投稿が、おそらくこれを最もよく説明していると思います。Chyrosは常時稼働型のプロアクティブなClaudeで、あなたが頼まなくても物事を実行します。あなたが働いている間も寝ている間も、24時間365日バックグラウンドで動作します。数秒ごとに、Chyrosはハートビートを受け取ります。基本的に、今すぐやる価値があることは何かというプロンプトです。

何が起きているかを見て判断を下します。何かするか、静かにしているか。もし行動するなら、コードのエラーを修正したり、メッセージに返信したり、ファイルを更新したり、タスクを実行したりできます。基本的に、Claude Codeがすでにできることは何でもです。ただあなたが指示しなくてもです。でもそれには通常のClaude Codeが持っていない3つの専用ツールがあります。1つ、プッシュ通知です。

ターミナルにいないときでも、電話やデスクトップであなたに連絡できます。2つ、ファイル配信です。あなたが頼まなくても、作成したものを送ることができます。そして3つ、プルリクエストのサブスクリプションです。GitHubを監視して、コードの変更に独自に反応できます。通常のClaude Codeはあなたが話しかけたときだけあなたと話せます。

Chyrosはあなたの肩を叩くことができます。そして毎日のログを保持します。何に気づいたか、何を決定したか、何をしたかの全てです。彼はここで、これが実際に何を意味するかについていくつかの例を挙げています。これが実際にどういう意味かを考えてみてください。あなたが寝ている間にウェブサイトがダウンします。Chyrosがそれを検知し、サーバーを再起動し、通知を送ります。

あなたがそれを見るまでには、すでに復旧しています。午前2時に顧客からのクレームメールが届きます。Chyrosがそれを読んで、返信を送り、何をしたかを記録します。目が覚めたときには、すでに解決済みです。Stripeの購読ページに3日間表示されていた誤字があります。Chyrosがそれを見つけて修正し、変更を記録します。

私たちはポストプロンプト時代に向かっています。これは私がしばらく説明しようとしてきたことのような気がします。CESでパネルディスカッションをして、そのパネル中にこれについて広範囲に話したんですが、私たちはAIがもっとプロアクティブになる時代に移行していると思います。そこに座ってプロンプトを入力して何かをするよう頼むのではありません。

あなたが何をするか、何に使いたいかを学習し、プロンプトなしであなたに代わって必要なことをするようになります。時間とともにLLMはバックグラウンドに移行し、実際に対話するものというよりも、もっともっと配管のようなものになっていくでしょう。

そして私は、Anthropicが取り組んでいるこのChyrosが、まだClaude Codeには展開されていないんですが、これはソースコードで気づかれたものに過ぎませんが、これは私たちがそれに向けてステップを踏んでいるように感じるものです。OpenClawがcronジョブを実行するときや、さまざまなハートビートを持っていて自律的に物事を行うときにも、同様のものが見られます。

これは本当にAIがもっとバックグラウンドに落ちていくというものに近づいているように感じます。人々はCapiaraのより多くの証拠も見つけました。これは先週の動画で話しましたね。彼らはCapiaraとMythosという名前を交互に使っているようです。これはAnthropicの次のレベルのモデルのようなものです。

彼らが隠れたバディシステムと呼ぶものも見つけました。これはたまごっちスタイルのターミナルペットで、カオスやスナークのような統計値があります。多くの人が、これは実際には計画されていたエイプリルフールのジョークで、流出の結果として見送られた可能性が高いと推測しています。個人的に、私がこの全体から最も興味深いと思う結論は、Chyrosです。バックグラウンドエージェント、つまりコンピュータ上で動作し、あなたに頼まれなくても問題を解決できるように、プロアクティブにすべきことを探すデーモンです。そしてそれがAIの向かう場所であってほしいと思います。正直なところ、私はそれと座って会話をしたくありません。何をすべきかを知っていて、すべきことをただ実行してほしいんです。

Boris Churneyさんがここで言っていますが、彼はClaude Codeの責任者だと思います。基本的に、これは単なる開発者のエラーで起きたと言っています。

彼はこう続けています。「ミスは起こります。チームとして重要なのは、決して個人の責任ではないと認識することです。それはプロセス、文化、またはインフラの問題です。」この場合、より自動化されるべき手動デプロイステップがありました。私たちのチームは次回に向けて自動化にいくつかの改善を加えました。あと数個が進行中です。

つまり、誰かが本当に非難されたり、このことで解雇されたりするようなことはなかったようです。そしてAnthropicはそれほど大騒ぎしているようにも見えません。これについて本当に公式声明のようなものは出ていません。顧客に関するプライベート情報などが流出したわけでもありません。

でも私の予感では、ソースコードを活用して独自バージョンを立ち上げる人々から、Claude Codeのスピンオフが本当に本当にすぐに市場に登場するだろうと思います。

ReCraftの新モデルとOpenAIの巨額資金調達

今週、ReCraftから視覚的に素晴らしいAIモデルのアップデートがありました。もし以前に聞いたことがなければ、彼らはプロフェッショナルな美学とエージェンシー品質のデザインアセットに特化して構築されたAIツールです。

私も以前使ったことがありますが、彼らはつい最近Recraft V4ファミリーのモデルをローンチしました。このアップグレードは、クリエイティブプロフェッショナル向けに高度なアートディレクション出力を提供することに本当に焦点を当てています。例えば、単発の画像を生成するだけでなく、新しいV4モデルは、まとまったブランドビジュアル、ウェブサイトのプロトタイピング、製品パッケージング、ロゴ、そして使用準備が整ったベクターイラストなどのために設計されています。

そしてV4リリースの下には実際に2つの新しいモデルがあります。V4とV4 Proモデルで、これらはフォトリアリスティックなシーン、モックアップ、詳細なイラスト、そして実際のアートディレクターのように照明、素材、ネガティブスペースを理解するより複雑な構成に優れています。そしてV4ベクターモデルは、ネイティブのベクターグラフィックスを生成できます。

つまり、ロゴ、アイコン、イラストなどで、AIを使ってこの種のものを生成しようとするときに通常起こるベクターアートの外見を偽装するのではなく、実際にスケーラブルで編集可能なSVGなんです。厳格なプロンプト遵守、素晴らしい美学があり、AIにしては驚くほど画像上のテキストをうまく扱います。

私は以前、AIイメージモデルが良いかどうかの最大のテストの1つだと述べました。なぜなら、今日の高度なモデルでさえ、私はまだAI画像で奇妙なテキストを見かけるからです。そしてまあ、それはプロフェッショナルグレードのブランドアセットには通用しません。照明、影、パッケージングを備えたフォトリアリスティックな製品モックアップのようなものも生成できて、実際の製品撮影のコストなしで、実際の製品撮影のように見えます。

これは、デザイナー、マーケター、コンテンツクリエイター、または本当にブランドのためにビジュアルアセットを構築している人にとって本当に素晴らしいツールです。通常見かけるAI画像ツールのほとんどよりも、より製品志向に感じられます。ReCraftが私のチャンネルをサポートし、今日の動画のこの部分をスポンサーしてくれたことに感謝します。

もっと詳しく知りたい、自分で試してみたいという方は、説明欄のリンクにアクセスしてください。今週、OpenAIは評価額8520億ドルで1220億ドルを調達しました。これはどの企業による史上最大の資金調達です。そしてこれによりOpenAIは、歴史上最も急成長している企業とほぼ言えるようになります。彼らはここでの投稿で少し自慢さえしています。

この段階で、私たちはAlphabetやMetaを含む、インターネットとモバイル時代を定義した企業の4倍の速さで収益を成長させています。彼らは現在、月に20億ドルの収益を生み出しています。OpenAIとMicrosoftの間の決裂について多くの話がありました。

そしてまあ、彼らが調達したこの新しいラウンドで、誰がここにリストされていると思いますか? Microsoftもこの調達に参加しています。つまり、両者の間に大きな決裂があったというすべての憶測にもかかわらず、彼らはまだOpenAIに資金を注ぎ込んでいるんです。さて、彼らが出したこのブログ投稿は、主に彼らが行った巨大な資金調達に焦点を当てていますが、ここの一番下までスクロールすると、これが私にとって本当に興味深いのは、彼らが次に何をするかについてここでいくつかの詳細に入っているからです。

つまり、私たちはAnthropicがどこに向かっているかを、流出したソースコードのおかげで知りました。OpenAIがどこに向かっているかを知っているのは、彼らがこの資金調達の記事にそれを埋め込んだからです。彼らは言っています。「私たちは統合されたAIスーパーアプリを構築しています。モデルがより能力を持つようになると、制限要因はインテリジェンスから使いやすさへと移行します。ユーザーは分断されたツールを望んでいません。

意図を理解し、行動を起こし、アプリケーション、データ、ワークフローを横断して動作できる単一のシステムを望んでいます。私たちのスーパーアプリは、チャット、GPT、コーデックス、ブラウジング、そしてより広範なエージェント機能を1つのエージェント第一の体験にまとめます。彼らは、インターネットをブラウジングするためにAtlasブラウザを使い、チャットのためにChatGPTを使い、コーディングのためにCodexを使い、アプリからアプリへとジャンプする必要をなくしたいんです。

実際、彼らはここでAnthropicを少しモデルにしているような気がします。なぜならAnthropicにはClaudeアプリがありますが、そのClaudeアプリの中にはClaudeチャット、Claude Co-work、Claude Codeが全て単一のアプリ内にあって使えるからです。OpenAIはその方向に進んでいるような気がします。そして彼らがAnthropicの足跡を追って、よりプロアクティブなバックグラウンドAIエージェントも追求しても驚きません。

つまり、結局のところ、彼らはOpenClawを作成したPeter Steinbergerさんを、OpenAIチームの一員として迎え入れました。だから彼らは明らかにそのエージェント的な考え方で考えていて、必要だと言う前に私たちのために代わりにやってほしいことをするものを構築しようとしています。それがSoraを段階的に廃止した理由でもあります。

彼らは作業する予定だったアダルトモードをスキップしているようです。そして彼らは本当にコアコンピテンシーに集中しています。それはチャットや研究だけでなく、コーディングやエージェント的なユースケースのための本当に本当にインテリジェントなモデルです。余談ですが、私はこれを本当に本当に興味深いと思います。

これはWall Street Journalの記事です。先週Soraがシャットダウンされた経緯を分解しています。これについては以前の動画で詳しく取り上げました。でもこの記事について私が魅力的だと思った1つのことは、Soraが1日あたり約100万ドルを失っていたということです。その文脈があれば、彼らがそれをシャットダウンしなければならなかった理由はかなり明白です。

年間3億ドル以上を失っていたんですから。

MicrosoftとGoogleの新技術

今週、Microsoftからもいくつかのニュースがありました。彼らはMAI Transcribe 1という真新しい文字起こしモデルをリリースしました。これは25言語でクラス最高の精度を達成する新しい音声認識モデルで、文字起こしワークロード専用に構築されています。ここでWERのこのテストで見ることができます。WERとは単語エラー率のことですが、この新しいMAI Transcribe 1は、GPT Transcribe、Scribe V2、Gemini 3を大幅に上回っています。

1 Flashと、OpenAIのWhisperモデルをかなりの差で上回っています。騒がしい環境でも本当にうまく機能するようです。そしてまあ、私は早期アクセスを得たので、ちょっとテストしてみましょう。ここMAIプレイグラウンド内で見ることができます。以前の動画で遊んだMAI image 2にアクセスできます。MAI voiceモデル、これはMicrosoftのテキスト読み上げモデルです。そして真新しいMAI transcribe oneモデルです。

では、これを選択してみましょう。ここから海が見えますが、友達の声が聞こえません。なぜなら風が彼女のプレイリストよりも大きいからです。彼女が「ここに来て」と叫びました。そして私は「ここにいるよ。ただ聞こえないんだ」と叫び返しました。それから彼女は「私たちのスナックは8ドルかかった」と言いました。そして私は「証拠はもう食べちゃったよ」と答えました。

近くにいたお父さんが息子に日焼け止めを塗るように言いました。そして子供は、それは太陽もブロックしなきゃいけないってことかと尋ねました。海は、コメディショー全体を見ることができるかのようにキラキラし続けました。さあ、これを送信してみましょう。私は同音異義語をたくさん使ったことに注意してください。同じ単語だけど意味が違うという、それが正しい言葉かどうかわかりませんが。どれだけうまくできたか見てみましょう。

ここから海が見えますが、友達の声が聞こえません。なぜなら風が彼女のプレイリストよりも大きいからです。彼女が「ここに来て」と叫びました。そして私は「ここにいるよ。ただ聞こえないんだ」と叫び返しました。それから彼女は「私たちのスナックは8ドルかかった」と言いました。そして私は「証拠はもう食べちゃったよ」と答えました。近くにいたお父さんが息子に日焼け止めを塗るように言いました。そして子供は、それは太陽もブロックしなきゃいけないってことかと尋ねました。

海は、コメディショー全体を見ることができるかのようにキラキラし続けました。つまり、私が言っていた言葉の違いを知っていました。なぜなら、私が言っていることの全ての文脈も理解しているからだと思います。今週、さまざまなMicrosoftツールがMicrosoft Foundry内で利用可能になったことも発表されました。つまり、開発者やこれらのモデルの上に構築したい人々も、それらにアクセスできるようになりました。

つまり、Microsoft Foundryで構築しているものの中で直接、MAI Transcribe 1、MAI Voice One、MAI Image 2モデルを使用できるようになったんです。Googleは今週、動画モデルの新バージョン、VO3.1をロールアウトし、現在VO3.1 Lightをリリースしています。これはより費用対効果の高い動画生成モデルです。トレードオフは品質にあると確信していますが、動画を生成するのがより安くなりました。

ここで価格設定を見ることができます。VO3.1はオーディオ付き標準動画で約40セントです。VO3.1 fastは15セント、VO3.1 lightは720pでわずか5セントです。また、3.1 lightは4Kでは生成しないようです。だから4Kが欲しい場合は、3.1 fastか3.1を使う必要があります。でもほとんどのものには1080pでおそらく大丈夫でしょう。

そして後で必要なら、アップスケーラーを使えばいいだけです。これについてもう1つ指摘したいことがあります。GoogleのLogan Kilpatrickさんが、VO3.1 lightを紹介するこのXの投稿を出しました。でも彼はまた、4月7日にVO3.1 fastの価格も下げると述べています。つまり、これらの価格も4月7日に下がるんです。

また、4月7日頃に他のニュースが出てくるのではないかと思わせます。これについて内部情報は何も持っていませんが、わかりませんよね? 多分4月7日頃にVOについて何か他のことが出てくるかもしれません。そして彼らはそのリリースに合わせて他のモデルの価格を下げているのかもしれません。多分。これを引用しないでください。ただ私が少し声に出して推測しているだけです。

そしてGoogleの話題になったついでに、彼らはAI Inboxという新機能をリリースしました。このAI Inboxにはスマート優先順位付けと毎日のパーソナライズされたブリーフィングがあります。さて、これについて動画の前半で話さなかった理由は、残念ながら現時点ではベータ版で、月額250ドルのGoogle AI Ultraサブスクライバー専用だからです。

つまり、最初の3ヶ月間は月額125ドルで入手できますが、通常は月額250ドルです。さて、私はテスト目的でGoogle Ultraプランを持っていて、こんな感じです。残念ながら、プライベートなので、これのほとんどをぼかさなければならないでしょう。代わりに、これが彼らのスクリーンショットです。

上部には受信箱に基づいた推奨タスクがあり、下にはキャッチアップすべきトピックがあります。そしてそれが私の受信箱が現在どのように見えるかとまさに同じです。

新しい大規模言語モデルの登場

今週は新しい大規模言語モデルもいくつか手に入りました。おそらく最も注目すべきはGoogleのGemma 4です。さて、これはオープンウェイトのオープンソースモデルで、デバイス上で実行したり、クラウドで実行したり、ファインチューニングしたり、好きなことに使えます。そして本当にパワフルなモデルです。

Apache 2.0ライセンスの下でリリースされたのが見えます。Androidデバイスやラップトップ用GPUで実行できるように設計されています。より現代的なデバイスを持っているなら、このモデルを実行できるはずです。Nvidia SparkやApple Mac Studioのようなものを持っていて、まともなメモリがあれば、これもエージェントを実行するように設計されているようです。

つまり、OpenClawのようなものを実行していて、全てローカルで実行したい場合、この新しいGemmaモデルはそういったことに最適なようです。これがこのモデルのベンチマークのクイックピークです。本当に過去のGemmaモデルとしか比較していませんが、見た感じ、本当に本当に堅実なモデルです。特にオープンウェイトで、ファインチューニングしてローカルで実行できるものとしては。

今週、Alibabaから2つではなく、2つの真新しいモデルが出ました。Quinn 3.5 Omniを手に入れました。これはオムニモーダルモデルです。つまり、テキスト、画像、音声、動画理解で機能します。そして彼らはこれに使える際立った機能を説明しています。オーディオビジュアルバイブコーディングで、カメラにあなたのビジョンを説明すれば、Quinn 3.5 Omni Plusが即座に機能的なウェブサイトやゲームを構築します。

彼らは音声でGemini 3.1 Proを上回り、音声ビジュアル理解ではそれに匹敵すると主張しています。そしてこれがこのモデルのベンチマークのピークです。ほとんど古いQuinnモデルと比較しているだけですが、ここでGemini 3.1 Proと比較しています。

ここでの全てのベンチマークで、他の全てのモデルをほぼ打ち負かしています。でもそのわずか数日後、AlibabaはQuinn 3.6 Plusもリリースしました。これは現実世界のエージェント向けに設計されたモデルのようで、次世代のエージェントコーディング、強化されたマルチモーダルビジョン用に設計され、100万トークンのコンテキストウィンドウを持っています。これはデフォルトで利用可能なので、特別なより高いトークン制限をオンにする必要はありません。

このモデルのベンチマークを見てみると、濃い紫色がここでの新しいモデルであることがわかります。そして彼らはこれを4.5 Opusと比較しています。つまり最新のOpusモデルではありません。また、Gemini 3 Proとも比較していますが、明らかにGemini 3.1 Proではありません。つまり、彼らはこれをフロンティアラボの前世代のモデルと比較しているようなものです。

でもTerminal Benchでは、これらの他のモデルを打ち負かしています。SWEBench Pro、ソフトウェアエンジニアリングベンチでは、Opus 4.5とほぼ同等です。Quinn Claw Benchは、明らかにQuinnによって作成されたベンチマークだと思いますが、それには本当に優れています。現実世界の質問と回答に本当に優れていて、動画推論に本当に優れていて、文書認識と理解に本当に優れています。

つまり、Alibabaから新しい本当に本当に堅実なモデルです。このモデルはオープンウェイトのオープンソースモデルではないようですが、この記事では、近いうちにより多くのモデルをオープンソース化すると述べています。そしてある会社から新しいモデルが出ました。まあ、これは私が実際に聞いたのは初めてです。彼らはRCと呼ばれ、Trinity Large Thinkingというモデルをリリースしました。

これもApache 2.0の下でリリースされたオープンソースモデルです。そしてこれもオープンソースモデルをリリースするアメリカの企業です。ここでベンチマークを見てみると、彼らはOpus 4.6、Kimmy K 2.5、GLM5、Miniax M2.7と比較しています。そしてそれらのモデルのほとんどとかなり同等のようですが、このTOA2航空を除いては本当にどれも打ち負かしていません。このベンチマークについては私自身あまり詳しくありません。

彼らは実際の使用を見せていて、スネークゲームを作成したり、何かエージェント的な作業のように見えることをしたり、全体で多くの異なるステップを進んでいます。ここでは本当に速くコードを作っているのが見えます。それがリアルタイムかどうかわかりませんが、コードを構築していて、月次予算プランナーアプリのようなものを作り出しています。それから、生成された迷路スクリーンセーバーが見えます。それはWolfenstein 3Dのようなものを本当に思い出させます。

繰り返しますが、これらについて本当に印象的なのは、これらがオープンウェイトモデルだということです。これらはダウンロードして、自分のシステムで実行して、クラウドで実行して、ファインチューニングして、反復して、好きなことができるモデルです。そして彼らは急速に最先端モデルに近づいています。今、クローズドソースのモデルは常にオープンモデルより少し先を行っているような気がしますが、オープンモデルはただ地歩を固め続けているように感じます。

そしてこれらが今週の新しいLLMリリースでした。正直に言うと、私は出てくる新しいLLMをテストして実験するのに本当に苦労しています。なぜなら、ほとんどの場合、私は既存のモデルでやりたいことのほとんど全てができるからです。OpenAIとAnthropicのモデルを使ってエージェントシステムを実行しています。

Neotronモデルでローカルにモデルを実行しています。それは私がブレインストーミングするのを助けてくれます。タイトルとサムネイルのアイデアを考えるのを助けてくれます。私の人生のさまざまなユースケースで助けてくれます。だから私は、これらのモデルがより良くなっていることを証明するために、テストして方法を見つける新しい方法を本当に考えるのに苦労しています。

自分自身のベンチマークがあって、これらの新しいモデルを常にテストできればいいのですが、私のメインゴールは、これらのモデルがビジネスや生活における日常のユースケースに対して最も多くの人々にとってどのように有用かを示すことだからです。そしてほとんどの場合、これらのモデルはすでに私たちがそれらに必要とすることをある程度やっています。

だから私は、ある種の日常ユーザーベンチマークを作成しようとしています。そして、もしそこに誰かそのベンチマークを作成するのを手伝ってくれたり、これらの大規模言語モデルをよりよくテストするために私と一緒に働いてくれる人がいれば、XやLinkedInで連絡してきてください。チャットしましょう。なぜなら、これらのモデルを人々の通常の日常使用のためにテストしてベンチマークするより良い方法を見つけたいからです。

その他の注目ニュース

さて、たくさんカバーしましたが、あともういくつかカバーしたいことがあります。でも本当に素早く分解します。では、ラピッドファイアに飛び込みましょう。Claudeからの新機能アップデートから始めましょう。先週、Claudeのコンピュータ使用機能について話しました。これは実際にマウスとキーボードのコントロールを取得して、ブラウザで何かをすることができるものです。

まあ、彼らは今その機能をClaude Codeに追加しました。ClaudeのProまたはMaxプランに加入していれば、その機能をプレビューできます。その機能に馴染みがなければ、先週のニュース動画をチェックしてください。なぜなら、その動画でデモをやったからです。Claude Codeと言えば、これは私が本当に興味深いと思ったものです。

Anthropicがこれを許可するとさえ思わなかったでしょうが、明らかにClaude Code用のCodexプラグインがあります。すでにClaude Codeを使っている場合、CodexプラグインはCodexを同じワークフローに持ち込む簡単な方法です。これは基本的にClaude Code内でOpenAIキーを使用し、Codexにコードをレビューさせたり、実際にタスクを委任させたりすることを可能にします。

だから本当にClaude CodeのUIが好きだけど、Codexも使いたい場合、まあ、これで両者を一緒にブレンドできるようになったんです。OpenAIと言えば、ChatGPTがApple CarPlayで利用可能になりました。だから車内から直接Chat GPTと会話したいと思ったことがあれば、まあ、明らかに今できるようになったんです。

そして、4月2日に出たものでなければ、絶対にエイプリルフールのジョークだったと誓っていただろうニュースで、OpenAIがTBPNを買収しました。TVPNはテクノロジー教育ビジネスのESPNのようなものです。Tech Business Production Networkの略だと思います。彼らは毎日のショーを行っていて、1日3時間のショーで、創業者やCEO、思想的リーダーを招いて、ちょっとした短いインタビューを行い、全てのニュースを分解し、XとYouTubeでライブストリームとして行っています。

そしてOpenAIが基本的に毎日のライブポッドキャストを買収するというのは、私にとって本当にワイルドです。特にサイドクエストをしないというこれら全ての話の後で。さて、私はTBPNの人たちにとっては素晴らしいことだと思います。素晴らしいショーです。実際、私はニュースで何も見逃していないことを確認するために視聴しています。

ただ、私が今まで見てくるとは思っていなかったことです。これがショーを編集的にどう変えるのか気になります。たとえば、OpenAIが少し奇妙なことをしたときに、OpenAIについてジョークを言うことはまだ許されるのでしょうか? AnthropicやGoogleのような競合他社のところでまだインタビューができるのでしょうか? わかりません。

OpenAI側からすると非常に興味深い選択のように思えます。どう展開するか見てみましょう。ただ本当にワイルドです。これは4月1日に投稿されました。絶対にエイプリルフールのジョークだと保証していたはずです。Perplexityはコンピュータモデルの新しいユースケースをリリースしました。税金用コンピュータと呼ばれています。Perplexityコンピュータは米国連邦税の質問のための税務モジュールを読み込みます。

コンピュータは通常、人々が最も時間とお金をかける税務作業の難しい部分を手伝うことができます。これは、公式IRS用紙で連邦所得税申告書を作成するのを手伝ったり、プロが作成した申告書をレビューしたり、税法のより複雑な部分のためのダッシュボードやツールを構築したり、あなたがデザインしたい他のワークフローをサポートしたりすることを意味します。

さて、私はまだこれを自分でテストしていません。なぜなら、まあ、私は先延ばしにしていて、まだ税金をやっていないからです。でも多分税金をこれに通して、どうなるか見てみます。信頼しているCPAがいますが、おそらくまだもう少し信頼していますが、多分税金をこれに通して、CPAが出したものとどれだけ近いか見てみます。

Slackを使うのが好きなら、Slackを所有する会社Salesforceが、Slackをよりエージェント的にしています。個人的に、私はSlackの大ファンです。Slack内で全ての作業を行っています。私のOpenClawさえ、Slackを通じて話しかけるために構築されています。だから、これは絶対に遊んでみるものです。でもこれが彼らがそれについて言っていることです。

今週、彼らはSlackbotを個人エージェントから究極のチームメイトにする30の新機能を発表しました。新しい会議の文字起こしとノートテイク機能があります。再利用可能なAIスキルなので、タスクを一度だけ定義できます。新しいMCPクライアントです。ビジネスはSlackbotにネイティブの顧客管理が組み込まれました。チャンネルを読み、何が起こったかを理解し、取引、連絡先、通話メモを自動的に最新の状態に保ちます。

ディープリサーチのような新しいスキルがあり、音声入力もあります。そしてSlack内でなくても会議を録音してくれるようです。ここで、Zoom上で起きている会議を録音しているのが見えます。ここでスクリーンショットを与えて、スクリーンショットからのフィードバックを要約するよう頼んでいます。

だから、Slackに追加される本当にクールな機能がたくさんあって、すでにやっているチャットボット的なことをSlack内で保つことができます。たくさんの新機能がロールアウトされているので、このニュース動画を出すたびにそうしているように、この記事を説明にリンクします。現在、これはビジネスプラスとエンタープライズプラスプランでのみ利用可能ですが、4月から開放すると書いてあります。

つまり、無料プランとプロプランも実際にかなりすぐにアクセスできるようになります。これは今週見かけたもので、本当に興味深いと思ったものです。GMはAIが車が存在する前に視覚化するのを助け、それが構築される速度を加速させると言っています。彼らはAIシステムを使って、早期の手描きスケッチをコンセプトビデオに変換し、デザイン変更を提案し、初期段階の空力テストさえ実行しています。

その結果、デザインタイムラインが劇的に短縮されます。なぜこれをそんなにクールだと思ったのかわかりませんが、ここで彼らがデザインをモックアップしていたのが見えて、それから彼らはこのデザインを現実世界でたくさん見せて、モックアップデザインを実際のビデオに変えさえして、この車が現実世界を走っているところがどんな感じかを見ることができます。

そして彼らはAIモデルを使って空力をシミュレートし、事前にこれらのAIモデルを使ってこれらの車がどれだけ効率的になるかをある程度事前に把握しています。わかりません。これは私が魅力的だと思うものに過ぎず、少なくとも皆さんの何人かも魅力的だと思うだろうと考えています。そして最後に、これで終わります。彼らはショッピングカートにAIを入れています。

Instacartはリアルタイムで食料品ショッピングに影響を与える物理的AIスマートカートを導入します。つまり、将来のショッピングカートはこのように見えるかもしれません。前面にタッチスクリーン、外向きカメラ、カート内の何があるかを見るバスケット向きカメラ、食料品店内のどこにいるかを知る位置センサー、そしてカート内に重量と測定と認定スケールもあります。

全てNvidia Jetsonによって駆動されています。小売業者がCaperカートを展開すると、それは単にデータを捕捉しているだけではありません。通路で起きていることをカート上で直接リアルタイムで処理しています。それには顧客のバスケットに何があるか、そして店内のどこに正確にいるかが含まれますと、会社は述べています。だから小売業者はチェックアウト後ではなく、買い物が起きている間に影響を与えることができます。

タイミングがずれた推奨は失敗するだけではありません。それは顧客に次のものを無視するように訓練しますとInstacartは述べています。なぜこれが面白いと思うのかわかりませんが、人々はこのコンセプトを拒否するような気がします。食料品店に行くとき、私たちは行くべきものを手に入れたいだけです。ショッピングカートに追加の製品を推奨されたいかどうかわかりません。でも、わかりません。

多分私がただ変わっているだけです。多分人々は本当にショッピングカートにもっとガラクタを売ってほしいのです。わかりません。とにかく、それが終わりにランダムなものだと思っただけです。でも、はい、それが今週の皆さんへの私の提供です。毎週毎週、全ての情報、全てのAIニュース、毎週出てくる全ての新しいAIツールをふるいにかけ、1週間に1つのビデオで知る必要があることだけに分解するために最善を尽くしています。

以前は毎日、絶えず出てくるニュースについて新しいAI動画を作ろうとしていましたが、それは少し圧倒的になりすぎるかもしれないと感じ始めました。なぜなら非常に多くのAIニュースが出ているからです。そして私は考えました。まあ、多分私が人々のためにできる最善のことは、私が一週間消火ホースから飲むことです。

そして毎週金曜日のたった1つのビデオで、AI界で出てきたもののうち、ほとんどの人が興味を持つと思うもの、またはほとんどの人が知りたいと思うものを分解します。私自身は圧倒され続けるので、皆さんは圧倒されなくて済みます。それがこのチャンネルの目標です。さて、私はその間にいくつかの他のビデオを出しています。起きていることについてのコメンタリーや分解もありますが、ほとんどの場合、私の目標は、全てのノイズをフィルタリングして、今知ることが重要なことのシグナルだけを与える週に1つのビデオを作ることです。

そして、もしそれが興味深く魅力的に聞こえて、完全にループインし続けるために週に1つのビデオだけが欲しいなら、このビデオにいいねして、このチャンネルを購読することを検討してみてください。それは私を本当に助けてくれます。私は100万人の購読者へのプッシュをしています。

今年中にそこに到達したいと思っています。だから、新しい購読者一人一人が本当に本当に助けになります。そして私は、可能な限り少ない圧倒で、可能な限りループインし続けるために最善を尽くし続けます。さて、私はこれらのビデオを木曜日に録画して金曜日に公開しています。だから、もし私が見逃したニュースがあれば、来週のビデオに入れようとします。

今週は、実際にこれの大部分を水曜日に録画し、一部を木曜日に録画しています。なぜなら私は今週末不在になるからです。でも、通常は木曜日に録画して、金曜日に公開しています。しかし繰り返しますが、私が見逃したものは、あなたが知る必要があると私が思うほど重要であれば、来週のビデオに入ります。今日チューニングして、一緒に過ごして、私と一緒にオタクになってくれて本当にありがとうございます。

本当に本当に感謝しています。そして願わくば次回お会いしましょう。バイバイ。おっと。あ、戻ってきた。おっと。ついにあの卵から出た。

コメント

タイトルとURLをコピーしました