2025年1月の第2週は、AIアシスタント業界において重要な転換点となった。Anthropicは新製品Claude Co-workを発表し、コンピュータ操作の自動化という新たな領域に踏み込んだ。一方Googleは、Geminiにパーソナルインテリジェンス機能を実装し、ユーザーの各種Googleアカウントと連携させることで、よりパーソナライズされたAI体験を提供し始めた。さらに動画生成モデルVeo 3.1のアップグレード、Google Trendsへの統合、小売業向けの新機能、そして翻訳モデルTranslate Gemmaのリリースなど、Googleは矢継ぎ早に新機能を投入している。OpenAIもChatGPT翻訳機能を静かにローンチし、Google翻訳への対抗姿勢を鮮明にした。その一方で、業界内では人材の移動をめぐるドラマや、AnthropicがサードパーティIDEでのAPI使用を制限したことによる開発者コミュニティの反発など、水面下での緊張も表面化している。さらにAppleがSiriにGoogle Geminiを統合するという発表は、モバイルAI市場におけるGoogleの優位性を決定づける出来事となった。

2025年最初のAIニュース週間
ニュース、ニュース、ニュースです。これは本当に居心地が悪いですね。ああ、私は人生で何をしているんでしょう?CESから帰ってきて以来、今年最初のニュース動画となります。本当に興味深い1週間でした。Googleからは大量のアップデートがあり、OpenAIとAnthropicからは新鮮なドラマが展開されています。DocuSignまでもが参戦してきましたが、何と言っても最初に取り上げなければならないのは、Claudeが発表した新しいCo-work製品です。早速見ていきましょう。
Claude Co-workとは何か
Claude Co-workとは何でしょうか。Claude Co-workは基本的に、コーディングに興味がない人向けのClaude Codeと言えます。彼らが言うには、Claude Codeをリリースした時、開発者がコーディングに使うことを期待していたそうです。そして実際にそうなったのですが、すぐに開発者たちはほぼすべてのことにそれを使い始めたのです。それがきっかけとなって、Co-workを構築することになりました。開発者だけでなく、誰にとってもよりシンプルな方法です。
基本的には、Claude Co-workにコンピュータ上の異なるフォルダへのアクセスを許可すれば、あなたに代わってコンピュータ上で様々なことを実行できるのです。デモ動画を見てみると、ファイルの作成、1日の準備、データの処理、ファイルの整理、プロトタイプの作成、メッセージの送信といったことができます。
例として、会議の議事録が入ったフォルダを渡して、「今週のミーティングを要約して、アクションアイテムを見つけて。私がもっと効率的になれる部分はどこだと思う?」と尋ねています。すると、すべての議事録を確認し、どれくらい詳細にまとめたいか尋ねてから、チェックリストを作成して、それに従って作業を進めていきます。
また、明日の緊急な予定をカレンダーで確認するよう依頼しています。するとタスクリストに追加して、一目で分かるページを作成してくれます。別のデモ例では、デスクトップを整理するよう依頼しています。散らかったデスクトップが見えますが、プロンプトを処理して、小さなタスクリストを作成し、実際にデスクトップの整理を始めて、かなりきれいにしていくのが分かります。
Claude Co-workの実際のテスト
これは私もすぐにテストしてみたいと思います。いくつか注意点があります。現時点ではMacでしか動作せず、Maxプランに加入している必要があります。最も低価格のMaxプランでも100ドルです。ですから、まだ誰もが使えるわけではありませんが、これはまだデモベータテスターモードのようなものです。
最上位プランのユーザーに展開してテストしてもらい、最終的にはProプラン、そして無料プランへと展開していく予定のようです。ちょっと待ってください、未来のマットです。Claude Co-workについて録画した時点では、Maxプランでしか利用できませんでした。しかし、録画後に実際に月額20ドルのプランでも利用可能になったことが発表されました。この情報を共有したかったので、より多くの人が使えるようになりました。やったね。
私はMaxプランに加入しているので、実際に自分で試してみます。デスクトップを整理してもらうことはできません。というのも、私は常にデスクトップをきれいに保つサイコパス的な性格なのです。しかし、ダウンロードフォルダについては同じことは言えません。このフォルダは掃除したことがないのです。
現時点では、これはClaude CodeデスクトップアプリでのみMac上で利用可能です。ここに3つのタブがあって、通常のClaudeチャット、Claude Code、そしてこのCo-workオプションが使えます。片側に寄せて、ダウンロードフォルダをここに表示させましょう。実際に、「何を整理する必要がありますか」という選択肢がすでに表示されています。
ダウンロードフォルダを選択します。するとClaudeがダウンロード内のファイルを変更してもよいか尋ねてきます。今回は許可すると答えます。実際のMacのダイアログボックスでも許可をクリックします。そして、作成されたプロンプトが見えます。ダウンロードフォルダを整理してください。コンテンツをスキャンして計画を提案してください。
カテゴリー、作成するフォルダ、ファイルの分類方法、適用する命名規則、確認または削除のためにフラグを立てるファイル。変更を加える前に計画を見せてください。承認後にのみ実行してください。さあ、これを実行して何が起こるか見てみましょう。いくつかのコマンドを実行し、ファイルを読み込んでいるのが分かります。
既存のサブフォルダの内容も確認させてください。さて、完全な全体像が把握できました。包括的な整理計画を作成しましょう。スキャンの結果、ダウンロードフォルダには9つの既存サブフォルダを含む約270個のアイテムがあります。提案する整理方法は次の通りです。
3Dモデル、3Dプリント用のSTLファイル、インストーラー、DMG、PKG、APKファイル。様々なファイル用に新しいフォルダを提案しています。命名規則、確認または削除のためにフラグを立てるファイル。どうやら重複があるようです。Zoomを複数回ダウンロードしていたみたいです。アクションの要約として、10個の新しいフォルダを作成、150個のファイルを移動、15組の重複をレビュー用にフラグ、35GBの古いインストーラーを削除候補としてフラグ。
うん、賢明な提案ですね。実行してください。では、何が起こるか見てみましょう。ダウンロードフォルダはここにあります。リアルタイムでこの作業を見られるかどうか確認しましょう。さて、コマンドを実行しています。
いくつか並び替えをしたようです。言っていたすべてのフォルダを作成したと思います。ファイルが移動しているのが見えるので、確実に何かをしていますね。インストールファイルを移動しています。右側には小さなチェックリストがあり、これらのステップを実行する際の進行状況を表示してくれています。
インストーラーファイルを移動しました。今度はフォントファイルを移動しています。「さらに10個表示」をクリックすると、実行するすべてのステップが確認できます。素晴らしいのは、今の私は完全に手を離していられることです。コンピュータから離れて、この作業を続けさせておくことができます。理論的には、戻ってきた時にはダウンロードフォルダが整理されているはずです。あるいは、YouTubeを開いて動画を見るとか。
最近のCES動画をお勧めします。かなり面白いですよ。見てください。ほぼ完全にきれいになりました。すべてがフォルダに移動されました。まだ作業中です。そして今、要約を生成してくれています。基本的にこれがやっていることは、あなたのコンピュータ上でターミナルコマンドを実行しているだけなのです。
ファイルの追加、削除、フォルダの作成、再整理に必要なターミナルコマンドを知っていて、舞台裏でそれらのbashコマンドを私のために実行しているのです。完了です。整理完了。そして、どこでストレージを解放できるかも非常に明確に示してくれています。
動画は66GBあります。プロジェクトフォルダには43GB。アーカイブには47GB。AIモデルは9.2GBです。これは本当に印象的です。この新しいClaude Co-workerを使って、基本的にコンピュータを管理してもらえるようになったのです。繰り返しますが、Macのみで、100ドル以上支払っている場合のみですが、最終的にはWindowsにも展開され、より安価なプランにも順次展開される予定です。
しかし、これはおそらく、大手モデルメーカーから最近出てきたツールや機能の中で、最も本当に有用なものの1つです。
Googleの大型アップデート:パーソナルインテリジェンス
今週はGoogleからも大量のアップデートがありました。すべてお伝えしますが、その中でも最大のものはGeminiの新しいパーソナルインテリジェンスです。パーソナルインテリジェンスにより、Geminiチャットボットを実際に様々なGoogleアカウントと接続できるようになります。
現時点では、Gmail、写真、YouTube、検索にワンタップで接続できます。将来的にはカレンダーにも接続されるでしょう。これは最初から接続されていないことに少し驚いています。Google Driveにも接続されるでしょう。つまり、Googleのエコシステムですから、最終的にはすべてに接続できるようになるはずです。
このパーソナルインテリジェンスの実際の使用例として最も良いものは、Google LabsのVP、GeminiとAI StudioのJosh Woodwardから出ています。彼の例では、タイヤショップにいて新しいタイヤを購入しようとしているけれど、車まで外に出て実際にどのタイヤが必要か確認したくない場合です。
Geminiが彼のGoogleフォトに接続されているため、カメラフィードの中におそらく写真があるでしょう。そこで、プロンプトを入力しました。Geminiが処理を行い、すべての分析を行って、「Honda Odysseyのような車両の場合、235/60 R18タイヤを使用しているので」などと答えました。しかし、ここでのポイントは、彼は「車のタイヤを交換する必要がある。どれをお勧めしますか?」としか言っていないのです。
車が何かは言っていません。カメラロールを使って、必要なタイヤを把握したのです。そして「Odysseyのナンバープレート番号は何だっけ?」と尋ねました。写真にアクセスできるからです。パーソナルインテリジェンスを使用して、ナンバープレート番号を表示しています。実際に彼はこの全体をX(旧Twitter)に投稿した動画で詳しく説明しています。
ここで見えるように、実際にGoogleフォトから写真を参照できたと言っています。つまり、何かを覚えておきたい場合は、写真を撮ってGoogleフォトに保存するだけでよいのです。そうすれば、Geminiと会話している時にいつでもその情報を引き出せます。
これはスクリーンショットや引用、将来覚えておきたいことに最適なようです。Googleフォトに保存するだけです。オンにするかどうかは選択できます。デフォルトではオンになっていません。どのアプリに接続するか正確に決定でき、いつでもオフにできます。Geminiはあなたのデータにアクセスしてあなたの特定のリクエストに答えますが、写真やメールのようなものはモデルを直接訓練するわけではありません。
つまり、そのようなものは訓練データとして保存されていません。ナンバープレート番号や所有している車の種類は、彼らのシステムに保存されてモデルに訓練されるわけではありません。本当ですか?
現在、無料プランではまだ利用できません。Google AI ProまたはAI Ultraプランに加入している必要があり、テスト中の現時点では米国にいる必要があります。しかし、ウェブ、Android、iOSで動作します。すべてのGeminiモデルで動作します。
今のところ1つ不満があります。まだ私にとってそれほど有用ではないからです。それは、現在個人のGoogleアカウントでは利用可能ですが、Workspaceビジネスアカウントでは利用できないという点です。
私はほぼ専ら Workspace ビジネスアカウントを使用しています。私が使用しているメインのGmail、Googleフォトアカウント、Googleカレンダー、これらすべては実際にmattwolf.comドメインに接続されたGoogle Workspaceアカウント上にあります。個人のGmailアカウントは持っていますが、個人的なメールにしか使用していません。そのメールアカウントではビジネスは一切行っていないので、まだ私にとってそれほど役立つものではありません。とはいえ、試してみましょう。
スポンサーメッセージ:Comet
さて、ニュースに戻る前に簡単に。毎週、この狂ったペースのAI世界にどうやってついていっているのかという質問をたくさん受けます。正直100%言うと、私はAIをたくさん使っています。当たり前ですよね。このプロセスを大幅に速く簡単にしてくれたものの1つがCometです。これはPerplexityのウェブブラウザで、日常の仕事でAIのパワーを使うことがとても簡単になります。
記事を読んだり、ソーシャルメディアをスキャンしたり、YouTube動画を見たり、ドキュメントやプレスリリースを掘り下げたりするような、普段やっていることをしている間に、Cometがそこにいてより良く、より速くするのを助けてくれます。例えば、3つか4つの異なるAIニュース記事を同時に読んでいますが、手動でメモを取る代わりに、開いているすべてのタブの主要な要点を要約して、実際に重要なことを教えてくれるようCometに依頼します。
それからYouTubeに移動して、新しいAIプラットフォームをレビューしている40分の動画をCometにスキャンしてもらいます。すると、最も興味深いタイムスタンプを引き出して、全体を見なくても簡単な内訳を提供してくれます。ツールや企業について調査している時は、タブを1つのワークスペースに整理させて、サイト間で主張を比較させ、きれいな要約をGoogle Docsに直接エクスポートさせたりもします。
大きな違いは、Cometが実際に現在見ているページを見ることができることです。だから、何かをするよう依頼した時に文脈を理解していて、バックグラウンドでこれらすべてが実行されている間、私は好きなことを続けられるのです。興味があれば、Cometは無料で使用でき、簡単に始められます。
説明欄のリンクからチェックしてみてください。今日の動画のこの部分をスポンサーしてくれたCometに心から感謝します。では、本題に戻りましょう。
パーソナルインテリジェンスの実際のテスト
さて、Google Geminiアカウント内にいます。これは個人アカウントで、仕事用アカウントではありません。Ultraプランなので、パーソナルインテリジェンスにアクセスできるはずです。
完全に開示すると、数週間前からこれにアクセスできていました。早期アクセスを与えられて、使ってみてフィードバックを提供していました。ですから、少しテストはしています。しかし使いたい場合は、オンにする必要があります。オンにするには、左下の設定とヘルプボタンをクリックし、パーソナルインテリジェンスを選択し、接続されたアプリを選択して、ほぼすべてのスイッチをオンにします。
現時点では、実際にGoogleカレンダーとGoogle Driveにも接続されているようです。それが彼らの記事では十分に明確にされていなかったように感じます。しかし、この画面から見ると、実際に今すぐそれらに接続できるようです。Geminiに戻れば、実際には他に何もする必要はありません。
これでパーソナルインテリジェンスに接続されました。前の動画で紹介されていたことの1つを実際にテストしてみます。うまくいけば、ぼかしを入れなければなりません。私のナンバープレート番号は何ですか?
パーソナライゼーションが進行中と表示されています。接続して答えを示しています。さて、ここにいくつかのナンバープレート番号が見つかりました。
それらを確実にぼかしましょう。各ナンバープレートはどのタイプの車両についていましたか?タイトルとして、写真からナンバープレート番号を識別していると実際に表示されているのが分かります。Googleフォトを見ています。Googleフォトを再度検索しています。そして、実際に古いGoogleフォトアカウント内の写真の中から、実際のナンバープレート番号を見つけました。
このアカウントには何年も新しい写真が追加されていないと思います。見つかったナンバープレート番号のうち2つは、もう所有していない車両のものでしたが、現在所有している車両のナンバープレート番号も写真の中から見つけました。はい、これは確実に機能しています。だからこそ多くをぼかさなければならないのです。見てみましょう。
今、私の受信箱に緊急のメールはありますか?さて、Google Workspaceに接続しています。そして今、画面上のほぼすべてをぼかさなければなりません。しかし、個人の受信箱にメールがいくつか見つかりました。正直なところ、どれも実際には超緊急というわけではありません。なぜなら、通常使用しているメールには接続されていないからです。
しかし、これがGmailのパーソナルインテリジェンスです。人生で使うものとますます多く接続されていくので、会話する時に、自分自身にとって完璧な答えを得るためにそれらすべての領域が利用可能になります。かなりクールですが、Workspaceプランで利用可能になり、無料プランでも利用可能になれば、さらに有用になります。
これらの企業が行うのは、より高額な有料プランに展開して、人々にテストしてもらい、バグを見つけてもらい、すべての問題を解決するのを手伝ってもらうことです。それらの問題が解決されたら、他のティアに展開し始めます。今起こっているのはそういうことのようですが、さあWorkspaceプランに提供してください。
本当に、本当にWorkspaceプランで使いたいです。しかし、Googleから多くのアップデートがあったと言いました。これはほんの始まりです。
GoogleのVeo 3.1とその他のアップデート
GoogleのVeo 3.1動画モデルにもアップグレードがありました。材料から動画への機能が改善されました。短いプロンプトでも、材料画像に基づいて動的で魅力的な動画を生成できるようになりました。より豊かな対話とストーリーテリングが見られ、動画がより生き生きと表現力豊かに感じられるようになります。
プロンプトの例として、ドキュメンタリースタイル、アライグマがコーヒーショップを経営している、対話。これがプロンプトのすべてでした。「私はいつも貢献したかったんです。ただ最高のコーヒーを作るためにここにいるだけです。」「そして、それを達成しましたね。」「もちろんです。」
アイデンティティの一貫性が改善され、設定が変わってもキャラクターの見た目を同じに保つことが簡単になり、同じキャラクターを複数のシーンに登場させて完全な物語を語りやすくなりました。背景とオブジェクトの一貫性を実現できます。
設定とその中のオブジェクトの完全性を維持することで、シーンをコントロールできます。シーン間でオブジェクト、背景、またはテクスチャを再利用できます。テクスチャ、キャラクター、オブジェクトをシームレスにブレンドできます。キャラクター、オブジェクト、テクスチャ、スタイライズされた背景のような異なる要素を組み合わせて、まとまりのある高インパクトなクリップにできます。
材料から動画への機能に、ネイティブの縦型出力が追加されました。初めて、材料から動画が9:16での動画生成をサポートします。また、4K解像度へのアップスケール機能が追加されました。これらの機能はYouTube ShortsとYouTube Createアプリで利用可能で、GeminiアプリのVeoのポートレートモードで強化されたVeo 3.1も試すことができます。
Flow、Gemini API、Vertex API、Google Vidsでも利用可能です。さて、これをテストしてみましょう。ここにいるこの男の写真をアップロードします。ドロップします。このキャラクターにジャンピングジャックをさせて、9:16の動画にしてください。
どうやらできないようです。実在する人物の顔をアップロードしたくないようです。では、架空のキャラクターならどうでしょう。このAI生成のジェダイタイプのキャラクターがあります。やってみましょう。このキャラクターを戦闘に入れてください。動画は9:16にしてください。
9:16にはなりませんでした。でも、動画の出来を見てみましょう。動画は良いですね。キャラクターの一貫性は保たれていますが、9:16にはなりませんでした。では、この機能はまだGemini内では機能しないのかもしれません。代わりにFlowで試してみましょう。
ただし、高需要が発生しているようです。うまくいくことを願います。新しいプロジェクトを作成します。ここでポートレートモードにします。3.1品質があります。過去に生成した海賊の画像があります。これを取り込みます。
まず、これを材料から動画に切り替える必要があります。次に画像を追加できます。この男をアップロードしましょう。本当の疑問は、169の画像をアップロードして、出力が9:16の場合、どうなるかということです。短いプロンプトを入力します。
海賊同士の壮大な剣の戦い。海賊のように話させてください。さて、この機能はVeo 3.1品質ではサポートされていません。Veo 3.1高速に変更されました。了解です。何が出てきたか見てみましょう。最初のものがこれです。「お前は俺の宝を決して手に入れられない、この悪党め。俺の死体を越えてからだ、このネズミ野郎。これを受けろ。今日じゃない。」
ライオンのように唸ったような気がします。別のものがこれです。「そうだ、この壊血病野郎、ドラゴンに打ち勝つ準備をしろ。」キャラクターの一貫性はあります。ワイド画像を9:16に変換しました。これが新バージョンのVeo 3.1です。
他のGoogleアップデートに移りましょう。繰り返しになりますが、いくつかありました。Googleは検索トレンドも更新しました。Google Trendsの舞台裏でGeminiを使用するようになりました。
trends.google.comに行くと、ここでトレンドを探索してみましょう。人工知能。確かに、よりクリーンなユーザーインターフェースに見えますが、検索用語を提案してもらいましょう。これが新機能の一種でした。興味のある分野は何ですか?もう一度人工知能と入力します。
検索用語を見つけます。そして、人工知能のための検索用語を見つけるために人工知能を使用しました。いくつかの用語が見えます。ChatGPT、ディープラーニング、機械学習、医療におけるAI、AI倫理など。探索する他のアイデアも提供してくれます。これらはすべてGeminiを使用して引き出されています。
1つ覚えておいてほしいのは、下部に、新しい体験は最初はデスクトップで開始され、段階的に展開されると書かれていることです。自分のGoogleアカウントの1つでこれを使おうとしましたが、機能しませんでした。そして個人アカウント、先ほど使わなければならなかったのと同じアカウントにログインしたところ、機能しました。まだ展開中のようです。
Googleは今週、小売業者向けの新しいテクノロジーとツールも展開しました。ユニバーサルコマースプロトコルを開始しました。このUCPは間もなく、検索のAIモードにある対象となるGoogle製品リストの新しいチェックアウト機能を強化します。まだ展開されていないようです。
しかし、製品名について話すと、AI検索モードがその製品を引き出し、基本的にすぐに購入できるように購入ボタンをそこに配置する予定です。ここに例があります。モダンでスタイリッシュなラグを探しているというプロンプトです。いくつかのオプションを提供してくれます。ラグの1つをクリックすると、AIを使用した価格トラッカーと、AI検索モード内から直接購入する機能があることが分かります。
Googleはまた、Translate Gemmaという新しいモデルもリリースしました。これはオープンソースの翻訳モデルです。Googleのオープンモデルの1つであるGemma 3を使用しており、現在55の言語で機能します。実行しているデバイスに応じて、様々なモデルサイズがあります。40億パラメータモデルはモバイル向けに最適化されています。120億はコンシューマーラップトップで実行するように設計されており、270億パラメータモデルはハイエンドのH100 GPUまたはGoogleのTPUで実行されます。
これはオープンモデルです。現時点で直接使用できる場所はないと思いますが、KaggleやHugging Faceでダウンロードして、ローカルコンピュータまたは好みのクラウドGPUサービスで実行できます。
ChatGPTの翻訳機能
翻訳について話しているついでに、ChatGPTは実際に静かに新しい翻訳機能を展開しました。奇妙なのは、彼らは通常すべてを大々的に宣伝するからです。ですから、これをステルス的に展開したという事実はかなり興味深いです。しかしこれは、50以上の言語をサポートするChatGPT内の翻訳ツールです。
彼らはこれをGoogle翻訳への直接的な挑戦として位置づけており、無料のChatGPTプランで実際に使用できると思います。chatgpt.com/translateに行けば、アクセスできます。通常のChatGPTアカウントには表示されないので、少なくともこの録画時点では、実際にこのURLに行ってアクセスする必要があります。
ここで見えるように、言語を検出させるか、特定の言語を選択して、これらの言語のいずれかに翻訳できます。ここにテキストを入力すると、スペイン語に翻訳してくれます。「Hola, es Matt Wolf y hago videos en YouTube sobre inteligencia artificial. Suscríbete.」スペイン語を話す皆さん、あなたの言語を完全に台無しにしてごめんなさい。
ロシア語に切り替えましょう。音声で話させることもできます。いや、できません。メッセージの再生に失敗したと表示されます。残念です。その機能は現時点では機能していないようです。
AI業界のドラマ
さて、どんどん進めましょう。今週はお伝えしたいAIドラマがあるからです。最初のAIドラマは、Thinking Machine LabsとOpenAIから出ています。Thinking Machinesについてご存じない方のために説明すると、Thinking MachinesのCEO兼創設者はMira Muratiです。
Mira MuratiはかつてOpenAIのCTOでした。実際、Sam AltmanがOpenAIから追放された時、非常に短い期間、実際にOpenAIのCEOでした。そのドラマの後すぐに、彼女は実際にOpenAIを去り、この新会社Thinking Machinesを立ち上げました。Thinking MachinesのCTOはBarret Zophという人物でした。
BarretはThinking Machinesが彼女が会社を立ち上げた時にOpenAIから基本的に引き抜いた人物でした。彼は追随しました。今週、Thinking Machinesは基本的に非倫理的行為で彼を解雇しました。非倫理的行為で解雇された同じ日に、彼はOpenAIに再雇用されました。
情報筋がWiredに語ったところによると、Zophはここで機密の会社情報を競合他社に渡していたとのことです。OpenAIはZophが復帰することを内部メモとXで発表し、Muratiの懸念を共有していないと述べました。これをすべてまとめると、Barret ZophはOpenAIで働いていました。Mira MuratiもOpenAIで働いていましたが、Thinking Machinesを立ち上げるために去りました。彼女はZophを連れて行きました。Zophは最終的に非倫理的行為で解雇され、同じ日にOpenAIに再加入しました。
舞台裏の話は、彼が機密情報を競合他社に渡していたということでした。私たちのほとんどが集めているのは、彼がThinking MachinesとOpenAIの二重スパイのようなものだったということです。彼らが何をしているかを監視し、その情報をOpenAIに提供するためにThinking Machinesに行ったようです。
これはすべて噂と憶測にすぎません。情報源は実際には分かっていませんが、これはクレイジーなドラマ映画から出てきたように感じられます。シリコンバレーで起こっていることは時々そのように感じられますが、これは単にワイルドなストーリーの1つです。
そして今起こっているもう1つのドラマはAnthropicから出ています。バイブコーディングをやっている人々は、現時点では彼らにあまり満足していません。理由は次の通りです。
Claude Maxプランにサインアップできます。100ドルから始まります。私はClaude Maxプランに加入しています。実際、そのClaude Maxプランに月額200ドル支払っていると思います。しかし、これらのプランのいずれかに加入していれば、Claude Code内のClaude Codeと最新モデルへのほぼ無制限のアクセスが得られます。
しかし、人々がコーディングしている他のIDEがいくつかあります。最も注目すべきものはCursorと呼ばれるものです。人々はAnthropicのAPIキーを取得して、Claude CodeではなくCursorで使用していました。これはClaude Maxプランで許可されていたことでした。APIへのアクセスがあり、このClaude Opusモデルからたくさんの使用量が得られました。
どうやらAnthropicは、人々がClaude CodeではなくAPIキーを他のIDEで使用することを好まなかったようです。大きな発表などは一切行いませんでしたが、Claude Codeで働くTariq(発音はこれだと思います)という人がTwitterで言いました。「昨日、Claude Code用サブスクリプションを使用してサードパーティのハーネスから不正使用フィルターをトリガーしたアカウントが禁止された後、Claude Codeハーネスのなりすましに対する保護対策を強化しました。」
基本的に、Claude Code外の他のツールでClaude Codeサブスクリプションを使用することは許可されていないと言っています。面白いのは、これが1月9日に起こったことに注目してください。人々は本当に本当にこれに不満でした。「エコシステム全体を殺した」、「これは負け戦だ」、「その保護対策は機能しない」といったコメントがありました。
Opus 4.5は今圧倒的です。Cursorチームと協力してこれを機能させる方がより賢い動きでしょう。スクロールダウンして、コメントをいくつか読むことができます。人々はこれに満足していませんでした。OpenAIはこれを機会として利用しました。まさに同じ日、1月9日に、OpenAIでWindsurfに取り組んでいるTiboがこう言いました。「私たちはCursorと協力して、Windsurfユーザーが自分のWindsurfサブスクリプションと使用制限をCursor上で直接使用できるようにしています。
このスペースの他の素晴らしいアクターをサポートする方法も模索しています。」人々はそれに満足していました。そしてAnthropicのことについては本当に不満でした。非常に不満だったので、人々はこれがいかに残念か、Claudeにとっていかに大きな失敗かについて完全な記事を書きました。
基本的に、月に数百ドルを支払っている顧客に、Claude Codeを使わなければならないと伝えているのです。そして、このAPIキーを別のプラットフォーム、別の場所で使用した場合、基本的にあなたは私たちにとって死んだも同然だと言っているのです。
その他の重要ニュース
さて、もうすぐ終わりです。あと数件のニュースストーリーをお伝えしたいので、速報モードに入って素早く見ていきましょう。今週出てきた本当に大きなストーリーから始めます。AppleがSiriにGoogleのGeminiを使用するというものです。
今週、共同声明を発表しました。AppleとGoogleは複数年にわたる協力関係を結び、次世代のApple基盤モデルはGoogleのGeminiモデルとクラウドテクノロジーに基づくことになります。つまり、GoogleはAndroid、Chrome、Google Drive、Gmailなど、Googleが所有するすべてのプラットフォームにGeminiを搭載しているだけでなく、Apple製の電話にも搭載することになりました。
基本的に、Geminiがあなたの携帯電話上のAIになります。Androidを使用していればGeminiを入手し、Siriを搭載したiPhoneを使用していてもGeminiを入手することになるからです。Apple Intelligenceにはまだ独自のより小さなオンデバイスモデルがあるので、Siriを使用する時に常にGeminiを使用するわけではありません。
しかし、クラウドを利用して応答を得る必要があるより複雑なクエリがある場合はGeminiを使用するようです。Googleにとって非常に、非常に大きな勝利です。
これは興味深いと思いました。OpenAIがCerebrasと提携しました。興味深いと思ったのは、CerebrasがおそらくGroqの最大の競合相手だからです。Groqと言う時、私はNvidiaが買収したばかりのチップを作る会社、GRO-Q Groqのことを話しています。GroqとCerebrasはどちらも、推論用に設計された超強力で高速なチップを作っています。
Nvidiaのチップのほとんどは訓練用に設計されており、訓練でうまく機能しますが、これらはプロンプトを入力してから応答を返すために最適化されています。OpenAIがCerebrasと提携したのは興味深いです。なぜなら、OpenAIはNvidiaと非常に強い関係を持っており、NvidiaはGroqを買収したばかりだからです。
OpenAIはNvidiaとの関係を通じてGroqを使用すると思っていましたが、違います。Nvidiaが買収したばかりの会社の競合他社に行くのです。分かりません。私にとってはすべて魅力的です。これを見ているほとんどの人は気にしないでしょうが、私はこういうことでオタクになります。
冒頭でDocuSignが参戦していることをほのめかしました。彼らは法律用語を翻訳し、契約の雑務をあなたのために行う新機能を追加しています。あなたもそうか分かりませんが、時々、何らかの理由で、NDAであれ、HubSpotとのパートナーシップ取引の契約であれ、署名する必要があるDocuSignの契約書が届きます。私のポッドキャストはHubSpotでホストされているからです。
私の最初の行動は、その文書全体をコピーして、ClaudeまたはChatGPTに貼り付け、分析してもらい、何か落とし穴や、あまりにも良い条件を彼らに与えてしまっているものがないか探してもらうことです。それが何を教えてくれるか見ます。そして、そのフィードバックを契約書に署名する前の交渉プロセスの一部として使用します。
今では、そのコピー&ペーストをする必要はありません。それらの機能がDocuSign内に組み込まれるからです。
最後に、これでまとめます。GLM Imageという新しい画像モデルが登場しました。Zhipu AIという会社のもので、密な知識と高忠実度の画像生成のための自己回帰型モデルです。基本的にこれが意味するのは、Ideogramがやっていることや最新のChatGPT画像モデルがやっていることの競合を目指しているということです。
プロンプトを与えると、情報を調べに行き、その情報を画像に組み込むことができます。ただし、これはオープンモデルです。画面上に作成した画像タイプのいくつかの例が見えます。Ideogramほどではないと感じますが、繰り返しになりますが、これはオープンウェイトモデルです。
実際にGitHubとHugging Faceでダウンロードして、ローカルまたはお気に入りのクラウドGPUサービスで実行できます。いつも私を驚かせるのは、Ideogramモデルのような最先端のモデルやChatGPT画像モデルがあって、文字通り数週間後、6週間後くらいに、それと同じもののオープンソース版が出てくることです。
そのギャップが縮まっている速度は私の心を吹き飛ばします。このモデルはお伝えしたかっただけです。このモデルをテストしていません。ダウンロードしてローカルで実行する努力をまだしたくありませんでした。もし皆さんが興味があれば、教えてください。将来遊んでみるモデルかもしれません。
しかし、今日お伝えできるのはこれだけです。うまくいけば、AI業界で何が起こっているかについて、より詳しくなれたと感じていただけたでしょう。私は毎週、AI、そしてある程度はテクノロジー全般の世界で起こっているすべてのことに指を置き続けるために最善を尽くしています。
そして毎週振り返って、話すことが重要だと思うことをまとめた動画を作っています。ノイズをふるいにかけて、皆さんのためにそのシグナルを見つけようとしています。最も多くの人にとって最も重要だと思うことを共有しています。
こういうのが好きなら、この動画に「いいね」をして、このチャンネルを登録してください。そうすることで、このような動画がYouTubeフィードにもっと表示されるようになります。もう一度、視聴してくださってありがとうございます。今日、私と一緒にオタクになってくれて本当に感謝しています。うまくいけば、次回お会いできるでしょう。
バイバイ。


コメント