AnthropicがConwayと呼ばれる常時起動型のClaudeエージェントをテスト中である。これは従来のチャットとは異なり、独自の環境内で動作し、トリガーに反応して自律的に稼働する。同時にZ.AIは画面認識に特化したビジョンコーディングモデルGLM 5V Turboを発表し、OpenClawやClaude Codeとの統合を実現した。一方、AlibabaはQwen 3.6 Plusをリリースし、100万トークンのコンテキストウィンドウを備え、リポジトリ全体を扱う本格的なエージェント開発と実運用を目指している。AI業界全体が、単なるチャットボットから、タスクに常駐し視覚情報に反応して作業を継続できるエージェントへと急速にシフトしている。

Claude Conwayとは何か
Anthropicは現在、Conwayと呼ばれる新しい常時起動型Claudeエージェントをテストしています。これは従来のチャットとは全く異なり、アクティブな状態を維持し、トリガーに反応し、独自の環境内で実行されます。Z.AIはOpenClawやClaude Codeのワークフローに特化した画面認識ビジョンコーディングモデルを発表しました。そしてAlibabaはQwen 3.6 Plusをリリースし、100万トークンのコンテキストを備え、本格的なエージェントコーディングと実際の運用展開を目指しています。
それでは、Anthropicから見ていきましょう。彼らはConwayをテストしていますが、これはClaudeを中心に構築された完全に独立した環境のように見えます。まるでAIエージェント専用のオペレーティングシステムのようなものです。通常のチャットを開く代わりに、Conwayは独自のサイドバーオプションとして表示されます。クリックすると、内部コードでConwayインスタンスと呼ばれるものが起動します。
この表現だけで、これが単なるセッションではなく、永続的な何かであることがわかります。この環境内では、単にチャットするだけでなく、完全なエージェントワークスペースを扱うことになります。検索、チャット、システムといったセクションを持つ独自のインターフェースがあります。チャットは予想通りの動きをします。検索は実験的なホットキーと連動しているようです。
システムセクションと拡張機能
そしてシステムは興味深いものです。なぜなら、そこで実際にConwayインスタンス全体を管理できるからです。拡張機能セクションがあり、カスタムツールをインストールしたり、新しいUIタブを追加したり、コンテキストハンドラーを定義したりできます。そして彼らが準備しているフォーマットは、CNW ZIPファイルと呼ばれるものです。
これは基本的に、Anthropicがアプリストアのような独自の拡張エコシステムを構築しているように見えます。開発者はこの環境専用にツールをパッケージ化できるのです。これがゲームチェンジャーです。なぜなら、Claudeはもはや単に会話するモデルではなく、他のツールがプラグインできるプラットフォームになるからです。
コネクターとツール統合
次にコネクターとツールがあります。システムは接続されたクライアントとそれらが公開するツールを表示します。つまりConwayは外部システムと直接統合できるということです。Chrome上で動作するClaudeがConwayに直接接続できるトグルさえあります。これでブラウザがエージェントループの一部になるのです。そしてここからが本格的です。
Conwayには完全なWebhookシステムが組み込まれています。外部サービスが呼び出せるパブリックURLが提供され、それが起こるとエージェントが起動します。つまりConwayはあなたが開くのを待っているわけではありません。バックグラウンドで待機し、イベントによってトリガーされ、作業を開始できるのです。これは基本的に常時起動型のエージェントモデルです。
これはAnthropicがClaude Codeやエージェントワークフローで行ってきたこと、特に以前発見されたEpitaxiインターフェースと完璧に一致しています。Conway内にはEpitaxiへの参照があり、それがこれらのエージェントを管理する制御レイヤーである可能性があります。ですから、方向性が見えてきます。Claudeは本質的に独自の環境内で常に動作するオペレーターになろうとしているのです。
そしてこれはOpenClawのようなものと直接競合することになります。ただしAnthropicは自社のモデルへのより深い統合でネイティブに構築しています。同時に、彼らは基礎レベルでの開発者体験も改善しています。Claude Codeはノーフリッカーモードを導入しました。これは実際に長い間人々を悩ませてきた問題を修正します。
ノーフリッカーモードの技術的改善
ターミナルベースのAIツールを使ったことがあれば、おそらくちらつき、ジャンプするコンテンツ、そして長いセッション中にパフォーマンスが低下する様子を見たことがあるでしょう。この新しいモードは、従来のレンダリングアプローチをフルスクリーンバッファーに置き換えます。VimやHTOPのようなツールの動作に似ています。
すべてを常に再レンダリングする代わりに、表示されているものだけを更新します。これによりちらつきが完全になくなり、長い会話やマルチエージェントワークフロー中でもCPUとメモリの使用が安定します。そしてその上に予想外のものを追加しました。完全なマウスサポートです。矢印キーの代わりにクリックしてカーソルを配置できます。
クリックしてツールの出力を展開できます。URLはクリックすると直接開きます。ファイルパスはエディタで開きます。テキストをドラッグして選択すると、自動的にクリップボードにコピーされます。スクロールホイールは長い履歴をナビゲートするのにスムーズに機能します。選択動作もアップグレードされました。ダブルクリックで単語を選択します。トリプルクリックで行全体を選択します。
そしてKittyやWezTermのような高度なプロトコルをサポートするターミナルでは、Ctrl+Cは選択をキャンセルする代わりにコピーします。これでターミナルがよりグラフィカルインターフェースのように振る舞うようになり、純粋なコマンドラインの摩擦を扱いたくない開発者のハードルが下がります。単一の環境変数CLAUDE_CODE_NO_FLICKER=1で有効にできます。
あるいはシェル設定に追加するだけです。バージョン2.1.88で導入されましたが、まだ実験的です。ただし、ほとんどの内部ユーザーはすでにこれを好んでいます。いくつかのトレードオフがあります。Command+Fのようなネイティブ検索ショートカットは同じように機能しないかもしれませんし、一部の動作は調整が必要です。とはいえ、全体的にこれはAIコーディングツールを実際の使用中によりスムーズで安定したものにする明確な動きです。
Z.AIのGLM 5V Turboとビジョン機能
さて、Anthropicがエージェントと開発者ツールをより深く推進している一方で、Z.AIは別の角度からアプローチしています。彼らはGLM 5V Turboを発表しました。基本的に、これは画面上にあるものを見て、それで実際の作業をするのに十分理解できるように構築されたAIモデルです。それが重要な考え方です。多くのAIモデルは画像を見ることができます。
多くのモデルはコードを書けます。難しいのは、両方を同時にうまくやる1つのモデルを手に入れることです。通常、一方が改善すると、もう一方が弱くなります。モデルは見たものを説明するのは得意でも、それを有用なコードや実際のアクションに変えるのに苦労するかもしれません。Z.AIはこのモデルが両方を一緒に処理するように構築されていると言っています。
ですから、スクリーンショットを見て、それを大まかなテキスト説明に変換してから、そこから推論する代わりに、GLM 5V Turboは視覚入力をより直接的に理解するように設計されています。これには画像、ビデオ、UIレイアウト、デザインモックアップ、密度の高いドキュメントが含まれます。そしてこれは重要です。なぜなら実際の作業は通常、きれいなテキストとして届かないからです。
壊れた画面、乱雑なPDF、奇妙なレイアウト、バグのスクリーンショット、または何が間違っていたかの録画として現れます。内部では、はい、ここには本物の技術があります。Z.AIはCogViT Vision Encoderを使用して、細かい視覚的詳細とレイアウト構造を保持していると言っています。また、速度を向上させ、より長い出力をより適切に処理するために、MTP(マルチトークン予測)も使用しています。
簡単に言えば、明確に見て、より速く考え、タスクが大きくなっても有用であり続けるように構築されています。そしてタスクは大きくなる可能性があります。このモデルは20万のコンテキストウィンドウをサポートしているため、一度に膨大な量の情報を処理できます。長いドキュメント、大規模なコードベース、拡張された視覚またはビデオベースのワークフローが含まれます。Z.AIはまた、モデルを30以上のタスクで同時にトレーニングしたと言っています。
これにはSTEM推論、視覚的グラウンディング、ビデオ分析、ツール使用が含まれます。実用的なポイントは非常にシンプルです。彼らは1つの部分だけでなく、チェーン全体で優れたものにしようとしています。ですから、画面上にあるものを認識するだけのAIや、孤立してコードを書くだけのAIの代わりに、何かを見て、それを理解し、次に何をする必要があるかを把握し、それを実行するのを助けることができるものを望んでいます。
だからこそエージェントワークフローに推進されているのです。OpenClaw用に最適化されているため、実際の視覚環境を通じて作業し、セットアップを支援し、画面上にあるものを分析し、人々が実際にコンピュータで行うことによく似たタスクを進めることができます。Claude Codeでも動作します。つまり、開発者はバグ、壊れたUI、または大まかな機能モックアップのスクリーンショットを見せることができ、モデルは見たものに基づいてコードを提案できます。
これははるかに自然なワークフローです。なぜなら、それが人々が実際に作業する方法だからです。時には完璧な技術的説明を書かないこともあります。ただ画面を指して「この部分が間違っている」と言うだけです。Z.AIはCCBench V2、ZClawBench、ClawEvalのようなベンチマークも指摘しています。これらはマルチモーダルコーディング、エージェントタスク、マルチステップ実行のテストです。
そして同社によると、GLM 5V TurboはAIが視覚を理解し、それで有用なことをしなければならないタスクで最先端の成果を上げています。ですから、これははるかに大きなシフトの一部です。AIは画面、レイアウト、アプリ、乱雑なワークフローを扱い、それをアクションに変えるように訓練されています。
AlibabaのQwen 3.6 Plusの登場
そしてこのトレンドが加速している今、AlibabaがQwen 3.6 Plusをリリースしました。これは本当に、このエージェントの話を企業が実際に使えるものに変えることについてです。Alibabaは、完全な能力ループを中心に構築されていると言っています。つまり、モデルは1つの接続されたワークフロー内で認識し、推論し、行動するように設計されているということです。ですから、ただ答えて止まるのではなく、タスクを分解し、ステップを進め、テストし、洗練し、使用可能な結果に向かって進み続けることができます。
これはコーディングで特に重要になります。AlibabaはQwen 3.6 Plusがリポジトリレベルのエンジニアリング用に構築されていると言っています。基本的に、一度に1つのコードスニペットだけでなく、プロジェクト全体にわたって作業できるということです。ですから、完全なコードベース全体にわたる、より大きく、より完全なタスクを意図しています。そして、この発表で最も大きな数字があります。Qwen 3.6 Plusには、デフォルトで100万トークンのコンテキストウィンドウが付属しています。
これは巨大です。平易な言葉で言えば、モデルが一度にはるかに多くの情報を視野に入れておくことができるということです。巨大なドキュメント、巨大なコードプロジェクト、複数のファイル、長い命令チェーンを供給しても、ほぼ同じ速さで流れを失うことはありません。
これはエージェントにとって非常に重要です。なぜなら、エージェントにはメモリが必要だからです。以前に何が起こったか、どのファイルが重要か、どのツールが使用されたか、まだ何をする必要があるかを追跡するスペースが必要です。Alibabaはまた、Open Routerにプレビュー版を置き、少なくとも今のところ、その完全な100万コンテキストで人々に無料アクセスを提供することで、これをより積極的にしました。
これにより、はるかに多くの開発者が実際に試してみる道が開かれます。内部では、Alibabaはモデルが効率を高め、エネルギー消費を削減し、スケーラビリティを向上させる改善されたハイブリッドアーキテクチャを使用していると言っています。また、推論とエージェント動作の信頼性が3.5シリーズよりも強化されていると述べています。
そしてこれは明らかに、派手なデモではなく、実際の展開を目的としています。Qwen 3.6 PlusはAlibabaの独自のエコシステムに投入されています。Wukongを含みます。これは複数のAIエージェントでビジネスタスクを自動化するためのエンタープライズプラットフォームです。OpenClaw、Claude Code、Kleinとも連携します。ですから、人々がすでに構築しているエージェントワークフローに適合します。
マルチモーダル機能と将来の展望
マルチモーダル側では、Alibabaはモデルが密度の高いドキュメント解析、実世界の視覚分析、長いビデオ推論を処理できると言っています。インターフェースのスクリーンショット、手描きのワイヤーフレーム、製品モックアップを見て、それらを動作するフロントエンドコードに変えることもできます。ですから、再びパターンが見えます。業界全体がAIを単なるチャットボットから離れ、タスク内に留まり、見たものに反応し、作業を続けることができるAIに向かって進んでいます。
とにかく、気になります。AIエージェントは本当にアプリを置き換えるのでしょうか、それともこれは誇張されているのでしょうか。ご視聴ありがとうございました。次回お会いしましょう。


コメント