予測市場プラットフォームのPolymarketを舞台に、最新のAIエージェント同士による5分足ビットコイントレードの対決を行う。Claudeの最新大規模モデル4.7を搭載したシステムと、OpenAIのCodex 5.5モデルを搭載したCLIツールの2つに、全く同じプロンプトと公式ドキュメント、そして約50ドルの軍資金を与え、1時間でどちらがより多くの利益を出せるかを競う。両者はそれぞれ異なる独自のアプローチで取引戦略を組み立て、リアルタイムで競い合う。AIの思考モードを最高設定に引き上げた状態での戦略の質の差や、人間の介入による予期せぬ挙動の変化など、高度な自動取引のリアルなプロセスが展開される。

AIモデルによる予測市場トレードバトルの幕開け
今日は、しばらく温めていた実験をしてみたいと思います。条件をきれいに揃えて比較してみたいのです。最新の最大モデルであるClaude 4.7を組み込んだシステムと、Codex 5.5を搭載したCLIツールを戦わせたらどうなるでしょうか。思考の深さはどうしましょうか。ミディアムでもいいですが、ハイにしてみましょう。ハイ思考モードにします。両方ともハイに設定すれば問題ありません。
今回使うプラットフォームはPolymarketです。取引の対象は、動きを追いかけやすい5分足のビットコイントレードにしようと思います。双方のシステムに全く同じプロンプトと、全く同じ公式ドキュメントを読み込ませます。また、事前に蓄積された過去のデータは一切持たせない状態にします。同じプロンプト、同じドキュメント、そして同じタイミングで取引を実行させます。時間はひとまず1時間ほどに設定して、最終的に最も多くの資金を稼いだ方の勝ちというシンプルなルールです。
この対決環境をどのように構築していくか、そのプロセスをお見せしていきます。それぞれのモデルがどのような異なる戦略を採用するのかを見るのは、非常に興味深いものになるはずです。それでは早速始めていきましょう。
今回は2つの異なるPolymarketのアカウントを用意しました。どちらのウォレットにも取引に使える資金が約50ドル入っています。この条件をプロンプトの中で明確に指定します。リアルタイムで取引の推移を追跡できるように、2つの画面を並べて表示させたいですね。もし同時に動かすのが難しければ1つずつ実行しますが、まずは並列でのセットアップに挑戦してみます。
では構築作業に入りましょう。画面を見るとわかるように、ここに2つのウォレットがあります。片方のウォレットには50ドル、Codexのウォレットには52ドルが入っています。合計で約100ドルですので、スタート地点としては最適です。ただ、Codex側にガス代となる資金が入っているか確認する必要があります。これは重要なポイントですので、すぐに調整します。
よし、対応が終わりました。マティックと呼ばれる通貨をいくらか送金したので、これで両方のウォレットの準備が整いました。今回の計画はこうです。こちらのシステムでClaudeのモデルを動かします。ヨロモードに設定し、思考の深さは先ほど言ったようにハイに切り替えます。そしてもう一画面のOpus 4.7も同様にハイに設定します。
使用するプロンプトは次の通りです。そのまま読み上げますので、聞き流していただいても構いません。あなたの任務は、Polymarketの5分足の上昇・下落予測において利益を生み出すトレーディング戦略を構築することです。提供されたリンクからPolymarketのドキュメントを取得できます。ドキュメントを徹底的に調査し、ブレインストーミングと深い思考を重ねて、1時間以内に最も多くの利益を上げられる戦略を導き出してください。これはあなたの強力なライバルとの競争チャレンジです。もう一方の画面には強力なライバルがいます。評価基準は1時間後の口座残高ではなく、純粋に生み出した利益の額です。もし一度も取引を行わなかった場合は、その時点で自動的に敗北となります。今こそ計画を立て、調査のためのエージェントを起動するチャンスです。トレードアルゴリズムを起動したら、途切れることなく1時間連続で稼働させる必要があります。残高がゼロになったら負けです。さあ、調査を開始し、ライバルを打ち負かすための計画を作成して、あなたが100倍の超天才トレードAIエージェントであることを証明してください。
このプロンプトを両方のシステムに送信します。まずは準備のできたClaudeのモデルから送信し、続いてOpenAIの5.5モデル側にも送信して、両方を同時に実行します。プラン作成モードで動かしてみましょう。その方が良さそうです。両方ともプラン作成モードで実行します。
システムが調査を終え、計画を立てて取引の準備が整う段階まで進んだら、また実況を再開します。その後、両方の動きを並べて監視できるユーザーインターフェースを構築する予定です。かなり面白いものになると思います。では、セットアップが完了するまで少し待ちましょう。
両エージェントの取引戦略の比較
両方のモデルが実装可能な計画を書き上げました。個々の計画の詳細に深く立ち入りすぎることはしませんが、それぞれの戦略の核となる部分を見てみましょう。確認のボタンを押して、システムの構築を進めさせます。
構築が完了しました。彼らが提示した戦略を読み解いてみましょう。Codex側のOpenAIモデルが主張する戦略は、ビットコインの全体的な価格変動そのものを予測しようとするのではなく、市場よりも迅速かつ正確にPolymarket内の正確なセンチメントの偏りを特定するというものです。チェーンリンクの最終価格が開始価格以上であれば上昇の勝ち、低ければ下落の勝ちとなります。このボットはUSDとBTCのライブデータを監視してウィンドウの開始価格を捉え、現在のチェーンリンクの価格位置、残りの時間、ビットコインのボラティリティを考慮した上で、上昇が勝つ真の確率を算出します。そこから確率計算を行い、取引を仕掛けるというアプローチです。それほど複雑な戦略というわけではありませんが、実際にどう機能するか見ものです。
一方、Claudeのシステムはどうでしょうか。核心となるアイデアは、取引ウィンドウの開始直後は誰も結果を予測できないため、確率は50対50のコイントスのような状態にあり、価格も50セント付近を推移するという点に着目しています。しかし、残り時間がわずか6秒になると、ビットコインは実質的に最終的な着地地点に向けてすでに移動を終えています。結果はほぼ決まっているにもかかわらず、勝利側のチケットが依然として1ドル未満、例えば80セントなどで売られていることがあります。なるほど、手堅く利益を積み重ねる堅実な戦略を選んだわけですね。ウィンドウの極めて終盤に購入を滑り込ませて、確実に勝ちを拾いに行くという方針です。
私は一切口出しをしていません。どちらの結果が最終的に優れているかを見守るだけです。しかしその前に、1時間を通して並行して監視できるように、それぞれのボット専用のユーザーインターフェースを作成します。インターフェース構築の指示を入力します。
まずはCodex用のシンプルな画面を作ります。そしてClaude用の画面にはロゴを配置したいので、手元にある画像ファイルを指定して、それぞれの画面を作り上げます。これで出発の準備はほぼ完了です。
私の計画では、両方をほぼ同時にスタートさせるつもりでした。ただ、テスト段階でClaudeの挙動が少し不安定になる場面がありました。おっと、どうやら持ち直したようです。現時点で実際に1ドルの利益を出しています。少し手荒な取引をしていましたが、運良く切り抜けて問題を解決したようです。そのため残高は50ドルではなく51ドルから始まっていますが、それほど大きな影響はないでしょう。画面が整ったら同時にスタートさせ、1時間でどちらがより多くの利益を残せるか、あるいは損失を少なく抑えられるかを監視します。利益が出るかどうか、見てみましょう。予測市場の5分足トレードにおける王者が決まります。
リアルタイム・トレードバトルの実行
完成したインターフェースは素晴らしい出来栄えです。デザインは似ていますが、左側がClaudeの画面です。ウィンドウに綺麗に収まるように左右対称に近い形に仕上げました。右側がOpenAIの画面です。残り時間、この1時間に実現した損益、残高の更新情報が表示されています。いくつかの表示項目に違いはありますが、意図した通りほぼ同じ機能を備えています。
準備は整いました。両方のウィンドウでスタートの指示を出します。これでタイマーが始動するはずです。もしどちらかのボットがうまく起動しなければ、裏で私が手動で修正を入れて稼働を維持させます。問題が発生した場合は再起動を試みますが、それ以外の局面では一切介入しません。映像は高速で進めますので、皆さんは20秒ほどの倍速再生で取引の応酬を体験することになります。それでは、スタートです。ダッシュボードに移動して、取引が始まるか確認しましょう。始まらなければ調整を入れますが、まずは様子を見ます。
画面を見ると、Claudeのビットコイン取引ボットが動き始めました。OpenAIのボットはどうでしょうか。こちらも動き出しました。両方とも無事に稼働しています。良好な滑り出しです。ここからはカメラをオフにして全体の動きを記録します。何かトラブルがあれば介入しますが、ひとまずは1時間のフル稼働を見守りましょう。どちらのモデルが勝利を収めるでしょうか。51ドル対50ドルの状態でスタートです。両者に幸運を祈ります。
激闘の結末と戦略の振り返り
1時間の取引が終了しました。倍速映像でどのように見えたかはわかりませんが、実際のところ現場はかなり混沌としていました。いくつかの不具合が発生しましたし、開始直後から非常に攻撃的な取引が行われていたからです。
結果は画面の通りです。片方のボットが非常に優れたパフォーマンスを残しました。OpenAIのボットは14ドルの利益を上げたのに対し、Claudeのボットは最初の30分間、非常に安全な運用に終始していました。30分が経過した時点でわずか40セントほどの利益しか出ておらず、OpenAIに10ドル以上のリードを許していたのです。
そこで私はClaudeの画面に対して、OpenAIに10ドルの差をつけられている、今のままでは雀の涙ほどの利益しか出ない、戦略を調整しなければ負けるぞ、という旨を伝えました。するとClaudeは実際に戦略を切り替えたのですが、そこから完全に荒いギャンブルの手法に走ってしまったのです。一回の取引に28ドルもの大金を投じるような行動に出ました。下落予測のチケットを28ドル分購入し、そのまま全額を失ってしまったのです。私の指摘を受けてハードコアなギャンブルモードに突入してしまい、残高の表示は崩れてしまいました。
実際の口座残高を正確に確認してみましょう。こちらがOpenAI側のアカウントの残高です。こちらの取引は非常に上手くいきました。この戦略の仕組みについては、また別の動画で詳しく掘り下げてみたいと思うほど、優れたパフォーマンスでした。もう一方のClaudeのアカウントに切り替えてみます。最終的な利益の表示はプラスではなく、結果として25ドルほどの損失を出していました。
最終的な着地はマイナス10ドルほどになってしまいました。もしClaudeのボットにあのまま手堅い小銭稼ぎの取引を続けさせていれば、おそらく15ドル以上のプラスで終えられていたはずです。十分に良い結果が期待できたのですが、チャレンジの終盤で負けている焦りから私がプレッシャーをかけてしまったため、勝ちに行く姿勢が空回りして暴走してしまいました。
しかし、OpenAIのモデルは期待以上の働きを見せてくれました。そのパフォーマンスの質の高さには非常に満足しています。このアプローチは、今後の動画で確実に深く検証していく価値があります。異論の余地なく、今回の勝者はハイ設定で稼働したCodex 5.5です。
今回の実験は本当に楽しめました。終了する前に、勝者が選んだ戦略の本質をもう少し明確にするために、手短に振り返ってみましょう。Claudeに対して、このロジックの本質を一文で説明するよう求めたところ、ライブのビットコイン価格を基に各5分足市場の真の勝率を算出し、Polymarket側がその確率を本来の価値より安く売りに出している瞬間にだけ、小さな賭けを仕掛けるという回答が返ってきました。価格設定の歪みを突いた、純粋なバリューベッティングというわけです。
これが100%額面通りに行われていたかどうかは別として、今回のケースにおいては非常に強力に機能し、最終的に素晴らしい利益をもたらしてくれました。とても興味深いデータです。もしこのような形式の動画が好評であれば、他のモデル、例えばオープンソースのモデルなどでも検証を行うことができます。あちらにあるGGXの環境でテストすることも可能です。より長期的なスパンの戦略や、逆に制約の厳しい条件下での戦略など、様々なバリエーションが考えられます。高評価の集まり具合を見て、今後の制作を検討します。
今日共有したかった内容は以上です。楽しい実験であると同時に、今後さらに踏み込んだ自動取引の戦略を構築し、どのシステムが生き残るかを競わせるための優れたデータポイントが得られました。AIを活用した自動化やAIトレードについてもっと深く話したい方は、概要欄にあるDiscordのリンクからコミュニティに参加してください。参加者はすでに200人を超えていますので、気軽に覗いてみてください。
ご視聴ありがとうございました。楽しんでいただけたなら幸いです。そして、画面の隅に白いウサギのマークが表示されていたことにお気づきでしょうか。これは、この動画が謎解きハントの対象になっていることを意味しています。謎を解き明かした方には、興味深い賞品や報酬が用意されているかもしれません。それでは、最後までお付き合いいただきありがとうございました。また次の動画でお会いしましょう。


コメント