OpenAI o3-Pro、Claude Opus 4、Gemini 2.5 Proの空間推論+微積分テスト

AIベンチマーク
この記事は約25分で読めます。

この動画は、OpenAI o3-Pro、Claude Opus 4、Gemini 2.5 Proという最新のAIモデルを用いて、空間推論能力と微積分問題の解決能力を比較検証する実験的な配信である。配信者は迷路パズルと複雑な多次元積分問題を各モデルに与え、それぞれの解答プロセスと精度を詳細に分析している。特に興味深いのは、o3-Proが積分問題で正解を導き出した一方で、他のモデルは苦戦を強いられた点であり、現在のAI技術の限界と可能性を浮き彫りにしている。

Testing OpenAI o3-Pro, Claude Opus 4, and Gemini 2.5 Pro on Spatial Reasoning + Calculus
Trying out the new o3-pro model for the first time tonight!

7月4日のAIモデル性能テスト配信

皆さん、7月4日おめでとうございます。今、少し新しいセットアップになっています。職場から大量の本を家に持ち帰ったところです。とても楽しみですね。でも、7月4日おめでとうございます。そして、いつものようにテストをやっていこうと思います。

あのパズルについてたくさん考えていました。OpenAI o3-Proが解くことができたパズルです。そして、同じパズルをClaude Opus 4Gemini 2.5 Proの両方に与えてみようと思っています。これらはそれぞれの会社からの最先端モデルですからね。

また私が映っていますね。Xに投稿しましょう。ここを見てください。よし、投稿しました。7月4日おめでとう、Euro。会えて嬉しいです。あなたはヨーロッパにいるんですよね。ヨーロッパの人たちは7月4日を祝わないと思いますが。

それでは、パズルを始めましょう。それぞれのモデル、Opus 4Gemini 2.5 Proがどのような結果を出すか見てみたいと思います。

パズルはあると思います。なければ、ここからダウンロードできます。よし、これのスクリーンショットを撮りましょう。これで大丈夫です。または保存することもできます。

鏡の中では7月14日を祝うんですね。7月14日ですか。とても興味深いです。知りませんでした。Daniloさん、本当にありがとうございます。とても感謝しています。

この画像が動作するか確認しましょう。動作しますね。それでは、Opus 4Gemini 2.5 Proがこのパズルをどのように処理するか見てみましょう。

実際に、ここでWeb検索をオフにします。Web検索は必要ありませんからね。でも拡張思考はオンにしておきます。Opus 4を使います。実行して、どうなるか見てみましょう。

Claude Opus 4による迷路問題への取り組み

何について話しているのでしょうか。ここでアーティファクトを作成していますね。画像を表示して、ナイトからドラゴンへの解決パスを描いています。インタラクティブなソリューションを作成しているんですね。かなりクールです。

私は反対側に配置すべきでしょうね。何をしているか見ることができます。どうでしたか。何ですって。解決策を表示をクリックして、次のラウンドからのパスを見てください。赤い線が迷路を通る正しいパスを示しています。

これは正しい迷路にさえ見えません。何ですか、これは。解決策を表示。この迷路には入る方法も出る方法もありません。ナイトは左下の角にいます。動き回る。何ですか。

それは私が望んでいたものとは全く違うようですが、頑張ったということですね。何ですか、ナイト。ああ、分かりました。ナイトがあって、それからドラゴンがあって、それでこれを描いたんですね。

これで大丈夫でしょうか。まず第一に、これは正しい画像ではありませんが、第二に、実際の画像でこれが本当に動作したでしょうか。そうは思えません。スタートして。いえいえいえいえ。Claude、頑張って、Claude。頑張って、Claude。本当ですか。これがあなたができることのすべてですか。がっかりです

Claudeがここでこのアーティファクトを作成しました。もう一度やってもらえるか聞いてみましょう。もう一度試してください。今度はPythonのツールを使って、迷路の黒い線に直接触れることなく、画像に赤い線を描いてください。

やってみましょう。おそらくすぐにプロンプトリクエストが不足するでしょう。私は彼らの2番目のティアの購読しかしていませんから。

実際にどこにカメラを置けばいいのか分からないです。ここに少し上に置きましょう。これが動作しているか分かりません。ああ、しまった。イーサネット接続を差し込んでいなかったことに気づきました。もっと早くやるべきでした。まあいいでしょう。

今のところ安定しているようです。このままであることを願っています。でも、ストリームが遅くなったら教えてください。最初からやるべきだったイーサネットで接続することもできます。

GPT-5に興奮していますか。はい、確実に興奮しています。それについてもっと聞いて、何をするのか見るのを楽しみにしています。でも、待つしかないでしょうね。一部の人が言うようにAGIになるのか、そうでないのか、分かりません。

何をここでしたのでしょうか。創造的にアクセスできません。迷路に線のパスを見つけてください。ここで数学を描いています。Hello、Eric。会えて嬉しいです。会えて嬉しいです。

イーサネットを素早く差し込めるか見てみましょう。これで落ちるかもしれません。ストリーム全体がクラッシュするかもしれません。まあいいでしょう。技術的な困難です。事前に設定するべきでした。

まだ続いているようです。まだ続いています。Hello、MD explains。会えて嬉しいです。

Pythonスクリプトによる迷路解決の試み

私たちは何を達成したのでしょうか。正直に言って、ここでトークンが不足したのでしょうか。迷路の解決策を描いてください。ああ、ここです。ああ、すみません。やっと読み込まれました。Pythonスクリプトが描きます。

接続できませんでした。一生懸命やっているのを見せています。ここを見てください。指示的なHTMLデモの処理方法を示しています。Python solve maze。

それを実行しなければなりません。HTMLソリューションはどうでしょうか、すぐに。何、また、これは正しい迷路ではありません。これは正しい迷路ではありませんが、まあいいでしょう。この迷路の右側には出口もありません。解決パスを表示。

それは、問題を正確に解決することはできませんが、元の迷路とは何の関係もない完全に違う迷路があり、明らかに間違っているということでした。

解決策をアニメ化。それはクールですね。少なくともアニメーション化します。間違ってアニメーション化しますが。

それは良くありませんでした。Claudeがここで提供したPythonバージョンを試してみましょう。スクリプトを実行できるか見てみましょう。素晴らしいSublime Textを出しましょう。

あなたが何を指しているのかよく分からないです。ポテンシャルバリアを通してトンネルしたんですか。それが話していることですか。少し迷っていました。

量子波動関数量子トンネリングについて話しているんですね。今は量子力学的な迷路で、ただ通り抜けなければならないということです。反対側で粒子を見つける非ゼロの確率があります。その場合は量子トンネリングでなければなりませんね。

このスクリプトをmaze puzzleみたいな名前で保存しましょう。maze solution。ターミナルはどうなっているのでしょうか。ターミナルはここです。タイプできません。solve mazeをダウンロード。

Python 3 maze solution.pyをしなければならないと思います。それから構文は何でしたか。名前を入れるだけです。迷路に解決策を描く。draw solutionを呼ばなければなりません。

簡単な描画パスが等しい。ここで実行しなければならないのでしょうか。それから画像をどこで取得するかを理解しようとしています。

実行できるでしょうか。実際に動作するのでしょうか、それとも何ですか。いえ。ああ、待って。これにはnumpaiがありません。Google Collabかなにかで実行できるでしょうか。

Vimを使っていると思いました。いえ、私自身はJupyter Notebookを使います。Google Collabに素早く入って実行することを考えています。

迷路問題の結果と評価

奇妙な組み合わせです。SublimeにはVimモードがあります。ああ、今はそうなんですね。collab取得。ここに行きましょう。ここに何かあるでしょうか。すみません、これを理解するのにとても時間がかかっています。イライラしています。

構築しているものは何でしょうか。ここにはどんな環境がありますか。draw solutionを呼ぶ。迷路で。この画像です。

うまくいきませんでした。うまくいきませんでした。AnthropicのコードがHTMLで行ったことに基づいて、これは良い解決策ではなかったので、続けようとする気になりません。まず第一に、実際のものに描画しませんでした。それはちょっと面白いですね。

その間に、同じ解決要求を与えながら、これをGeminiに与えてみましょう。メディアとlaを作成し始めます。はい、同じ解決要求を与えます。

IMOをベンチマークとして使うべきだと思いますか。しばらくベンチマークとして使っていました。でも、数学形式論理のようなものについて何かあると思います。形式的に定義されたロジックシステムや記号操作のようなものをすでに学習しているので、それで試すのは良いアイデアではないかもしれません。

赤はどこですか。パスはどこですか。迷路の解決策はどこですか。私が言おうとしていたのは、これまでの数学のデータについて非常に多く学習している場合、Project Eulerのような本当に難しい数学問題を解くことができているので、それが大きなハードルになるとは思えないということでした。それらは公開されている既知の答えがないような問題です。

高校生や賢い大学生ができる問題を解くのが上手になっています。それらが使うべき正しいベンチマークかどうか分かりません。

ああ、戻ってきましたね。Hello。戻ってきましたね。すみませんが、それをしないようにお願いしなければなりません。これを素早く処理させてください。去るようにお願いしなければなりません。削除しなければなりませんでした。

温度設定と計算手法について

なぜ温度ゼロなのですか。特定のタスクでは低い温度の方が良いといつも感じています。最も確率の高いものを与えないという点で。数学や物理学の場合はそうです。ゼロに近いか、まさにゼロに保っています。

でも今、混乱しています。どこに混乱しています。代わりにこれを試してみましょう。ちょっとの間Wolfromをオフにします。One note。今のところそれらは必要ありません。

この人が本当に理解できません。はい、彼はaltです。すみません。視聴している皆さん、または後で見る方々のために、少しスパマーがいます。

おっと、ちょっと待ってください。それはo3-Proでしたね。気にしないでください。それはo3-Proだったと思います。誰がこれを解いたのでしょうか。待って、これは解決策付きの迷路でしたか。それはスクリプトを実行した結果から来たのでしょうか。実際にスクリプトを実行した結果だったのでしょうか。

すみません、今少し混乱しています。はい、いえ、それはスクリプトを実行した解決策でした。ああ、また君ですね。正直に言って、何回君を遠ざけなければならないのか分かりません。

この人も削除します。すみません。実際にスクリプトを実行しました。これが実行されたスクリプトでした。エラーと言いましたが、私がそれをやったことで、この解決策が生み出されたようです。

すみません、これが出てきました。これはClaude Opus 4によって提供された解決策でした。ここで基本的に量子トンネリングをしているのが見えます。私たちが望んでいたものとは全く違います。正確ではありませんでした。

それから先に進んで、Geminiに素早く戻りましょう。ターミナルではなく、すみません、ウェブブラウザで試したかったのです。AI studioではなく。どうするか見てみましょう。

ああ、ワオ。ああ、また君です。すみませんが、君にはここにいないようにお願いしなければなりません。君をタイムアウトに入れます。

ストリーミングを始めてからずっと一貫して私のストリームをスパムしている人がいて、タイムアウトに入れたり報告したりし続けなければなりませんでした。かなり迷惑です。

Geminiの解答試行と結果

top dog undocumentsが言及したいのは、私が取り組んでいる問題のほとんどは証明であり、証明は最終的な正しい答えよりもエンティティに依存するため、それらが苦労することです。これはRLにより適しています。それは知っておくべき良いことですね。

ナイトで始まりました。ここには視覚化がありません。Pythonスクリプトを書くように頼むべきでしょうか。画像を描くPythonスクリプトを書いてください。

パリからの乾杯。Hello。誰ですか。CM。Hi、会えて嬉しいです、Sam。立ち寄ってくれて本当にありがとうございます。とても感謝しています。また会えて嬉しいです。

実際にGeminiにスクリプトを書くように頼みます。すみません、みなさん、少し気が散っています。スパムなどがたくさんあったので。

Gemini Proを嫌悪しています。嫌悪はとても重い言葉ですね。なぜ嫌悪するのですか。

Geminiにこれを解かせています。右で始まって。これが解決パスだとされています。試してみます。このスクリプトは何ですか。このスクリプトを何と呼びましょうか。solve mazeとしましょう。

私のターミナルの色が変わりました。奇妙です。Geminiを信頼しているので、それとして解決する必要がありました。

人々はKyle、君はヒスパニック系のルーツがあるよね、と言っています。いえ、私はフィリピン系です。実際、私はフィリピン系です。ここに行って、実際の画像の名前にこれを変更する必要があります。

実行してみましょう。おっと。PILがありません。それが本当にそうなのでしょうか。はい。この環境にはどんな環境がありますか。これは私のストリーミングアカウントなので、実際にはそれほど作業するものがありません。

ここにPILがありますか。Python 3 solve maze。空間推論と言っていました。数学と物理学にすぐに進みます。考えていた1つの問題をどのようにするか試してみたかったのです。

top dog underdogが言ったように、前から組み合わせ論の質問のようなものをくれませんでしたか。

解決しましたか。実際に、ここに行きます。解決しましたか。解決していませんでした。それがGeminiの試みでした。

GeminiとClaudeはあまりうまくやりませんでした。今、人々が求めていたように、実際に数学と物理学をやってみましょう。これは、正直に言って迷路やそのようなものについて私が持っていたこれらの質問のループを閉じるようなものでした。

複雑な積分問題への挑戦

この日に考えていた問題があります。それを与えるのが良い問題かどうかさえ分かりません。正直に言って、与えるのがそれほど良い問題かどうか分からないです。

Grok 4のベンチマークとされるものを見ましたか。人類の最後の試験で45点を取ったそうです。本当なら大きなことです。ワオ。Xでそれについて何か見ましたが、それをどれほど真剣に受け取るべきか、ただの誇大宣伝なのか分かりませんが、もし本当なら、それは本当に素晴らしいことです。

ノートブックはどこですか。読み込まれていません。しまった。消えてしまいました。すみません。あまりせっかちすぎました。せっかちすぎないのがルールだと思います。そうすれば実際にここで完了するでしょう。

私の後ろにはたくさんの本があります。これが1つです。回路やそのような性質のものを含む何かを与えることを考えていました。なぜか回路はそれほどうまくやらないように感じるからです。興味深いことに。

群論を勉強しようとして失敗しました。はい、群論も私の好きな科目の1つではありません。

ここにこの興味深い積分があります。この式分数はどこですか。w^2 + x^2 + y^2 + c^2の2乗だと思います。それから基本的に0から無限大に行きます。すみません、何をしているのですか。無限大、無限大、それから0から1に行くと思います。これはかなり興味深いです。

それからdx dxのようなことをしなければなりません。だから、dw dx dy おっと dz。実際にこれは何か興味深いものになると思います。実行されるでしょうか。

0から1では収束しません。π^2/8÷Zは収束しません。これは何かだと思っていました。これは収束しないのでしょうか。何か興味深いものに収束すると思っていました。

数学の場合、基本をしばらく続けることができる必要がありますよね。それとも1/2でしたか。これは平方根でしたか。覚えていません。問題は正確に何ですか。この写真も撮ったような気がします。この問題を解くことに興味があったからです。

当然、私の他のアカウントにあります。平方根を素早く取り除きましょう。できません。すみません、余分なものがあるからです。本当に。すみません、なぜそこに2があるのですか。いえ、なくなりました。1プラスのようなものでした。

これは全体が2乗でしたか。今思い出し始めています。すみません。もう少し考えるべきでした。これが収束を確実にするために2乗だったと思うからです。はい。π^2/16です。

私はここでひねりを加えました。これが私が考えていた基本的な問題でした。でも、私は大学院でMathematicaのようなもので授業があって、楽しみのために、それを楽しみと呼ぶなら、これで遊ぶことができると思っていました。別の変数の2乗を追加できます。

それを2乗して、それプラスそれ。有限である必要があるからです。これは実際に収束するものです。1/8 π^2 arc of 1。かなり興味深いです。これを少し変更すると、異なる数値を得ることができます。異なる境界などで遊んで、実際に解決できるかどうか見るのが好きです。

エラトステネスだったと思います。地球の半径を計算した人です。間違いでなければ正しいですか。

数値は2.29です。これらがこの問題を行うことができるかどうか見てみましょう。これを解析的に行うことができるかどうか知りたいです。これには閉形式解があるからです。実際に解析的に解く方法を知りません。おそらく非常に長くて退屈で、いくつかの置換で満ちているでしょう。

でも、これらのモデルが実際にこのような種類のものを処理できるかどうか興味があります。Mathematicaで量子場理論の積分を行うことができます。理論的には、はい、o3に与えることができます。

この積分を評価してください。解析的には、まず解析的に行い、答えとして閉形式表現を見つけてください。それから数値的に答えを実行し、積分の値を2桁の精度で報告してください。

これがどうなるか見てみましょう。その質問は癌のように見えます。まあ、彼らは大丈夫です、分かりますよね。大丈夫でしょう。生きるでしょう。これで彼らを殺すつもりはありませんが。

o3-Proの積分問題への取り組み

おそらくClaude Opus 4でのリクエストが不足するでしょう。これらを多く取りすぎるからですが、探求する価値があると思います。

Claude codeを試しましたか。Claude codeは試していません。Google Gemini CLIは試しました。

なぜこれが私に与えているのでしょうか。何と言っているのですか。高解像度を添付してください。いえ、それはかなり高解像度です。それができるはずです。与えてください。ただ興味があります。

積分の値は何ですか。いえいえいえいえ。これはπ^2/8を得ません。ああ、倍。ああ、π^2倍これ。何ですか。3.726。いえ、実際にはしません。それは答えではありません。答えは3.726ではなく2.29です。

はい、私たちはいくつかの積分o3-Proを困惑させることができたかもしれません。やりましたね。そうです、彼は夏至のような期間中だったようで、太陽が空で最も高いとき、夏至のように、2つの異なる都市で作られた2つの影の角度を使って、三角法と幾何学を使って、地球がどれほど大きいかを計算しました。

ああ、ワオ。ああ、π^2。したがって、最終答えはπ^3です。ああ、π^3の1/。ああ、正しくありません。1.18ではありません。2.29です。おっと。

これらのもので破綻点を見つけたようです。この積分を評価できないようです。4次元積分でしたが、少し苦労しているのを見るのはクールです。球座標

実際にどこで間違ったのでしょうか。これは実際にかなり興味深いです。明らかに数値的に間違ってやっているからです。はい、分かります。4重積分は、これらのものを困惑させたいときに行く方法です。幻覚です。

3つの異なる答えがあります。まあ、これまでのところ2つの異なる答えです。o3-Proは3.726だと言っています。そして他に何をしているのでしょうか。モンテカルロサンプリング

Gemini 2.5 Proはどうしているでしょうか。解析評価。ああ、答えを見ました。正しくありませんでしたが、1.80445。これはこれと同じものですか。1.18。いえ、数値はおよそ1.80445です。すべてのステップを再確認しましたが、結果に自信があります。

そのすべてを行って、これらすべてを行うことができます。これはπ^3/32 arc cinch of πと書くことができます。1.80。

はい、うまく困惑させました。皆さん、うまく困惑させました。積分。やりましたね。原理的には、深刻な計算ではLLMにこれをやらせないでしょう。おそらくMathematicaにプラグインするだけでしょう。

でも、これらのモデルが試行し、明らかに答えは、はい、明らかに答えはπ^3/8÷1 uh^2 1 + p^2、またはこの表現であっても、それは正しくないのにBSを言うのを見るのはクールだと思います。

正解の提示と各モデルの反応

計算機を使っていないということを評価しなければなりません。高度なパターンマッチングの形として記号操作を行っています。はい。

いえ、これを試みるのを見るのはまだ本当にクールです。人間としてこれを見ると、何らかの三角置換などが必要だと認識しています。でも、それはとても醜いので、おそらく自分でやりたくないでしょう、正直に言って。

非常に興味深いです。答えを与えて、逆方向に作業するように頼んでください。やってみましょう。そうですね、それをするべきかもしれません。実際にあなたは間違っています。

正しい答えはπ^2だと言いましょう。π^2/8 times arinch arc cinch of πと書きます。π^2/8 arch of πで、これはおよそ230です。この結果を知って、数学的導出のどこで間違ったかを特定するために逆方向に作業してください。そして、この最終結果に到達するための正しいヒントを提供してください。

どうなるか見てみましょう。ここで数値的答えを与えました。これが答えです。どうするか見てみましょう。どうやって考えているのでしょうか。π^2拡張π。はい。異なる置換。

私は積分を評価するときにエラーを犯したかもしれません。慎重に再計算する必要があります。ピースに焦点を当てます。バックトラック。積分を評価するとき、計算でエラーを犯しました。このステップを正しくやり直しましょう。a = 1 + w^2とします。

置換を使ってこれを評価する必要があります。積分はこれになります。したがって、これが私のエラーがあった場所です。1 + ω^2の-3ではなく、1 + ω^2の-1/2を持っていました。

今、これの最終積分とこれの逆導関数はこれです。2.30になったので完璧です。

それが明らかに間違った場所だということです。どこに-3/2があったのでしょうか。1プラスωの2乗マイナス3/2を持っていました。前回のものに実際にそれがありましたか。ωああ、ωの2乗プラスがありました。sはs = 1 + ω^2の3/2はここにあります。

興味深い。この置換を使ったときに間違ったということです。s = 1プラスω^2 u jezであれば、興味深いです。彼らは私にガスライティングをしているのでしょうか。はい、実際に知りたいです。

同じことをGeminiに素早く与えてみましょう。すみません、それは間違ったものでした。Gemini Pro 2.5 Proに同じことを与えたいと思います。o3-Proはどうしましたか。

o3-Proは何と言いましたか。ちょっと待ってください。ああ、正解を得ました。おっと。すごい。すごい。o3-Proが正しい答えを得ました。o3-Proは実際にここで正しい答えを得ました。それはクレイジーです。

sinchの積分を使って、W = π^2/8 arc cinch。ワオ、とても良いo3-Pro。とてもとても良い。それは本当に良いです。それは本当に良いです。

Geminiがどうしているか見てみましょう。第3の視点をありがとうございます。前のステップから2乗を素早く。ここに正しい結果があります。統合が正しい。3/2がまたあります。

o3-Proを信頼してください。それが私がここで得ている雰囲気のようなものです。o3-Proは最初の試行で得ました。Claudeはここで自分自身を再修正しなければなりませんでした。

でも、なぜそれをしたのでしょうか。したがって、ωのIまたはωの積分のIはこれでした。そして、それは何を持っていましたか。はい、これを持っていました。s² = 1 + ωの2乗uと書くと言います。そのように書くと、これが本当に出てくるのでしょうか。それがめちゃくちゃになった方法ですか。

この表現を書きたいです。1/1 + 2 + s uh s^2。その表現があります。今、sをとして、1 + ω^2倍uにその表現を取りましょう。それをするとき、1 + ω^2。ああ、ちょっと待ってください。それは正しく見えません。

したがって、今は誰もo3-Proに触れることはできません。今のところそうは見えませんね。

積分計算の詳細検証

これでなにかを見たいと思います。どのようにそれをしたかがよく分からないからです。1 + ω^2を平方根にすべきです。ああ。ああ、分かりました。ちょっと待って。ここに戻って、したがってこれと等しいです。これは1つの要因、1の2乗、1つで外れています。

これは1プラスω^2の-3/2ではなく、1プラスω^2のマイナス1/2であるべきです。なぜ平方根の下にあるのかさえ理解できません、実際に。

OpenAI、よくやりました。問題に計算を投げつけるだけ。はい。1プラスω^2 1プラスω^2があります。1プラスω^2を因数分解して、得られます。

明らかにここで正しいですが、Iがどこから来るのか分かりません。Iはここからここまでで、1プラスω^2 uをプラグインして、何らかの形で因数分解しなければなりません。ああ、分かります。2乗するからです。基本的にそれらのもののうちの1つがあります。

One Noteをここで素早く使う必要があります。それは今開いている予想です。投稿したものは良いものです。すみません。これは異なるストリームからですが、ここで使います。

新しいページをください。ちょっと待って。基本的にroo s/1 + ω^2 + s^2があると言いました。それからs = 1 + ω^2 u。それから s/1 + ω^2プラス1 + ω^2 * uの2乗があります。

そのすべてが2乗されていますよね。はい。そのすべてが2乗されています。ここで見ているのは、基本的にこれを取る必要があるということだと思います。

C1と呼びましょう。数学で少し助けてもらうために。時々、長いだけの表現があまり好きではない場合、より短いものの観点から書くことがあります。C1 U^2。なぜそこに2があるのですか。すみません。なぜそこに2があるのですか。

ああ、今なくなりました。基本的にあなたが持っているのは、ちょっと待って、なぜそうなのかまだ分からない。1プラスu^2があります。でも、どのようにして、ああ、でもsは1プラス2乗と等しい。ああ、分かりました。

sはこれと等しいです。sは1プラスと等しいです。分かります。あのC1があります。C1を何と呼びましたか。C1は1プラスω^2です。

これはC1^2乗U/C1^2 C1 2 * 1 + U 2の2乗と等しいです。はい、これが台無しになったところだと思います。いえ、ちょっと待ってください。本当にそれが台無しになった理由でしょうか。

C1/C1^2がC1の1/2/C1^2と等しいと言っているからです。それは1/2マイナス4で、マイナス3と等しいです。ちょっと待って、何ですか。これがあると言いました。つまり、それはあなたが1プラスω^2に持つべき正しい力です。

でも、なぜそれが間違っていると言ったのですか。ここで1プラスメガ^2の代わりにマイナス3があったと言ったからです。分からないです。これは正しいアプローチでしたが、それが間違いだったと言っているのです。

それは間違った置換だったのか、それとも最初から間違ったステップだったのか。積分力がマイナス1/2ではなく最初に仮定したマイナス3/2であったということですが、とにかく、興味深いです。

Gemini Proはどうでしたか。見ることができますか。なぜ間違っていたのですか。π^2/32を持っていました。そのπ^2/32はどこから来たのですか。はい、ここにπ^2/32がありました。ここで標準的な積分だと言っています。

実際にこの積分を間違って行ったのでしょうか。現在やっているiyと言っています。これを素早くやる必要があります。無限大1 d y c^2 + y^2。それから外側にπ^2/16があります。π^2/16。それから何が起こるのでしょうか。

ああ、これは標準的なMathematicaであるべきです。π5/2があります。ちょっと待って、何ですか。π5/2/32 C。でも、混乱しています。この32の要因が間違っていた理由だと言っているからです。でも、問題はこれの間違った係数を持っていることです。

Cをこれと等しくします。これが修正されたステップです。積分はこれです。I Yyはこれと等しいです。これは8であるべきでした。ああ、そこに16があります。でも、なぜ16があったのですか。

積分が好きです。原理的にLLMがどこで間違ったかを理解できて、かなり迅速に検証できるからです。まあ、私でなければかなり迅速に検証できるでしょうが、私はここで時間をかけて、その論理のどこで正確に間違ったかを理解しようとしています。

でも、間違った32の要因があったと言っているので、よく分からないです。ここで間違った係数のπ π^3/32があると言っています。正しい係数はπ^2/8です。その欠けているπの要因はどこから来るのでしょうか。π^3/32。π^2とπ 5/2があります。

ああ、5/2 5/2。5/2IYと言って、これはこの積分です。これを今やったところです。π^3の答えは。ああ、うわあうわあうわあ、ちょっと待ってください。はい、実際に。ああ、ここで何が間違ったかがなんとなく分かると思います。

IYと言います。これはこの積分ですが、我々がやったものです。最終答えはπ^3/32 1 + 7^2だと言いました。

ここでも間違ったπの要因を得ています。正しい係数を得ていますが、そこで5/2の正しい力を得ていません。それが正しく評価しなかったのでしょうか。なぜc^2ではないのですか。もう一度試してみましょう。

まだ1/32 1^2 1/c^2 π^3です。そこにπ^3があります。それを正しく行いました。それはここで正しかったですが、これが間違った係数だと言っていますが、この積分を正しく行いました。

それは最初から間違った積分を設定したか、後で数学を間違えたということになります。この積分を正しく行ったからです。はい、π^3/32が持つべき間違った係数だと言っていますが、それはこの積分を正しく行ったことになります。

c^2を本当に素早く人々に言います。はい、それをキャッチしてくれてありがとうございます。でも、はい、ここでこの積分を正しく行ったと思いますが、π^3/32が間違った係数だと言っています。それは最初から間違った積分をやったか、代数を間違ってやったということです。

私はそれ以外の考え方を知らないからです。この積分を正しく行ったからです。または少なくとも、それがそのように解釈する方法です。最初から間違った積分をやったか、上に移動して代数を間違えたかのどちらかということになります。はい、よく分からないです。

興味深い。興味深い。とてもとても興味深いです。でも、ストリームの1時間マークに近づいています。今日は1時間だけストリームするつもりでした。

すみません、迷路積分のような2つの問題を見るのにこんなに時間を費やすとは思いませんでした。でも、次回もぜひ戻ってきてください。このようなことをもっと続けることができることを願っています。

これらのLLMが積分をやるのを見るのはいつも面白いと思います。もちろん、Wolfram AlphaMathematicaのようなツールがあって、それらが私たちのためにやってくれますが。これらの拡張された多次元積分を試行し、その分析のどこで正確に間違ったかを理解しようとするのを見るのはかなりクールだと思います。

皆さん、見てくれて再びありがとうございました。

コメント

タイトルとURLをコピーしました