OpenAIが突如リリースしたGPT-5.2は、GPT-5本体よりも重要な意味を持つ画期的なアップデートである。GoogleのGemini 3リリースを受けて始動した「コードレッド」イニシアチブの成果として、GPT-5.2はGemini 3 ProやClaude 4.5 Opusを多くの評価指標で上回る性能を達成した。特に複雑な推論、数学、コーディング、シミュレーションにおいて大幅な進化を遂げ、標準版、Thinking版、Pro版の3バージョンが展開されている。最大768という驚異的な推論レベルを持つPro Extendedは、長時間の思考プロセスを可能にする。コンテキスト理解は256万トークンまでほぼ完璧な検索精度を実現し、画像認識能力も大幅に向上してGemini 3 Proを凌駕している。幻覚率は30〜40%削減され、SWE-benchなど主要ベンチマークで最高性能を記録した。特筆すべきは、ビジネスタスクにおいて専門家と70.9%の確率で同等以上の成果を出しながら、コストは1%未満、速度は11倍という圧倒的な効率性である。スプレッドシート作成やプレゼンテーション生成においてFortune 500企業の専門家レベルの品質を実現し、ARC AGIベンチマークでは1年前に比べて390倍のコスト効率改善を達成するなど、大規模言語モデルの進化が停滞していないことを明確に証明した。

GPT-5.2の衝撃的なリリース
ほとんどの人はおそらく見逃すでしょうが、OpenAIはGPT-5.2をリリースしました。正直なところ、これはGPT-5本体よりも大きなリリースです。多くの異なる評価指標でGemini 3 ProやClaude 4.5 Opusさえも上回っています。
GPT-5.2はOpenAIのコードレッドの成果です。これはサム・アルトマンが始めたイニシアチブで、GoogleがGemini 3をリリースした直後に開始されました。OpenAIチーム全体がこの攻撃モードに入り、自分たちがリードを失いつつあることを認識し、最大限の緊急性を持って前進し続けるために迅速に取り組む必要があると実感したのです。正直なところ、効果があったと言えるでしょう。なぜならGPT-5.2は驚くほど優れたリリースだからです。
Pietroはこう述べています。私はしばらくGPT-5.2をテストしてきました。複雑な推論、数学、コーディング、シミュレーションにおいて真剣な飛躍です。彼は3Dグラフィックスエンジンを一発で構築しました。
GPT-5.2には3つの異なるバージョンがあります。クラシック版、つまりデフォルト版があり、これはほとんどの人がChatGPTで使用するものです。これはインスタント版ですね。GPT-5.2です。しかしGPT-5.2 Thinkingもあります。これはより高い推論努力を持つバージョンです。明らかに、ChatGPTで使用する際には複数のオプションがあります。ライト、スタンダード、エクステンデッド、ヘビーです。
しかしGPT-5.2 Proもあります。これも大きなアップデートです。なぜなら、ほとんどの場合OpenAIはProバージョンをリリースするのを待つからです。他のモデルより2、3週間遅れてリリースするのが通常です。しかし今回は、Proの2つのバージョン、Extended Proまで提供しています。
これは狂気じみています。これについては後でさらに詳しく説明します。しかし、このモデルが何ができるかのちょっとしたスニークピークとして、ジュースレベル、つまりどれだけの推論を持っているかを決定するものが768に設定されています。これはこれまで見たことのないものです。モデルは通常128を持っており、Proでは256だったかもしれませんが、見てください。
GPT-5 Pro Extendedでは768です。これは、このモデルが非常に長い時間考えることができ、あなたの質問に答えるために多くの計算リソースを費やすことを意味します。ですから、この200ドルのChatGPTプランが価値があるかどうか検討しているなら、今がおそらく試す最高のタイミングです。
この動画では、GPT-5.2について知っておくべきすべてのこと、そしてGemini 3 ProやClaude 4.5 Opusとどう比較されるかを説明します。後ほど、ライブでこれを使って何でも構築する方法と、コーディングにどれだけ優れているかをお見せします。最後まで必ず視聴してください。
ちなみに、私はGeminiと提携してポーランドのワルシャワで対面ハッカソンを開催します。ハッカソンは2026年1月に開催され、限定枠となります。参加したい方は、Instagramで私をフォローして「hackathon」という単語をDMしてください。
コンテキスト理解の大幅改善
まず、GPT-5.2におけるコンテキスト理解の大幅な改善です。最大256万トークンのコンテキストに対してほぼ完璧なコンテキスト検索能力を持っています。このベンチマークを見てください。これはOpenAI MRCv2 for needlesです。これは針を隠すNeedle in Haystackテストです。
これを見てください。GPT-5.0 Thinkingと比較すると、これは1ヶ月半ほど前にリリースされたばかりですが、改善は大規模です。256万トークンまでは95%以上です。これは、コーディングのような長時間の作業タスクを行う場合、新しいチャットにリセットする必要がほとんどなくなることを意味します。これは大規模な改善です。
8本の針でも同様で、95%ほど良くはありませんが、それでも80%、75%といったところで、GPT-5.1よりもはるかに優れています。
ビジョン能力の予想外の向上
次は、もう一つの予想外の改善、ビジョン機能です。通常、Gemini 3が標準でした。なぜなら、Googleは常にモデルをマルチモーダルにしてきたからです。しかしOpenAIはここで驚異的な改善を行いました。実際、スクリーンショット理解においては、Gemini 3 Proよりも優れています。
ここに明確な例があります。これはマザーボードです。GPT-5.1はマザーボードを識別し、それからポートとUSBポートを認識しました。正直なところ、かなり悪いです。しかしGPT-5.2を見てください。画像全体をマザーボードとして識別し、その後具体的にVGAポート、HDMI、HDMI、USB Type-Cと識別しました。はい、はるかに優れた画像理解です。実際、比較にならないほどです。
ですから、分析したい複雑な画像がある場合や、何らかのビジョン認識システムを構築している場合、GPT-5.2は素晴らしい選択肢です。ちなみに、これはすでにOpen Router内で利用可能です。Open Routerでアプリを構築している場合、このモデルへの切り替えは30秒ほどで完了します。
信頼性の向上と幻覚の削減
もう一つの改善は信頼性です。GPT-5.2はGPT-5.1よりも30〜40%幻覚が少なくなっています。これも大きな飛躍です。数パーセントというレベルではありません。30〜40%です。これは重要です。特にファクトチェックシステム、学校向けのもの、教育向けのもの、正確性が非常に重要な場所で何かを構築している場合には。30〜40%の幻覚削減は驚異的です。
これはOpenAIの公式システムカードからのものです。GPT-5.2の平均幻覚率は0.8%であることがわかります。
圧倒的なベンチマーク性能
これはベンチマーク、つまり評価指標に繋がりますが、非常に印象的です。皆さん、誤解しないでください。人々はこれを見て「GPT-5.1、5.2、これはまた小さなアップデートだ」と思うかもしれませんが、これは小さなアップデートではありません。重要なアップデートです。
ここを見てみましょう。人生や仕事のあらゆる分野や領域から8つの異なるベンチマークがあります。まずSWE-bench Proを見てみましょう。最も有名なベンチマークの一つで、ソフトウェアエンジニアリング向けです。私たち全員がAIでの構築に関心を持っているので、GPT-5.2はどのように機能するのでしょうか。
Gemini 3 ProとClaude 4.5 Opusの両方を完全に破壊しています。つまり、今OpenAIは世界最高のコーディングモデルを持っているということです。
GPQA Diamondは非常に難しい科学の質問で、ここでも再びOpusを破壊し、Gemini 3 Proよりもわずかに優れています。Carive Reasoningは科学的な図の質問で、再び最高クラスで、Gemini 3よりも優れています。Frontier Mathは最高クラス、AMEは別の数学で100%飽和し、このベンチマークで最高クラスです。
ARC AGI1は視覚推論ベンチマークで、再びOpusとGemini 3の両方を破壊しました。そしてARC AGI2は大幅に難しいのですが、大規模な飛躍を遂げました。数パーセントポイントだけでなく、Opusより15%近く、Gemini 3より20%以上です。
ちなみに、Gemini 3とClaude 4.5 Opusの両方を画面に表示しますが、両方ともこれらのベンチマークで最先端を達成しました。つまり、これは停滞していたベンチマークではありません。いいえ、Gemini 3はこのベンチマークで大きな飛躍でした。私のGemini 3の動画でカバーしましたが、GPT-5.2はそれらの結果を完全に粉砕しました。
そしてGDP Valも同様です。これについては少し詳しく説明します。多くの人がこの評価指標について知らないからです。これは最も重要なベンチマークの一つであり、GPT-5.2はそれを完全に粉砕しました。
コーディング能力の革新
さて、コーディングについて話しましょう。これは私たち全員が興味を持っていることであり、動画の後半ではこのモデルがコーディングでどれほど優れているかをお見せします。これはファインチューンされたCodexモデルさえも打ち負かします。
覚えておいてください、OpenAIには多くの異なるモデルがあります。Cursor拡張機能をすぐに見れば確認できます。ちょっとしたスニークピークです。彼らはGPT-5 Codex Max、GPT-5 Codex、GPT-5 Codex Miniを持っています。これらはすべて、ChatGPTで使用されていたGPT-5.1デフォルトよりも優れるようにファインチューンされています。
今GPT-5.2はこれらすべてを破壊し、SWE-bench Proで55.6%を達成しています。このチャートで、他のGPT-5.1モデル、デフォルトとファインチューンされたCodex Maxとどう比較されるかを見ることができます。そして、ほぼすべてのコンテキスト長で勝利しています。GPT-5.2 ThinkingはOpenAIの最高のコーディングモデルとなりました。
OpenAI内部のテストでは、このモデルがOpenAI研究エンジニアの仕事をどれだけ置き換えられるかを確認したかったのです。なぜなら、AIがAI研究自体を行えるようになれば、理論的には改善が本当に超高速になり、再帰的に改善されることになるからです。
測定したところ、他のベンチマークほどではありませんが、それでもGPT-5.1からGPT-5.2への大きな飛躍があり、プルリクエストの量で10%以上の改善がありました。開発者でない方のために説明すると、プルリクエストは作業の単位のようなものです。新機能かもしれませんし、バグ修正かもしれません。
しかし重要な部分は、今や50%以上が再現されているということです。つまりGPT-5.2は実世界のプルリクエストの55%を再現できるのです。これは偽のデモコーディング問題ではありません。これはOpenAI従業員の仕事です。そしてOpenAI従業員は、画面にも表示しますが、非常に高額な報酬を受けています。
つまり、これらは単なる平凡な開発者ではありません。これらはトップ研究者、トップエンジニアです。そして今GPT-5.2は彼らのプルリクエストの半分以上を再現できるのです。驚異的です。
サイバーセキュリティにおける優位性
次はサイバーセキュリティです。OpenAIにはCTFベンチマークがあります。これはCapture the Flagの略です。これは、モデルが現実的なタスクベースのハッキングシナリオで、脆弱性や防御システムをどれだけうまく見つけて悪用できるかをテストするために使用されます。
繰り返しますが、目標は実世界のシナリオを再現することであり、子供向けの偽の簡単な問題を与えることではありません。このベンチマークでも、GPT-5.2は再び最高クラスです。ちなみに、Pass@12は12回の試行内で問題を解決したかどうかを意味します。これはワンショットではありません。12回の試行です。そして12回の試行中に少なくとも1回解決されれば、成功とカウントされます。
ベンチマークでこれを見たとき、今あなたは何を意味するか分かります。
ビジネスタスクでの専門家レベルの性能
しかし、ここからがメインパートです。なぜならGPT-5.2はすべてビジネス、すべて仕事に関するものだからです。一方GPT-5.1はすべてパーソナリティに関するものでした。これはまた、一般ユーザー向けにモデル化されたもので、GPT-5.1の記事で有名な例を作ったときにそれを見ました。彼らは「会議の前にコーヒーを自分にこぼしてしまった。みんな私がバカだと思っただろうか?」と言いました。
彼らはこれをGPT-5.1の改善を示すメインの例の一つとして使用しました。これは絶対にばかげており、明らかに主流ユーザーを対象としています。ビジネスを運営している場合は注意してください。なぜなら、この動画のこのセクションは特にあなたのためのものだからです。
GPT-5.2はビジネスタスクにおいて、専門家と同等かそれ以上の成果を70.9%の確率で出すことができました。これらは特定の職業を持つ人々、フルタイムの仕事を持つ人々であり、路上のランダムな人々ではありません。71%の確率でビジネスタスクにおいて、コストの1%未満、11倍の速さです。これを理解する時間を取りましょう。
これがどこに向かっているかを理解するために天才である必要はありません。ですから、ビジネスを運営していてまだAIを使用していない場合、あなたは遅れをとっています。
さて、ウォートン・スクールの教授でAI研究者のイーサン・モーリックがGPT-5.2、特にGDP Valスコアについて述べたことは次のとおりです。これは動画の前半セクションでヒントを出した評価指標です。
この新しいGDPスコアは非常に大きな意味を持ち、おそらくAI能力の最も経済的に関連性の高い測定値であり、人間が4〜8時間かかるタスクでの人間の専門家との直接対決において、GPT-5.2が他の人間によって判断されて71%の確率で勝利することを示唆しています。
ですから、AIが経済の生産性や成長に影響を与えるかどうかまだ疑っているなら、もう一度考え直してください。
スプレッドシートとプレゼンテーションの革新
より具体的に、スプレッドシートを見てみましょう。これは、どれだけの職業がExcelやGoogle Sheetsで作業を行うかということです。基本的に、ほぼすべての知識労働者がある時点でスプレッドシートに触れます。
そしてGPT-5.2はスプレッドシートとExcelで大幅な改善を遂げています。GPT-5.1を見てみましょう。列は正しくフォーマットされていますが、スタイリング、デザインは存在しません。すべてが白で、ハイライトも何もありません。GPT-5.2 Thinkingを見てください。クリーンで、分離され、間隔が空いており、はるかに良く見え、概観しやすいです。これははるかに優れた製品、はるかに優れたスプレッドシートです。
そして、それには理由があります。GPT-5.2はFortune 500企業のプロフェッショナル、特に財務モデリングのフォーマットに一致します。これは財務モデルであり、これらは簡単に行える仕事ではありません。これらは6桁の給与のポジションです。
ニューヨークのジュニア投資銀行アナリストは年間9万ドルから17万8000ドルを稼ぎます。これらの財務モデルを作成するスキルセットを持つジュニアポジションで6桁の給与です。そして何だと思いますか。GPT-5.2は今やこれらのタスクの多くを実行できます。
しかし、それはさらに深くなります。なぜなら、プレゼンテーションが完全に成功したからです。GPT-5.2は単一のスクリーンショットに基づいて、あなたのためにプロフェッショナルなプレゼンテーションを作成できます。そして再び、それを説明するのではなく、私のチームがテストした実際の会話からお見せしましょう。
GPT-5.2、これはThinkingでした。これはProでさえありませんでした。Thinkingで、Extended Thinkingでした。これはExtendedで、19分間考えました。皆さん、Proでのジュースレベルがどれほど狂気じみているか想像できますか。GPT-5.2 Thinkingが19分間考えることができるなら、Extendedを持つProが何ができるか想像できるだけです。
とにかく、これはこの動画の準備のためのTLAのスクリーンショットでした。そしてプロンプトは非常にシンプルでした。このコンテキストに基づいてPowerPointプレゼンテーションを生成してください。19分間考え、その後これが結果です。
繰り返しますが、単一のプロンプトです。これらのスライドを一つずつ見ていきますので、これが堅実なプレゼンテーションだと思うかどうか判断してください。そして推論プロセスをお見せします。なぜなら、このプレゼンテーションの作成についてどのように考えたかは非常に興味深いからです。
言うまでもなく、このプレゼンテーションは堅実です。単一のプロンプトから作られたという事実は一種の狂気です。私たちはこれらのAIの改善に対して免疫ができていると思います。それらは印象的なのに。12ヶ月前に誰かにこれを見せたら、彼らはショックを受けるでしょう。24ヶ月前なら、AIモデルがこれをしたとあなたが嘘をついていると思うでしょう。しかし今、私たちは「ああ、そうだね、完全なプレゼンテーション、まあ」という感じです。人間がこれを行うのに複数時間の作業と研究が必要なのに、単一のプロンプト、それだけです。
進化の継続性の証明
ですから、何よりも、GPT-5.2は大規模言語モデルが壁にぶつかっていないことを証明しています。1年前にOpenAI o3がリリースされたとき、ARC AGI1で88%のスコアを記録し、タスクあたり推定4500ドルのコストでした。これがo3のAPIコストでした。
今日、ARC Prize Foundationは、GPT-5.2 Proをextra high推論努力で検証することができ、より高いスコアを達成しましたが、タスクあたりわずか11ドルです。つまり、より高いスコアで大幅に安価です。計算すると、これは1年、たった1年で390倍の効率改善です。同じスコア、実際には少し良いスコアを得るために、モデルは同じタスクで390倍安くなっています。これは狂気じみた進歩のペースであり、絶対に信じられません。
ARC AGIが何か知らない場合、これはAIベンチマークの中で最も有名なものの一つであり、通常は視覚的で推論、つまり流動的知性を必要とするさまざまなグリッドパズルでモデルをテストします。それは抽象的推論と一般化です。これは記憶ではありません。これはトレーニングデータにありません。モデルが実際にどれだけ賢いかをテストします。特に能力と効率をストレステストします。
そして、これらは通常、人間が比較的簡単に解決できるがAIが苦労するテストです。そして、このベンチマークでは減速していないことがわかります。数ヶ月前、私たちは50%未満のここにいました。その後Gemini 3を得ました。その後Claude 4.5 Opusを得ました。そして今、GPT-5.2 Proとextra high推論努力がARC AGIリーダーボードで最先端です。
これはARC AGI1ですが、ARC AGI2でも最先端です。ですから、これが世界最高のモデルの一つ、もしかしたら世界最高のモデルであることを理解していただけたと思います。
実践:アンチハッカーエージェントの構築
では、このモデルがコーディングでどれほど優れているか、そしてそれを使って何でも構築する方法をお見せしましょう。Cursor内でこれを使用して、できるだけ少ないプロンプトで、ゼロから動作するアンチハッカーエージェントを構築します。
OpenAIがこのリリースで終わったと思うなら、もう一度考え直してください。なぜなら、サム・アルトマン自身が「来週あなたのために小さなクリスマスプレゼントをいくつか用意しています」とツイートしたからです。つまり、いくつかのアップデートが近づいています。もっとChatGPT関連のもの、もっとOpenAIのアップデートがすぐそこにあります。
ですから、私が動画を作ったときに見逃さないようにしたい場合は、必ず登録してください。完全に無料で、2秒かかります。動画の下に行って登録をクリックしてください。それでは、構築に取りかかりましょう。
CursorとCodexの両方を使用してこのモデルをテストします。まず、空のフォルダを作成します。その後、それをCursor内で開きます。Codex、拡張機能とCLIの両方も使用します。Codexをインストールしていない場合、大きな秘密をお教えします。ChatGPTに聞くだけです。
「MacBookにCodex CLIをステップバイステップでインストールする方法を教えてください。ウェブを閲覧して短く答えてください」と伝えます。ステップバイステップと言ったこと、そしてオペレーティングシステムを指定したことに注目してください。すると手順が与えられます。それに従うだけです。
または、CursorやVS Codeを使用している場合、実際にCodex拡張機能は本当に良いと思います。拡張機能に行き、Codexと入力すると、公式OpenAIアカウントからのこれが表示されます。インストールすると、左側に表示されます。実際、デフォルトでは右側にあると思いますが、私は左に移動しました。どちらでもかまいません。
拡張機能では、モデルを選択できます。古いGPT-5.1があります。5.2を選択してください。そして推論努力。低、つまり非常に高速な思考があります。中、ほとんどのタスクで使用すべきです。高、そしてextra high。これは最近追加された新しいものです。
彼らが言うように、特にPlusプランを持っている場合、制限を非常に速く消費する可能性があります。明らかに、ここではProアカウントで実行しています。ですから、このアカウントのために月に200ドル払っています。皆さんに最新かつ最高のモデルをお見せできるように。現在、GPT-5.2 ProとExtended Thinkingは獣です。
これは単一のタスクで複数時間考えることができ、AIが与えることができる絶対最高の応答を提供できます。少なくとも2025年12月時点では。AIが改善する速度を考えると、来月までに何が起こるでしょうか。Claude 5、Grok 5、今後30日から60日のAIで多くのことが起こる可能性があります。
それがまさに、私がThe New Societyを作成した理由です。AIの最先端にいたい人々のための排他的なグループです。ですから、AIに真剣に取り組み、AIでのコーディングをマスターしたい場合は、必ず参加してください。動画の下にリンクされます。
では、GPT-5.2での構築を始めましょう。このビルドアイデアを準備しました。中程度の推論努力から始めます。そうでなければ、これは永遠に実行され、皆さんの時間を尊重したいからです。
これは私が旅行中しばらく自分自身に警告していたものです。これらのランダムなWi-Fiネットワークを信頼しません。空港で接続しなければならず、ホテルやAirbnb、カフェで接続しなければなりません。自分自身が実行していないWi-Fiネットワーク、または安全かどうか確信が持てないネットワークに接続するのは気分が悪いことがあります。
ですから、私たちが行うことは、ターミナルからpipexを介して実行できるAIエージェントを作成することです。たとえば、カスタムの作業効率追跡があります。これは私が毎日使用しているもので、Deep Work Blockベースの作業と時間の無駄を追跡するために実行するターミナルコマンドです。
MKVファイルをクリーンアップするためのものもあります。記録からMKV cleanupを実行するだけで、MKVファイルをすべて削除するのではなく、ゴミ箱に入れます。ですから、毎日私の時間を節約するこれらのターミナルコマンドがたくさんあります。
そしてこれらのもう一つがこのアンチハッカーエージェントになります。これはネットワークをスキャンし、すべてのデータを読み込みます。私はサイバーセキュリティの専門家ではありません。ですから、これはGPT-5.2が解決しなければならないことです。このネットワークに関するデータを取得するためにどのコマンドを実行すべきか、すべての接続デバイス、私からデータを読み取ろうとしているかどうか。
その後、それらすべての情報といくつかの他のコマンドをLLMに投げ込みます。ですから、Open Routerを通じてこのAIエージェントを動かすためにGPT-5.2を使用します。そうすることで、異なるモデルや異なるプロバイダーに簡単に切り替えることができ、推論努力を低くし、このネットワークがどれだけ安全かについての結論を私に与えます。
しかし、まず私がどこにいるかを尋ねることから始めます。空港にいると言えます。コーヒーショップにいます。モロッコに旅行したばかりで、このネットワークがここにあります。そうすることで、すべてのデータを適切に分析するためのコンテキストを使用します。
今それが始まっています。中程度でも時間をかけていることがわかります。まだ単一のファイルを作成していません。フォルダも作成していません。ですから、extra highでどれだけの時間を考えることに費やすか想像できます。
それが私が中程度に設定した理由です。なぜなら、Codexを知っているからです。これがCodexの良い部分と悪い部分の両方です。たとえば、Claude Codeを使用する場合、Claudeは明らかに素晴らしいです。私はClaude Codeを愛しています。多くの動画を作成しました。しかしClaude CodeはCodexよりも怠け者です。Gemini 3も同じです。
Gemini 3は怠け者です。たとえばDroidを使用し、Droid内でGemini 3を使用する場合、再び素晴らしいモデル、素晴らしいツールですが、Codexほど努力しません。Codexについては多くのことを言えます。怠け者ではありません。常にすべてのファイルを分析します。常に大量の推論を行い、詳細な答えを提供します。
中程度の推論努力でもです。しかし、これの問題は、時々物事が単純なとき、小さな変更、クイックなバグ、または何かを説明する必要があるときは、Claude Codeに尋ねるのが最適かもしれないということです。本当に何をいつ使用するかを知る必要があります。
しかし、深いバグ、Claude CodeやGemini 3で修正できなかった深刻な問題に直面している場合、extra high推論努力でCodexを使用することが方法となります。実際、OpenAIは推論を最大限に活用することで本当に料理をしています。なぜなら、AnthropicもGoogle DeepMindも、推論を高い程度まで活用することができないからです。
比較にならないほどです。Codexは10分、15分、20分、問題なく実行できます。Claude CodeやGemini 3からそれを見たことがありません。しかし、繰り返しますが、単純なことの場合、多くの場合Codexは考えすぎます。
ですから、それが現在のユースケースであり、繰り返しますが、ほとんどのことには本当に中程度が必要です。すでに1分以上話していますが、まだ実行中で、この推論努力は中程度です。
ですから、extra highは本当に最も深刻なバグや危険因子のようなもののためだけにあります。ほとんどのユースケースでは、中程度または高で十分以上です。特にChatGPT Proに支払っていない場合は。Extra highは制限を無駄にするだけです。
さて。Claude Codeが私たちが気にすべきすべてのことの答えを与えました。これらのうち、ターミナルコマンド/オープンソースライブラリで何ができますか?より深く考えて短く答えてください。
その後、Claude Codeを使用して、GPT-5.2が良い仕事をしているかどうかをダブルチェックします。Open Router APIキーも取得する必要があります。Open RouterキーをGPT-5.2テスト用に作成します。忘れた場合に備えて制限を設定します。皆さんが私のクレジットを盗まないように。冗談です。しかし、とにかく制限を設定します。
envファイルが必要ですか?それを作成してどこに置く必要がありますか。ここがAPIキーです。すべてのセキュリティルールを破っています、皆さん。これを繰り返さないでください。しかし、時間効率のために、APIキーをハードコードします。
明らかに、自分自身のプロジェクトでは、環境変数を使用し、envファイルを使用し、シークレットを使用し、APIキーを適切に保存し、誰とも共有しないでください。パスワードとして扱ってください。私は常に更新します。動画をアップロードする前に削除します。しかし、自由にテストしてください。もしかしたら忘れるかもしれません。もしかしたら運が良いかもしれません。
まず、現在のプロジェクトをチェックして、このWi-Fiペンテストシナリオで有用かどうかを確認します。簡潔なレポートを出力してください。ですから、Claude 4.5 OpusがGPT-5.2の仕事についてどう思うか見てみましょう。プロジェクトもテストする必要があります。
pipex install dotを実行し、Open Routerキーをエクスポートします。キーをハードコードできませんか?秘密が露出しているか、ホームディレクトリのローカル設定ファイルから読み込まれたサポートセキュリティストアを追加してください。悪いセキュリティ慣行なので拒否しています。とにかく、指示に従います。
実際、これは圧倒的すぎる応答の典型的な例だと思います。ですから、私がすることは、別のClaude Codeを開始します。ここに移動して、テキストと言います。貼り付けます。このテキストをより簡単で短い方法で説明してください。このpipexエージェントを実行できるようにしてください。MacBookで実際にどうやってテストしますか?短く答えてください。
比較にならないほどです。Claudeモデルは説明がはるかに優れています。はるかに話しやすいです。何ですか?net checkというコマンドラインツールがあります。
ですから、このディレクトリからpipex installを実行する必要があります。そして、私たちはすでにここにいます。ですから、それをインストールします。次に、Open Router APIキーをエクスポートする必要があります。ですから、それを行います。適切な方法で行います。
ですから、先ほど言ったことは忘れてください、皆さん。CodexがコードベースにAPIキーを入れることに満足していなかったので、適切なセキュリティ慣行を行います。文字通りそれを拒否しました。正直なところ、ユーザーが望むなら拒否すべきではないと思いますが、まあ、いいでしょう。
その後、net checkを実行しましょう。動作するか見てみましょう。今どこにいますか?ドバイのアパートです。これの一部をぼかす必要があるかもしれません。ですから、これは編集者へのメモです。うまくいけば私を特定しません。
5つの異なる質問をしましたが、基本的にこれはこのネットワークについての私からの重要な情報を得ています。今、それはすべての情報といくつかの他のコマンドをGPT-5.2に送信し、評決を見てみましょう。
ローカル評決、安全、リスク10中3。主な調査結果。これはおそらく私のIPアドレスです。ですから、削除する必要があるかもしれません。推奨アクション、HTTPSのみのサイトを優先してください。おそらく多くをぼかす必要があります。
しかし基本的に、これは私の分析を提供しました。Open Routerに送信したプロンプトを持っているファイルはどれですか?短く答えてください。アップデートを行う場合、どうやってこれを再インストールしますか?
システムプロンプトを更新して、レポートをより簡潔で明確にしてください。アンインストールしてから再インストールします。Codexに尋ねます。なぜなら、これは2つのオプションを与えており、初心者の場合、これらのオプションのどれが良いか分からないからです。
ですから、このpipex reinstallを使用します。クリア。グローバルターミナルから実行できますか?他のコマンドと同じように。毎回このフォルダ、このディレクトリから実行したくありません。
net checkと言います。そして動作します。ドバイ。プライベート。共有したくないので、すべてをぼかす必要はありません。ネットワークタイム。ホームです。仕事に使用します。問題ありません。
そして今、Open Routerに送信しています。実際、Open Routerに行くと、アクティビティで見ることができるはずです。ありました。これが私たちのスクリプトです。戻りましょう。ここでAPIキーを設定していません。グローバル環境でAPIキーが必要です。それは知っておくと良いことです。
ドバイ、プライベート、ホーム、仕事、問題なし。現在のコードベースがペンテストの観点から何をするか説明してください。ウルトラシンキング、短く答えてください。
このエージェントが行うことは、受動的偵察と状況認識です。ネットワークインターフェース、ARPテーブル、デフォルトゲートウェイ、Wi-Fi詳細、取得できる限りの情報を収集し、さらに私が伝えることを加えて、現在世界最高のモデルであるGPT-5.2に入れ、それについて推論し、評決を教えてくれます。
結論
これでGPT-5.2、OpenAIからの非常に予想外のリリースです。つまり、Gemini 3がリリースされて以来、彼らがリリースしたので、ある意味予想されていました。対応する必要があることは予想されていましたが、それがどれだけ優れているかは予想外であり、多くの人々がこのリリースを見逃すでしょう。
そして、あなたがこの動画を見たので、うまくいけばOpenAIがゲームに戻ってきたことを理解していただけたと思います。彼らは減速していませんし、Googleに対抗します。簡単に置き換えられることはありません。そして、このモデルは本当に、本当に良いです。
特にスプレッドシート、画像理解、コーディングで専門的な作業を行う場合、GPT-5.2、自分で試してください。それでは、皆さん、視聴ありがとうございました。素晴らしく生産的な週をお過ごしください。またお会いしましょう。


コメント