本動画は、OpenAIが新たに発表した次世代AIモデル「GPT-5.5」および「GPT-5.5 Pro」のリリースに関するライブ配信の模様を収録したものである。配信者はリリース直前のSNS上の匂わせ投稿やコミュニティの熱狂を追いかけながら、実際にモデルが公開された瞬間に立ち会う。その後、事前にアーリーアクセスを得ていた自身の経験に基づき、GPT-5.5の優れたコーディング能力、トークン効率の向上、推論力、そして競合モデルとの比較について詳細なレビューとベンチマークの解説を行う。視聴者からのプロンプトをリアルタイムでテストする様子や、開発者目線での実践的な評価も交え、AI業界の最新動向を網羅的に伝える内容となっている。

GPT-5.5リリースの予感と匂わせ投稿
はい、こんにちは。みんな聞こえますか?ちょっと、Tiboがツイートしましたよ。Tiboは何てツイートしたんでしょう?見てみましょう。よし、画面を共有しますね。あー、もう匂わせ投稿が始まってるんですか?そういうことですか?ええ、そうですね。おお、見てください。さあ、期待して待っててくださいね。オフィスのWi-Fiを再起動しているところです。間違いないですね。はい、一体何が起きているんでしょうか。Sam Altmanによると、今日実際に5.5をリリースするかもしれないんです。この敬礼の絵文字が何かを意味しているとしたら、そういうことになりますよね。数字を数えられるGPTを発表するつもりなんですよ。ええ、これは酔っ払ったSamでしたね。その通りです。酔っ払ったSam Altmanです。本当ですよ。だからうっかり漏らしちゃったんです。というわけで、酔っ払ったSam Altmanによれば、今日5.5か6が出るということですね。Brianが部屋を盛り上げてくれています。チャットも盛り上がってますね。Ray、調子はどうですか?
Ray Fernandoが来てくれました。もうAGIですかね?ええ、そうかもしれません。どうなるか見てみましょう。Ray、ちょっとの間配信に遊びに来られませんか?リンクを送りますよ。よし、他の匂わせ投稿も探してみましょう。OpenAIはこういうのが得意ですからね。ああ、ありました。NS41。これが何なのかは分かりませんが。ええ。Alex、これが何なのか言ってましたよね、でも私は知りません。よし、見てみましょう。Alex。さて、その間に他に何が起きているか見てみましょう。はい。OpenAIの従業員であるPeter Steinbergerが、私のお気に入りのセキュリティアドバイザリの再現手順を踏んでいます。うーん、ここには匂わせ投稿はありませんね。よし、Beth。もしSpudが本当に優れていたら、ここ数週間のCodexにとって大きな進歩を意味するかもしれません。Mythosか、あるいはAnthropicからリードを奪ったのかもしれませんね。A16ZがGlyphのシードラウンドを主導しました。Glyph、JonahはGlyphの大ファンだと思います。おお、見てください。Base 64。これは配信に載せないと。NS41のBase 64デコードが5.5になります。匂わせ投稿がどんどん面白くなってきました。
調子はどうですか、Ray?今お呼びしますね。ちょっと待ってください。いや、違いました。今やってます。こっちの操作を頑張ってるんです。これをやらないと。ええと、割り当て。まだこのシステムに慣れてなくて。はい、来ました。あ、私が消えちゃった。信じられない。待って、私はどこですか?
見えてますよ。
私が見えますか?配信の画面には私が映ってないんです。おかしいですね。
あ、本当ですか?本当に?あなたの言う通りだと思います。
私が画面を独占しちゃってますね。
ええ、あなたが乗っ取ってますよ。
ゲストのRayとの対話とAnthropicへの苦言
オーケー。はい、戻りました。真ん中に素敵なレンガがドンとあるだけですね。Ray、音声が二重になってます。よし、これで試してみましょう。どうですか?何か言ってください、Ray。
これで良くなったと思います。
私の方の問題だと思います。
すみません、私の方でした。Safariの音声が自分にフィードバックされてました。もう大丈夫です。
ええ。
はい、もう大丈夫だと思います。
よし。Ray、何が来るかについて話したいんですが、真ん中にあるこのおかしな黒い帯を消そうとしてるんです。どうしてこんなのがあるのか分かりません。すごく変ですね。
あ、多分私を画面から一度削除して、他の人を削除するか何かしてから、もう一度私を追加し直す必要があるんじゃないですか。
ああ、直りました。よし。
ええ。Ray、ecamを使うようにアドバイスしてくれてありがとうございます。すごくいいですね。まだ使い慣れてないですけど。間違いなく学習カーブがありますね。
まだエコーがかかってますか、皆さん?まだエコーが聞こえますか、特にRayの声に。Ray、何か少し話してみてください。
はい、エコーですね。オーケー。それは私の方の問題です。そっちをオフにしますね。これで良くなるはずです。
ヤオヤオヤオ。
私が解決できていないことがあって、これはAIとは全く関係ないんですが、Ray、もしかしたらあなたが助けてくれるかもしれません。デスクトップの音声をどうやってecamに取り込めばいいのか分からないんです。Blackhole 2chを使ってるんですが、それが二重の残響の原因になってるんです。残響はまだありますね。あ、サウンドレベルのところにインタビューゲストというのがあって、そこに音声が入ってくるのが見えると思います。はい。そして私がそこに入っていくのが見えるでしょう。だから、もし音声をそこに入力しているなら、おそらくそこから音声を取っているんだと思います。もしそこでインタビューゲストをミュートにして、メインの…
いや、それであなたがミュートになっちゃいました。
落ち着いて。オーケー。
面白いですね。
テスト、テスト、テスト。今は大丈夫です。オーケー。
あ、今は大丈夫ですね。よし。全て良好です。オーケー。素晴らしい。良かった。
多分、チャットが少し遅れているだけかもしれませんね。さて。ええと、どう思いますか?今、何を考えてますか?
彼らが「ChatGPTを臨床医にとってより良いものにする」という投稿をしたんですよ。
それは見てないですね。ちょっと見てみます。
ええ、ゲストチャットに送りますね。これが彼らがツイートの1つに載せていたリンクです。
それでみんな強気になっているんですね。オーケー。なんてことだ、まだこれに慣れようと必死です。オーケー、リンクを受け取りました。これが発表ですか?「ChatGPTを…」そうですね、でも公平に言うと、これは昨日のことです。昨日の夜に出たもので、もしSam Altman氏を見れば、彼が今日リリースされることをほぼ確定させたようなものです。
それからTrevorが実際にポテトの画像を。見ましたか?
なんてことだ。バーン!嘘でしょ。勘弁してよ。よし。皆さん、音声の件は申し訳ありません。どうしてなのか分かりません。二重になり続けてます。Blackholeのミュートボタンが勝手に外れちゃうんです。今は直っているといいんですが。AIを使ってエコーを直せって?ecamのこの問題を解決できるほど優れたAIはありませんよ。
ええ、リリースされるのは避けられないように思えますよね?それに、今Twitterの右側にあるみんなのライブ配信を見てください。全部GPT-5.5関連ですよ。Alexからも5.5についての言及があります。Ryan Carsonは何も言ってませんが、「クレイジーな日だ」と。Yamは5.5。Weights and Biasesは何もなし。ええ、だからただ待つしかないですね。単なるWi-Fiの問題じゃないことを祈ります。オフィスのルーターを再起動しなきゃいけないんだと思いますよ。ええ、ありました。NS。うんうんうん。Import B。うん。Output 5.5。さあ来い。
何もなし。
まだ何もないですね。
でも、この匂わせ投稿は大好きですよ。すごくいいですね。よし、その間Twitterを眺めて何が起きてるか見てみましょう。
Opus 4.7を超えると思いますか?もし大胆な予想をするとしたら。今、Opus 4.7について多くの人が不満を言っていますからね。
ええ、多くの人が言ってますね。私はまだファンですよ。特にファストモードをオンにした時は、やっぱり4.6が一番好きです。使っていて本当に楽しいですし、プロジェクトをGPTができることの5倍のスピードで反復して進められるというのは、かなり意味のあることです。だから、もしGPTがOpus 4.6の2倍の割合で正解を出したとしても、実際はそんなことないんですが、もしかしたら難しいバグやバックエンドでは少し多めに正解を出すかもしれませんが、4.6がはるかに速いという事実のおかげで、とにかく反復してバグをずっと早く修正できるんです。私はまだスピード至上主義者の少数派にいるような気がします。どう思いますか、Ray?
私はスピードが好きですよ。それに、一度かなり速く構築し始めると、反復サイクルが本当にクレイジーなことになって、そこがOpus 4.6のファストモードの一番好きなところでもあります。中毒性がありますよね。特に税金関係のデータ分析みたいなことをするのは本当に楽しいです。
でも、ちょっと話はそれますが、OpenClawについて考えているんです。彼らがツールの呼び出しを機能させて、より良く振る舞うようにするために、OpenClaw用におそらくどれくらいファインチューニングできたのかなって。あなたもOpenClawのヘビーユーザーですからね。
ええ、そうです。もし彼らがすぐに新しいモデルをリリースするとしたら、性格づけの部分にもっと時間を費やしているんじゃないかと推測しています。なぜならそれが大きな問題だったからです。Opusから離れてGPTに乗り換えなければならなかった時、人々はまるで魂が完全に失われたように感じました。OpenClawの魂が消え去ってしまったんです。4.6の性格はとにかく最高でしたから。だから、そこに時間をかけてくれていることを願っています。5.4はツール呼び出しが優れているはずですし、Codexの中で使うと本当に良かったです。だからそこで問題を感じたことはあまりありませんでしたが、性格と特定のOpenClawハーネスに関しては、あまりうまく機能しませんでしたね。
当然期待しますよね。彼らはPeterを買収したわけですから。彼はおそらく社内でかなり声を上げているでしょう。それに、Anthropicについての昨日の私の動画を見たか分かりませんが、AnthropicはOpenClawの件で失敗していて、基本的にAnthropicのサブスクリプションでOpenClawを使うのをほぼ不可能にしています。だから当然、超負けず嫌いのSam Altmanのことですから、それを見て「おっと、今すぐあの市場の好意を掴みに行こう」と思っているはずです。だから、彼らがそうしない理由がないですよね?
同感です。Jensen Huangがステージに立って「皆さんのOpenClaw戦略は何ですか?」と問いかけて以来、人々は実際に自分のビジネスにこの種のものを導入しようと奔走していますし、PerplexityがPerplexityコンピューターを出してきたり、みんながこの種のものを採用しようとしていることを認識しています。だからAnthropicのやり方は少し逆行しているように見えます。Anthropicは自分たちのターゲットを非常に小さく偏った人々に絞りたいのでしょうか?とても不明確です。Cursorのメーカーでさえ、自分たちのIDEにOpenClawのようなものをいくつか統合していますからね。なんだか少し奇妙に思えます。
それに、トークンの観点から非効率だというのも納得できません。BorisがOpenClawリポジトリで環境を改善するためのキャッシングの貢献をしているのを見ましたから。だから、社内にはある方向に考える非常に技術的な人々がいて、大きな溝があるんじゃないかと思います。特定のリーダーシップ層は別の考え方をしているかもしれず、優先順位の焦点がおかしくなっていて、厳しい状況なのだと思います。まだまだスタートアップの世界であり、結局のところ皆GPUを奪い合っている状況なので、彼らの現在のGPUへのアクセス状況が気になります。OpenAIは実際にGPUへの最高のアクセスを持っていて、サービスを提供できているのでしょうか?
彼らの方がGPUへのアクセスはずっと良いですよ。それが昨日の私の動画の前提でした。Anthropicは彼ら自身の需要の重圧に苦しんでいます。需要が多すぎるんです。彼らは何をしたいのかについて、難しく、時には矛盾する決断を下さなければならなくなっています。ほんの数ヶ月前のDario Amodeiのインタビューを振り返ってみると、彼は「AIの需要が我々が考えるほどの速度で加速しない可能性に備えて、資本的支出やインフラに全財産を賭けたくはない」と言っていました。「加速するとは思うが、もしそうならなかった場合、資本的支出に投資しすぎると会社が破産するかもしれない」と。そして、それが大きな計算違いで、彼らは今その代償を払っているのだと思います。AIの需要は誰もが思っていたよりも早く加速しています。
そしてその結果、彼らは今顧客を失っています。OpenClawを使っている人たちは、小さくても声の大きいマイノリティだと知っていますが、彼らはGPTに移行しています。そしてClaude Codeを使ってクォータ制限でひどい目に遭っている人たちもGPTに移行しています。なぜなら、GPTのCodexクォータは見たところ1日おきにリセットされているからです。
それは素晴らしいですね。最高です。本当によく機能しますし。もっと頻繁に使い始めると、「オーケー、これなら慣れるな」と思うようになります。そしてしばらくすると離れられなくなり、少しずつうまく話しかける方法を学んでいくんです。そうすると、Opusのちょっとした出力の粗が見え始めて、「ああ、もしかしたらこの出力は私が思っていたほど良くなかったのかも」と気づくんです。本当に興味深いです。
その点に関して、CursorとSpaceXの件ですが、あなたの考えも気になります。GPUへのアクセスという意味で興味深いですよね。Cursorの人たちは「Colossusが欲しい。Colossusをくれ」と言っていたと思いますから。
CursorとSpaceXの提携について
そうですね、ええと…彼らはこのCursorの件ではそれについて言及していませんね。ええ、いろいろと思うところはあります。ええと、言及してなかったかな?あ、ありました。「我々はCursorを改善するためにSpaceXと提携しています。」
これは本当に理にかなっています。基本的にElon Muskと彼の会社は10万個のGPUを持つ信じられないようなデータセンターを構築しました。今や100万個のGPUに向けて順調に進んでいます。彼らはすでにそれを構築し、支払いを済ませています。しかし、それを使うのに必要な需要を生み出すほどの能力を持つモデルを実際には構築できなかったことが判明しました。だから、彼らには未使用のGPUキャパシティがたくさんあるんです。
一方でCursorがあります。彼らは独自のフロンティアモデルを作っているわけではありません。作り方はおそらく知っているでしょうし、歴史上最も価値のあるデータセットの1つに座っていることは間違いありません。だから、お互いを見つめ合ってこう言ったんでしょう。「君たちには素晴らしいブランドがある。Cursorというブランドと、信じられないようなデータがある。Composer 1.5と2を構築して、それらは良いモデルだ。フロンティアモデルではないが、よく働く良いモデルだ。作り方を知っているのは明らかだし、両チームの専門知識を合わせればやり方はわかる。データもある。でも計算資源がない。だから力を合わせよう」と。これは非常に理にかなっていると思います。
唯一奇妙なのは、年末に向けて600億ドルで会社を買収するオプションの部分です。もし買収しなければ100億ドルを支払わなければならない。Cursorにとってはウィンウィンでしかないように思えますが、少し奇妙に感じました。なぜ今すぐ買収しないんでしょう?何を待っているんですか?
私はElon Muskのアプローチが好きですよ。あ、スーパーチャットありがとうございます。市場に対して「おい、婚約指輪を渡したぞ」と言っているようなものだと思います。指輪をはめたようなものです。彼女は指輪をつけて歩いていますが、まだ他の選択肢もあるという状態です。でも大体は決まりですね。
ええ。そしてSpaceX側の取り組みを率いるためにCursorから移籍したAndrewたちですが、彼らはプロダクト人間で、自分が何をしているか分かっています。彼らは素晴らしいです。両陣営にいる全員が信じられないほど優秀です。そして文化ですね。Cursorのオフィスに何度も足を運んだことがありますが、人々は24時間体制で休むことなく働いています。誰かが強制しているわけではありません。純粋な情熱と意欲なんです。Elon Muskのチームで働いている人々にも同じものが見られます。Elon Muskは間違いなく、細部に至るまで本当に徹底的に突き詰めています。Xのオフィスなどでもそうです。こういった人々はこれに全力を注いでいて、良い相乗効果が生まれています。100億ドルを支払うにしても、そこから得られる知的財産、特にそれが複利で増えていく可能性があることを考えれば、彼はその投資から簡単に10倍のリターンを見込んでいるはずです。
私が気になっているのは、ええ、私たちは2人ともCursorをよく知っていますね、Ray。Cursorのオフィスで少し一緒に過ごす機会もありましたし。彼らのチームは小さいんです。相対的に言えば、まだ非常に小さなチームです。彼らが何人くらいいるか知っていますか?数百人くらいですよね。
ええ、公開されている数字は分かりませんが、初期の頃、数年前のAI業界は14年前のような感覚ですが、当時はたった10人の男たちで、現在エージェントと呼ばれているもの(当時はComposerでした)に取り組んでいたのはたった2人でした。座り込んで彼らがすべての作業をこなし、すべてを書き直したんだと思います。だから、こういう小さなアクハイヤ(人材獲得目的の買収)なんかは今でも小さなチームなんです。そこではまだ1〜2人のチームが多くの作業をこなしていて、オフィスを歩き回って全員に話しかければ、アプリ全体について1日で把握できるくらいですよ。
すごいですね。
ええ。本当に良いチームですし、OpenAIからCursorに移ったEdwinのことも2人とも知っていますね。あそこには優秀な人材が揃っていて、私たちクリエイターを大切に扱ってくれます。それに、たまたま驚くべき製品を持っているわけですから、悪いことなんてありません。
ええ。もう一つ驚いたのは、私が時に彼らを厳しく批判したことがあっても、彼らは私のフィードバックを非常に真剣に受け止めてくれることです。それは新鮮でした。そういうことをしたがる会社は多くありません。時には突き放されたりすることもありますから。だから、私たちのために時間を割いてくれる会社はいつも好きです。
これはOpenAIに関しても興味深い点ですね。彼らは常に公の批判に対して非常にオープンで、真剣に受け止め、製品を改善し続けたいと考えています。それは常に本当に新鮮なことです。一部のクリエイターは、Anthropic側には同じような感情が向けられていないことにも気づいています。Anthropicには多くの矢が向けられていて、たくさんの人がいろいろなことを言っているので、難しい部分もあります。私も反対の立場にいたことがあるので分かりますが、多くの批判がある時、それが批判なのか、特定の製品についてのものなのか、実際に製品を改善しようとしているのかを見極めるのは、すべてのノイズを分類しなければならず本当に大変です。でも、文化的な観点から言うと、オンラインで、特にXにいることがすべてのバズが起きている場所なんだと思います。
ええ。それにClaudeやAnthropicは自分たちを高い台座に置いているように見えます。聞いてください、私は超ポジティブでいたいんです。楽観的でいたいんです。企業について否定的なことは言いたくないんですが、Anthropicがそれを難しくさせているんです。そしてそれはすべて修正可能なことなんです。
ええ、もちろん修正可能ですが、それが彼らの助けにもなっているんです。彼らはみんなに対して「お前たちなんて必要ない」というような態度をとります。それから、何か適当な機能のローンチについてツイートを投稿すると、1時間で400万回も見られるんです。だから、彼らは何かを、何かを本当にうまくやっているんですが、必ずしも気分が良いわけではありません。私は必要とされたいんですよ、Ray。
ええ、結局のところ私もあなたと同じです。その上で、本当に良いモデルがあって、アクセスしやすく、実際に使って仕事をこなせるようにしてほしいんです。そして、それを一貫して提供できる人が、最終的に私のお金を勝ち取るんだと思います。だから私のお金もそっちに向かっています。
チャットに次々と流れてくる、「誰が最初に瞬きするか様子を見ているのかも」みたいな投稿が大好きです。OpenAIがモデルを出す前に、Googleがうっかりモデルを投下するのか?Anthropicが何か出そうとするのか?たくさんの投稿があり、たくさんの注目が集まっています。私たちがこうして話していること自体が、このSpudモデル、potato.comモデルへの期待を煽っているようなものですよね。さあ来い。
よし。最後に何か一言ありますか、Ray?皆さんはどこであなたをチェックすればいいですか?
ええと、Xの@RayFernando1337でチェックできます。YouTubeでも同じハンドルネームを使っています。AIのライブ配信をやったり、いろいろなことをカバーしていく予定です。あなたのお気に入りのライブ配信者ですよ。毎週火曜日と木曜日にライブでこういったものをチェックしています。ぜひチェックしてください。そしてMatt、番組に呼んでくれて本当にありがとう。あなたがやっている仕事や、「Forward Future」のムーブメント全体をサポートしてくれている皆さんに感謝しています。AIスペースであなたたちがやっていることすべてに興奮しています。
ありがとう、Ray。それから、いろんな会社のオフィスから配信してくれるの、本当に楽しんで見ていますよ。それだけ伝えたかったんです。本当にいいですね。
素晴らしい。ええ、ありがとう。最高です。
よし。じゃあまた後で。またね。
GPT-5.5の公式リリースと機能概要
さて。それでは、何か起きているか見てみましょう。TheoがいつものようにAnthropicをチクリと刺しています。友人のOpen Euchen Jinの投稿。「OpenAIはSpudをローンチする計画だったが、Wi-Fiが壊れた。だからオンコールのエンジニアであるClaudeに直してくれと頼んでいるところだ。」
見てみましょう。ええ、Theoは手厳しいですね。本当です。Lord Khakiが「友よ、今日はSpudは出ないぞ」と言っています。どうなるか見てみましょう。
ただ更新を繰り返しています。どこに投稿されるんでしょう?ChatGPT。おお、チャットに来てますね。ここにありますか?おお、見てみましょう。「GPT-5.5を発表」見てみましょう。来ましたよ。さあ、行きましょう。手に入れました。よし。GPT-5.5が登場しました。私も投稿します。実はこれのアーリーアクセスをもらっていたことを明かさないといけません。良いモデルですよ。これについて全て話します。やっと話せます。ごめんなさいね。この30分間ずっと演技してたようなものですが、興奮しています。ちょっと待ってください。Xにすぐに投稿します。バーン。今レビューを投稿しました。これは短いレビューです。これから深く掘り下げていきますからね。ごめんなさい、ごめんなさい、分かってます。皆さんの何人かは知っていたでしょうね。私も知ってました。
だって、モデルが来ることはみんな分かってましたよね。みんな確認してましたし、Elon Musk、いや違った、Sam Altmanも確認してました。さあ、行きましょう。ちなみに私、ポーカーフェイスが全くできないんですよ。だからポーカーでいつも負けるんです。秘密を守れないから。
ええと、これはいい質問ですね。「最近Anthropicを嫌っていたのはこのためですか?」いいえ。彼らは純粋に私をひどく苛立たせていただけです。
よし。早速本題に入りましょうか、皆さん。実は2週間使ってたんです。素晴らしいモデルですよ。最高のモデルです。5.4よりも上手くこなします。5.4が弱かった部分を大幅に改善しています。Codexに入るはずです。2つの形で出ます。Codexと…Proはヤバいですよ。
ちょっとこちらに切り替えて見てみましょう。ええと、ちょっと待ってくださいね。録画を始めようと思います。これをやりながら動画も録画します。
騙されましたね。さあ、行きましょう。よし。あ、これじゃない。これについては話したくない。GPT-5.5が登場しました。彼らの新しいフロンティアモデルです。CodexとChatGPT Proに搭載されます。そして、はい、信じられないほど素晴らしいモデルです。よし、一緒にレビューしてみましょう。
「GPT-5.5をリリースします。これまでで最もスマートで、最も直感的に使えるモデルであり、コンピュータで仕事をこなす新しい方法への次のステップです。」
私はこれを2週間使ってきました。自分のコードベースや、新しいコードベースで徹底的にテストしました。ChatGPT Proでも使いましたが、非常に、非常に良いモデルです。GPT-5.4が抱えていた問題の多くを修正しています。具体的には、より良い性格を持っています。これは、OpenClawでGPT-5.4を使うのがどれほど難しくて魂がないように感じられたかという声に対する反応だと思います。これは注目すべき点ですね。
よし、他に何があるか見てみましょう。この辺りの多くはマーケティングの宣伝文句みたいなものです。もちろん全部本当なんですが、どのブログ記事でも言っているようなことです。
本当に重要なのはここです。「この進歩は、エージェントによるコーディング、コンピュータの使用、ナレッジワーク、そして初期の科学研究において特に顕著です。」
ここが明らかに重要なんです。ここにお金があるんです。Anthropicは、エンタープライズコーディングに極端にフォーカスすることで、年間ランレート300億ドルまで倍々ゲームで信じられないほど急速に収益を伸ばせることを私たちに示しました。OpenAIはそのメッセージを受け取ったんです。彼らは今、コーディングにフォーカスしていて、これがその結果です。彼らはエージェントによるコーディングにどんどん優れていくモデルを出し始めています。なぜなら、フライホイール効果が信じられないほど強力だからです。コーディングモデルを作り、エンタープライズに販売して大金を稼ぐ。そして、その素晴らしいコーディングデータを全て収集し、モデルを改善し、そのモデルを使って次のモデルを訓練する。これが人工知能の自己改善のフライホイールなんです。
オーケー。「GPT-5.5は、スピードを犠牲にすることなく、この知能のステップアップを実現しています。より大規模で高性能なモデルは、提供に時間がかかることがよくあります。しかし、GPT-5.5はGPT-5.4のトークンレイテンシや実際のサービス提供速度に匹敵しつつ、はるかに高いレベルの知能で機能します。」
これは彼らが多くの時間を費やしたと知っている部分で、私もいくつか気づいたことがあります。まず、はるかに少ないトークンでGPT-5.4と同じレベルの知能が得られます。全体的によりトークン効率が良いんです。もちろん、より高価なモデルであるという事実と相殺されますが、全体でバランスを見ると支払う金額は少なくなる、これが鍵です。そして、GPT-5.5モデルから得られる総合的な知能の上限も高くなっています。だから、トークンあたりの効率が非常に良く、トークンあたりのコストは高くなっていますが、同様に効率も上がっているんです。
よし、他を見てみましょう。「また、同じCodexのタスクを完了するのに使用するトークンも大幅に少なくなり、より有能であると同時により効率的になっています。」
はい、これには気づきました。使用している思考トークンの量だけでなく、事柄の論理的な説明の仕方にもはっきりと現れていました。コーディングをしている時、特にバイブコーディングをしている時、自分がしたちょっとした変更やモデルがした変更を説明するのに長いエッセイを出されるとイライラするんです。そんなのいらない、長すぎる。だからいつも「おい、それを簡単に説明してくれ、短く説明してくれ」と言わなければなりませんでした。そう言えば必ずやってくれますが、今はもうそんなこと言わなくていいんです。非常に簡潔に説明してくれます。
そしてこれは、先ほど言及した性格の改善の一部でもあります。もしGPT-5.4が非常に堅苦しく、フォーマルなエッセイで何かを説明してくるとしたら、5.5は「ほら、君に必要なものを正確に教えるよ」という感じです。これは、5.5から受け取るメッセージの性格やトーンにおける改善なんです。
ちなみに、文書でのレビューも出しました。プロフィールにピン留めしておきます。Xを使っているなら、私の書いたレビューが出ているので、読みたければチェックしてみてください。ええ、チームで2週間使ってきましたが、とても楽しかったです。
それから、Twitchでの配信も始めました。これは全く新しい試みです。よければTwitchでもフォローしてください。そしてDiscordも再開しました。以前は6000人くらいのアクティブな人がいたんですが、管理しきれなくなってしまって。今はチームにBrianがいて、彼曰く自分はDiscordの専門家すぎるそうなので、再開しました。Discordもチェックしてみてください。リンクを貼りますね。ありがとう、Brian。リンクを貼ってくれてありがとう。Discordに参加してくださいね。私はそこでアクティブに活動する予定です。いつ配信を始めるか共有したり、動画を投稿した時に共有したり、より緊密なコミュニティを作ろうとしています。それが今年残りの主要な目標の1つです。だからぜひ参加してくださいね。
ベンチマークと性能評価
よし、これに戻りましょう。「私たちは5.5を、有益な仕事へのアクセスを維持しつつ、悪用を減らすように設計された、これまでで最も強力なセーフガードのセットとともにリリースします。」オーケー。「5.5は、ChatGPTおよびCodexのPlus、Pro、Business、Enterpriseユーザーにロールアウトされます。」そして「GPT-5.5 Proは、ChatGPTのPro、Business、Enterpriseユーザーにロールアウトされます。」
5.5 Proはちょっとヤバいですよ。ちなみに、後でこの配信の中でテストをします。テストしたいことをチャットに書き込んでください。オーケー。私は頭が悪いので、5.5 Proが何か信じられないようなことをしていると本当に分かるくらい難しく、かつ、正しく答えていると分かるくらい検証可能でシンプル、あるいは少なくとも説明可能なテストを思いつけないんです。だから、もし良いプロンプトがあれば、後でテストしてみましょう。
「使えよ、おしゃべりはやめて」Guru factsさん。はいはい、これからやるところです。これからやりますよ。ベンチマークを見てみましょう。ベンチマークを見るのは好きなんです。GPT-5.5、5.4があります。ここに5.5 Proと5.4 Proの比較があります。ここが重要なところです。ついに、彼らは競合モデルもリストアップしました。Claude Opus 4.7とGPT-3.1 Proがあります。本当に重要なのはClaude Opus 4.7だけです。
ではTerminal Bench。これは使い勝手の指標です。この違いを見てください。5.4から5.5への7ポイントのジャンプがあります。ええ、Alexが今思い出させてくれましたが、もし素晴らしいプロンプトをくれて、それをこの動画で使ってテストすることになったら、YouTubeの動画に載るかもしれませんし、シャウトアウト(紹介)しますよ。だからプロンプトを書き込んでください。AlexとBrian、もしお気に入りやスターをつけられたら、追跡できるようにどこかに記録しておいてくれると助かります。
急に喉が渇いてきました。後で水を取りに行かないといけないかも。オーケー、続けましょう。これは5.4からの大きな飛躍で、Terminal BenchでClaude Opus 4.7を完全に圧倒しています。これは、モデルがターミナルに入ってCLI(コマンドラインインターフェース)を操作する能力です。これはエージェントとしての使用において本当に重要です。ツールの呼び出しにおいても本当に重要です。
Expert SUI internalというのがあります。Expert SUIが何なのか実は知りませんが、明らかにおそらく内部ベンチマークでしょう。68に対して73です。他の競合モデルのデータはありませんが、いいでしょう。
GDP Val。これはOpenAIのチームが作成したベンチマークです。これは実際の使用、モデルにとって実際に価値のあるナレッジワークでの使用をテストしています。少し良くなっていますね。GPT-5.4から1.9%の向上です。ここでの5.5 Proは、面白いことに実は下がっています。ここにClaude 4.7があります。Claude Opus 4.7は80.3です。
オーケー。OS World Verified。これはモデルがコンピュータやブラウザを制御する能力です。基本的にはモデルに環境を与えて、コンピュータを操作させます。見ての通り、向上していますね。大きな向上ではありませんが、3.7%でClaude Opus 4.7と同等です。
正直に言うと、私はブラウザ制御やコンピュータ制御をあまり使いません。ただただ苦痛なほど遅いと感じるし、今の私には必要のないユースケースなんです。もしCLIを通して制御できるものなら、そうすべきです。自分のエージェントにポイント&クリックなんてさせたくありません。遅いしエラーが起きやすいです。だから、全てのものにCLIがあるべきです。全てのものにAPIがあるべきです。それが進むべき道です。それがエージェントから最大限の力を引き出す方法です。私が求めているのはそれです。速いですしね。オーケー?だから何かを作るなら、そうしてください。作ってください。
Browse Comp。もう一つのブラウザ制御です。ええと、5.5 Proを見てみると。これって、Browse Compですよね?Browse Compはコンピュータ制御でしたっけ?これを確認するためにClaudeを使っているのが面白いですね。ウェブブラウジング。すみません、ブラウザ制御じゃなかったです。オーケー、もう一度言います。Browse Compというウェブブラウジングのベンチマークがあります。GPT-5.5は84.4を記録しています。GPT-5.5 Proは、研究や非常に難しい問題のために特別に構築されたハーネス内のモデルなので、特にこのウェブブラウジングのベンチマークで非常に優れているのは納得がいきます。
「Mad Dog、私のCloud Skillsプラグインを全てCodexに移行する方法を教えてください。」ええと、オーケー。僅差の2位がGPT-5.4 Pro。ここでは大きな向上はありません。Claude Opus 4.7はずっと下の80%、79%です。
Frontier Mathがあります。見てみましょう。5.5、特に5.5 Proで1位のスコアを獲得しました。Frontier Math Tier 2も同じです。ええ、見ての通り、Proは難しい問題用で、CodexのGPT-5.5はコーディング用です。そう考えるべきです。しかしここで見ているのは、Claude Opus 4.7と比較してはるかに優れているということです。
ここにArtificial Analysis Intelligence Indexがあります。これは複数の異なるベンチマークをインデックス化して表示したものです。ここで見ているのは2つのことです。Y軸に実際のスコアがあり、X軸に出力トークンがあります。ここで探すべきなのは、より高く、より左にあるものです。出力トークンに関しては小さい方が良いです。それが意味するのは、トークンあたりの効率が上がっているということです。トークンあたりの知能が上がっているんです。だから5.5はより高く、より左にあります。それが私たちがここで求めているものです。オーケー。
CJ the creativeさん。「うわ、配信してるの知らなかった。」配信に参加してくれましたね。MinimaはCodexにもWebチャットにもありません。どこにあるんでしょう?数分前に出たばかりです。もし見えなくても、すぐに見えるようになりますよ。ただし、ChatGPTのPlus、Pro、またはEnterpriseのアカウントが必要です。まだ見えなくても、少し待っていれば表示されます。オーケー。ここでも同じです。
彼らが行った大きなこと、そして私が気づいたことは、トークン効率が非常に良いということです。だから、先ほど言及したように、後で価格をお見せしますがより高価になっている一方で、トークン効率も高く、その価格の上昇を相殺するのに十分なほどトークン効率が良いんです。よし、これがここに見えているものです。より高い知能が見られます。水色の線が5.5です。濃い青の線が5.4です。この1つを除いて、ほぼ全体的に高い知能を示しています。しかし、はるかに安価です。このスコアを見てみましょう。これはTerminal Benchの彼らのスコアの1つです。おそらくこれが最も労力が少ないものだと思います。GPT-5.4では、基本的に4950の出力トークンで34.2を獲得しました。こちらでは、2165の出力トークンで39.1を獲得しています。大幅に効率が良く、トークンあたりの知能が大幅に高いです。彼らが今これにフォーカスしているのは素晴らしいですね。
ええ、Andre。Andrea、Andreaさん、間違って発音してたらごめんなさい。全員にロールアウトされるには大抵時間がかかります。ええ、スイッチを切り替えるようなものじゃありません。時間がかかります。すぐ手に入りますよ。オーケー。ここでも同じです。Expert Suite。ここではるかにトークン効率が良いことが分かり、さらに高い知能インデックスも得られます。
デモの確認と視覚的推論能力
よし、見てみましょう。実際にいくつかテストをしました。彼らが用意したデモを見てみましょう。これは「NASA JPL Horizonsのベクトルを使用して軌道を描画する。プロンプトに画像を添付。WebGLとVite(Viteと言うべきか、とりあえずViteと呼んでおきます)を使用して、Artemis 2ミッションの実際のデータを使った新しいアプリとしてこれを実装してください。完全に機能するまでアプリを徹底的にテストし…」オーケー、ここに戻りたいです。「完全に機能し、写真のアプリのように見えるまで。惑星のレンダリングとフライバイに細心の注意を払ってください。」
ちょっとここで止まりたいんですが。「完全に機能するまでアプリを徹底的にテストしてください。」なぜこれがそんなに重要なのでしょうか?彼らが5.5で大きく改善したことの1つは、ええと、さっきはどう言いましたっけ?ええと、Jonah。ええと、視覚検査です。そう。明らかに大きく改善されたことの1つは、視覚検査です。Codexでプロンプトを与えて何かを作らせると、それが正しくなるまで継続してそれを見続けます。後でいくつか例をお見せしますが、他のどのモデルよりもそれを上手くこなし、実際にページ上にあるものを見て、ページ上のものを継続して改善していくという反復作業を、Claude Opus 4.7を含む他のどのモデルよりも上手く行います。
それ自体が非常に印象的で、単にエージェントやCodex内のGPT-5.5がはるかに自律的に行動できるようになっています。私が「あ、そのボタンは本当は場所が違うよ」と言わなくても、プロジェクトをはるかに自律的に完了できるんです。勝手にやってくれます。ええ、皆さんありがとうございます。プロンプトをどんどん投げてください。
あ、ええと。Dave Wilsonさん、スーパーチャットありがとうございます。こんにちは皆さん。「私のお気に入りのテストは、いつもWhitespace言語でHello Worldを書かせることです。もし失敗したら、トークンを狂ったように消費することだけ覚えておいてください。」Whitespace言語が何なのか分かりません。調べてみないと。だからプロンプトをどんどん投げてください。GPT-5.5でテストしてほしいことがあれば書き込んでください。もしそれを使って動画に含めることになれば、動画内で言及されるかもしれません。
オーケー、これは。ええ、とてもクールですね。良さそうです。とても完成度が高く見えます。地震トラッカー。オーケー。少しシンプルなウェブサイトですね。私は、正直に言うと、これにはあまり感銘を受けていません。フロントエンドのデザインについて、少なくとも5.5を改善するために彼らが行ったもう一つのことは、ピル(角丸ボタン)を多用しないこと、ボックスを多用しないことだと思います。ここでは少し改善したことが明らかですが、見てください。ポートフォリオのウェブサイトやチャートのウェブサイトを作れること。これはもう全部やられてきたことです。だから、このダンジョンゲーム(の前のデモ)にはあまり感銘を受けません。
一方で、これは本当に印象的です。これを見るとダンジョンキーパーを思い出します。皆さん、昔のあのゲーム覚えてますか?私のお気に入りのゲームの1つでした。名前を正しく言えているといいんですが。正しく記憶しているといいんですが。ダンジョンキーパーですよね?チャットの皆さん、分かりますか?あの小さなインプたちを叩き回すやつです。
「Kevin must play。GPT-5.5のベストなユースケースは何ですか?」スーパーチャットありがとうございます。状況によりますね。2つの選択肢があります。Codexで使うなら、驚異的なコーダーです。ChatGPT Proで使うなら、ハードコアな研究、最先端の数学、最先端の科学、ええ、暗号技術みたいなものですね。正しいか間違っているかを私が検証するのが非常に難しいようなものです。
よし、このゲーム。オーケー、このゲームは非常に印象的に見えます。フル3Dのハックアンドスラッシュゲームで、とてもよく動いているようです。実際の騎士のアニメーションもかなり良いですね。でも何より、実際に機能しています。ビジュアルも本当に良く見えます。照明も本当に良く見えて、影も確認できます。ロジックも、実際のロジックがあります。この小さなインプたち、ゴブリンたちを攻撃すると、実際にライフがあって、攻撃するにつれてライフが減っていきます。ええ、とてもクールですね。
よし、最後のものを見てみましょう。3Dゲーム、タンクダウン。こういうのは見たことがあります。実際に前より印象的かどうか見てみましょう。ええ、まあまあですね。こういうのは見たことがあります。あまり感銘は受けません。
アーリーテスターの評価とナレッジワーク
よし、続けましょう。よし。ベンチマークを超えて。アーリーテスターたち、つまり私や他の多くの人たちですね。「GPT-5.5は、システムの形状、なぜ何かが失敗しているのか、修正をどこに着地させる必要があるのか、そしてコードベースの他の何が影響を受けるのかを理解するより強い能力を示している」と言っています。
これは実際に私が彼らに特に伝えたことです。私が彼らに特に伝えたフィードバックの1つです。GPT-5.5について私が気づいたのは、角の先まで見通すような直感があるということです。私はプロダクション(本番)のウェブサイトで抱えていた問題を伝えました。プロダクションのデータベースへのアクセス権を与えなかったので、ログやエラー、実際の本番データを見ることはできなかったのですが、問題が何であるかをおおまかに説明しただけで、修正方法を理解していました。Claude Opus 4.6や4.7にはそれができませんでした。とても印象的でした。だから、アプリが本番環境でどのように動作すべきかについて、他のモデルでは見たことのないような直感を持っているんです。本当に印象的でした。
よし、Dan Shipperさんがいます。「明確な概念的明晰さを持つ初めてのコーディングモデルだ。」うん。
「モデルをテストしたシニアエンジニアたちは、推論と自律性においてGPT-5.5がGPT-5.4やClaude Opus 4.7より著しく優れていると述べた。」うーん、5.4についてはそう言えるでしょう。Claude Opus 4.7のテストはまだ初期段階ですが、自律性において著しく優れていたかどうかは分かりません。というのも、それは本当にハーネスの機能による部分が大きいからです。Claude Codeは素晴らしいハーネスです。Codexも素晴らしいハーネスです。これらはもともと非常に自律的です。だから当然モデルの機能でもありますが、それ以上にハーネスによるものだと言えるでしょう。ええ。
ちなみに、これを見ているなら「いいね」ボタンを押してください。フォローして、配信をシェアしてください。もっと広めるのを手伝ってください。配信をやるのは本当に好きなので、もっと多くの人に見てもらいたいんです。だからお願いします。Brian、それを持ち出してくれてありがとう。感謝します。そして繰り返しになりますが、Discordを再稼働させました。BrianがチャットにDiscordのリンクを貼ってくれます。チェックしてみてください。
よし。これは少し言い過ぎかもしれません。「モデルのアーリーアクセスを得たNvidiaのあるエンジニアは、『GPT-5.5へのアクセスを失うことは、手足を切断されたような気分だ』とまで言った。」オーケー、ちょっと引きますね。
見てみましょう。「GPT-5.5をコーディングで偉大にしているのと同じ強みが、コンピュータ上での日常的な作業でも強力にしている。」はい、それは本当です。「情報の検索、重要なことの理解、ツールの使用、出力の確認、そして生の素材を有用なものに変えるといった、ナレッジワークのフルループをより自然に進めることができる。」
ちょっと水を一口飲んできます。すぐ戻ります。
よし。「GPT-5.5は、文書、スプレッドシート、スライドプレゼンテーションの生成においてGPT-5.4よりも優れている。」はい、これは本当です。Jonahは特にChatGPT Pro内のGPT-5.5に、非常に幅広く徹底的な文書の作成を指示しましたが、60ページの論理的でデザインの整った文書を問題なく作成したと言っていました。だから、失礼。実際のナレッジワークの文書を実際に作成する能力においては非常に優れています。
「現在、会社の85%以上が毎週Codexを使用している。」なぜ100%じゃないんでしょう。社内のコミュニケーションに自分たちのモデルを使わないで済むような役割なんてあるんでしょうか。
「チームは5.5とCodexを使って、6ヶ月分の講演依頼データを分析し…」なんてことだ、それって私がSam Altmanにインタビューしたいってお願いしたのが80%くらい占めてるんじゃないですか。「…スコアリングとリスクフレームワークを構築し、自動化されたSlackエージェントを検証して、低リスクの依頼は自動的に処理され、高リスクの依頼は引き続き人間のレビューに回るようにした。」オーケー。ええ。
ちなみに、私を訪ねてきている友人とちょうど話していたんですが、彼は会計事務所で働いていて、ExcelでAIを全く使っていないそうです。それを聞いて本当に驚きました。私は彼に無理やりラップトップを開かせて、Claude for Excelをインストールさせました。今何が起きているかを知らない会社が世の中にはたくさんあるように思えます。だから、もしそういう人を知っていたら、私の動画の1つを送ってあげてください。助けになればいいんですが。私はただ、世界中の人にこの技術の恩恵を受けてほしいんです。こんなにも多くのことができて、こんなにも生産性が上がるなんて、本当にエキサイティングです。それがここでの私たちの使命なんです。
よし。「オンボーディングフローのテスト。」ブラウザの使用。オーケー。ええと、もう一度言いますが、ページ上の視覚要素を特定し、理解し、視覚的推論を行う能力は5.5で非常に強力です。
よし。「ChatGPT 5.5では、考えることでより難しい問題に対してより速く助けを得られ、よりスマートで簡潔な答えによって複雑な作業をより効率的に進めることができる。」ここでいくつかポイントがあります。複数の思考設定があります。私が気づいたのは、Extra High(超高)設定にすると、ものすごく遅いということです。永遠に時間がかかり、永遠に考え続けます。私がやっていることで、そのレベルの思考を必要とするユースケースは本当にありません。だから、High(高)、Medium(中)、Highがスピードと思考の完璧なバランスのように思えます。少なくとも私にとっては。だから試してみてください。自分に一番合うものを見つけてください。
簡潔な答えというのも本当に重要です。モデルからエッセイを送られて、「いや、簡単に説明して。面倒くさい。全部読みたくない」と言わなければならないのには本当にうんざりしています。そうすればやってくれますが、最初からやってくれる方がずっと簡単です。現時点で、人工知能のボトルネックは本当に人間なんです。彼らのフィードバックを読む私の能力が、私のすべてのプロジェクトを遅らせているもの、あるいは全体的なボトルネックになっています。
A Pretzさんが「だから複雑なコードベースではExtra Highが私のデフォルトです」と言っています。理由が知りたいですね。私は同意しません。当然、私よりも洗練された、より複雑なコードベースを持っているのでしょうが、Highで十分すぎるくらいです。実際、ClaudeでもOpusでも、最高の思考レベルを常に使っているわけではありません。よく使いますが、常ではありません。そして特にGPT-5.4、5.5に関しては、Extra Highの思考を使うことはほぼありません。ええ。
ここにGDP Val、OS World Verifiedがあります。たくさんの引用。科学研究。ここは本当に良い改善が見られるところです。5.5の上限は5.4の上限よりもずっと高く感じます。そういうことなんです。さらに、同じ条件で比較すれば、5.5からはるかに多くのものを引き出せますが、トークン効率がはるかに高いため、より安価になります。それが覚えておくべきことです。
これがSpudです。はい、Dishwasher 69さん。これがSpudです。
よし。BixBench。これは聞いたことがありません。バイオインフォマティクスとデータ分析。素晴らしい。おお、見てください。「カスタムハーネスを備えた内部バージョンのGPT-5.5が、ラムゼー数に関する新しい証明を発見するのに貢献した。」そしてここにリンクが貼られています。これこそ私が言っていることです。私にはこれが正しいか間違っているかを個人的に検証することは決してできないでしょう。だから、5.5がどれほど優れているかを示すのがこれらの問題だとしたら、どうやってこれを使えばいいのか、どうやって検証すればいいのか分かりません。
ええ、「アーリーテスターはChatGPT内の5.5 Proを、一問一答の回答エンジンとしてではなく、研究パートナーとして使い、複数回にわたって原稿を批評し、技術的な議論にストレステストを行い、分析を提案し、コードノートやPDFの文脈を使って作業しました。」これです。これはまさに性格に関する部分です。モデルがあなたに話しかけるときのトーンが、はるかに短くなっています。短気という意味での短いではなく、考えていること全てをいちいち教えないという意味で短くなっています。
これは諸刃の剣でもあります。その思考プロセスに対する洞察はあまり得られませんが、同時に、私はそんなこと本当に気にしていません。大体何を考えているかが大まかに分かればよくて、その後は可能な限り短い方法で私のプロンプトを説明するか、答えをくれればいいんです。必要な正しい情報は全て伝えてくれつつね。オーケー。
SNTS Andreが「5.5は5.4より安いですか?」と言っています。いいえ、より高価です。それについては後で触れます。しかし、5.4と5.5を比較すると、繰り返しになりますが、5.5のトークン効率のおかげで、5.4と同じレベルの知能に到達するコストは安くなります。これで伝わるといいんですが。
オーケー。おお、Dariaへのシャウトアウト。引用されてますね。チャンネルの友人です。よし。
トークン効率と価格、サイバーセキュリティの取り組み
そのトークン効率について少し話しましょう。これがどれほど重要か、人々は理解していないと思います。知能は向上していますが、知能あたりのコストは実際に下がっていて、これはほとんどの人にとって良いことです。もしあなたが最先端の科学研究、最先端の数学の問題、世界で最も難しいコーディングの問題に取り組んでいるなら、最高の上限、知能の最高の上限が必要です。それが5.5が提供するものです。しかし、私のような一般ユーザーにとっては、ただ信じられないようなコーディングモデルが欲しいだけなんです。できるだけ安く、できるだけ速く。そこでトークン効率の出番です。だからこれほど価値があるんです。5.4で得ていたものと同じものが、より安く、より簡潔に得られるんですから。
私が本当に気に入っているのは、「5.4のレイテンシで5.5を提供するには、統合システムとしての推論を再考する必要があった。5.5はGB200およびGB300 NVLink 72システムのために共同設計され、訓練され、提供されています」という部分です。そして思い出してください、人工知能の自己改善について話しましたね。「CodexとGPT-5.5は、私たちがパフォーマンスの目標を達成する上で重要な役割を果たしました。Codexは、アイデアからベンチマーク可能な実装へとチームがより速く移行するのを助け、アプローチのスケッチ、実験の構成、どの最適化により深く投資する価値があるかの特定を支援しました。」
「トークン生成速度を20%以上向上。」素晴らしい。テスト中も速く感じましたが、テスト中に私が経験したこのスピードは、ローンチ後のスピードを代表するものではないと言われました。だからまだテストする必要があります。文字通りローンチ後にはまだテストしていないので、どうなるか見てみましょう。
おお、「みんなの安全のためのサイバーセキュリティの推進。」これはほぼ間違いなくMythosへの当てつけですね。「セキュリティの脆弱性を見つけてパッチを当てるのが非常に得意なモデルに向けて世界を準備することはチームスポーツであり、エコシステム全体が回復力を構築し、モデルへのアクセスを民主化し、反復的なデプロイメントを行うために懸命に働く必要があります。」
これはAnthropicへの直接的な攻撃です。Sam AltmanとGreg Brockmanは先日ポッドキャストに出演し、Anthropicのアプローチを恐怖ベースのマーケティングと呼びました。私はそれが本当に図星だと思いました。だから「我々には信じられないようなモデルがある。でもそれは優秀すぎるから君たちには与えない。でもところで、我々が君たちにそのモデルを与える前に、彼らがシステムを強化できるように全てのエンタープライズ企業にそれを売るつもりだ」と言う代わりに。いいえ。いいえ。彼らは「いや、我々はこれをみんなに提供し、反復的にデプロイする。早く、頻繁に出して、できるだけ頻繁にコミュニケーションをとる」と言ったんです。それが彼らのアプローチです。これがAnthropicのアプローチへの反応なのか、彼らが純粋にそう信じているのか、あるいはただSam Altmanがチャンスを掴んだだけなのかは永遠に分かりません。しかし本当に重要なのは、実際に何が起きているかということです。
プロデューサーのBrianが陰謀論を持ち込んできました。Sam alt man(オルト・マン)。Greg Brock man(ブロック・マン)。ここにパターンがあるでしょうか?2人とも「男(man)」ですね。良い。良い発見です。クレイジーですね。画面に映しちゃいました。気をつけないと。私、何でも画面に映しちゃいますから。よし。
ええと。「フロンティアモデルはサイバーセキュリティにおいてますます有能になっています。これらの能力は広く行き渡るようになり、私たちは最善の道は、それらがサイバー防衛を加速し、エコシステムを強化するために確実に活用されるようにすることだと信じています。」
ちなみに、Alex、Brian、あるいはAlex。ええと、私がこれを全部読んでいるところを動画に含める必要はありませんからね。「業界をリードするセーフガード。」「あらゆるレベルでサイバー防衛を加速するためのアクセスを拡大します。」「政府パートナーとの協力。」よし、見てみましょう。
よし、利用可能性と価格について話しましょう。
よし、続けましょう。ええと。よし、続けましょう。
だから、ええ、Plus、Pro、Business、Enterpriseにロールアウトされます。主に2つの形で提供されます。Codexアプリを使っている場合のCodexと、GPT-5.5 Proです。よし。Codex内ではGPT-5.5。オーケー。よし。400Kのコンテキストウィンドウ。そしてファストモードで利用可能で、これは素晴らしいです。2.5倍のコストで1.5倍速くトークンを生成します。オーケー。
ええと、GPT-5.5。あ、そうです。私たちの事前のアーリーアクセスグループで彼らが言及したことの1つは、5.5はまだAPI経由では利用できないということです。すぐになるでしょうが、まだです。だからAPI開発者にとってはまもなく利用可能になります。入力100万トークンあたり5ドル、出力100万トークンあたり30ドル、100万トークンのコンテキストウィンドウ。
価格ページを見てみましょう。ええと、そうですね。どう比較するんでしたっけ?だから、2.5ドルと15ドル対…ええ。だから、価格は2倍ですよね?私の読み方合ってますか、チャットの皆さん?価格は2倍です。入力100万トークンあたり5ドル、出力100万トークンあたり30ドル対して、5.4はその半額です。これは高いですね。はい。
しかし、トークン効率、知能あたりのトークン効率の向上に注目すべきで、それが少なくともある程度はその価格を相殺するはずです。さて、バッチ価格、キャッシング、フレックス価格を組み合わせ、思考トークンの予算を制御すれば、ほとんどのユースケースでExtra Highの思考は必要ありません。繰り返しますが、私たちはこのモデルで可能な上限について話しているんです。99%のユースケースではその上限は必要ありません。だから、実効的な価格は実際には5ドルと30ドルにはならないでしょう。
よし。私のこの話にうんざりしてる人はいますか?テストしましょうか?これについては話しました。数字についても話しました。見てみましょう。テストしてみましょう。だから、まずいくつかテストをお見せしたいんです。
ええと、見てみましょう。Jonah、これを見せるのに一番いい方法は何だと思いますか?Brian、「私としては、ずっと読んでるだけの配信だったらいいのにと思います。」彼に同意するならサムズアップを。同意しないならサムズダウンをお願いします。さあ、来ました。よし。ええと、Jonahがいくつかテストを実行して、これは信じられないほど、信じられないほど印象的でした。
ええと、2つ目の動画リンクをやりましたね。オーケー、やりますよ、やりますよ。それでは、過去2週間に私たちが社内で実際に実行してきたテストのいくつかをお見せします。これは録画です。一緒に見ましょう。私たちが発見したことは、ChatGPT Proを見てコードを書くように頼むと、かなり良いんですが、完璧には程遠いということです。特にこの種の3Dボクセルの小さな環境、小さな世界を作るのは、あまりうまく完成させられませんでした。しかし、5.5のパワーをCodexに入れ、出力を見て反復できるコーディングハーネスを実際に持たせると。これについてはたくさん話しましたね。出力を見て、反復する。ええと、ずっとうまくいきます。
オーケー、これが小さな3Dの世界です。Jonah、これの共有リンクをChatGPTで送ってくれませんか?私が実際に、ええと、見てみられるように。オーケー、これは…はい。オーケー、ちょっと待ってください。録画を終了します。アップロードしないと。ちょっと待ってくださいね、皆さん。
GPT-5.5。Alexが作業を始められるように、動画をアップロードしているところです。だから少々お待ちください、皆さん。すぐに配信に戻ります。
よし、今再起動しています。クリック。よし、再起動しました。今アップロード中です。あと4分で終わるはずです。オーケー。ええと、そう。Codexですね。オーケー。ええ。だから、これはただただ非常に印象的だと思いました。これは私が過去に作ろうとして苦労したものです。
「Kimmy K 2.6を使ってください。検閲なしです。」検閲なしのモデルにはあまり使い道がないんです。正直に言うと。モデルが(制限されて)教えてくれないことを教えてくれたらいいのに、と思うような質問はあまりありません。多くの場合、ポリシーや、特にOpusのような厳しすぎるポリシーのせいで物事を拒否されていて、それを彼らが撤回して少し緩める、ということの方が多いと気づいています。だから、モデルが検閲されていないかどうかにはあまり関心がありません。それに正直なところ、Kimmyは別の方法で検閲されています。状況によります。オープンソースモデルの良いところは、もちろん好きなように検閲を解除できることです。中国がモデルを検閲するのと、アメリカがモデルを検閲するのとの違いは大きく異なります。オープンソースなら、自分の好きなものを選べます。よし。
Codexを更新しないといけないみたいです。よし、5.5はありますね。オーケー、共有しましょう。ここでCodexを簡単に共有できるか見てみましょう。いくつかテストしてみましょう。よし、来ました。Codexを開きました。更新したばかりです。GPT-5.5のHighです。Extra Highではなく、Highです。そしてファストスピードにしたいです。オーケー。
ええと、何をテストしましょうか?最初にテストすべきなのは何ですか?見てみましょう。ええと。
Dave Wilsonさん「Whitespace言語でHello Worldを書く。」それって実際にどういう意味ですか?よし、Alex、ありがとう。彼が皆さんのプロンプトをいくつか集めてくれました。そのうちのいくつかをテストできます。オーケー。
ここに書くだけでいいんですか?見てみましょう。分かりません。どうなるか見てみましょう。「YouTubeのチャットだとチャットが小さすぎます。」おお、興味深い。分かりません。これで解決しましたか?どうやって知ればいいんでしょう?もしプロンプトをくれるなら、それがうまくいったかどうかを確認する方法も教えてください。オーケー。ええ。「車を洗う」やつ、いいですね。それをやりましょう。テストしてみましょう。ええと、これは他のモデルが何度も間違えてきたものです。ええと、何て言うんでしょう?脳トレ問題みたいなものです。
オーケー。じゃあ、これを試してみましょう。Proは5.5であるべきですよね?オーケー。だから、「洗車」と言ってみましょう。よし。ちょっと待ってください。画面に収まっているか確認します。大丈夫ですね。でもこれは大丈夫ですよね?切れてますか。大丈夫だと思います。私が必要なものはそこにあるので。ええと、オーケー。
オーケー。では試してみましょう。「車を洗いたい。洗車場は100フィート(約30メートル)離れている。歩くべきか、それとも車で行くべきか?」よし。これはProです。拡張思考は必要ないと思います。ええと、そして5.5のはずです。さあ、行きましょう。来ました。これがAGIです。私たちはAGIに到達しました。なぜこんなことを繰り返すんでしょう?来ました。ええ、「車で行く。」車も洗車場に行く必要がありますからね。たった11秒しか考えませんでした。そしてもちろん、思考トークンに対する洞察は得られません。
配信トラブルとデザイン能力の検証
「カメラがラグってます。」なるほど。オーケー、まだ起きているか見てみましょう。はい、とてもひどいですね。オーケー、ちょっと様子を見ましょう。すぐにスピードアップするといいんですが。アップロードしていないのに、なぜラグるのか分かりません。おお、どうやって直せばいいんでしょう?少し仮想カメラをオフにしてみます。またオンにします。
いや、違いますね。よし、見てみましょう。ecamは…教えてくれませんか、ラグっているのは私のカメラだけですか?ええと、物理的なボタン。私のカメラじゃないですね。ええ、私のカメラじゃありません。なぜなら、ここでOBSを開いていて、それは完全にスムーズだからです。ecamと配信自体の間の何かが問題なんです。
「ecamがラグってます。」オーケー、だから私のカメラ、ecamのカメラだけですね。ええと、この質問にうまく答えられるか見てみましょう。ああ、ええ。こっちもですね。いや。「オフにしてまたオンにしてみましたか?」ありがとう。私は…カメラは、本当にどうすればいいのか分かりません。カメラの実際のハードウェアはうまくいってます。私のマシンにはちゃんと入力されています。録画しているOBSの別のウィンドウが見えていて、それは全く問題ないですから。ええと。配信を止めないといけないですね。ほら、それはやりたくないんです。再起動。でも配信を再起動したくないんです。
「許容範囲です。」ああいや、十分じゃないですね。十分じゃありません、友よ。
「直す間、配信を別のデバイスに転送してください。」興味深い。どうやるのかさえ分かりません、Robert。
見てみましょう。見てみましょう。いくつか試してみます。OBSの録画を止めます。OBSを終了します。だからちょっと待ってください。皆さん、我慢してください。
ええ、これで…オーケー。OBSでした。OBSです。仮想カメラが今はうまく動いていません。来ました。はい。よし。見てください、戻りました。来ました。よし。OBSでした。OBSでした。だから、もう一度録画を開始すれば、過負荷にならないことを願います。クール。戻りました。戻りました。はい。よし。ええと、もう一度録画ボタンを押します。これがうまくいくか見てみましょう。もしダメなら、何か別の方法を考えます。バーン。クリック。よし、これで録画中で、戻ってきましたよ、ベイビー。よし。ええ、我慢してくれてありがとう、David。ええと。
クール。よし、他に何を話す予定だったか見てみましょう。Airbnbの予約。ええと、Jonah、どれをテストするのがいいと思いますか?実は、ここに良いものがあります。ええと、だから、これがうまく映るといいんですが。ええと、フラッシュバンの準備をしてください。これらをダウンロードしたいんです。簡単にはさせてくれないんですよね?ええ、簡単にはさせてくれません。Googleドライブのそういうところ本当に嫌いです。あ、ごめんなさい、Googleドキュメントでした。右クリックして画像をダウンロードするのが簡単じゃないんです。クレイジーですよ。
よし、これが見えるといいんですが。確認させてください。ええ。オーケー。では、何が起きたかお見せします。だから、私のプロジェクト「journeykits.ai」があります。あ、始まりました。またラグり始めているのが見えますよね?ええ。ええ。またラグり始めてます。うん。うん。うん。オーケー。エンコーダーですね。実は初めて、私の化け物みたいなシステムに過負荷をかけているんだと思います。ええと、戻りました。でもこれをどうやってやるか分かりません。閉じられるものがあるか見てみましょう。もしかしたらそれかもしれません。OBSを閉じて再起動してみます。私はここにいます。ちょっと待ってください、皆さん。よし、これもやります。これが悪影響を与えているんだと思います。もうすぐ戻ります。もうすぐ戻ります。
よし。OBSがもちろんここで私を裏切りました。OBSはゴミですね。ごめんなさい。超イライラします。Alexが今、OBSのせいで私の画面録画全体が機能していなかったと教えてくれました。OBSはゴミだからです。彼はゴミとは言っていません。私がゴミだと言ったんです。よし。クリック。これで機能するようになるか見てみましょう。
よし。ではここに戻りましょう。全て機能しています。このままいってくれるといいんですが。
それでは、GPT-5.5が実際にフロントエンドでいかに優れていたかを示す素晴らしい例の1つをお話ししましょう。すでにデザインはありました。だからGPTは一般的にフロントエンドのデザインはあまり得意ではありません。しかし、すでにデザインはあったので、物理的なレイアウトが私が直面していた問題でした。だから、私の製品「journeykits.ai」のこのセクションが欲しかったんです。実際、それをお見せしましょう。だから、キットの中に入ると、上部にあるこのセクションです。そして、以前はひどい見た目でした。オーケー。だから、ここを見ると、空きスペースが多すぎました。これはOpus 4.6か4.7だったんですが。見た目が良くなかったんです。何も揃っていなくて、ボタンも変な場所にありました。
そこで、5.5にプロンプトを出しました。そしてこれが得られたものです。ずっと良くなりましたよね?よりクリーンで、空間とレイアウトについてより良い理解を持っています。そして、いくつかヒントを与えてもう一度プロンプトを出したら、こうなりました。これが最終結果です。私はOpusを使ってこのレイアウトをうまく機能させようとすごく頑張ったんですが、できませんでした。私のページの実際のレイアウトを理解していなかったんです。しかしGPTにはできました。それは、ページを見て、見ているものを理解し、それを何度も反復する能力が優れているからだと思います。それが本当に素晴らしいところです。
よし。もう少しテストしてみましょう。オーケー、これいいですね。Simonさん「フル高精細の解剖図」。それをやりましょう。Codexに切り替えます。これがどれくらい速いか分かりませんが、一緒にテストしてみましょう。ええと、よし、少し動かします。大丈夫です。よし、テストしてみましょう。ちょっとズームインできるか見てみましょう。来ました。配信画面ではどう見えますか?良さそうです。よし、テストしてみましょう。ええと、これは消していいです。このテストボックスに行きたいんです。オーケー。
5.5のHighでCodexを使います。「フル高精細の解剖図。完全な骨格リギングとアニメーションで制御可能な人物の正確な図を、素晴らしいグラフィカルな3D環境で。」さあ、行きましょう。Simon Bolosさん、そのお勧めありがとうございます。
オーケー、スピードはかなり良いことが分かります。ファストスピードをオンにしています。配信画面でそれが見えるか分かりませんが。ええ。ええ、見えますね。だから、小さな稲妻のアイコンが見えます。それはファスト(速い)という意味です。だから、2.5倍のコストで1.5倍速いです。なぜExtra Highではないのか?Extra Highは単に必要ないと感じたからです。ええと、これはSimon S… Seaman Sandbergさんからのものです。ええと、私が必要とするユースケースには、その余分な思考力は必要ありませんでしたし、待ちたくなかったんです。分かりますか?より速いレスポンスが欲しいんです。それが通常のHighで得られるものです。それでも遅いですけどね。これはOpusと比較してのことです。Opus 4.6のファストモードはとにかく最速ですから。
「Opus 4.7とCodex、どちらが速いですか?」Opus 4.7です。ええ。Opusは一般的に速いモデルです。ええと、まだ動いてますか?すごく遅いですね。よし。それが動いている間。まだ動いてますか?うん。まだ考えてます。ライブでテストするのは遅すぎるかもしれません。私にはそれを待つ忍耐力がありません。ええと、その間に何をするか?Twitterをスクロールしましょう。
オーケー。ええと、オーケー。1時間。「110万回再生。」Anthropicならもっと稼げたような気がします。オーケー。ここにMatt Schumerのレビューがあります。彼が何と言ったか見てみましょう。「真のアップグレードだ。多くの日常的なエンジニアリングの仕事において、アップグレードは必ずしも重要ではない。以前のモデルはすでに狂ったように優れていたからだ。」私が言ってきた通りです。私が言ってきた通りですよ。ええと、Mattを呼べるか見てみましょう。テキストを送ってみます。配信に参加できるか見てみましょう。よし。ええと、だから、私はただ…おお、見てみましょう。彼は空いてるでしょうか?オーケー、彼は空いてないですね。
よし。ええと、いくつか結果が出ました。Codexに戻りましょう。オーケー、いくつか出てきました。これを動かします。おお、見てください。まだ動いてますが、何か出てきました。これ、どう思いますか?まあ、かなり良いですね。ズームアウトします。牢屋の中にいるように見えます。そして明らかに、プロポーションはあまり良くありませんが、見てみましょう。歩く。オーケー、明らかに妙な歩き方をしています。そして骨はそっちの方向には動かないはずですが。ええと、でもオーケー、見てみましょう。走る。これは面白いですね。そして見ての通り、ちなみにまだ動いてますよ。まだ動いてます。ええと、手を伸ばす。よし。ハーフダブ(ダンスのポーズ)みたいなことをしているように見えます。つま先。つま先は機能しませんでした。調べる。オーケー。変ですね。歩くのが好きです。
まあ、見てください、そんなに正確じゃありません。ほら、目を見てください。鼻を見てください。正確じゃありません。アニメーションの速度。すごく速くしたり遅くしたりできます。オーケー、クール。スキンライトの強度。オーケー。あるいはスキャンライトの強度。呼吸の振幅。呼吸しているようには全く見えません。ええ。
だから、見てください。ええと。最初のパスのレンダリング。オーケー。今、新しいバージョンをレンダリングしました。今見えた点滅がそれです。だから、処理を進めているところです。「テスト中に2つの仕上げの問題が見つかりました。リグのノード数がUIが示唆するよりも少なくなっています。」オーケー、見てみましょう。今度は歩く。ええ、良くなってないですね。実際に動かせるでしょうか?ええと、実際には、ええと、こいつを掴めない。いや、無理です。残念ながら動かせないと思います。ラグドール(物理演算でぐったりさせること)みたいにしたいんですが。よし、終わりました。終わりました。6分39秒かかって、終わりました。おかしく見えますね。「これはルックスマキシング(見た目を極める)バージョンだからおかしく見えるんだ。」ええ。よし。
ええと、だから、見てください。これはまあまあです。ええと、何か驚くようなものではありません。ええと、他の何人かの人がこれについて何と言っているかチェックしてみましょう。ええと、こういう「業界の反応」みたいな動画です。見てみましょう。
業界の反応と総括
だから、Matt Schumerに戻ります。今彼にテキストを送りました。彼のレビューを取り上げていると伝えました。シャウトアウト、Matt。ええ、「真のアップグレード。」でも彼の言う通りです。これが私が言いたかったポイントです。5.5の上限は超高いんです。5.4よりも高いです。しかし、ユースケースの大部分において、その上限は必要ありません。だから、改善はそこでは本当に感じられません。改善を見出す場所、ごめんなさい、改善を感じる場所はトークン効率です。価格は2倍払っていますが、願わくば同じレベルの知能や同じレベルのタスクを、はるかに低いトークン予算で行えることです。それが望みです。
「本格的なソフトウェア作業において例外的だ。」はい。「最大のニュースは範囲だ。」はい。ええと、これはテストしていませんが、「既存のコンテキストからのデザイン、iOSネイティブアプリ、Macアプリ、セキュリティなど。全て非常に優れている。」
少し休んで宣伝させてください。ええと、Discordを開設しました。Discordを刷新したんです。それをやってくれたBrianに感謝します。チェックしてください。彼が今チャットにリンクを貼ります。Discordに参加してください。私たちのニュースレター「forwardfuture.ai」をチェックしてください。この動画を見ているなら、シェアして、いいねをして、そういうことを全部やってください。コメントしてください。すごく助かります。みんなと話すのが大好きなんです。ええと、そして見ての通り、BrianとAlexは2人ともチャットで超アクティブです。ええと、だからそういうことを全部やってください。Discordでお待ちしています。
そしてもう一つ、裏側のことも少し話すべきですね。ニュースレターにさらに追加を行っています。すでに超誇りに思っています。私たちのニュースレターの登録者は7万人くらいだったと思います。完全に無料ですが、ゲスト投稿をもっと始めようとしています。オリジナルの記事ももっと始めようとしています。だから、もし私たちのニュースレターにまだ登録していなかったら、「forwardfuture.ai」に行って登録してください。それが王道です。ええと、そしてチャンネルで見かける友人たちがそこにゲスト投稿を書いているのも見られるでしょう。
よし。「良い点。例外的なエンジニアだ。完了するまで働くことができる。」はい。「デザインが意味を持って良くなった。空間をより良く理解している。」より優れたデザイナーだとは言いません。ええと、確かに5.4よりは間違いなく優れていますが、Opusより優れたデザイナーではありません。Opusは、フロントエンドのセンスがずっとずっと良いです。ええと、Sarderさんが「このモデルはいつ出たんですか?」1時間くらい前です。1時間ちょっと前ですね。
ええと、これを少しお見せしたいです。Asenさん「Anthropicに対するコミュニティの声を代弁してくれてありがとう。」私がAnthropicに反対しているとは言いません。彼らが最近私を怒らせているだけです。ええと、私はポジティブでいたいんです。楽観的でいたいんです。彼らが状況を好転させてくれることを願っていますが、過去2ヶ月間に彼らが下した決定の多くが私を怒らせたんです。だから、それについて何か言わなければなりませんでした。もしその動画を見ていなければ、ええと、チェックしてください。私が作った最後のフル動画です。XとYouTubeの両方に投稿しました。
よし。「コードがより読みやすい。」私はもうコードを読まないので、それについては何とも言えません。「セキュリティの仕事は大きなステップアップだ。」オーケー。
「あまり良くない点。もし通常のエンジニアリングタスクでモデルを主に使うなら、違いを感じるのは難しいかもしれない。」はい、その通りです。「前の世代の5.4はすでに十分すぎるほど狂ったように優れていた。」はい、非常に良いポイントです、Matt。「ゼロからの美しいフロントエンド作業には、私の第一選択ではない。」はい、これが鍵です。もし何かを作っていて、ゼロからデザインをしているなら、まだOpusを使うことをお勧めします。しかし、先ほどお見せしたように、もし既存のデザインテンプレートがあって、単にスペースの使用やレイアウトを最大化または最適化したいだけなら、ええと、これは驚異的です。5.5は本当に良いです。オーケー。「Proは時々徹底していないように感じる。」「Proの文章は悪い。」「判断のミス。」完全なレビュー。オーケー、Mattのええと、完全なレビューをチェックしてください。Matt Schumer。
ええと、Theoを見てみましょう。おお、いや。これは彼の暗号パズルですね。彼がどう考えているか見てみましょう。いや。だから、彼はまだそれについて投稿していません。オーケー。「5.5 MediumはArtificial AnalysisでSOTA(最高水準)タイ。5.5 HighとX Highは意味を持って先行している。」オーケー、だから彼は入力100万あたり5ドルで出力100万あたり30ドルと言いました。ええと、おお見てください。彼らがやったのは、ええと。これ、「Matt Romanルービックキューブテスト」って呼んでいいですか?それが最初のあれだったと思いますが。とにかく、GPT-5.5が音楽を爆音で鳴らしています。本当にごめんなさい。了解です。皆さん、ごめんなさい。皆さん、ごめんなさい。うるさかったですね。ええ。ええ。ええ。まだ私の声聞こえますか?オーケー。ええと、音声なし。
ええと、ええ。だから、ええと、扱いづらくて高すぎるのも変ですね。5.4の2倍の価格。4.7より20%高い。もし4.7と比較するなら、得られるトークン効率を考えれば、おそらく全体的な価格は同じになることが分かると思います。
スーパーチャット。どうもありがとうございます。「もし列車Aが時速100キロで移動し、列車Bが20分遅れて出発し、時速150キロで移動した場合…」これって私が中学2年生の時に出たような問題ですよね。GPTがこれをこなせることを願いますよ。
オーケー、テストしてみましょう。よし、戻ります。ええと、そう。そう、「このモデルは私が今まで使ったどのモデルよりも良いコードを書ける。また、多くの励ましも必要とする。」オーケー、かなり良いですね。興味深い。
Boris「Claude Codeの品質問題に関する最近の報告を調査し、発見したことについてのポストモーテム(事後分析)を公開しました。」これが5.5とは何の関係もないことは分かっていますが、これは興味深いです。ええと、興味深い。これは後でカバーしましょう。後でカバーします。おお。
ええと、そう。動画を見ます。動画にリアクションします。そして音楽をまたオンにしないといけませんね。爆音にならないように気をつけます。皆さんは全体を見ることができます。
やりましょう。オーケー。ブラウザを使用。これは見たことがあると思います。ええ、テストですね。ルービックキューブテストです。大好きです。オーケー、Slackに繋いで、Gmail、GitHub、あらゆるものに繋ぐと本当に強力になります。これは実はJonahが言っていたことです。GoogleドキュメントやWordなど他の全ての機能と一緒に使うと、5.5のパワーを本当に実感できると彼は言っていました。
よし。ここにはあまり情報がありませんね。ええと、クール。これで全部だと思います。LennyがClaude Codeのプロダクト責任者であるCat Wuとの新しいポッドキャストを公開しました。とてもクールですね。チェックしてみてください。
今日はここまでにしておきましょうか、皆さん。テストの多くをやり遂げられなかったことは分かっていますので、謝ります。ええと、列車の追いつき問題をやってみましょう。ええと、「列車Bが同じ地点から出発すると仮定し、50mのギャップとは列車Bが列車Aの50m後ろにいることを意味するとし、列車Aの20分のリード…」オーケー、これを考える精神的なエネルギーが残っているとは思えません。それが答えですか?プロンプトを出した人。見てみましょう。「50mのギャップがあれば、正確に40分、1時間かかります。」オーケー、それは…おお、彼は正解だと言いました。はい、どうぞ。ありがとう。検証してくれてありがとう。さて、どうやってあなたを検証すればいいんでしょう?ChatGPT Proに聞かないと。そして誰がそれを検証するのか?
ここで終わりにしましょう。ええと、あ、いや、もう一つ話さなきゃいけないことがありました。それは別で録画します。今はアウトロをやります。皆さんがここに残って、ええと、付き合ってくれたことに感謝します。動画がグリッチ(バグ)ってますね。オーケー。
ええと、ええ、Discordをチェックしてください。リンクを貼ります。再稼働させたばかりです。ぜひ参加してください。ニュースレター「forwardfuture.ai」もチェックしてください。TwitterでMatthew Bermanをフォローしてください。そして、ええと、楽しかったです。こういう配信をもっとやっていきます。じゃあまたね。


コメント