この動画は2025年8月1日に配信された「Forward Future Live」の完全版である。AI業界の最新動向、人材獲得競争の激化、巨額の資金調達ラッシュ、インフラ投資の急拡大などを詳細に解説している。ゲストとして連続起業家のヒートン・ショウ氏とAIエージェント開発のスペシャリストであるニコ・クリスティ氏を迎え、MetaのパーソナルAGI戦略、仕事の未来、教育の変化、そして革新的なExcelエージェント「Shortcut」について深く議論している。さらに、中国発のオープンソースモデルの急速な進歩とAGI競争の現状についても包括的に分析している。

- Forward Future Live開始とAI業界の最新動向
- AI業界の人材獲得競争とMeta AI
- Notebook LMの大型アップデートと動画機能
- 謎のモデルHorizon Alpha登場
- 資金調達ラッシュとAI企業の急成長
- ゲスト登壇:連続起業家ヒートン・ショウとの対談
- 仕事の未来と技術の変化
- 教育と子育てへのAI影響
- Figureロボットとテック界のトレンド
- ChatGPT会話のGoogle検索インデックス問題
- OpenAI研究者による新しい思考方法の開発
- AIインフラ構築の爆発的成長
- ゲスト登壇:Shortcut開発者ニコ・クリスティとの対談
- Shortcut:AI搭載Excel革命
- AIモデルの訓練と技術的アプローチ
- 会社構造とByteDance型アプローチ
- 仕事の未来と人材の自動化への見解
- AGI競争アップデートとオープンソースモデルの躍進
Forward Future Live開始とAI業界の最新動向
やあやあやあ。こんにちは、番組へようこそや。今日は2025年8月1日で、Forward Future Liveにようこそや。今日は素晴らしい番組をお届けするで。まず、今週のニュースを振り返って、AI界隈のトレンドを一気に見ていくわ。そんで、二人の素晴らしいゲストをお迎えしとる。
一人目はヒートン・ショウや。連続起業家で、Crazy EggやKissmetricsを立ち上げて、最後のスタートアップNeiraはDropboxに売却して、今はDropboxでAI製品を手がけとる。それから、二人目のゲストはニコ・クリスティやな。Fundamental Researchの創設者で、X(旧Twitter)で見たことあるかもしれんけど、彼の新製品Shortcutのデモ動画が完全にバズっとる。
彼の会社とAIでスプレッドシートを再発明することについて話してもらう予定や。その後、ゲストの合間にトレンドツイートも見ていこうと思う。それじゃあ始めよか。アレックス、画面を出してくれるか。ありがとう。アレックスが裏方を全部やってくれとる。
AI業界の人材獲得競争とMeta AI
最初のニュースやけど、AI Meta AIがMiratiスタートアップのThinking Machinesを狙って採用攻勢を続けとる。そう、Thinky Machinesって呼ぶべきやろな。Wiredの報道によると、MetaはMorotti氏のAIスタートアップのスタッフ十数人以上にアプローチして、新しい超知能ラボへの参加について議論したんや。超知能ラボが発表されたとはいえ、Alexander Wangがトップに立って、引き続き一流のAI研究者たちを狙っとる。
記事をもうちょっと詳しく見ると、4年間で2億から5億ドルのオファーがあったそうや。初年度だけで、一部のスタッフは5000万から1億ドルが保証されてたって情報筋が言うとる。ただ、MetaのコミュニケーションディレクターAndy StoneがWiredに対してこの報道に反論しとる。「TML(Thinking Machines Labs)には一握りの人にしかオファーしてない。大型オファーが一つあったのは事実やけど、詳細は間違っとる」って言うとる。
ここで言いたいのは、Thinking Machines Labsのほとんどの人が実際にオファーを断って、誰も引き抜けなかったっちゅうことや。ミッションがカネより大事って思える研究ラボがいくつかあるんやな。
Notebook LMの大型アップデートと動画機能
次に、Notebook LMが大きなアップデートをリリースした。Notebook LMは多くの人にめちゃくちゃ人気で、基本的にはどんな文書でも音声ポッドキャストに変換してくれる。主に学習用に使われとるんやけど、今回動画機能が追加された。動画概要が作れるようになったんや。ちょっとタブを切り替えるわ。で、これを少し再生してみよう。
ほら、ここで動画概要が見えるやろ。文書を読み込むと、ポッドキャスト風な感じだけやなくて、視覚的な要素も一緒に提供してくれるんや。これが今見えとるものや。「よし、シュルレアリズムの世界に飛び込んでみよう」って感じで、Notebook LMで学習体験に視覚的な側面を作り出してくれるんや。
実は俺、Notebook LMそんなに使ったことないねん。コメントで、定期的に使っとる人がおったら、どんな風に使っとるか教えてや。
謎のモデルHorizon Alpha登場
次に、Open Routerに謎のモデルが登場した。昨日動画で取り上げたんやけど、まだ見てない人はチェックしてや。アレックス、チャットにそれ投稿してくれるかな。
それはHorizon Alphaって呼ばれとって、多分OpenAIのオープンソースモデルやと思うんやけど、確認はされてない。どのモデルか、誰が作ったかって聞くと、OpenAIって答えるんや。思考型モデルやないし、25万6千トークンのコンテキストウィンドウがある。かなり大きいな。めちゃくちゃ速いんや。テストした時は、1秒間に100から130トークンくらい出してた。めちゃくちゃ速い。
ただ、思考型モデルやない。でも当然、このオープンソースの基盤モデルに強化学習を適用して、思考できるようにすることはできるわな。
資金調達ラッシュとAI企業の急成長
次に、いくつかの資金調達の発表がある。まずCoherから、Commandシリーズのモデルを作っとる会社や。これは本当に素晴らしいモデルで、主に企業向けに使われとると思う。収益2億ドルを見込んどって、OpenAIやAnthropicと比べると比較的小さいけど、それでもめちゃくちゃ印象的や。彼らも追加資金調達を発表する、少なくとも噂されとる。
Coherは投資家と数億ドルの株式調達について話し合っとって、資金調達前の評価額は63億ドルや。これは1年前の最後の株式調達と比べて25%の評価額増加になる。
Coherが資金調達しとるだけやなくて、ニューヨーク・タイムズによると、OpenAIも資金調達しとって、今では民間企業として最高評価額になったと思う。このベンチャーキャピタルラウンドでChatGPTメーカーの評価額は3000億ドルになっとる。
少し下にスクロールすると、最新の投資家が見える。Blackstone、TPG、T. Rowe Price、Fidelity、Founders Fund、Sequoia、Andreessen Horowitz(当然や、みんなに投資しとるからな)、Coatue、Altimeter、D1、Tiger、Thriveや。
彼らも新しい収益マイルストーンを達成した時点で資金調達しとる。それを見てみよう。The Informationによると、OpenAIは年間収益120億ドルを達成し、ChatGPTの週間アクティブユーザーが7億人を突破した。
とんでもない数字や。とんでもない成長や。週間アクティブユーザー7億人て。月10億ドル稼いどって、今年初めの月5億ドルと比べるとな。この成長の全ては今年初めからのもので、どんどん勢いを増しとる。OpenAIおめでとうや。
でもそれだけやない。Anthropicも負けてへん。AnthropicもIconic Capitalが主導して1700億ドルの評価額で資金調達の話し合いをしとるってBloombergが報道しとる。これは前回のLightseed Venture Partnersが主導したラウンドの580億ドルからの増加やな。
OpenAIは基本的にみんなから資金を得とるから、CoherやAnthropicのような会社に投資できる投資家はほんの一握りしか残ってへん。AI研究者の引き抜きと人材戦争の激化、AI系スタートアップ全体の収益増加、そして彼らみんなが途方もない金額を調達しとることを見ると、何も減速する気配がない。
彼らは避けられないインフラ構築、AI研究者、人材戦争、そして基本的にこれらの会社の多くが持つ勝者総取りメンタリティのために戦争資金を積み上げとるんや。
ゲスト登壇:連続起業家ヒートン・ショウとの対談
これが今日カバーしたかった簡単なニュースや。今度は最初のゲストをお迎えしよう。ヒートン・ショウが最初のゲストや。さっき紹介したように、連続起業家でCrazy EggやKissmetricsを立ち上げて、最新のスタートアップNeiraはDropboxに売却され、今はDropboxでAI製品に取り組んどる。そして実は、俺の前の会社の最初のエンジェル投資家でもあったんや。お迎えするのがめちゃくちゃ楽しみや。アレックス、番組に呼んでくれ。
やあ。やあ、みんな。調子どうや?会えてうれしいで。めちゃくちゃかっこいいスウェットシャツやな。どこで手に入るんや?
実は、Jack Butcherっていうアーティストがいて、Visualize Valueっていうブランドを持っとるんや。グッズを売っとる。俺、彼のもの全部持っとるわ。Zerpって大きく書いたやつもあるから、今日はそっちを着るべきやったかもしれんけど、今日はschool of the internetバイブスやねん。
今日カバーしたニュース全部でZerpについて話すんには、めちゃくちゃ適切やったやろうな。
そのリンク絶対教えてもらうわ。今日はいくつか話したいことがあるんや、ヒートン。まずはMetaのパーソナル超知能発表について。いくつか引用を読んで、それから君の考えを聞かせてや。
みんなに文脈を説明すると、今週初めにMetaがZuckから、Metaチームからの発表を出して、基本的に「超知能ラボでの俺たちのミッションはこれや」って言って、少し詳しく説明したんや。読む引用が二つある。まずこれから始めよう。
「これは、超知能が有価値な仕事を全て自動化することに向けて中央集権的に向けられるべきやと信じる業界の他の人たちとは違う。」文脈として、彼が言及しとるのは、Metaの超知能はみんなに個人的に超知能を提供するっていうのが彼らの今のミッションやってことや。「そして人類はその産出物の施しで生きていくことになる。Metaでは、人々が個人の願望を追求することが、いつも繁栄、科学、健康、文化を拡大させる進歩を作ってきた方法やと信じとる。これは将来においてもますます重要になるやろう。」
これはOpenAIや他のラボに対する直接的な当てつけで、「俺たちが超知能を運営して、適切な時期やと思った時にその一部をお前らに与える」って言っとる人たちに対してや。彼らのアプローチは、みんなに超知能を与えようってことや。もちろん、少しマーケティングが入っとるけど、ちょっと止めるわ。
ヒートン、ここについてどう思う?
AIの全体的な話は、iOS、Android、Windows phone、Amazonの電話での大失敗(Fire phonやったっけ?Fireタブレットがあるから、Fire phoneもあったんやろ)の戦争を思い出させるし、今でも思い出させるわ。
いろんな角度でこれを見ることができるけど、俺の友人Om Malikが書いた記事が一番好きや。彼はこのコミュニケーション面を分析して、たくさんの質問をしたんや。だから今はその視点は省いとくわ。
全体的に言うと、OpenAI、Anthropic、MetaのMark Zuckerbergなどのリーダーたちは、彼らの会社が将来において関連性を持つ必要があるんや。それが本当にこれの本質やと思う。
これについて考えれば考えるほど、これらは俺たち消費者がどの会社と関わりたいかを理解するのを助けるように設計された観点やと思うんや。これは長期戦略の一部や。その一部は、人々がAppleの方がプライバシーを重視しとるって信じることから来とる。より安全なエコシステムやって思うけど、Androidは正反対でオープンやと思うわけや。
だから、マーケティングを全部取り除いたら、これは単に戦略や。彼はMetaとして、すべての消費者プロパティを持ちながら、作りたかったけど作れなかったもの、つまりChatGPTと競争する必要があるから、こう言わざるを得ないんや。ChatGPTが消費者の注意を奪っとるからな。
だから俺にとっては、これは各企業が市場に出したい、または出す必要があると思う正しい見た目についてのゲームや。もう一つ例を挙げると、Mark Zuckerbergはキャッシュフローでたくさんのお金を持っとる。その会社が持っとるキャッシュフローはOpenAIにはないものや。だからOpenAIはAGI、ASI、そういう大きな乗っ取りについて話さなあかん。
Mark Zuckerbergがそれについて話してないわけやないけど、俺たちが世界により良くフィットして、彼らが全てを乗っ取って所有して、俺たちをコントロールするわけやないって感じさせるフレーミングで話しとるんや。でもこの会社の歴史を考えると、絶えず物語の変化があった。でも一つの真実は、彼らは何十億人もの人々のエンゲージメントを成長させて維持する方法を知っとるってことや。
それを忘れたらあかん。それが彼らの出発点や。そして突然、その一部を奪っとる脅威が現れた。彼らはそれを取り戻さなあかん。それが俺がこれを考える方法や。
確かに。perception(認識)について言うと、ついこの前まで、MetaってVR、ARが全てやったやんか。何百億ドルも投資して、今度は人工知能が全てになった。だから君の言う通りや。そして技術的な観点から、パーソナル超知能って実際何を意味するんやろうか?俺のスマホに超知能が搭載されるわけやないやろ。おそらく彼らが構築しとる超データセンターに中央集権的に配置されるはずや。だから実際どんな感じになるんやろう?それは君が説明しとることにもっと近いような感じで、これは全部マーケティング戦略みたいなもんや。
そうやな、そうならざるを得ないんや。Sam Altmanが言うことも、AnthropicのDario(Amodei)が言うことも、マーケティング戦略やからな。彼らみんな大金が必要やねん。トレーニングや推論の計算と容量を構築するためのお金が必要で、そこに到達するため、そして「そこ」が何であれ、彼らみんなが「そこ」のバージョンを持っとるけど、AIが今やっとることよりずっと多くのことをしてくれるってことについては合意しとると思う。
興味深いやろうし、Metaについての会話を続けよう。なぜなら彼らが出した発表の一部で、実際俺の心が沈んだ部分があるんや。めちゃくちゃ失望した、そんなに驚きはしなかったけど、これを読んでから君の考えを聞かせてや。
「とはいえ、超知能は新たな安全性の懸念を提起するやろう。これらのリスクを軽減することについて厳格である必要があるし、何をオープンソースにするか、何をオープンソースにするかについて慎重でなければならない。」俺はMetaのオープンソースの取り組みの大きな支持者やったから、これを読んだ時は本当に悲しかった。俺たちがオープンソース競争を中国に譲ってしまうような気がしたんや。
そこで止めとくわ。ヒートン、これを読んだ時どう思った?
君が怖がったほど俺は怖くなかった。その理由は、俺の視点では、これらの企業は事業やから、まず自分たちにとって最善やと信じることをするやろうっていう視点が続いとるからや。OpenAIでさえ事業になろうとしなかったって言おう。でも何やと思う?彼らも事業や。
そして彼らはSam Altmanとクルーが開発・変更しようとしとる企業構造の変更で、もっと事業になろうとしとる。訴訟や懸念、ElonやMicrosoftからの「いや、俺たちはこの構造が好きや。構造を変えるな。構造を変えたら」っていう話、そしてOpenAIがGoogleと提携するっていう話もある。
だから俺にとっては、これにはいろんなレベル、層、視点があるんや。君が言っとることの一部は、超地政学的な関連のものやけど、ある意味ではMetaがLlamaで猫を袋から出したんや。Llamaなしに、今日存在しとるこれらのモデルや研究所のうち、どれくらいが存在せんかったやろうか?
それは本当に大きな質問やろ?だからそう考えると、「俺は君らに何かをあげた、それは俺たちの選択やった。Metaとして世界にこれを与えるのは俺たちの選択やった」って感じや。Llamaについての投稿を読んでも、ここで言われとることと超違うことは言ってない。
だから俺の意見では、これは単なるヘッジで、彼らがオープンソース側で貢献し続けないことについてはそんなに心配してない。それが俺の現在の考えや。とはいえ、彼らが全てをオープンソースにするって言ってるわけやないのは言うまでもない。その声明は明らかにそうやないことを示唆しとる。
でもみんな、自分たちがやっとることのかなりの部分をオープンソースにせなあかんと思う。OpenAIでさえ何かをオープンソースにするって言っとる。以前にWhisperをオープンソースにしたしな。
でもみんなこれを所有したいんや。これは次の大きなもんやし、VRについての君の指摘に話を戻したいんやけど、俺の理解と信念では、VR投資はMetaがプラットフォームを持ってないからやった。彼らはAppleや、ある程度はAndroidに振り回される、上に乗っかる製品とサービスやった。だから俺は、彼らがそれを追求してデバイスを出そうとし続けると思う。
そしてAIで、実際にそのAR、VR、全てのビジネスが時間と共に非常に違ったものになると思う。
つまり、彼らはそれにハードに取り組んどるってことやろ、なぜなら彼が眼鏡についてずっと話しとるから、AI眼鏡についてな。これは過去数年間の二つの主要投資、彼らのビジネスがこの一つの製品に収束する感じや。
彼が二つの側面からアプローチしとるって聞いたことがある。一つは、AIを搭載できる最もシンプルな眼鏡は何か?着用できて、君の眼鏡のように見えるもの。そして反対側では、毎日一日中は着用しない、最も技術的に有能なハードウェアは何か?そして彼らはこの二つの製品で中間に向かって進んどるって感じや。だから興味深いやろうな。
今、君が言ったことについて話したいんや。最終的には彼らは事業やって言ったやろ、明らかに。取締役会に、株主に責任がある。実際数週間前にAnthropicからストーリーがあって、CEOが基本的に、彼らはAnthropicでの道徳、道徳的コンパスが全てやって言ったのがリークされたんや。基本的に彼らは「実際俺たちは競争する必要がある。たくさんのお金を調達する必要があって、それはUAEからかもしれん」って感じやった。
だから最終的に、これらの人たちは超資本主義者で、勝つためなら何でもするんや。だからこそ彼らは、兆ドルではないにしても確実に数千億ドルの企業なんや。でも俺は失望した。アメリカがオープンソースAIに手を上げとる感じがしたんや。多くのアメリカの研究所が基本的にフロンティアをクローズドソースにして、モデルの前世代をオープンソースにするって感じで、Metaも少なくとも早期にそうするってコミュニケーションを取っとるように思える。
アメリカはAIに大きな投資をしとる。今のところ、俺たちはまだその側面でのイノベーションの中心地やけど、中国やかなり多くの他の国もこれを気にかけとる。
中国に行ったことはないけど、俺の友人の多くが定期的に行っとって、AIを日常的にどれだけ実際に使っとるかって点で全く違う世界やって言うとる。特に政府はな。多くの監視AI、だろ?だから彼らがすでに持っとる特定の技術は俺たちアメリカより良いかもしれん、そういうもののいくつかについて。なぜなら持っとるデータが多いほど、その監視データ、動画、写真などが多いほど、AIを訓練できるからや。
だから俺が思うのは、俺たちがオープンソースが勝つための競争として話し続けとることの一部は、実際にはデータ、コンテキスト、ラベリング、こういうもの全てが、AIがまだ発展しとる間は、より興味深く有用な空間かもしれんってことや。俺たちがラベリングのようなポイントに到達するまで。例えば、コードのラベリング。
コードのラベリングは非常に興味深いもので、その理由の一つは、彼らがScale AIにあれほど多くのお金を費やした理由の一つやからや。他の研究所が何をしとるかを見ることができて、みんながどこにいるかを理解できた。そして今、彼らはAlexanderや他の人たち、NAT、そして正直に言って、どう思おうが、Alexanderの管理スタイルやNATについて何かあろうが、それは問題やない。問題は、彼らが人々をまとめとるってことや。それはアメリカ企業やし、彼らはすでにオープンソースのものを持っとる。
実際、Metaが出したより興味深いオープンソースのものは、俺の考えではLlamaでさえないんや。実際には、動画や画像のオブジェクトを識別する技術や。それがMetaとは関係のないツールにどれだけの影響を与えたかは信じられへん。
だから物事は発展しとると思うし、どの国もここで大きな投資をしとる。文脈、データ、ラベリング、トレーニングに関連する全ての投資が、俺が掘り下げたい場所やと思う。
Metaが長年にわたって行ってきた人工知能以外のオープンソース貢献の全てについて、十分な評価を得てないと思う。だから君の言う通りや。でも少し矛盾しとるように思える。アメリカ政府、アメリカ政府が基本的にオープンソースがいかに重要かっていう強いナレーティブを推し進めとって、ほぼ同じ週に、世界でオープンソースを推し進める第一の企業、Metaがそれをちょっと撤回しとる。
そして今、中国対アメリカのAI競争やと仮定しよう、そんな感じやから。実際の競争はオープンソース対クローズドソースのような気がするんや。中国は素晴らしいオープンソースモデルをリリースしとって、後で番組で見る予定やけど、世界のトップ10モデルに到達しとる。世界のトップ10モデルのうち3つが今オープンソースやと思う。
オープン対クローズド競争、中国対アメリカ競争についてどう思う?賭けをしたい?明らかに君も俺と同様にアメリカにいるから、君の考えは?
賭けはせんけど、頭に浮かんだ一つのことに光を当てたいんや。非常に興味深い方向に向かう可能性があるけど、それかもしれんが、こういうことや。
その声明が実は戦術やったらどうやろう?その声明が戦術やったとしたら、誰のために設計された声明やろうか?それはおそらくアメリカ政府のために設計されたものやろう。基本的にその声明を翻訳すると、一つの視点では、「俺たちがやっとるオープンソースのことを続けるためには、お前らが俺たちにインセンティブを与えなあかん」ってことや。
考えてみろ、Metaは俺が最後にチェックした限りでは、あのAI発表には入ってない。でも何やと思う?OpenAIには補助金のような補助金がある。なんでMetaやったらそれを欲しがらへんのや?彼らのバランスシートを見てみろ。たくさん使っとる。何十億も使っとる。そして彼らはアメリカで何十億も使っとる。
だからそこからのレバレッジがどこにあるんやろ?だから君はMark Zuckerbergと彼のチームを地球上で最高の戦略家の何人かとして考えなあかん。そう言える他のチームもいくつかあるけど、彼らはMetaのサイズやない。
だからそう考えると、すべての行は、ここで実際に何が起こっとるか、なぜ彼らがそれを言っとるかを理解するために、複数の視点で受け取られるべきや。だから俺の恐怖は非常に低いんや。なぜなら彼が話しかけとる相手について理解する翻訳があるからや。その一部は俺たち消費者、その一部は俺たちビルダー、その一部は市場、その一部は彼が雇おうとしとる研究者たちやけど、大きな部分はアメリカ政府、アメリカ政府やと思う。
俺は陰謀が好きや、ヒートン。
これは陰謀やない。これは戦略や。俺は陰謀論者やないで?これは純粋に戦略やと思うけど、その言葉はいただくわ。
今チャットを読んどるんやけど、たくさんの人が君に同意しとる。だからそれは本当に良いポイントやな。
明らかに、俺たちは地球上で最も賢い人々について話しとる。彼らは勝つために外に出とる。冷酷や。勝つためなら何でもする。だからそれは全部プレイや。全部戦略や。同意するわ。
仕事の未来と技術の変化
話題を変えたいんや。これは君がたくさん考えたことがあると知っとる、仕事の未来についてや。AIが良くなり続ける中で、外の多くの人が自動化されることを恐れとる。俺は未来についてずっと楽観的な見方をする傾向がある。みんながずっと生産的になって、今よりも自分の時間で何をするかを選択できるようになると信じとる。
これの歴史的例がたくさんある。でも人々がより快適で楽観的になることを期待して、これについて話し続けたいんや。まず聞きたいんやけど、君はどのグループに入る?未来について悲観的やと思う?Anthropic CEOのDarioが言うたような「ホワイトカラーの大虐殺」があると思う?それとも人間一人当たりの超生産性で、俺たちがもっと自由時間を持つことになると思う?どのバケツに入るか、その中間のどこかで、なぜそう思うか?
俺がこのような変化の可能性について考える時、それは実際にはかなり稀やけど、俺たち二人とも今日存在する俺たちがアクセスできる技術の多くが存在する前に生きとったやろ?俺が子供の時は、他にすることがないから近所を自転車で走り回ることがよくあった。他に説明がないから、ポケットに電話を持ってなかったんや。
だから技術について考える時、俺の視点はいつも、俺は8歳の時からコンピューターを持っとった。昨日で44歳になったから36年間コンピューターと一緒や。ありがとう。36年間コンピューターと。だから俺はこれをまた別のシフトやと思うだけで、人々を非常に怖がらせる人もいれば、非常に楽観的にさせる人もいる。
少なくとも俺の経験について話すことができるのは、俺は3000人以上の会社で働いとるんや。これは俺の人生で初めての仕事や。その前は、スタートアップの創設者だけやった。そして俺が見るのは、大多数の人々がそれがどう彼らを助けることができるかについて非常に興奮しとるけど、それが実際にどう彼らを助けることができるかをまだ理解してないってことや。
だから俺の意見では起こることは、それを理解しとる人々が乗り物に乗る必要がある人々に教えることになるやろう。そして最終的には、そこに到達したくない少数の人々がいるかもしれん。君は彼らをエリートと呼んでもいいし、何でも使いたい言葉を使ってもいい。俺はそれをするためにここにいるわけやない。
でも常にそう感じるほど立ち往生しとる、または俺たち楽観主義者が見ると、彼らは立ち往生してると感じとるけど、おそらく何らかの妥協をする必要があるか、これに乗る必要があるかに関係なく、彼らのために生活を切り開くことができる人口がいつもある。それはコンピューターと同じや。今はみんなコンピューターを使っとる。ポケットにも持っとる。
これは俺にとってはそれより大きいけど、技術が社会全体にどう拡散されるかと何も違わへん。だから人々がAnthropicのCEOや外の他の人々のようにドラマチックになる時、俺はいつも考えようとするんや、彼らが働いとることに基づく彼らの意図は何か、彼らの知識よりもな。そしてそう考え始めると、彼らが走っとるビジネスと彼らが稼ぎたいお金と彼らが持っとるかもしれんビジョンのせいでバイアスかかっとるから、彼らから良い部分を取るんや。いいわ。でも俺は、地上では、俺が見るのはみんながお互いにAIを使うのを助けようとしとるってことやし、それが真実や。
だから特定の市場のポケットや何かが圧縮され始めて、人々が「それは俺の仕事を奪っとる」とかになると、彼らは拡散して他のことをするし、レベルアップする方法を学ぶし、物事はシフトするんや。でも俺が共有したい一つのことは、俺の先端的な不足、より良い言葉がないから、君と俺が間違いなく話して一致しとることやと思うけど、人間を管理することからAIを管理することに移行するだけで、みんながこれまでできなかった方法でマネージャーになるんや。それは良いことやと思う。
ヒートンと俺は同意するわ。君が押し返そうとする一つのポイントは、これが単なる別のシフトやってことや。時々、これは俺が未来について非常に楽観的やっていうレンズを通してやけど、これはより大きなシフトでより速いシフト、俺たちがこれまで見たことがないより速いこの技術の拡散のように感じる。
人々の日常、個人的なものと仕事の両方でかなり劇的な混乱があるやろう。だからこれは最後のシフトのような気がするんや。それを言うのは少し躊躇するけど、これらの完全に異なる変革的技術の一つのような気がするんや。
俺はそれが社会にとって変革的やと信じとるし、俺たちは生きとる誰もが理解しとる可能性の代理を間違いなく持ってない。だからそれも考えなあかんことや。俺は過去100年間、1900年代以前のように、たくさんの異なることについてこんな風に感じた人々がいたと確信しとる。
何世代にもわたって。だから再び、俺は実際に君と完全に同意するんや、これが違うと感じるだけやなくて、それが違う側面がたくさんあるけど、ChatGPTを使おうとすると幻覚を起こすんや。
君が言ったもう一つのことを実際に少し掘り下げたいんや。君と接しとる大多数の人々が本当に興奮しとるって言ったか?それを正しく聞いたか?彼らは楽観的で、それを理解しようとしとる。
興奮しとるとは言いたくないけど、みんな理解しようとしとるとは言いたい。俺と話すみんなとそれを強く信じとる。
俺が気づいたのは、業界の人々と話す時、かなりバイナリーやけど、楽観的に大きく偏っとるってことや。「そう、これは信じられへんことになる」か「うわー、俺たちは大きな問題を抱えることになる」のどちらかや。俺たちの小さなバブルの外では、それについて知識がないか、非常に神経質な多くの人と話すんや。
自動化されることを本当に心配しとるわけやないけど、神経質で、どう始めたらいいかわからへん。だから俺もそれを見とる。俺は必ずしも俺たちの業界の外でハードコアな悲観主義を見るわけやない。ちなみに、若い世代でもっとそれを見ることがある。
でも全体的には、それはそれなりに楽観的やけど、多くの人がまだ非常に神経質やと思う。
俺の反応は、それは期待されることやないかってことや。俺たちは変化が苦手やけど、変化は俺たちの周りでいつも起こっとる。そしてこれは君が一年中このことを考えることができるようなもんや。AIで何が起こるかを考えて、24時間365日それをやっても、AIで何が起こる可能性があるかを考え終わらへんやろ?それは何が起こる可能性があるかがたくさんあるそういうもののうちの一つや。そして俺たちはコンピューターでも同じことが起こったことを評価せなあかん。どんどん良くなって、良くなって、良くなって、良くなって、時計にコンピューターを持つまでになったんや。
そして再び、AIがこれらと同じか違うか小さいかを言おうとしとるわけやない。いや、それはあらゆるものに浸透するからずっと大きいんや。コンピューターは最初はそうやなかったけど、今は俺たちのポケットに一つある。あらゆるものに浸透したんや。だから俺はこれについて考え続けるだけで、君のポイントに対して、テックの人々は彼らがそれを理解しとると感じるか、それが彼らの仕事やと感じるか、SF小説を読みすぎるかで、非常にセンセーショナルになる傾向があると思う。わからん。
でも世界に出ると、例えば俺が知っとる最大の花崗岩砂利会社の一つを経営しとる紳士がいる。彼らは年間10億ドルくらい稼いどる。彼はChatGPTを使って友達に個人的な詩を書けることにめちゃくちゃ興奮して、70歳の誕生日か何かに60編くらい書いたんや。
俺はそれを見て読んで、「そうや、70%は良くて30%はスロップやけど、それでいいんや」って思う。これまでできなかったことができるって感じて、めちゃくちゃ興奮させたんや。これはかなり年配の実業家で、テック業界にいるわけやない。そしてそういうことを聞くと、俺たちはこの技術で何をするかわからへんって感じるんや。テック業界では、俺たちがみんなの答えを持っとると思う傾向があるけど、実際は持ってないんや。
教育と子育てへのAI影響
それは本当に良いポイントやと思う、俺たちがこの技術を発明しとるけど、実際にどう使われるかはわからんってことは。長年にわたってそれの100万の違うアナロジーがあると思う。インターネットでも、俺たちは雑誌や新聞をウェブにぽんと載せるだけやと思っとったけど、違った。全然違うもんやった。
話題を変えたいんやけど、同じトピックから少し。君は親やし、俺も親や。俺は未来の教育について考えとる。俺は自分の子供たちの教育について常に考えとる。人工知能でこの数年間に起こったことに基づいて、君が子供たちに教えたいスキルや何が変わったか、彼らの学校教育がどんな風に見えるか、将来成功するために必要なスキルについての君のビジョンが3年前とは違ったか、考えとるんや。
俺は非常に奇妙な育ち方をしたんや、何をすべきかを言われたことがないって意味で。トラブルに巻き込まれたら、俺に最初に電話しろって言われただけや。俺の父は俺がトラブルに巻き込まれた時の最初の電話やなかったけど、それが彼の望みやった。午前2時にスピード違反の切符を切られた時、「父さん、スピード違反の切符をもらった」って電話するような感じや。
だから俺は、俺の父は医師やけど、4歳の時から君は創設者になるべきで、誰のためにも働いたらあかんって言われた場所から来とる。だからこれが42歳で人生初の仕事な理由や。
本当に?それは非常に興味深い。
だから俺のこれに対する視点は、AI以前でもすでに超偏っとるんや、これが重要やけど、批判的思考、自己認識、真実を求めること、学校ではもう教えてくれへんこれらの基本的なことや。もう教えてくれへんって言うのは、俺が持っとった先生たちは俺にその一部を教えてくれたけど、俺の父は言葉を発するよりも彼を観察することでもっと多くを教えてくれたからや。
だから俺にとって、ここで興奮することがある。個人的なことを簡単に話そう。これがあるやろ?クロシェのようなもので、多肉植物のように見える。これは昨日の俺のお気に入りや。俺の娘がこれをくれたんや。実際にはこれらは小さなコースターや。でも植物のように見える。彼女は俺が植物が好きやって知っとるんや。この前、ミントチョコレートミントの植物を手に入れた。今住んどる新しい家での最初の植物や。
そして彼女がこういうことを続ける限り、それは超クリエイティブや。「彼は植物が好きや。彼にはこれらのコースターが必要や」っていう批判的思考がたくさん必要やった。彼女はおそらく俺の部屋に来て、コースターがなくて机に円の跡があるのを見たんやろう。
俺がそれを共有しとるのは、子供として、または親として、俺は彼らの創造性を見たいだけやからや。批判的に考えることができるのを見たい。自己認識を持っとることを確認したい、真実を求めるってことを。だから俺は、彼らがそれを欲しがる方法でそれを提供する機会を得るたびに、俺が彼らに欲しいと思う方法やなくて、そんな感じや。それが俺たちにできることの全てや。
そしてAIは、俺がコンピューターと一緒に育つことができたように、彼らが一緒に育つそのような素晴らしい技術や。最終的にはそれは電話やった。いや、電話と一緒に育ったわけやない。電話とは言いたくなかった。くそっ。彼らは電話と一緒に育った。そして俺は最初のiPadが出た時に俺の息子が1歳くらいの時の写真をまだ持っとる。彼はiPadを小さな手で持っとった。見とったわけやない、心配するな、見てなかったけど、持っとったんや。俺にとっては、技術は俺たちを興奮させるべきで、それが俺たちを怖がらせるなら、俺たちは真実を求めて、それを管理する必要がある。それが俺がそれについて考える方法や。俺は子供たちにそれを教えたいんや。
君が言ったほとんど全てに同意するわ。創造性の部分が本当に興味深いと思うのは、人工知能が信じられへん作品を作ることができて、誰でもそれができる世界では、ノイズ対シグナル比が偏ってくるやろうし、ある時点でテイストが信じられへんほど価値のある人格特性、個人的なものやないかもしれんが、持つべき特性になるやろうってことや。だから人生の早い段階でその創造性を育むことは、人生の後でグレートテイストを持つ素晴らしい方法のようや。
俺も同意する、好奇心、粘り強さ、創造性、これらは俺も自分の子供たちのために考えとるスキルや。そしてそれに関連して、創設者について話そう。君は複数回の創設者や。多くの創設者に投資して、長い間エコシステムにいる。この数年間で何が変わったのを見たか?人工知能がソフトウェアのあらゆる側面を完全に支配する中で、初期段階の創設者への君のアドバイスはどう変わったか?
俺の義理の兄弟と俺は一緒に会社を始めたんや。彼は、いくつかの概念について行ったり来たりして、この前俺に電話してきた。通常、俺が彼よりもちょっとテック寄りやから、ベイエリアにいて、そういうこともあって、テックの何かについて俺の意見を聞きたい時に電話してくる。彼が俺に質問しとったんや。彼が彼なりの方法で質問して、俺が知っとるいくつかの会社や事柄についてのデータを得たがった後、俺は彼に人生で初めて言ったことがない言葉を言ったんや、彼は普通これを自分でやるから。「おい、考えるのやめろ。ただ行け、ただ行け、ただ構築しろ。ただそのことをしろ。考えるのやめろ。そう、君の言う通りや。君が俺から聞きたいことは何でも、俺からイエスを聞くやろう。ただそれをしてくれるか?君のためになるから、ただそれをしろ。今すぐそれをしてくれるか?」
そして5分後に俺は自分の薬を飲まされた。何やったかは言えんけど、彼は「君もそれをすべきや」って感じやった。俺は「そうや、わかった。くそっ」って感じやった。
とにかく、最近創設者と話す時、これは過去とは違うし、ニュアンスはあるけど、それほどでもないんやけど、俺は彼らにより大きな緊急感を感じてほしいだけや。彼らにとって文脈的に関連のある分野でその電話でそれができるなら、俺は喜んでや。
今日はそれまでのように感じへんかった。以前は明確さやった。何をしとるか知っとるか?顧客を知っとるか?そういうことに入っていった。それらはまだ重要やけど、今はパラダイム全体が反転したような感じや。
俺は、人々が何を必要としとるかを学んで、それからそれらのニーズに対して発明できる最高のソリューションを見つける世界から来とる。今日俺たちがいる世界は、実際には何でもいいから何かを速く構築して、それから次の部分をするんや。そしてそれはほとんどの人が構築に慣れとる方法やないと思う、彼らは出荷する必要があるってことや。
出荷して学ぶ必要があって、学んでから出荷するんやない。
Googleの発表を見たか?誰が書いたか忘れたけど、基本的にGoogleで今文化的シフトが起こっとるって言ったんや。プロトタイピングに移行しとる。書くことファーストの文化から構築することファーストの文化に移行しとるんや。以前は、彼らは全ての考えを書いて、それを回覧して、みんなの同意を得とったけど、今は「いや、ただそれを構築しろ」って感じや。
Aaron LevieもBoxのCEOとして同じことを言っとる。ただそれを構築しろ、作ったものを見せろ、そしてそれを素早く繰り返そうって。だから君がここで説明しとることを正確に反映しとるようや。
俺たちの最高の人たちは、文書があろうがなかろうが、いつもそれをやってた。君が話しとる二つの公開企業について、一つは非常に巨大で、もう一つはそれほど巨大やなくて、正直に言うと苦戦しとるかもしれんが、同じことを言っとる。でも俺たちスタートアップの人たちは、それがスピードについてで、現実と接触する何か本当のものに到達することについてやってずっと知っとった。
これらの人たちがそれを言っとることについて考えると、ZIRPがこれらの会社にどう影響したか、彼らの製品チームがどれだけ肥大化しとるかとかを考えると、俺が言いたいのは、彼らは俺たちスタートアップよりもずっと肥大化したプロセスを持っとったってことを割り引きたいんや。
だから俺の視点はさらに極端やねん。プロトタイピングについてでもない。愛されるものについてでもない。どうやってするかは気にせん、でも君はシップして学ぶ必要がある。これらの人たちがそれについて話す時に欠けとる部分は、彼らがツールやラブルやボルトや突然PMたちがプロトタイピングすることについて話しとるからや。俺はPMとして何もプロトタイプしたことがない。俺は今PMやけど、PMとして何もプロトタイプする予定もない。なぜなら俺がいつも動作してきた方法は、スピードと緊急性やからや。
俺がしようとしとることの全ては、エンジニアをブロック解除して、彼らが出荷できるようにすることや。そして今、彼らはずっと速く、ずっと多く出荷できる。だから俺は彼らをもっとブロック解除せなあかん。彼らをブロック解除することがプロトタイプを作ることを意味するなら、素晴らしい。俺は喜んでそれをする。
でも俺たちは、数個のプロンプトでどれだけのことができるかっていう興奮の中で、いろんなことを一緒にこんがらがらせとると思う。
面白いな。ヒートン、今日参加してくれてありがとう。いつものように楽しかった。ヒートンをチェックしたかったら、彼のTwitterは@HNSShaw、HNSShawや。ちなみに彼のYouTube、このことについて直接メッセージしたんやけど、君が動画に込める品質と制作価値は本当に素晴らしい。だからHeaton Showをチェックしてや。ヒートン、本当にありがとう。
俺はいつもそう言われるとお世辞を言われて赤面するのが見えるやろ、なぜなら君が作ることができたものを俺はめちゃくちゃ高く評価しとるし、それが何もやなかった時から知っとるからや。君がこれを始める前にずっと前に話したやんか。だから君にも同じことが言える。君が構築できたものと君が共有しとること、俺たち全員が学ぶのを助けてくれとることは、超印象的や。俺をここで最初のゲストとして迎えてくれて本当に感謝しとる。ありがとう。
ありがとう。会えて良かった。君のリンク全部チャットに入れとくから、チェックしてや。また後でな、ヒートン。バイバイ。
Figureロボットとテック界のトレンド
素晴らしかった。今度は今週のニュースをいくつか見ていこう。Twitterからの面白いもの。アレックス、最初に洗濯をしとるロボットを出してくれるかな。
Figure RoboticsのCEOであるBrett Adcockが、Figureロボットを家に持って帰って、洗濯をしとる動画を投稿した。これは本当に夢のビジョンやな。これを見た時、俺は完全に驚いた。器用さを見てや。彼の子供たちが背景にいる。全く恐れてない。
ちなみに、Figureは俺の意見では最もかっこいい見た目のロボットの一つやけど、本当に信じられへん。コメントでこれに驚いとる人たちを見とるわ。俺もや。俺もこれの一つが欲しい。俺は今、ヒューマノイドロボットを手に入れようとしとるんや。中国製で本当に良さそうなのがいくつかあるけど、もしこのFigureロボットの一つを買えるなら、絶対に買うやろうな。
君らに質問させてもらうわ。皿洗いか洗濯か?このロボットに家庭でどっちをしてもらいたい?俺にとっては皿洗いや。洗濯はそんなに気にならんけど、このヒューマノイドロボットが俺の家にいて、家事を手伝ってくれるのは、本当に夢のシナリオや。多くの人がこの種の結果を恐れとるのは知っとるし、俺の妻も含めてやけど、俺の心では興奮しとる。それが俺の楽観主義者やからな。
ChatGPT会話のGoogle検索インデックス問題
次の話に移ろう。ChatGPTの会話がGoogleでインデックスされとる。これは今週かなりバズった。ChatGPTの会話がデフォルトでインデックスされとった、シークレットモードみたいなのを使わへん限りはな。多くのユーザーがプライベートやと思っとった会話がGoogle検索に表示されとったんや。
WaveFnxからの情報や。「複数のChatGPT会話が検索エンジンでインデックスされとるのは、共有する時に公開で発見可能にするオプションがあるからや。機能として全く意味をなさへんから、多分削除されるやろう。」そしてそうなった。次のを出してくれるかな。
これはOpenAIのDaneやと思う。最高情報セキュリティ責任者や。「ChatGPTアプリから、ユーザーが会話をGoogleなどの検索エンジンで発見可能にする機能を削除した。有用な会話を人々に発見してもらうための短期間の実験やった。」
それは良いユースケースやけど、もっと積極的であるべきやった。デフォルトでオンになっとるんやなくて、オプトインせなあかんはずや。実際にデフォルトでオンになっとったかは100%確実やないけど、多くの人が十分に混乱して、ただオンにして会話をインデックスされとったみたいや。
だから本当に強力なプロンプトとユースケースのライブラリを見たいと思う。うまくいけば彼らがそれを追加してくれるやろう。「最終的に、この機能は人々が意図せずに共有してしまう機会を多すぎる形で導入したと思う。」
俺が思うのは、パブリックリンクを作る時、俺はいつもやっとるんやけど他の人とリンクを共有するために、それがクローラブルになるってことやと思う。
OpenAI研究者による新しい思考方法の開発
次に、OpenAIの主任科学者と技術フェローが、モデルが新しい思考方法を開発することについて議論しとる会話がある。このクリップを再生して、それについて話そう。
「GPT-4の思考方法はかなり違うんや。その脳の働き方は人間の脳の働き方とはかなり違う。だから俺たちは彼らに独自の思考方法を教えるっていうゴールを追求しとって、時間がかかった。多くのバグ修正が必要やった。そして何人かのOpenAIの研究者からの洞察が必要やったし、最終的に俺たちはそれが機能し始めるポイントに到達して、実際にこれらのモデルが独自の思考方法を考え出すのを見始めたんや。まだ英語やったし、俺たちには読めるものやったけど、始めた場所とは違っとった。それは俺たちにとって大きな瞬間やった。」
ここでいくつかのことがある。彼が言っとるのは、これらのモデルが人間の思考とは違う思考を発達させる異なる方法があるってことや。面白いコンセプトやと思うけど、実際には初めてやない。Anthropicが数ヶ月前に論文を出して、アレックス、それを出してくれるかな、これらのモデルの思考連鎖と内部思考の多くが、俺たちが思っとった方法や人間の思考方法とは実際に非常に違うことを示したんや。
彼らは、自然言語やないモデル内の内部思考連鎖のようなものがあることを証明した。いくつかの方法でそれを証明したんや。ジェイルブレイキングに対する反応の方法は、俺たちが思っとったのとは違うようや。でも本当にこれらのモデルが知能を発達させる最良の方法は、人間が知能を発達させる方法とは違うようや。両方向に議論が見える。
でもそう言う理由は、AlphaGoの37手目のせいや。これらのモデルが独自の思考方法を発達させることを許可すると、この場合AlphaGoの37手目のようになる。知らん人のために、AlphaGoは囲碁を本当に上手にプレイするためだけに強化学習で訓練されたモデルや。世界最高の囲碁プレイヤーを破った。そしてこの37手目を打った。
これは今では非常に有名で、なぜならライブでその手を打った時、実況者や番組を見て解説しとった人たちが困惑したからや。ミスやと思ったんやけど、結局ゲーム終了時の最終的な勝利にとって非常に重要な手になったんや。
だからこれは、これらのモデルを独自に思考させる必要があるってことを示しとる。プレイグラウンドを与えて、開発環境を与えて、計算資源を与えて、自由にさせるんや。可能な時に人間をループから外し、人間のデータをループから外すことが、アプローチのようで、おそらく彼がそこで説明しとることや。
AIインフラ構築の爆発的成長
最後にカバーしたい話は、トップ企業間で続くインフラ構築や。Christopher Mimsによると、AIインフラ構築は非常に巨大で、過去6ヶ月間で、すべての個人消費よりもアメリカ経済の成長により多く貢献した、インフラ構築だけでな。成長曲線を見てや。
2018年から2019年は平坦、19年から20年も平坦やった。そして突然21年に大きな構築が始まる。でも23年から24年、24年から25年、そして今25年に、俺たちは巨大な増加を見とる。
Magnificent 7、世界のトップ7テック企業で、本当にFortune 500の時価総額の大部分を占めとるんやけど、過去3ヶ月だけでデータセンターなどに1000億ドル以上を費やした。アレックス、少し下にスクロールしてくれるかな。
インフラは狂ったように続いとる。ここにある。GDP比でのAIインフラへの支出は、ドットコムブームからの通信・インターネットインフラへの支出をすでに超えとって、まだ成長しとる、感覚を与えるためにな。
だから俺たちは人材戦争について話す話をカバーした。これらの企業の大規模な資金調達、さらに大規模な評価額での大規模ラウンド調達について話したし、彼らはインフラ構築にも同じくらい投資しとる。この一部になるのは非常に興味深い時代や。ここには非常に多くのお金があって、多くのユースケースが本当に成功して投資家に資本を返しとるのを見てきたけど、大部分はまだそのリターンを待っとる。
John D. Rockefeller、Andrew Carnegie、JP Morganの過ぎ去った時代との完璧すぎる類似として、今日の電力に飢えたデータセンターの一部は、エネルギー源への近さのために、実際に元製鉄所の場所に置かれとる。
だからエネルギーが必要で、計算が必要で、それは絶対に狂った成長を見とることや。
ちょっと待ってくれ、みんな。
これらが話や。コメントを残してや。考えを聞かせて。Yuki Aromoは同意せん。「俺たちにはもっとベースのオープンソースモデルだけが必要や。」同意するわ。中国はオープンソースモデルで絶対に圧倒しとる。今週リリースされた多くのオープンソースモデルを見ていく予定や。
Polygonは「効率の大幅な増加に対して、得られた利益は社会に分配されてない」って言っとる。Murrayも同じことを言っとる。「それは巨大な利益が少数の手に落ちるからや。」
俺は基本的により楽観的やけどな。明らかに短期的にはそれを見とるけど、長期的には、これらの利益の多くと、本当に人工知能の恩恵が、みんなに拡散されるのを見ることになると信じとる。俺はそれに希望を持っとるし、それが実際に俺の会社Forward Futureのミッション、俺たちが動画でやっとること、教育コンテンツでやっとることや。それがポイントや。
ゲスト登壇:Shortcut開発者ニコ・クリスティとの対談
次のゲストをすぐに迎えよう。ニコと話すのがめちゃくちゃ楽しみやねん。これはNico Christie、Fundamental Research Labsの創設者や。彼の新製品Shortcutのデモ動画を見たことがあるかもしれん。絶対にバズっとる。Xで何百万ビューもされとる。本当に信じられへん製品や。彼と話すのが楽しみや。スプレッドシートをAIネイティブに再発明しとるんや。ニコ、番組へようこそ。
やあ、ここにいるのが興奮するわ。実際に技術的になれる観客と一緒にいることにも興奮しとる。
絶対や。見とる人たちは間違いなく技術的やから、自由にそれについて話してくれ。今日はいくつか話したいことがある。今週初めに話した時、OS Worldで最先端の結果を達成した初期の仕事について話してくれた。
実際にその瞬間、君がそれについて話してくれた時、「あ、OS Worldをカバーしたことがあると思う」って思ったんや。実際にやっとった。多分この時点で1年以上前の動画があった。でも君自身、君の会社、何をやっとるか、そしてOS Worldでエージェントをビルドしとった初期の日々について少し話してくれ。OS Worldって何や?
OS Worldはコンピューター使用タスクで最も困難なベンチマークや。Excel、PowerPoint、メール、ウェブ検索、動画編集、写真編集、なんでも分割される。
でも少し戻ろう。約18ヶ月前、俺と共同創設者たちはMITでの研究室を閉じた。俺の共同創設者は元教授で、計算神経科学の教授で、EECSとBCS部門にいた。彼の人生の夢は、狂気的に聞こえるかもしれんが、脳を構築すること、実際にはデジタル人間を構築することや。俺たちはそれに挑戦することにした。
神経科学では、知能を超えた多くの概念は汚い言葉やない。長期自律性、人間がするような協力、社会的感情体験、さらには意識などを考えてや。これらすべては存在し、モデル化可能や。実際に何十年もモデル化されてきたんや、ある程度の成功または失敗で。
俺たちが作ったデジタル人間の最初のバージョンは、君と一緒にゲームをプレイできる友達やった。MinecraftとRobloxをプレイした。彼らは最初の自律プレイヤーやった。それをデモして、何百万人のプレイヤーを得て、Andreessen、いくつかの大きなファンドから900万ドルを調達して、それから1000人を一緒にした。
俺はこれがAIの次の大きなパラダイムになると今でも思っとる、つまりランタイムスケーリング、エージェントが一人では他にできないことをするために協力することや。かなり前衛的で、セクシーやけど、まだ明らかに価値があるわけやない。今それが見え始めとると思う。
でもその後俺たちがやったのは、彼らにコンピューターへのアクセスを与えたらどうやろうってことやった。俺たちは彼らがすでに環境に依存しないことを望んでた。彼らはすでにDiscord、Slack、ツール、何でもにいた。そして俺たちがこれをやっとる時、AnthropicがClaude、Claude previewをリリースして、OS Worldで20%を達成した。俺たちは6週間これに集中して45%を達成した。
実際には5週間半や。どんな感じやったか、挑戦や、そのスプリントが何を含んでたかについて詳しく話すことができる。でもそこでもサブカテゴリがあって、サブカテゴリの一つはLibreOffice CalcまたはExcelで、香港大学の人間は62%やった。俺たちは68%を達成した。だから超人的なものに初めて近づいたんや。
その時点でもまだ十分良くないと感じた。環境を制約して、その時点で知っとることを考えて良いエージェントを構築するのに本当に何が必要かを学ぶ必要があった。だからShortcutを構築したんや、その主任エンジニアとして。
Shortcutについて話したいんやけど、君が言ったことで少し掘り下げたいことがある。意識はモデル化可能やって言った。それを説明してくれるかな?人々がいつも俺に聞いてくることや。意識が何かを本当に説明する方法がわからんし、それがモデル化可能かどうかも。何を意味したか教えてくれ。
本当に引っ張ってくるべきは俺の共同創設者のRobertや、廊下の向こうにいる。意識について、モデル化できない理由についてのナンセンスな議論がたくさんあるんや。その中のほとんどは、君が触れようとしとる名状しがたいものに触れとるんやけど、それを説明できへんかったら、どうやってモデル化できるんやってことや。
でも実際には、これをモデル化するのがどんな感じかについて、実際に何世紀にもわたる研究がある。最初のニューラルネットワークモデルは実際に金属を使って潜水艦でパーセプトロンを使ってモデル化されたんや。当然粗雑やったけど、原理的にはモデル化されなければならないもので、なぜならそれは絶対に存在するし、おそらく俺たちの種だけに限定されるものでもないからや。
だから、これらはAIでは汚い言葉やけど、神経科学では当たり前の話の一部や。解決されとるってわけやないけど、日常的な議論の一部や。
モデル化可能ってのは、もしも彼らがすべてのニューロンをモデル化できるなら、人間らしさがモデル化可能ってことかもしれん。6ヶ月、9ヶ月前にこれを見たかわからんけど、完全にエンドツーエンドでモデル化された虫があって、実際にモデルを虫の現実で動かすことができたんや。君はそれを見たか?そしてそれについてどう思った?ちなみに、俺はそれが素晴らしいと思った。
絶対に信じられへんかった。俺が本当に意味するのは、俺たちは自分自身を理解する能力、自分が誰で、世界のどこに位置し、周りの人々についての心の理論を持つ機械を持つべきやってことや。そしてそれが実際に人間を素晴らしくするものや、精神的または哲学的レベルだけやなくて、協力においてもな。
これらの一つは共感でさえある。なぜ俺は君がどう感じるかを気にするんや?種を破壊しないことや協力にとって実際に非常にネットポジティブや。これも実際にモデル化可能な接線の一つや。だから目標は必ずしもレプリカを構築することやないけど、非常にインスパイアされた機械を構築することで、これらの一つは確実に自己認識や。
Shortcut:AI搭載Excel革命
Shortcutについて話したいんや、なぜならそれを見ると、「当然、これは存在すべきもんや」って感じるもののうちの一つのようやから。Shortcutは君の会社Fundamental Research Labsからの新製品や。Shortcutが何で、なぜ構築したかの概要を教えてくれ。
Shortcutは超人的なExcelエージェントや。君のためにほぼ全てのExcel作業ができる。ExcelでやりたいことはほぼすべてShortcut内でできる、Excelのほぼ完璧なコピーでもある。できることよりもできないことを挙げる方が簡単や。
目標は、これまでに存在した最も重要なビジネスソフトウェアであるMicrosoft Excelを変えることや。実際に今年俺の誕生日に40歳の誕生日を迎える予定で、かなり劇的な変化の時期やと思う。
実際、Shortcutに組み込んだ機能のいくつかについて話してくれ、今Excelでは不可能なことについて。
デモを見ると、俺が提供する例のほとんどはエンドツーエンドのタスクや。今例えばコパイロットに「このセクションにチャートを作ってくれ」って聞くと、これらの単一および2ステップのアクションはできるけど、20分間の長期自律性エンドツーエンドの精度は持ってない。
リアルタイムで自己検証できるサブエージェントアーキテクチャも持ってない。エージェント構築でよく知られとることで、何らかの理由でMicrosoft側では達成されてないことがある。俺たちはフロンティアをスプレッドシートユーザーに持ってくるつもりや。
Fundamental Research、君らはエージェント構築の専門家や。エージェントでの君らの専門知識が、Excelタスクを非常に上手く達成できるエージェントを構築することを可能にしとるってことか?それが良い説明方法か?
その通りや。俺たちが思うような方法で本当にエージェントを構築できる会社は一握りしかない。これについて考える正しい方法は、西洋にはモデルがないけど、ByteDanceが良い考え方かもしれん。ByteDanceは統一された製品テーマすら持ってない。推薦エンジンっていう統一された技術テーマを持っとって、推薦できる機械を構築するためのもので、そこから全てのこれらのものが開花するかもしれん。
その一つがDouyinやろ?TikTokやImplyJokesのような。それがコア技術で、俺たちのコア技術に相当するのは、信じられへんほど強いエージェントを構築することや。これをやるプレイブックがあって、俺たちはShortcut、Fairies、OS World、Minecraft、Roblox、実際にはそれ以上の間で5回やった。俺たちはそれが非常に上手くなって、実際にシステム化しようとしとる。
秘密のソースを明らかに共有せずに、俺のチャンネルで作る動画の多くはエージェントについてや。俺の動画を見る人たちの多くは、エージェント構築が大好きや。超効果的なエージェント構築について人々に与えることができるトップのヒントはいくつかあるか?
素晴らしい質問や。全てはKarpathyが造語したと思うコンテキストエンジニアリングに帰結する。どうやって本当に公開するかってことや。多分彼やろな、彼はコイニングしとる。彼は全てをコイニングしとる。この人がどうやってるかわからん。俺たちがローンチした日に彼がDMしてきて、「使えるか?」って聞いてきた。俺は「ああ、俺たちのインフォがクラッシュしとる」って感じやった。「試してみて」って言った。彼はまだ返事をくれてるで。
彼はそれに才能がある。でもそれを持ち出す理由は、これらのLLMスピリットを本当に上手く扱えるなら、彼らができないことはそれほど多くないからや。君はただ彼らを扱う方法を知る必要がある。これらの例の一つはKBキャッシュヒット率や。
どれだけ上手くすべてをキャッシュしとるか?どれくらいの頻度でキャッシュを無効化しとるか?本当に長期自律性に取り組もうとする時、それは大きな挑戦や。でも何をしとるか知っとったら、20分間でも90%以上のキャッシュヒット率を達成できる。それがこれをスケーラブルにするんや。
コンピューターサイエンスで有名な言葉がある。「コンピューターサイエンスで最も困難な2つの問題は、キャッシュの無効化と命名や」ってやつやろ?そんなんがあるやろ?
命名や。俺たちはまだその部分は下手やけどな。キャッシュ無効化は今日でも狂ったコンピューターサイエンス問題や。特にエージェントでは、完全にコントロールしてないか、毎回出力が何になるかを正確に知らん場合、さらに困難になる。
人々はキャッシュについて考えるべきや。確実に。ツールについて考えろ。ここに確実にヒントがある。君は自分のソフトウェアを所有すべきや。何か美徳的なことができるからやない。本当にできる限り多くのマシンインターフェースをエージェントに公開したいからや。
君が何かを使ってるせいで制限されとるなら、例えばOpen PixelをAPIとして使うとしたら、今度は君のエージェントはそのAPIで書ける可能なコードしか書けへん。でも彼らが完璧なAPIを持っとったらどうやろう?そしてそれが俺が秘密のソースを共有せん場所や、なぜなら完璧なAPIを構築するのがどんな感じかを知っとるからや。
でもコード生成が今どこにあるかを考えると、多分君のエージェントが最も得意とすることをさせるべきや。OpenAIがOperatorで半分のタスクに対してやっとるように、GUIを使うべきやない。
面白いな。ちなみに、君は基本的にExcelの機能的なクローンを構築した。なぜそうすることにしたんや?それは巨大なタスクや。どれくらいかかったんや?なぜそうすることにしたんや?
それをする理由について本当に輝かしい知的理論があったって言いたいところやけど、俺にとっては明らかやったと思うんや。今では非常に正当化されたと感じる方法でやけど、俺はマウスに触れたら怒られるような人間やった。ソフトウェアエンジニアリングと研究に入る前に金融にいたんやけど、金融でマウスに触れたら怒られるんや。Excelは非常に深く根付いとる。
君がおそらくCursorを愛してるか、プログラマーであることについて愛し、アイデンティファイしとることがあるように、それが実際に10億人の人々がExcelについて感じることや。彼らが技術的であることを感じる唯一のもので、フォーミュラを知っとって、キーボードショートカットを知っとる。
それは俺たちの文化の精神の非常に大きな部分や。ほぼ同じに感じるものを与えずに、みんなをそれから移そうとしたら、非常に多くの本能的な消化不良を得るやろう。でも俺はもしExcelの中と外にいることを決して知らへんって感じさせることができるなら、パフォーマンスの恩恵を得ることを喜んでやろうって明確やった。
それを感じた理由はCursorを見てくれ。CognitionはCursorと同時期か、さらに早く、デモを考える時によっては、ローンチした。でもCognitionはみんなを長期自律性エージェントのこの最終状態に連れて行こうとした。一方、Cursorは「俺に使っとる同じものを取らせてくれ、オープンソースのVS Codeやから文字通り簡単や。AIを投げ込んで、今では完璧な機能パリティを定義的に持っとって、より良いことをする。」
それが満たされるなら、なぜ戻る必要があるんや?だから俺がやりたかったのは、パリティから始めて、それからコパイロットが全くできないこと、Geminiができないこと、他の誰もできないことを君に与えることやった。そうしたら本当に戻らへんかもしれん。
限界で議論できるいくつかのことがあって、俺たちが解決し始めとる挑戦やけど、それが俺のフレームワークやった。だから俺が自分に与えた以上に洗練されてたかもしれん。
今全てがブラウザにあるんやけど、ネイティブなオペレーティングシステムアプリを構築することを考えとるか?
既にデスクトップアプリを持っとる。
失礼、わからんかった。
いや、いや、いや。ライブやない。内部的にや。
内部的にか。了解。
AIモデルの訓練と技術的アプローチ
次のことやけど、君らはエージェント構築の専門家やな。これのために独自のモデルも訓練する必要があったか?
そうや。ソースについて詳しく話すわ。俺たちはモデルを訓練しとるかなり大きな研究チームを持っとる。訓練って言うのは、君の才能と君のキャッシュの二つに制限されるんや。
だから俺たちはつい最近、ハードコアなポストトレーニングに入ったんや。AWSIでRLの元ヘッド、O1でRLの元ヘッド、AlibabaのQwenモデルの初期とかを持っとるってことや。だから俺たちは今世界クラスのポストトレーニングの筋肉を持っとって、積極的にポストトレーニングしとる。
俺たちは今、フロンティアモデルを使いたかったらフロンティアクローズドソースモデルを使わなあかんっていうバランスポイントにいる。本当に良いオープンソースモデルをポストトレーニングしたかったら、ある時点でそれらを交換することに快適さを感じる閾値に到達せなあかん。だから、より良い、より速い、より安いモデルが必要やから計画の一部やけど、俺はかなりモデルに依存しないアーキテクチャを持ちたいし、俺は内部顧客やから、Opus 4が神の恵みやと感じたら、それを使うわ。
スピードはExcelのヘビーパワーユーザーにとって大きな要因やと思うし、その世界では、エッジでデバイス上でモデルを訓練できるなら、すべてがずっと速くなるって議論がある。それについてどう思う?
確実にや。そして本当にクールなのは、Excelはそれほど広いスペースやないってことや。俺はOpenAIと会ったんやけど、彼らはLinux VMでできることなら何でも、コンピューター使用プレビューまたはコンピューター使用モデルを作ろうとしとる。
Excelはずっと狭いし、環境を所有しとったら、RLのためにかなり上手く制約できる。だから俺たちはモデルを訓練する必要があることは非常に明確やと思える。デスクトップアプリかなんかを通してでも、君のマシンでローカルに提供する必要がある。なぜならスピードはモデルだけに制約されるわけやないからや。ブラウザにも制約される。君のブラウザはデスクトップアプリよりパフォーマンス面で遅いんや。
だから君が考えとる同じ理由で非常に興奮するし、それは非常に興奮することや。
自分のモデルを構築しながら、Shortcutもベンチマークしとる時、ベンチマーク全般についてどう考えとる?進歩を遂げとるか、平均的な初級アナリストより良いかをどう決定したか?ベンチマークについて何を考えとる?
それが最も重要なことや。ベンチマークについて具体的に話させてくれ。ベンチマークの困難な部分は、製品体験を成功裏に反映するベンチマークを作ることや。俺たちはこれを困難な方法で学んだ。Minecraftでベンチマークを持っとったんやけど、ユーザーが実際にMinecraftをプレイする方法から離れすぎとった。だから技術と研究のこととしては印象的やったけど、楽しくなかった。
だから俺たちがやったのは、まずspreadsheet benchを捨てた。それは愚かなベンチマークや。数ステップの自律性のためのようなもので、率直に言って分布外や。
だから俺がする必要があったのは、最も分布内のベンチマークを得て、文字通り顧客と話し、彼らが快適やったら彼らのデータを使うことやった。明示的な許可を得る必要があって、initファイル、goldenファイル、verifierを持っとって、このベンチマークを進めてこのパーセンテージを達成したら、すべてのコアユースケースに対してExcelを解決しとると言えるんや。
俺はそれらをゼロから構築、新しいデータに照らしてアップデート、複雑なファイルの上書き、既存のテンプレートから開始にバケット化しとる。これらはベンチマークに持つ必要がある重要なことで、俺たちが見逃しとると感じることを見つけるたびに、ベンチマークに追加される。実際にAnthropicがこれをやる方法やと思う。
気づいたら、彼らはもうLLM Marinaを気にしてない。あまりSweetBenchも気にしてない。俺は彼らがヒルクライムしたら世界最高のコーディングモデルを得ることを知っとる内部ベンチマークを持っとると確信しとる。だからそうするんや。
会社構造とByteDance型アプローチ
ByteDanceのアナロジーについて少し話してくれたことと、Fundamental Research Labsがアメリカの他の会社や構造とは対照的に、それにより類似しとる理由について。なぜその道を行くことにしたんやと、すぐに来る他の製品についてヒントを与えることができるか?
これは研究会社での最も困難な問題を解決する俺たちの試みや。研究と製品の間の根本的な緊張をどう扱うかってことや。それはおそらくOpenAIを壊したんやと思う。彼らは製品会社や。
どういう意味で?
ChatGPTにテーマ的に結びついてない製品をリリースすることを拒否するって意味で。研究は主にChatGPTを進歩させる限りで価値がある。それは持つには良い問題やけど、Sam Altmanが王になって、研究者のほとんどが去ったか、初期の研究者のほとんどがAnthropicを去ったのは偶然やない。それがDNAの種類やし、意図的やったかどうかもわからん。
研究者は研究したがるし、製品の人たちは金を稼ぎたがるから、本当に残酷な緊張の結果やと思う。だからこの緊張が管理可能になるような組織構造を持つ必要がある。
だからそれがどんな感じかっていうのは、俺たちが定義した方法で、これまた非常にユニークやけど、3つの歯で考えるんや。研究があって、研究は研究がやる方法で動くやろう。つまり、実りがあるかもしれんしないかもしれん奇妙なポッドで働く2、3、4、5人の研究者がいるってことや。彼らはコア技術プラットフォームに接続されとる。それは俺たちのシステムエンジニアリングのようなもんや。どうやってエージェントフレームワークを構築するか?必要な全てのもの。
どうやってキャッシュを最適化するか?トレーサビリティ、観測性、モデルにとらわれないツールをどう最適化するか?俺たちはエンジニアがこれを構築しとるけど、そこからそれに接続して、俺のShortcutのような製品チームがある。フロンティアエージェントを持っとったら、どうやって物を構築するかってことや。
本当に必要なのは、非常に技術的で、エージェントを構築する方法を知っとって、でも君が最も得意とすることの内部顧客でもある創設者や。
そして何かがTikTokでDouyinが打ったような方法で打った時、できる限り制約されへん必要がある。俺はExcelに挑戦するつもりや。それに取り組むつもりや。俺はそれが白鯨やと思う。40年間ここにあった。俺はそれを打ち負かすことができると思う。俺はそれのために必要な全ての金と人を持つつもりや。
そして俺は全ての研究者をそれに欲しいわけでもない。才能スタックの部分が必要や。独立した人々が必要や。今度は統合エンジニア、クラウド展開エンジニアが必要や。これらは独自の生命を持つようになる。TikTokが世界で最大の会社の一つになったやろうけど、ByteDanceに属するのと同じ方法でな。これが俺たちがこの緊張を管理する方法や。
俺たちが会社を始めた時にVinodに会ったのを覚えとるし、これは俺が彼に評価することの一つやけど、彼が俺たちに言った最初のことは「研究製品エンジンをどう管理するか?」やった。彼はOpenAIの最初の投資家の一人や。
ExcelのようなFutureの競争や、君が取り組みたい将来のエリアとして狙っとる他の製品をヒントにしたり共有したりできるか?
もう少し教えたいところやけど、残念ながらできへん。Shortcutに関しては、俺はExcelに取り組むつもりや。俺たちは今他のアプリも作業中や。そのうちの一つは非常に一般的なコンピューター使用エージェントや。もう一つ少し共有するのは、たくさんの読書に取り組んどることや。
仕事の未来と人材の自動化への見解
このエピソードで仕事の未来についてたくさん話したし、それは俺がよくカバーすることや。業界の友達とよく話すことや。外の多くの人が自動化されることを恐れとる。俺は未来についてずっと楽観的な見方をする傾向がある。みんながずっと生産的になって、今よりも自分の時間で何をするかを選択できるようになると信じとる。
投資会社の一年目のアナリストがShortcutを見て、「俺は何をするつもりなんや」って言うのは確実やと思う。まず、どのグループに入るか?未来について悲観的やと思うか?AnthropicのCEOであるDarioが言うた「ホワイトカラーの大虐殺」があると思うか?それとも人間あたりの超生産性で、俺たちがもっと自由時間を手にすることになると思うか?どのバケツに入るか、どこかその中間で、投資会社の一年目のアナリストはShortcutをどう見るべきか?生産性ツールか、彼らの競争相手か?これについてどう考えてもらうかを彼らに伝えるとしたら?
重要な質問や。俺の考えは、この種の問題に取り組む責任がある大部分の人たちよりも発達しとると思う。俺は証拠に基づく資本主義者または技術者みたいなもんや。技術の歴史上、入力のコストを下げることが、全体的な出力の品質や数量を減らした例は一度もない。
でも今は、ツールが自分自身を使うことができる時代も一度もなかった。だからこれにどう取り組むか?ありがたいことに、俺たちは2年前にソフトウェアエンジニアリングでこれをすでに見とる。
今日、混同変数を取り除こうとしてみろ。Microsoftは今日記録的な4兆ドルや。彼らは9000人の解雇を発表した。これはAIのせいか、それにも関わらずか?俺はそれにも関わらずやと主張するやろう。2年前のインフレ率、金利がどこにあったかを考えると、俺たちは大規模な、俺たちは不況に向かっとった。
おそらくAIがなかったら、俺たちは大規模な恐慌を持っとったやろう。そして俺の推測では、Microsoftはもっと後退しとったやろう。
AIと職の代替のせいで消化不良が起こる場所についてもっと具体的になろう。俺はソフトウェアで見てきたから信じとるんやけど、現れて最前線のツールを使うことを望まんかったら、代替されるリスクがある。
最も脆弱やった人たちは、ツールを持ってないか、ツールの使い方を理解してない1〜2年目の新人アナリストで、同僚ほど価値がなかった。実際に最もリスクが高かったもう一つの人たちは、アイデンティティの一部として、線形代数はそれほど印象的やない、俺は自分のコードを書けるって感じとったシニアエンジニアたちやった。
そして起こったことは、2、3年のコーディングで、俺は彼らのほとんどよりも効果的か、それ以上になるってことや。代替される最も簡単な方法は、利用可能な最強のツールを使わんことや。
俺は、一年目の投資銀行員、コンサルタント、FP&A、会計士、何でも、すべての人がこれらのツールを使うことで実質的により効率的になることに本当に楽観的や。俺が間違ってへんことを希望しとる。
君に同意する傾向がある。反対側の議論も間違いなく聞いとる。Semi analysisのDylan Patelは、一年目のソフトウェアエンジニアが今仕事を得るのに苦労しとるって話しとる。でも最終的に、これらの一年目のソフトウェアエンジニアが非常に生産的で、ツールを学んだとしたら、大手テック企業の一つが彼らを雇うのは当然のようや。多分俺たちは今それを見てないだけやと思う。消化不良の期間があると思う。
でも俺は、俺の右に6人のMITインターンがいて、全員19歳やって言うわ。そのうちの一人を雇ったばかりで、彼はAIを使うのが異常なほど上手いから学校に戻らんことにしたんや。
それは新しい学校や。新しい学習方法、新しいやり方や。若い人たちが何を学ぶべきかって聞くと、これらのツールを使うのが非常に上手くなるべきや。
俺は約束するけど、Microsoftは俺が雇ったばかりの人を雇いたがるやろうし、彼の100万人が欲しいと思っとる。これらのツールをどれだけ上手く使えるかになるんや。
俺は2歳の娘がいて、もう一人生まれる予定で、俺が焦点を当てるのは、彼らができるだけフロンティアにアクセスできるようにすることだけや。重要なスキルを構築できるように。ただ見た目が根本的に違うだけや。
スプレッドシートが来た時、それらは人類史上最大の雇用破壊者やった。実際にExcelがそうやった。人々は手動で記録を取って、複式簿記をやっとった。多分数年間はたくさんの消化不良があって、人々はExcelの使い方を学んだ。ある人は他より苦労したけど、ネットポジティブは劇的やった。
俺は前のゲストであるヒートン・ショウに、彼が子供たちに何を教えたいかって聞いたんやけど、君に2歳の娘がいるって知らんかった。だから俺たちは幼い子供たちの親として一緒やな。だから同じ質問をするわ。人工知能で変わっとることすべてを考えて、将来最も成功しそうになるために、最高のスキルを学んで、親として子供たちに教えることは何やと思う?
超重要な質問や。もちろん答えは持ってない。スレッドで別の質問があったと思うんやけど、どうやってAGIがみんなの利益になるようにするか?みんなが何をすべきか知っとるか?これらの研究所は全部ずっと前に上場すべきやった。
すべての人がこれらの人たちに投資できるはずやった。AGIを全ての人の利益になるようにしなかった時に、これらの企業の大失敗や。だから俺は、システム的に俺の娘、君の子供たち、みんなの利益になるためにすべきことがあると思う。
スキルセットと能力に関しては、技術的になるのが最も重要な時やと思う。みんなが技術的であるべきや。実際に20歳として技術的やないなら、それは君の親が君を失敗させたからやと思う。20歳を過ぎて技術的やないなら、それは君が自分を失敗させとるからや。
学習スキルセットには異なるレベルがあって、君は学ぶべきで、それはChatGPTを使うほど簡単やないけど、モデルがリリースされたりアップデートされたりするたびに、俺ができる最も速くて素晴らしいことは何かってことや。
それは異なる年齢層の間で少しゲートキーピングされるやろうし、子供たちを安全にしたいことについてもな。でも彼らはツールを使うことを学ぶべきや。実際に俺は、子供たちの神経可塑性がAIでのことをロックインして、俺には信じられへんことやと思う。
俺のチームでShortcutにいる計算神経科学の博士がいて、世界最高のコンテキストエンジニアの一人やけど、彼の左を見ると、素早く彼のレベルに到達しとる19歳がいて、俺たちは「これってどうやって可能なんや?」って感じや。君は2、3年の経験しか持てへんし、それは19歳でより意味があるし、5歳でより意味があるやろう。
技術的になる必要があるって言う時、必ずしも明示的にソフトウェアエンジニアリングについて話しとるわけやないな。ツールについて学ぶことを話しとって、それをするには深く技術的な脳が必要やってことやろ?
そうや。IDEでPython環境をセットアップする方法を学ぶ必要があるって意味やない。Lovableでアプリを作って、路上でレモネードを売ろうとするような感じや。それが俺の言っとることの路線にもっと近い。
ニコ、今日参加してくれて本当にありがとう。成功おめでとう。進歩おめでとう。ニコをチェックしたかったら、TwitterでNico Christieをチェックできる。今チャットにそれを投稿するわ。そしてShortcutを試したかったら、まだウェイトリストがあると思う。Try shortcut.ai。
リリースされたばかりや。Try shortcut.ai。誰でも使える。Try shortcut.ai。ニコ、本当にありがとう。
喜んで。迎えてくれてありがとう。会えて良かった。
AGI競争アップデートとオープンソースモデルの躍進
今日話す最後のことがある。AGI競争アップデートを提供するつもりや。今週と先週にリリースされた多くの異なるモデルについて話したいし、ほぼ全てがオープンソースで、俺にとって非常に興奮することや。
まず、Qwen 3や。アレックス、Qwen 3を出してくれるかな。Qwenのチームは絶対に料理しとる。この数週間でQwen 3ファミリーモデルの多くの異なるバリエーション、異なるフレーバーをリリースした。
これはQwen 3 30B A3B、つまり30億のアクティブパラメータを意味する。それは思考モデルや。中型サイズで、本当に本当に良いパフォーマンスをする。これはローカルマシンで動かすことができるかもしれないモデルの一つや。
25万6千トークンのコンテキストウィンドウで、100万まで拡張可能や。それはQwen 3シリーズのモデルのテーマのようで、覚えてたらChatGLM K2もそうや。ツール使用が得意で、より大きなモデルと競争的や。
GLM4.5、アレックス、それを出してくれるかな。GLM4.5もリリースされた。ちなみに、俺はこれらのモデル両方でテスト動画を作った。俺のチャンネルでチェックしてや。GLM 4.5も絶対に信じられへんモデルをリリースした。本当に、本当に良いパフォーマンスをした。
これはZhipu AIによってリリースされた。無料で試せる。URLはchat.zhipu.aiやと思う。Dotがどのモデルがコーディングに最適かって聞いとる。全部テストする必要があると思う。俺はGLM 4.5をテストして、コーディングで非常に、非常に良かった。
Loは「堅実なモデル」って言うとる。絶対や。そして謎のモデルHorizon Alphaがあって、当然それは噂されとるOpenAIオープンソースモデルHorizon Alphaや。俺はそれもテストして動画を作った。コーディングでも信じられへんかった。
ここで言いたいのは、俺は実際にこれらのツールをCursorやWindsurf、Factory、これらのようなエージェンティックコーディングフレームワークにプラグインしてない。だからそんな風にはテストしてない。これらは全部直接ゼロショットプロンプティングやったし、本当に本当に良い。
それからDeep Cogitoがあった。うまく発音しとることを願う。Deep Cogitoが昨日出たと思う。7月31日、昨日や。「今日、俺たちは4つのハイブリッド推論モデルをリリースしとる。70B、109BEこれはmixture of experts、405B、そして大規模な6710億モデルをオープンライセンスの下で」別のオープンソースライセンスや。彼らは異なるアプローチを取っとる。
これらのモデルは、少し下にスクロールしてくれアレックス、俺はここから直接読むつもりや、なぜならそれが彼らがどう考えとるかについて超興味深いからや。「これらのモデルは、iterated distillation and amplificationを使って超知能を構築する俺たちの作業に基づいて構築されとる。」
特に、俺たちは推論時により長く検索するんやなくて、反復的ポリシー改善を使ってモデルが推論プロセスを内在化することで、モデルの知能の事前分布をスケールしとる。これは自然言語に適用されたAlphaGo、AlphaZeroと同じアプローチに沿っとる。
だから再び、このエピソードのテーマは本当に人間をループから外し、モデルが独自に学ぶための独自のプレイグラウンドを持つことを許可し、必要なだけの計算を与えるってことのようや。
そして今朝から、君たちの多くがコメントで見ると思うけど、Dotが見ると思うけど、Gemini 2.5 Pro DeepThink IMO edition。これは国際数学オリンピック金メダリストモデルで、今誰でも使えるようになっとる。
ちょっと止まって、これがどれだけ狂っとるかを理解しよう。Logan Kilpatrick、「Gemini DeepThink、IMO金メダルを獲得した並列思考を持つ俺たちの最先端モデルが、Ultraサブスクライバー向けのGeminiアプリで利用可能になった。」
Ultraは月200ドル、250ドルやと思う。俺は当然やっとる、これらのモデル全部をテストせなあかんからやけど、他にもたくさんのものが得られる。YouTube Premium、30テラバイトのストレージが得られる。GoogleはChatGPTは俺に何も払ってない。俺はただその計画のファンや。
それを取ったら、この最先端の数学オリンピックモデルも得られるんや。それについて考えるのは狂っとる。そしてLoganが聞いとる、次にGemini APIに入れるべきかって。
俺たちはテキストから画像のモデルも持っとった。Black Forest Labsから、flux created devアレックス。「今日、俺たちはflux one created dev、別の最先端オープンウェイトfluxモデルをリリースしとる。」
Korea AIとのコラボレーションで開発された多くのオープンソースモデルが市場に来るのを見て俺は非常に嬉しい。「このモデルはユニークな美学を持つ画像に焦点を当てとる。AIルックなし、吹き飛ばされたハイライトなし、ただ自然な詳細。」
見ると、これらは信じられへんほど見える。そして最高の部分は、それがオープンソースってことや。
最後に、ARC 2で新しい第1位がある。これはARC 3やなくて、ARC 2や。ARC AGI賞で、Gato AIが21.6%をスコアしとる。その下にもっと情報があるかわからん、アレックス。
いや、リーダーボードをチェックしたかったら、ARC AGIのウェブサイトに行ける。チャットにそれを投稿するわ。でも物事は熱くなっとる。オープンソースは絶対に追いついとる。
この2週間は、中国発の多くのオープンソースモデルが、これまでのモデルよりもフロンティアに近い、フロンティアに近い信じられへんものを見るのに信じられへんかった。
最後に言いたいのは、いくつかの締めくくりのことや。俺たちのニュースレター、Forward Futureをチェックしてや。下の説明に投稿するわ。ヒートン・ショウとニコ・クリスティ、俺たちの2人のゲストに参加してもらったことに感謝したい。彼らのリンク全部を下に投稿するわ。
俺たちをチェックしてや。ForwardF.ai。そこにある最高のニュースレターや。たくさんのオリジナルがある。今週のニュースをまとめとる。裏方ですべてがスムーズに行くようにしてくれたアレックスにも感謝したい。ありがとう。
みんな参加してくれてありがとう、また来週会おう。バイバイ。


コメント