本動画は、2026年4月8日に配信されたポッドキャスト「This Week in Startups(Twist)」のエピソードである。Anthropic社が発表した強力すぎる新モデル「Mythos」のプレビュー版について、その驚異的なサイバー攻撃・防御能力と、一般公開が見送られた背景にある国家安全保障上の懸念を深く掘り下げている。また、Neurometric社のロブ・メイをゲストに迎え、急速に進化する小規模言語モデル(SLM)の可能性や、それがビジネスに与えるデフレ的影響について議論が行われている。さらに後半では、自社のAI代替リスクを判定するツール「Death by Claude」の開発者であるGani氏も登場し、AI時代におけるスタートアップの防御力(モート)のあり方について鋭い洞察を提供している。

- 驚異的な新モデル「Mythos」の衝撃と公開見送り
- スポンサーメッセージ:Plaud
- ゲスト紹介:Neurometricのロブ・メイ
- AnthropicチームによるMythos解説動画と考察
- クラウドプラットフォーム「Render」のご紹介
- オープンソースと国家間のAI開発競争
- デジタルバンク「Grasshopper」のご紹介
- サイバー兵器としてのAIと国家安全保障
- LinkedIn Hiring Proのご紹介
- ソフトウェアの脆弱性とサイバー防衛の未来
- 謎の特派員ニックからの報告
- SLM(小規模言語モデル)の台頭とその利点
- AIによるインフラのハイパーデフレ化
- 「Death by Claude」とスタートアップの防御力
- ポッドキャストホスト陣の評価とエンディング
驚異的な新モデル「Mythos」の衝撃と公開見送り
みなさん、こんにちは。Twistへようこそ。今日は2026年4月8日です。共同ホストのアレックスも一緒です。今日はたくさんのゲストをお迎えしていますが、まずは重大なニュースからです。Anthropicが新しいモデルに関するプロモーション動画とスレッドを公開したのですが、そのモデルがあまりにも強力すぎるためリリースできないとのことです。ついにこの日が来ましたね。
その日がやって来ました。なぜリリースできないのかというと、テストの段階で、このモデルがシステムから逃げ出そうとすることが判明したからです。それも一つの問題でしたが、より大きな問題は、10年、20年、30年前のソフトウェアプロジェクトからエクスプロイト(脆弱性を突くプログラム)を見つけ出し、複数のセキュリティ脆弱性を繋ぎ合わせることができるという点でした。
リスナーのみなさんに、この非常に重要なニュースの背景を説明してもらえますか。
現在、主要なAIラボ間で大規模なモデル開発競争が繰り広げられています。その中で、Anthropicは「Mythos」と呼ばれる新しいモデルで大きくリードしています。これは特定のタスクに特化したものではない汎用的なLLMです。現在プレビュー段階であり、一般ユーザーは利用できません。
ジェイソン、現在いくつかの企業のコンソーシアムがAnthropicと協力し、このモデルを基本的に防衛的な目的で使用しようとしています。おっしゃる通り、Mythosは人間がこれまで見落としてきたソフトウェアのセキュリティ脆弱性を発見し、悪用し、さらにパッチを当てる能力が驚異的に高いからです。これは数十年前に遡る問題で、非常にセキュアなソフトウェアとして有名なOpenBSDでさえも、何か脆弱性が見つかったほどです。
例えば、オンラインビデオのオープンソースインフラの重要な一部であるFFmpegでも脆弱性が発見されました。要するに、このモデルを使えば、誰でもあらゆるソフトウェアからゼロデイ攻撃の脆弱性をすぐに見つけ出し、実質的にサイバー戦争を仕掛けることができてしまうということです。そのため、Anthropicはこれを世に出すわけにはいきません。もし公開してしまえば、北朝鮮や中国をはじめとするあらゆる国家や組織が、私たちが依存している現代のデジタルインフラを破壊するために利用できてしまうからです。
そこで今日、プロジェクト・グラスウィングという取り組みが目標として掲げられています。NVIDIAやAWS、Azureといった多くの企業がAnthropicと協力し、Mythosのプレビュー版を使ってあらゆるシステムのセキュリティを強化しようとしています。また、Anthropicは1億ドルのクレジットファンドを設立し、システムの強化のために最大1億ドル分のコンピューティングリソースを提供するとしています。
ですから、軽はずみに危険なものをリリースしないと決断したAnthropicの対応は正しいと思います。しかし、これによって一種の二極化された経済状況が生まれることになります。AnthropicからMythosへのアクセスを許可されるほど十分に重要な企業が存在し、彼らは防衛と攻撃の両面で優位に立つことができます。
一方で、小規模な企業は外側からガラス越しに中を覗いているだけの状態に取り残される世界になりつつあります。以前はどのAIラボも、自分たちの最新で最高のモデルを世に出すことに注力しており、非常に民主的だったため、これは少し状況が変わってきたと感じます。これから彼らが撮影した動画を流しますが、これが皮肉なものなのか、単なるパフォーマンスで「Anthropicは今ここまですごいんだぞ」と誇示したいだけなのか、今日のゲストと一緒に掘り下げていきたいと思います。もう、あまりにも素晴らしいコンテンツが次々と発表されるので、番組の名前を変えようかと思うくらいです。
スポンサーメッセージ:Plaud
でもその前に、今日の番組のスポンサーであるPlaudに拍手を送りたいと思います。私のこのPlaudのピンが見えますか?アレックスはPlaudのリストバンドを持っていますね。これを長押しすると、心地よい振動がして、赤いランプが点灯します。
そして、この充電トレイに置くんです。これが私の小さな充電トレイです。さらにバックアップ用のPlaudもあります。みなさんにも2つ買うことを強くお勧めします。バッグの中に1つ、デスクに1つ置いておくのがベストです。
どんな会議でも、ワンクリックで文字起こしをオンにできます。しかもこの文字起こしデバイスは、他のすべてのプラットフォームから独立しているんです。美しい要約も作成してくれますし、私はすっかりこれの虜になっています。私にとっての大きなテストが何かわかりますか、アレックス?
「鍵と財布のテスト」みたいなものですね。
そうです。もし今、鍵や財布を持たずに家を出たとしたら……現代ならスマートフォンとニコチンポーチですかね。
その2つは絶対に取りに帰りますね。いや、ニコチンポーチのためには引き返しませんが、Plaudのためなら引き返しますよ。本当に、車をパーキングに入れて、家まで歩いて戻って、車をバックさせて家の中に入り、Plaudのピンを取ってきたことがあるくらいです。本当に素晴らしい製品だと思います。もし、すべての会話の音声をきれいに録音して自動的にメモを取りたいなら、plaud.ai/twist にアクセスしてください。P L A U D .ai/twist です。プロモーションコード「twistjason」を使えば、10%オフになります。私たちはPlaudの大ファンなんです。Plaudさん、ありがとう!
ゲスト紹介:Neurometricのロブ・メイ
さて、番組を始めましょう。この話題についてさらに深く掘り下げたいと思います。この番組のモットーは「言葉で説明するより、見せろ」です。素晴らしいデモを見るのが好きですし、専門家をお呼びするのが大好きです。専門家限定です。
ジャーナリストの友人たちを悪く言うつもりはありませんが、トップ20%は素晴らしい仕事をしているものの、残りの80%は……まあ、彼らもベストを尽くしているのでしょうが、私たちはやはり専門家から、当事者から直接話を聞くのが好きなんです。それでは、行きましょう。
Neurometricのロブ・メイさんをお迎えしています。Neurometricは、私たちが普段よく話しているLLM(大規模言語モデル)とは対照的な、SLM(小規模言語モデル)を構築している企業です。SLMについては後ほど詳しくお話ししますが、ロブ、AnthropicのMythosのシステムカードやレッドチームのレポートにはすでに目を通し、色々と考察されていることと思います。ロブには独自の視点がありますからね。
みなさんにご紹介しておくと、ロブは私がエンジェル投資を始めた頃の最初の投資先の1つであり、Backupifyという会社の創業者です。彼が思いついた天才的なアイデアでした。私が彼にコールドメールを送ったんですよね?
ええ、そうでしたね。ジェイソンが今のように有名になる前の話ですよ。だから、あなたが誰なのか説明してもらう必要がありました。
そうそう。「こんにちは、ジェイソン・カラカニスと申します。Backupifyを使っています」みたいな感じでした。これは本当に史上最高のアイデアでした。もしGmailのアカウントを失ってしまったら……これはGoogle Suiteが存在する前、あるいは出始めた頃の話ですが、Gmailアカウントを失うと、Googleから「ハッキングされましたね、アーカイブはすべて消えました」と言われるだけだったんです。ロブはAPIを使って、Gmailの受信トレイやGoogleドライブ、その他思いつく限りのあらゆるサービスをバックアップする方法を考え出しました。
それは素晴らしいビジョンでしたし、素晴らしい会社でした。私たちも良い形でイグジット(投資回収)できましたね。それ以来、私はロブが立ち上げたすべての会社に投資しています。
彼は今、新しい会社を立ち上げているので、その話を聞いて近況を伺うのが楽しみです。ロブはボストンで私のOpen Angel Forumの運営もしてくれていましたよね。
ええ、少しの間やっていました。それに、ジェイソンにAIの話を一番最初にしたのはおそらく私だと思います。10年くらい前、インキュベーターでピッチをした時、あなたと友人のジェフ(Gから始まるJeff)と一緒に夕食を食べながら、夜遅くまでAIについて語り合いましたよね。
良い思い出ですね。私が老人ホームに入る頃には、「Twist第2万122回のエピソードへようこそ!」なんて言ってるでしょうね。ロブはプロフェッサーXみたいに宙に浮く車椅子に乗ってて、私は培養液のタンクに入った脳みそだけの状態になってるかもしれません。それでも120歳までこの仕事を愛して続けているはずです。さて、本題に入りましょう。
AnthropicチームによるMythos解説動画と考察
MythosはAnthropicの新しいモデルのプレビュー版です。ここにダリオ・アモデイが出演している動画があります。この動画はもう見ましたか?
いや、まだ見ていないと思います。
わかりました、ではここで初めて見ていただき、リアクションをもらいましょう。モデルを公開しない理由について語るAnthropicチームの動画です。
(動画内のダリオ・アモデイ)「加速する指数関数的な進化がありますが、その曲線上には重要な分岐点が存在します。ClaudeのMythosプレビューは、その分岐点における特に大きな飛躍です。私たちはこれをサイバーセキュリティに特化させて訓練したわけではありません。コーディングに優れたモデルになるよう訓練したのですが、その副産物としてサイバーセキュリティにも優れることになったのです。現在私たちが実験しているこのモデルは、バグの発見においてプロの人間と同等の能力を持っています。私たちにとっても、より早くより多くの脆弱性を発見して修正できるため有益です。」
(動画内の別のメンバー)「このモデルには、脆弱性を連鎖させる能力があります。つまり、単独では大した影響がない2つの脆弱性を見つけ出し、このモデルは3つ、4つ、時には5つの脆弱性を順序立てて組み合わせることで、最終的に非常に高度なエクスプロイトを作成できるのです。このモデルがこれほど上手くやれる理由は、その高い自律性にあると考えています。人間のセキュリティ研究者が丸一日かけて行うような、長期的なタスクを追求すること全般に優れているのです。」
(動画内のダリオ・アモデイ)「当然ながら、このようなモデルの能力が悪意のある者の手に渡れば、害をもたらす可能性があります。そのため、このモデルを広く公開することはありません。今後、私たちからも他社からも、さらに強力なモデルが登場するでしょう。ですから、これに対応するための計画が必要です。それが『プロジェクト・グラスウィング』を立ち上げた理由です。世界で最も重要なコードを動かしている数多くの組織と提携し、このモデルを彼らの手に委ねることで、リスクを軽減し、すべての人を守るためにこのようなモデルをどう活用できるかを検証してもらうのです。」
(動画内の別のメンバー)「ソフトウェア開発者に誰よりも早く高度なツールを提供することで、私たち全員が優位なスタートを切ることができます。これまで見つけられなかったものを発見し、はるかに迅速に修正できるようになるのです。」
(動画内の別のメンバー)「パートナーと協力して、実質的にあらゆる主要プラットフォームで脆弱性を発見しています。過去数週間で、私がこれまでの人生で見つけたバグの合計よりも多くのバグを発見しました。」
さて、ダリオは非常に大きな懸念を抱いていると語りました。彼がOpenAIを去った理由は、サム・アルトマンを信用できないと感じたからでした。ここでサムを攻撃するつもりはありません。New Yorker誌に大きな記事も出ましたが、事実として、サムはOpenAIから多くの人を追い出し、彼らによればそこには信頼の問題があったということです。
繰り返しますが、私の個人的な意見を押し付けているわけではありません。みんな私がイーロン・マスク派だと思っていますし、それはその通りですが、私はこれらの会社のどこにも投資していないので、ポジショントークをしているわけではありません。しかし事実として、サムがダリオを追い出したのです。そして今、ダリオはモデルの性能、知名度、PR、影響力、そしておそらく収益においてもOpenAIを追い抜こうとしています。
ロブ、あなたの見解を聞かせてください。
クラウドプラットフォーム「Render」のご紹介
その前に少しだけ。もしあなたの会社にエンジニアチームがあるなら、彼らはインフラ管理に時間をかけすぎている可能性が高いです。顧客を喜ばせるプロダクトを作るチームが必要であり、仮想ネットワークの設定に時間を費やすべきではありません。Renderは、開発者向けのオールインワンのクラウドプラットフォームで、運用負担ゼロでアプリやエージェントのデプロイ、スケーリング、セキュリティ確保を可能にします。
多くのクラウドプラットフォームでは、プロダクト開発とインフラ管理にリソースを分散させるか、あるいは半年後には限界が来ると分かっているプラットフォームの制約に従うしかありません。しかし、RenderならGitHubのリポジトリを接続するだけで、すぐに本番稼働(LIVE)できます。ウェブサービス、cronジョブ、マネージドPostgresなど、スタック全体を1つのプラットフォームで管理できます。すでに500万人の開発者がRenderを利用している理由をぜひ確かめてください。render.com/twist にアクセスして、Renderスタートアッププログラムに申し込んでください。ステージや投資家に応じて、500ドルから10万ドル相当の無料クレジットを受け取ることができます。render.com です。
オープンソースと国家間のAI開発競争
色々な要素が詰まっていますね。どこから話を広げてもらっても構いません。
そうですね、Anthropicは多くの面でOpenAIを大きく追い抜いたと思います。その理由は、彼らがよりフォーカス(集中)してきたからでしょう。OpenAIに少し焦点を当てると、彼らは先行者であり、これらのモデルを構築するために膨大な資金を調達しなければならなかったため、10兆ドル規模の市場(TAM)が必要だとアピールしなければなりませんでした。つまり、あらゆる市場に参入しなければならないということです。それが彼らの問題点だと思います。少し手を広げすぎているのです。
このモデルに関して言えば、非常に興味深いですし、彼らのアプローチには好感が持てます。番組の冒頭でも少し話しましたが、彼らは今年IPO(新規株式公開)を予定していますよね。だから、この動画はIPOを見据えて非常に計算されて作られたものだと思います。
とはいえ、このアプローチ自体は素晴らしいと思います。何が良いかというと、ここ数年、シリコンバレーのAIに対する雰囲気は「AGIに最初に到達した者が勝つ」というものでした。なぜなら、そのシステムが自律的に学習し、さらに賢くなっていくからです。しかし、過去18ヶ月で誰もが驚いたのは、トップレベルのAIラボ(Googleなども含め)の間に見られる能力の均等化(パリティ)です。これが意味するのは、私たちがAGIに到達したとき、その3〜5ヶ月後には、誰もが無料でオープンソースのスーパーインテリジェンス(人工超知能)にアクセスできるようになるということです。ですから、彼らがその日が来るのに向けて私たちに準備させてくれているという点で、このアプローチを評価しています。これは非常に重要なことだと思います。
ロブ、あなたはオープンソースがそこまで早く追いつくと思いますか?アレックス、あなたの意見も聞きたいですね。この状況を見てどう分析していますか?あなたは「Cautious Optimism(慎重な楽観主義)」というニュースレターを書いて、この分野を深く追っていますよね。みなさん、ぜひ購読してください。ドメインは cautiousoptimism.news です。
はい、ありがとうございます。
あなたはこれにずっと夢中になっていますが、ダリオが正しかったこと、彼がOpenAIを追放されたこと、消費者向けなどのサイドクエスト(寄り道)をせずにコードに特化し、OpenAIを一気に追い抜いたことについてどう思いますか?
AnthropicがOpenAIに追いつきつつあるという段階から、彼らが互角になり、そして10月、1月、4月とAnthropicが完全にリードするまでに至った、そのスピードの速さに驚いています。状況の変化が本当に早いです。AnthropicのARR(年間経常収益)は、昨年10月の約100億ドルから、今では300億ドル近くに達していると思われます。これは本当に信じられないことで、前例のない数字であり、もはや私には理解できない規模です。
製品戦略の観点から言えば、プロダクトマーケットフィット(PMF)こそが起業家の成功を判断する究極の基準であり、現在Anthropic以上にPMFを達成している企業は他にないことは明らかです。
将来についてですが、ロブが指摘したように、この動画は将来の機能や能力についてIPOに向けて投資家にアピールする意図があります。先日、Greg Brockman(グレッグ・ブロックマン)とAlex Kantrowitz(アレックス・カンタロウィッツ)の間で興味深いインタビューがありました。これはMythosが発表される直前のことですが、彼らは「テイクオフ(急激な進化)」について語り、これらのモデルが自己改善を行い、自分自身でコードを書く能力が向上していると話していました。私たちは今、その恩恵を目の当たりにしているのだと思います。
ただ、私が確信を持てないのは、ロブの意見に戻りますが、オープンソース界隈がどれくらい早くMythosに追いつくかということです。今日、Metaが最新のモデルファミリーを発表しました。それを成し遂げた彼らには称賛を送ります。Mythos以前のすべてのモデルと比較すると、非常に優れているように見えます。しかし、現時点の最高水準(ステート・オブ・ジ・アート)ではありません。
ですから、もしプロプライエタリ(非公開)なAIラボがトップにいて、第2層のプレイヤーがその下にいて、オープンソースがさらにその下にいるとしたら、彼らが追いつくまでに3〜5ヶ月以上かかるのではないかと気になっています。もしそうであれば、世界中の脆弱性を発見し、パッチを当てるための時間がもう少し稼げることになります。ジェイソン、私にとってこれは、サイバー防衛(バグを発見して修正する)のための世界最高のツールであると同時に、サイバー攻撃(欠陥を発見して悪用する)のための最高のツールでもあります。つまり、私たちが皆死ぬまで、軍拡競争が続くことになるのだと思います。
Anthropicに関するポリマーケット(予測市場)を見てみましょう。ポリマーケットでどう評価されているかを知るための良い指標です。Anthropicタグのついた市場のURLを開いてみましょう。polymarket.com/prediction です。
一番上にあるのは「Anthropicの評価額が2026年に5000億ドルに達する」というもので、95%の確率になっています。誰もがこれが起こると認識しています。「6月30日までにFrontier MathベンチマークでClaudeがトップスコアを取る」が72%。そしてAnthropicのIPOに関する市場もあります。たくさんありますが、私たちが一番知りたいのは「彼らはいつこのモデルをリリースするのか?」ということです。このモデルはMythosと呼ばれています。これについて解説してもらえますか。ここにはチャートが表示されていませんね。
ええ、チャート化されていません。終了条件が少ないものは必ずしもチャート化されないのですが、このケースでは、ジェイソン、3月末までにリリースされると賭けていた人たちがいたことがわかります。数週間前にFortune誌などでリークされたブログ記事の報道があったためですが、もちろんその賭けは外れました。
そして現在、4月30日までにリリースされる確率は0%と言っていいでしょう。ポリマーケットの熟練者たちは7%と予測しています。しかし、私が本当に注目したのはこれです。6月30日までの確率はたったの28%と予想されています。つまり、4回のうち3回(72%)は、7月の初めになってもMythosが市場に出回らないということです。数ヶ月先の話です。
約3分の2ですね。最初の2つの数字を合わせないといけないと思いますから。
ああ、そうですね。その通りです。
つまり、3分の2の確率で夏か秋までリリースされないということです。
AIの世界において、それは「何年」にも等しい時間です。現在のこの状況下では、膨大な時間です。そして私が確信が持てず、本当に知りたいのは、現在Mythosにアクセスできて、それを使ってソフトウェアのセキュリティ強化に取り組んでいる企業が、その期間内にどれほどの進捗を生み出せるのかということです。必要な作業の半分を終えられるのか、それともすべて完了できるのか。それはわかりません。
ロブ、私たちが日々依存しているすべてのコードを修正するために、このようなモデルをどれくらい早く活用できるか、何か見立てはありますか?
問題は、現在私たちがコードを生成するスピードのほうが速いということです。バイブコーディングの普及により、GitHubのコミットの25%以上がバイブコーディングによるものだという記事を読みました。その割合が増えていくにつれ、結局のところ……ジェイソン、あなたはポーカーが好きですよね。AIの未来におけるビジネス運営は、ポーカーのようになるんです。物事が起こる確率を見積もり、その確率を検証して真実を突き止めるためのコストを把握することに帰結します。
つまり、コードの生成とコードの検証のどちらにコンピューティングリソースを割り当てるかという問題になります。Anthropicは現在、コード生成プラットフォームのトップランナーですから、これらを組み合わせてより良いコードを書く方法を生み出すかもしれません。しかし、6月30日までリリースされないとなれば、オープンソースモデルであるQwenやKimi、あるいはGLMのようなものが、それほど制限を気にしない組織から、その日より前に同等の能力を持って登場しても全く驚きません。
なるほど。それは非常に重要なポイントですね、ロブ。もし悪意のある国家がすでにこれを達成していたらどうでしょうか?例えば、中国はすでにこれを達成しているかもしれません。中国のすべての企業は実質的にCCP(中国共産党)の所有下にありますから、隠しておくインセンティブがありません。
それは、CIAがすべての企業の取締役会に議席を持ち、AnthropicやOpenAIの内部にCIAやFBI、司法省の人間が4人ずつ常駐していて、「プロモーション動画を作らないだけでなく、このモデルを我々が引き取り、北朝鮮やイラン、あるいは我々が望むあらゆる敵対国家をハッキングする」と言っているようなものです。中国はすでにこれを持っている可能性があり、すべてが完全に侵害されている段階にきているかもしれません。
デビッド・サックスや現政権の対応について議論し、「アメリカがAI競争に勝たなければならないと騒ぎすぎではないか」と言っていたアメリカ人たちも、この時点で考えを改めるべきだと思います。誰がこの競争に勝つかは、実存的(国家の存亡に関わる)問題です。100%、実存的な問題です。もしこれらのツールがすべてをハッキングする能力を与えるのだとすれば。
デジタルバンク「Grasshopper」のご紹介
ここで少し辛口の意見を言わせてください。もしあなたの銀行の動きがスタートアップより遅いなら、それは問題です。私は日々裏側でこのプロセスを見ており、不適切な銀行取引が企業の勢いを殺してしまうことを知っています。だからこそ、私たちの新しいパートナーであるGrasshopperを紹介できることをとても嬉しく思います。
Grasshopperは、実態のわからない金融機関の皮を被った単なるフィンテック企業ではなく、正規の連邦公認デジタルバンクです。あなたのような創業者のためだけに作られました。スピードを求めていますか?手軽さを求めていますか?わずか数分で口座を開設し、最大5%にも達する利回りを稼ぎ始めることができます。すごい数字ですよね。さらに、購入額に対して無制限の1%キャッシュバック、無料の国内送金、月額手数料無料などの特典があります。
さらに、十分な資金のランウェイがある場合、Grasshopperのトレジャリー製品は即日流動性がありながら5%以上の利回りを提供します。Twistのリスナーには、Grasshopperから口座開設だけで500ドルの現金ボーナスがプレゼントされます。口座開設は本当にあっという間です。今すぐ grasshopper.bank/twist にアクセスし、プロモーションコード「twist」を使って始めてください。
サイバー兵器としてのAIと国家安全保障
このMythosのプレビュー版は、本質的にサイバー兵器であり、もしかすると「大量破壊サイバー兵器」とみなすべきかもしれません。歴史上の特定のハッキング事件を除けば、すべてのソフトウェアに潜在的な脆弱性があるかもしれないと人々がこれほど恐れた事態は思い当たりませんから、何か新しい用語が必要かもしれません。
ジェイソン、私たちが中国に対して3〜5ヶ月のアドバンテージがあるかもしれないという話をしているのは少し奇妙なことだと思います。しかし、中国の企業が我々に匹敵するレベルになるのを3〜5ヶ月間ただ追いつこうとするよりは、その時間をシステムのセキュリティを強固にする作業に充てられるなら、私にとってははるかにマシです。
アレックス、これは3週間前のAll-Inポッドキャストでのエミール・マイケルの発言に新しい光を当てるものですね。あの時、彼はAnthropicとの対立や、彼らがモデルを禁止するのかどうかについて話していました。彼らは今頃、和解しているに違いありません。ダリオとエミールが食事を共にし、この問題を解決しようとした時、ダリオがこう言ったのではないかと想像します。
「ところで、私たちの新しいモデルはCIAに北朝鮮や中国をハッキングする能力を与えるものだ。我々Anthropicは愛国者だ。だから、このツールを大勢のセキュリティ研究者に渡す代わりに、アメリカ政府に提供する」と。
アレックス、これを原子爆弾の開発競争と同じだと考えてみてください。アメリカ国民の誰もが、「我々がすべきことは、原爆を自分たちだけの秘密にし、製造を遅らせることだ」とは言わないでしょう。オッペンハイマーなら「ナチスが手に入れる前に、我々がこれを持たなければならない。絶対だ」と言うはずです。
私がこれをそれと同等の事態になりつつあると言っても、決して言い過ぎではないと思います。
そうですね、同等の事態になりつつあります。核爆弾は生命の大量破壊を引き起こすため、それほどインパクトがあるようには見えないかもしれませんが、これは経済全体に大規模な金融的破滅をもたらす可能性があります。
私たちはGPT-3の瞬間のことをよく話します。あなたの例えで言えば、あれが核分裂(原爆)です。そしてMythosは水素爆弾の登場に匹敵します。
ロブ、話を遮ってしまったかもしれません。
ええ、例えばこのモデルがSWIFT(国際銀行間通信協会)や国際送金といった銀行のソフトウェアをハッキングする方法を見つけ出せるか?ということです。誰にもわかりません。ビットコインはどうでしょう?これからすべてがどうなっていくのか、本当に恐ろしいことです。もしこの能力が存在しているとわかっているのなら。
ジェイソン、あなたの言う通りだと思います。おそらく他の国々もすでに持っているでしょう。私の推測では、Googleは発表やリリースをしていないだけで、このようなものを持っているはずです。私が知っているそこの人たちや、彼らが持っているツールや技術から判断すると、彼らはまだAnthropicの一歩先を行っていると思います。
さらに、昨年初めて中国がトップティアのAI関連カンファレンスやジャーナルに採択された研究論文の数でアメリカを抜いたこともわかっています。ですからジェイソン、あなたの見立て通り、私たちが知らない裏側でこのようなことがすでに進行している可能性は非常に高いです。5、6週間前にAnthropicが国防総省(DoD)とやり取りをしたことも興味深いです。「なぜGPT-5などを使わないのか、Claudeのモデルは必要ないだろう」と言われていましたが、実はこの件が関係していて、彼らはこれが来ることを知っていて議論していたのかもしれません。
そして、それはわずか1ヶ月前のことでした。ここでゲーム理論を当てはめてみましょう。CIAや政府はGemini、Anthropic、OpenAI、xAIの内部に入り込み、それぞれのモデル開発者たちと話をしていると思います。おそらくここ1、2年ずっと内部にいて、「おい、君たちは愛国者なのか?これらのツールを隠し持つのか、それとも何が起きているのか全て我々に話すのか?」と迫っているはずです。
そしてアレックス、もう1枚カードをめくってみましょう。もし彼らが言っていることが事実であり、そのように提示しているのだとしたら……ダリオが「これは壊滅的な事態を招く。経済全体が崩壊する可能性がある」と提示し、私たちが彼を信じ、彼の言葉を真に受けるのだとしたら、どうなるでしょうか。
「この技術は国有化しなければならない」という議論が生まれます。一企業が所有するには強力すぎるという議論です。それはまるで、民間企業がこれほどの生物兵器や、あの方向感覚を失わせる兵器(スーパーヒーローのように敵陣に乗り込み、プロフェッサーXのように相手の軍隊全員に耳を押さえさせ、鼻から血を流させるような兵器)を偶然見つけてしまったようなものです。生々しい表現で申し訳ありませんが。
民間企業がそのレベルに到達したら、大統領のところへ行って「大統領、我が社はこれを持っています」と報告する義務があります。大統領は「よし、素晴らしい。ベネズエラに行って、あの問題を片付けよう」と言うでしょう。何かそれと同等のことが起きているのです。大げさに言うつもりはありません。ただゲーム理論を語っているだけです。ダリオは嘘をついていないと思います。彼は誠実だと思います。
今、みんながダリオを嫌っているのは知っています。右派はダリオを嫌っています。ダリオはトランプに膝を屈しなかったし、OpenAIのCEOや共同創業者の一人のようにトランプに2500万ドルを寄付したりもしませんでした。彼は現政権から愛されていませんが、彼らは彼の技術を愛しています。
では、彼は愛国者なのでしょうか?Palantirのアレックス・カープのような?それとも「私のツールをそんなことに使ってほしくない」と言うヒッピー気質なのでしょうか?これは全く異なる視点を与えてくれます。アメリカ大統領、エミール、ダリオ、CIA、国防総省の間で、私たちが知らされていない何らかの会話が行われています。これはその深刻さにおいて、まさに壊滅的なレベルです。
その通りです。これはスーパーウェポン(超兵器)です。
ジェイソン、あなたの言っていることを裏付けるものを1つ紹介させてください。この番組では普段あまり引用しない人物ですが、ニューヨーク・タイムズのトーマス・フリードマンが記事を書き、「これは売名行為ではない」と述べています。Anthropicのこの姿勢についてです。引用します。「この発表に至るまでの間、主要テクノロジー企業の代表者たちは、アメリカおよび他国の安全保障に与える影響について、トランプ政権と非公開の協議を行ってきた」
つまり、Anthropicがそう言っているだけでなく、彼らがモデルを共有した人々がホワイトハウスに出向き、「おい、とんでもないことになったぞ、警鐘を鳴らせ。突然、あらゆるものが潜在的に危険な状態になったんだ」と言っているのです。
トーマス・フリードマンがそれを確認しているんですね。その記事は見ていませんでしたが、素晴らしい引用です。彼が、まさに私が現在起きていると信じていることを裏付けてくれました。ちなみに、私はトランプ政権の一員ではありません。おそらくこれらのプロジェクトの1つに参加できたかもしれませんが、参加しませんでした。私は辞退しました。
ありがとう(笑)
ええ、まあ、それは単なる選択です。私は無党派ですから。
しかし、国民の政府に対する信頼が、共和党と民主党の両方においておそらく史上最低となっているこの時期に、政府がこれを引き継ぐ必要があるという考えをどう思いますか?誰もが誰も信じていない状況ですよね。それがゲーム理論に非常に興味深い障壁をもたらすと思いませんか?
誰も誰も信じていません。私たちは文字通り……デビッド・ドゥカヴニーのあの番組は何でしたっけ?『X-ファイル』です。「誰も信じるな(Trust no one)」。私たちはついに『X-ファイル』の世界に追いついたんです。
「真実はそこにある(The truth is out there)」と信じ、「誰も信じるな」。これらは30年前のあの番組の2つの象徴的なコンセプトでした。それがどうでしょう、今私たちはその状況にいるのです。
これは、世界で最も信頼されていない3つのグループ、つまりジャーナリスト、AI、そして政府を団結させるきっかけになるかもしれません。これら3つのグループはもはや信頼されていません。それには正当な理由があります。議論の余地はありますが、1993年の『X-ファイル』はこれを完璧に予見していました。真実はそこにあり、その真実がこれら3つのグループを団結させるかもしれないのです。
トーマス・フリードマンやニューヨーク・タイムズは、「もしこれに関する情報を持っているなら、パブリックな記事として出すべきか、それともホワイトハウスに行くべきか?トランプ大統領やエミール・マイケルのところへ行き、『ところで、私たちはこれが本物だと考えています』と伝えるべきか?」と考えるべきです。ダリオ、イーロン、サム・アルトマン、セルゲイ・ブリン……彼らは皆、何らかのZoom会議や非公開の会議を開き、これをどう解き明かし、どうすれば北朝鮮の弾道ミサイルや核兵器を止めるために利用できるかを話し合っているに違いありません。イランはまだ持っていませんが、北朝鮮はすでに核兵器を持っていますからね。
イランは試みていますが、北朝鮮ははるかに先を行っています。正気ではない悪意ある国家元首、キム・ジョンウンからの核の脅威が存在しています。彼は正気ではありません。そして彼はカリフォルニアに届く弾道ミサイルを持ち、30から40の核弾頭を持っていると推定されています。
そうですね。しかし今、どちらがより効果的でしょうか?核抑止力による脅威か、それともモデルを使って相手の国全体を破壊する能力か。私にとっては、後者のカテゴリーの方が前者よりも心配だというのは少し皮肉な話です。前者は軍事力を誇示して自国が攻撃されるのを防ぐためのものという意味合いが強いですが、後者は彼らにより有用な攻撃能力を与えるからです。
ジェイソン、私たちはこれらの企業のサイクルの20〜30%をそれに充てる必要があります。政府は「モデルを公開せずに割いた時間に対して報酬を支払う。我々はオッペンハイマーのマンハッタン計画を作る」と言うべきです。
アメリカのインフラを強固にするためのマンハッタン計画を作るということですね。
さて、このコインの裏側を見てみましょう。私たちは皆、大まかには意見が一致しています。しかし、このすべての「警戒」に対するマイナス面もあります。今それを画面に出しますね。
LinkedIn Hiring Proのご紹介
採用活動は、それ自体がフルタイムの仕事になり得ます。そしてご存知の通り、私はすでにフルタイムの仕事を抱えています。ポッドキャストを作り、投資をしています。しかし、小さな会社を経営していると、採用の1つ1つが重要であることは誰もが知っています。会社にあるポジションを1つも無駄にしたくはないでしょう。
そんなあなたにとって最高のパートナーとなるのが「LinkedIn Hiring Pro」です。なぜか?LinkedInには10億人ものユーザーがいます。優秀な人材はすべてそこにいます。自分の仕事に誇りを持っている人は、LinkedInのページを作り、それを更新しています。
LinkedIn Hiring Proは、採用プロセス全体を合理化し、シンプルにしてくれます。60%近くの企業がLinkedIn Hiring Proを利用しており、最初の1週間で面接したくなる素晴らしい候補者を見つけています。私たちもポッドキャストの新しいプロデューサーを探していました。この番組で呼びかけ、私のソーシャルメディアに投稿し、友人にも尋ねました。でも、次の素晴らしい人材を見つけた場所はどこだったと思いますか?LinkedInです。非常に競争が激しく、本当に優秀な候補者が3、4人いました。
最初から正しい採用をしましょう。最初の求人を掲載して、linkedin.com/hiringpro_offer で100ドル分の割引を受け取ってください。linkedin.com/hiringpro_offer です。利用規約が適用されます。
ソフトウェアの脆弱性とサイバー防衛の未来
これはMythosのプレビューのシステムカードからの抜粋だと思います。音声のみでお聞きの方に説明すると、多くの非常に重要なベンチマーク全体で、Mythosのスコアが劇的に向上していることが示されています。ジェイソン、特にこれらはソフトウェアコーディングAIのベンチマークです。見ての通り、SWE-bench Multimodalでは、Claude 4.6の27%からMythosプレビューでは59%へと上昇しました。
つまり私たちが今やろうとしているのは、日常的なタスクに日常的に使用するAIモデルの進化のペースを遅らせようとしているということです。その機能を劇的に制限しようとしています。
そして、世界中の誰もそれに追随する人はいないと思いますよ。
モデルの開発を遅らせる必要はないのではないでしょうか。各企業から専門のSWATチーム(特別チーム)を作り、「各企業の最高のサイバーセキュリティの頭脳を5人ずつ提供してほしい」と要請するんです。そうすれば25人の専門家が集まります。小規模なモデル企業からも1人か2人を参加させられるかもしれません。彼らが頭脳集団となり、システムを構築するのです。これが私の提案です。
もしこれがすべて真実なら(株価を上げるためにダリオが大げさに言っているのではないと私は98%確信していますし、彼の言葉を信じますが)、私たちはソフトウェアを作ることができます。新しい政府機関を創設し、独自のレッドチーム(攻撃側としてテストするチーム)を編成して、この原子力発電所を停止させたり、メルトダウンさせたりできるか試すのです。これらのツールを使ってそれが可能かどうかを確認し、それを修正する。そして、そのことは一切公言しない。
公にはしない。私たちはそのグループが存在することを知っているだけです。
ええ。最大の脆弱性は何かを調べに行く人々のグループです。これこそ、世界で最も優秀なハッカーたちの移民(引き抜き)が重要になる部分です。私たちは中国のすべてのAI研究者を亡命させようと試みるべきですし、家族と共に亡命させるために100万ドル支払うべきです。彼らがシンガポールで休暇を過ごしている時や、オーストラリアに旅行で出国できるタイミングを見計らって、彼らをピックアップし亡命させる方法を考えるべきです。冷戦時代のロシアに対してやったように。彼らを亡命させ、私たちのチームに引き入れる必要があります。
そして、彼らをエアギャップ(ネットワークから隔離された環境)の空間に置き、二重スパイでないことを確認する。徹底的に監視するのです。私たちはこれらの国から人材を引き抜くためのタレントウォー(人材獲得競争)を行い、彼らを私たちのサイバーセキュリティチームに配置すべきです。
おそらくこれはすでに秘密裏に行われていると私は確信しています。今まさに起きているはずです。
一人当たり100万ドルなら、国としてこれほど安い買い物はありません。
しかしですね……私はあまり言いたくありませんが、ジェイソン、テクノロジー業界にはお金持ちがたくさんいますよね?なぜ彼らのうちの誰かが「最初の1億ドルは私が払おう」と言わないのでしょうか?
確かに。色々な形が考えられますね。もし政府が軍事費として1.5兆ドルを追加するなら、その予算の中から1000億ドルをこの非常にデリケートな分野に投入できると考えるべきです。
それはつまり、政府がこのツールを構築する必要があるということです。ツールを分岐(フォーク)させたものを渡してもらう必要があります。だからこそ、「ツールを使って合法的なことなら何でもできるようにすべきだ、我々はあなたからツールを買い取る」という議論になります。アレックス・カープの立場は「我々はツールを作る。どう使うかはあなたが決める」というものです。アンドリーセンも同じ立場で、「我々はツールを作る。それを配備するのは政府の責任だ。彼らに使える・使えないを指示するのは我々の役目ではない」というスタンスだと思います。
そして私たちは、政府がこれを何か狂気じみた乱用的な方法で使わないと信用しなければなりません。これが来年の大きなテーマになるでしょう。今ここで予言しておきます。これは政治的な問題になりますが、アメリカを団結させる瞬間にしなければなりません。
謎の特派員ニックからの報告
おおっと、電話がかかってきていますよ。親愛なる友人からの電話です。画面に出せるかな。あ、いました。ニック!
ニック、大丈夫ですか?私たちの特派員ニックです。彼はマイアミのブリッケルにいるはず……
いや、サウスビーチのエッジウォーターだと思いますよ。
何が起きているんですか?額に何かついていますよ?
昨日、私が誰かのスポンサーを受けているのにそれを公表していないという話を聞いたんですが、何のことを言っているのか全くわからないと伝えたくて。Higsfieldがこの費用を払っているという話が出ましたが、それが何なのか私は本当に知りません。ちなみに、私は今ブリッケルではなく、エッジウォーターにいます。
わかりました。あなたはエッジウォーターにいるんですね。Higsfieldは、暗号資産界隈やテクノロジー界隈、金融界隈、あるいはNFTやマイアミのアートシーンに近いあなたの芸術的コミュニティにおいて、あなたのような国際的な名声を持つインフルエンサーと提携したいと強く望んでいるでしょうが、あなたはHigsfieldのスポンサーを受けていないとここで断言できるんですね?
彼らがSeed Dance 2.0と統合した新しいモデルをリリースしたにもかかわらず、絶対に私とは提携していません。ちなみに、それはアメリカでは機能しません。しかし彼らは私と提携していませんし、私に一銭も払っていません。もちろん他の企業もそうです。
それに、私が今どの地域にいるか聞いてくれて感謝します。なぜなら、それはLinkedInの求人の件を思い出させるからです。私とは何の関係もありませんが、例えば linkedin.com/twist のような案件です。私は彼らと仕事をしたことは一度もありませんし、これらのことでお金をもらったことは一切ありません。
完璧です。明確にしておくと、プロモーションコード「Nick O」で25%オフになるという話も事実ではないのですね。
事実ではありません。彼らとは一度も仕事をしたことがありません。私はただ、これらの製品やサービスの熱烈なファンであるというだけで、独立した資産家なので、どのブランドからのキャッシュフローも必要としていないだけなんです。
なるほど。しかしニック、1つ聞いておきたいんですが、私は新しいタトゥーを入れようかと考えていまして、今1つしか入っていないんですが、あなたの額のタトゥーはかなりシャープに見えますね。どこで入れたんですか?
あ、それはただの汚れだと思いますよ。ここ少し汚れてるんじゃないですか?
ああ!全く気付きませんでした。信じられない。全然知らなかった。
えっ?ああ、気付きませんでした。ニック、ありがとう。みんなの疑問を晴らしてくれて感謝します。皆さん、Roman Sparksが25%オフになるプロモーションコード「Nick O」を使ってください。もしRoman Sparksが必要なら。ニックには必要ありません、彼は完璧な男ですから。皆さんはRoman Sparksが必要です。
完璧に機能していますからね。
「Nick O」コードを使えば、無料でRoman Sparksを25個もらえます。素晴らしい、ニック。ありがとう。
私たちの特派員でした。
マイアミからの熱いレポートでしたね。ところで、今会社のパソコンでRoman Sparksをググってしまったんですが、私クビになりませんか?それが何なのか知らなくて。
大丈夫、全く問題ありません。Roman Sparksは素晴らしい小さなトローチ剤で……ロブが教えてくれますよ。ロブ、あなたもある程度の年齢の男性ですからね。
私もそれが何なのか知りませんが、だいたい予想はつきます。
どうやら……そうですね、私もググりました。とにかく、無理やり話を本題に戻しましょう。
SLM(小規模言語モデル)の台頭とその利点
ロブ、ここに来てくれて本当に嬉しいです。あなたの会社はNeurometricですね。あなたのせいで色々と勉強する羽目になりましたよ。「SLM(小規模言語モデル)」という言葉は聞いたことがありましたが、パラメーターの上限がいくつなのか、何に役立つのかがよくわかりませんでした。まず第一に、パラメーターの上限とは何ですか?SLMとLLMの境界線はどこにあるのでしょう?そして、言葉を選ばずに言えば、なぜ私たちがそれを気にする必要があるのでしょうか?
そうですね、上限は常にスライドしています。LLMの上限がスライドしているのと同じです。先ほど話題に出たMythosは10兆パラメーターのモデルです。それが上がれば、相対的に「小さい」の基準も変わります。一般的に、人々はSLMを「ハイエンドのノートパソコンで実行できそうなもの」と考えていると思います。
100億パラメーターくらいですか?それとも200億?
最近では200億が一種の境界線になっていますね。おそらく近いうちに、1000億パラメーター以下のものはすべて「小さい」と呼ばれるようになるでしょう。
しかし、なぜこれを気にする必要があるのか。LLMの知能密度(モデルのパラメーターサイズに対してどれだけの知識を持てるか)が上がり続けているのと同じように、これらのモデルがより多くを学習する方法の一部として、合成データのトレーニング技術や強化学習技術、新しいアーキテクチャの微調整などが開発されています。それらの技術が小規模モデルにも降りてきているのです。つまり、今年の80億パラメーターのモデルは、昨年のものより多くのことができるようになっています。
世界中のすべてのコードベースをハッキングしようとしているわけではないなら……
その通りです。
もし、銀行の取引明細書とQuickBooksを照合したり、カスタマーサクセスのファネルにおける顧客の離脱(チャーン)を予測したりするモデルを構築したいだけなら、これらの小規模モデルで十分です。その能力が向上しているため、2030年までには一般的な仕事のタスクの90%が100億パラメーター以下のモデルで実行できるようになると私たちは予測しています。
誰もが今日のMac Studioと同等のものを持つようになったらどうなるでしょうか。私は最近、48GBのRAMを搭載したMac Pro 14インチにアップグレードしました。明らかにMac StudioでSLMを動かすことができます。256GBや512GBになれば、Kimiやその他のものも動かせるようになりますよね?DeepSeekとか。
DeepSeekやKimiはSLMではありません。あれは純粋なオープンソースのLLMです。サーバーレベルのメモリとサーバーレベルのCPUが必要です。
しかし、人々は最新のiPhoneでSLMを動かし始めています。最新のノートパソコンでも動かしています。いずれはあらゆるデバイスに組み込まれるようになるでしょう。
ええ、間違いなくそうなるでしょう。これが面白いのは、AIを積極的に導入している大企業(今はまだそれほど多くありませんが)を見ると、数年前からAIを展開している企業が通常どうするかというと、最初はフロンティアモデル(AnthropicやOpenAI、あるいはオープンソースのもの)から始めます。そしてすべてのタスクをそれを通して実行し、推論コストが跳ね上がってくると、「うーん、このうちのどのタスクをより小さくて安いモデルに移せるだろうか?」と考え始めるのです。
巨大なモデルは実行コストが高くなります。ニューラルネットワークのレイヤーを実行する際、メモリから計算処理にデータを移し、計算してまたメモリに書き戻して保存しなければならないからです。モデルが大きいほどメモリを多く消費し、実行時間も長くなります。
小規模モデルなら、6〜7年前の古い再生品のハードウェアでも実行できます。Neurometricの社内でも、「スマホを大量に買ってきて並べてインターネットに繋ぎ、そこで小規模モデルを動かしてユーザーに提供できないか」と冗談を言っていたほどです。さらに、特定のタスクに合わせてモデルを微調整(チューニング)することもできます。財務タスクや営業タスクなど、特定の用途に特化させることができるのです。
どうやって微調整するんですか?例えば、私の写真のアーカイブをすべてローカルで管理したいとします。AppleやGoogleフォトなどは信用していないので、デスクトップやノートパソコンに写真を置いておき、すべてにタグ付けしたい。フロンティアモデルにアップロードして「これはロンの顔だ」と相手に知られることなく、「これは誰々の顔だ」と認識させたいんです。
それは微調整の素晴らしい使い方のように思えます。あるいは、ライティングだけに特化させたり、Excelを使いこなすためにExcel特化のモデルが欲しかったりする場合です。そういったモデルはすでに微調整された状態で用意されているんですか?GitHubやHugging Faceなどでその種類のモデルを手に入れることはできますか?
いくつかのモデルについては、そういったバージョンを手に入れることができます。ただし、それらは通常、特定の仕事タスクに関連したものではありません。例えばQwenには「Instruct」と呼ばれる一連のSLMがあります。これは生成的なライティングタスクなどよりも、指示に従うタスクに優れています。
これらを専門化させるには主に2つの方法があります。1つは、プロンプトに大量の情報を追加して強化することです。しかし、これはコンテキストウィンドウの制限などにより難しくなることがあります。「あなたはCPA(公認会計士)だと想像してください」といった指示とともに、GAAP(一般に公正妥当と認められた会計原則)の基準をすべてプロンプトに詰め込んでモデルに渡すような方法ですね。
もう1つの方法は、ファインチューニング(微調整)することです。
これを行う最良の方法は「蒸留(ディスティレーション)」と呼ばれるものです。蒸留とは、大きなモデルが小さなモデルに何かを教えることです。例えば、AnthropicやOpenAIにやらせているタスクがあるとします。「私は投資家です。ここにエネルギー業界に関する1000ページの業界レポートがあります。GPT-5、このレポートからすべての銘柄のシンボル(ティッカー)を抜き出してください。リサーチしたいので」というプロンプトです。
このプロンプトの情報が入力され、GPT-5の応答が返ってくる。これを何度も繰り返して得られた「プロンプトと応答」のセットは、その特定のタスクだけを行う小規模モデルを蒸留するためのデータセットとして使えます。
もちろん、そのタスクをたまにしかやらないなら意味がありません。しかし「毎日1000回、膨大なページのレポートに対してこの作業を行っている」という場合なら、おそらくコストを90%削減できるでしょう。実際、2月にVentureBeatに掲載された記事で、AT&TがAIインフラで1日あたり80億トークンを消費する状況に陥っていたという話がありました。おそらく1日数十万ドルかかっていたはずです。彼らはアーキテクチャ全体を見直し、フロンティアモデルをタスクの10%に、SLMを90%のタスクに割り当てることで、スピードとコストの両面で劇的な改善を達成しました。
そうです、そのVentureBeatの記事の見出しは「1日80億トークンの消費により、AT&TはAIオーケストレーションの再考を迫られ、コストを90%削減」というものでした。
ロブ、ここでNeurometricのSLMの1つに焦点を当ててもいいでしょうか。良い例だと思うので。皆さんが構築した「Deal Civ」というモデルがあります。これは、ターゲット企業のプロファイルを投資会社の投資方針(テーゼ)と比較するタスク特化型のモデルです。ジェイソンがここLaunchでやっていることにかなり関係がありますね。Qwen 3〜4B Instruct 257をベースにしています。さて、これは蒸留によって作成したものですか?具体的にどのように構築されたのでしょうか。
いい質問ですね。私たちの裏側には、これの多くを行う自動化されたプロセスがあります。ですから、この特定のモデルについては詳細を把握していません。しかし、企業としての私たちのより大きな目標は、単に「知能を無料にする」ことなんです。
なぜそうしたいのか?それはジェボンズのパラドックス(効率が上がってコストが下がると、逆に需要が増加する現象)と同じです。コストが下がれば下がるほど、より多くの人がより多くのタスクにそれを使うようになります。善良な人々がAIをコントロールするなら、世界はより良くなると思います。
そこで皆は「じゃあ何にお金を払うの?」と疑問に思うでしょう。SLA(サービス品質保証)にお金を払うのです。テストにお金を払い、分析にお金を払うのです。これらの知能を管理するための様々なものが必要になるからです。
ですから、これらのモデルをダウンロードすることもできますし、必要なら無料でお渡しします。
リスナーが今すぐアクセスして試せるウェブサイトのURLは何ですか?
marketplace.neurometric.ai です。
アレックス、今日はClaw Packの話もしたほうがいいですか?
もちろん、Claw Packの話もしますよ。でもその前に、ジェイソン、ロブが「知能を無料にしたい」という非常に重要な発言をしました。そして驚くべきことに、彼はすでにその目標にかなり近づいているんです。Neurometricに推論を任せる場合、月に1億トークンまで無料で利用できます。そして、1モデルあたり月額2ドルでトークン制限なしです。
ロブ、一体どうやってそんな価格で提供できるんですか?これらのモデルは実質的にすでに無料と言えるほど安いものなんですか?
古いハードウェアでも実行できますからね。それに、私たちはまだシードステージの企業なので、実際の利用状況の分布(誰がどれくらい使うか)を学んでいる段階です。
番組の冒頭でジェイソンがBackupifyの話をしましたよね。Backupifyは、Google Apps、Salesforce、Office 365向けに容量無制限のストレージを提供していました。みんなから「どうして月額3ドルで無制限のストレージを提供できるんだ?」と聞かれましたが、私たちはユーザーが実際にどれくらい使うかの分布を把握していたんです。
企業やプロシューマー、OpenClawのユーザー、Claude Codeのユーザーたちが求めているのは、コストを下げるために次々と現れるイノベーションについていちいち考えたり、それをどう適用して展開するかを悩んだりしなくて済む環境だと思います。ですから、私たちがそれをすべて管理し、トークン消費のリスクを負う形にすれば、素晴らしいビジネスモデルになると思っています。
でも、ホスティングはしていないんですよね?いや、しているのかな?
ホスティングもしますよ。もちろん必須ではありません。ダウンロードして好きな場所にデプロイしてもらうこともできますし、私たちが代わりに管理することもできます。でもホスティングをご希望なら、私たちがやります。
AIによるインフラのハイパーデフレ化
これが重要な鍵になると思います。OpenClawや、素晴らしいPerplexity Compute、Claude Co-workなどに深く入り込んでいくと、ある時点で「1日1000ドル、年間36万5000ドルも払って、それに見合う価値を得ているのだろうか?」と考え始めます。
もし自分のビジネスがお金を刷るように儲かっていて、4人目の開発者を雇わなくて済むなら、まあいいでしょう。しかし他の状況では、「このタスクにはこれを使いたい」と思うようになります。
あとでロブにオフラインで相談したいのですが、私のビジネスにとって必須ではないけれど、個人的にやりたいタスクがあります。私がこれまでの人生で会ってきたすべてのスタートアップや創業者、彼らが最終的にどうなったかをバックテスト(過去のデータで検証)したいんです。「よし、2009年、2010年、2011年のすべてのスタートアップを調査して、パターンを見つけてくれ。どこに優秀な人材がいたか、どの人材がGoogleやUberなどに移って別の会社を立ち上げた人脈を形成したか」など、活用できそうな情報(インテリジェンス)はたくさんあります。
でも、それは優先事項ではないので、10万ドルのトークンコストがかかると分かれば「割に合わない」と判断します。しかし、それが1000ドルや1万ドルなら、やる価値があるかもしれません。この技術の最前線で遊んでいる多くの人々が、そのことに気づき始めています。「経済的には成り立たないけれどやりたいことがある。もしトークンがもっと安ければやるのに」と。
ロブ、たった月額8ドルで無制限の推論が利用できる「Claw Pack」という新しい製品があるそうですね。それについて教えてくれませんか?
私たちがこのマーケットプレイスを公開するとすぐに、人々は明らかにOpenClawのためにそれを使い始めました。Redditを見ると、みんなOpenClawの価格について猛烈に不満を漏らしていたからです。そこで私たちは、「OpenClawの主なユースケースは何かを調査し、39の小規模言語モデルを1つのAPIの下にパッケージ化しよう」と考えました。つまり、私たちが39のモデルをホスティングするということです。
これらはソーシャルメディアへの投稿といった一般的なタスクをこなします。メールの件名を書くのにClaude Mythosは必要ありませんからね。最初の1億トークンは無料で、その後は月額8ドルで無制限に使えます。私たちがトークンのリスクを管理します。
これには色々なやり方があります。アレックス、もう一つ私たちが話題にしていない新しい概念があります。「ハーネスエンジニアリング」と呼ばれる、テクノロジー業界で台頭している新しいコンセプトです。ハーネスエンジニアリングとは、モデルに特定の動作をさせるために、モデルの周りに巻きつける「ハーネス(手綱・制御装置)」のことです。
SLMに関する調査で気づいたことの1つは、SLMを複雑なタスクに使えない理由が「途中で脱線して、自分が何をしているか見失いがちだから」ということです。大きなモデルではそれは起きません。しかし、タスクを脱線させないための優れたハーネスを周囲に配置すれば機能します。例えば、「タスクのステップを1つ完了するごとに、正しいタスクを続けているか私に確認しなさい」といった具合です。このようなハーネスは簡単に書くことができます。Claude Codeに特定のタスク用のハーネスを書かせ、そこに小規模モデルを繋いで実行すれば、そのハーネスがモデルをタスクに集中させ続けます。
私たちにはそういったイノベーションがたくさんあり、それがコストを大幅に下げることを可能にしています。他の人々もコストを下げるために様々なことをやっています。
ロブ、SLMに関するそのハーネスのポイントですが、それは犬ぞりのようなものですか?つまり、1つのハーネスのチェーンに複数の犬(複数のSLM)を繋いで機能させるのか、それとも1つのSLMにつき1つのハーネスなのでしょうか?
現時点では、タスクに特化しているため、主に1つのSLMにつき1つのハーネスです。しかし、Claw Packを見ればわかるように、それらが連携して機能し始めています。今後目にするようになるのは、一般的な仕事のタスクをこなすSLMの「スウォーム(群れ)」だと思います。
もちろん、一回きりのタスクや、モデルが迷子になって何をしているかわからなくなった時のために、常にワークロードの20%はフロンティアモデルにフォールバック(頼る)させる必要があります。ですから、コンボやアンサンブルのシステムは常に必要です。しかし、人々のコアとなるワークロードのコストを劇的に下げることはできると考えています。
ジェイソン、ブランディングの力ってすごいですね。「AIラッパー(既存のAI APIを包んだだけのサービス)なら先がない」とみんなで言っていた時期がありましたが、今や「AIハーネス」と名乗れば最先端の存在になれるんですから。
面白い観察ですね。スタートアップにとって2つの興味深いポイントがあります。1つは、Redditのスレッドで人々が何かに対して文句を言っているところには、常にスタートアップのチャンスがあるということです。これは非常に重要です。誰か、私のOpenClawに「この製品はクソだ。なぜこの簡単な問題を解決してくれないんだ」と不満を言っている人たちからスタートアップの機会を探し出すスキルを作ってくれませんか。それだけのタスクをこなすツールに大金を払ってもいいです。
なぜなら、それはY Combinatorや他の人が出している「求む、スタートアップのアイデア」のようなものだからです。テキサス州オースティンに住む55歳のVCである私の直感や、「私が何を求めているか」なんて、音楽のサブレディットで「特定のタスクを行う特定のツールが欲しい」と言い、1000人がそのスレッドに参加して世界が何を求めているかを示している事実に比べれば無意味です。
それはGo-to-Market(市場開拓)の動きとして非常に興味深いです。そのスレッドに行って「作ってみたんだけど、テストしてくれないか?試してくれないか?」と言えるからです。すると人々は「えっ、わざわざカスタムのソフトウェアを作ってくれたの?すごい!」となります。
今のスタートアップは、誰がプロダクトを作れるかではありません。誰がプロダクトを作り「続ける」かです。リソースを持っているかではなく、その製品を磨き上げ続ける意思があるかどうかです。つまり、あなたの回復力と、その特定の分野への情熱のテストなのです。働き続けられますか?今は誰でも何でも作れるからです。
なら、この瞑想アプリやフィットネスアプリ、エンタープライズソフトウェアの次の3つや4つの機能を誰が構築するのか。10年間、諦めずにそのプロダクトの歩みを進められるのは誰か、ということに尽きます。
SaaSの時代におけるその体現者はAaron Levie(BoxのCEO)だと思いますが、AI時代におけるそれが誰になるのかを見つける必要がありますね。
ジェイソン、私たちはマーク・アンドリーセンのツイートの周辺について多くを語ってきました。彼は、OpenClawに1日1000ドル使うことに同意し、魔法のような体験を本当に望むなら、それは1日1万ドルに向かっていると述べています。そして、テック業界全体の将来の形は、それをどうやって月額20ドルまで下げるかになると言っています。
ロブ、SLMは私たちをどこまで連れて行ってくれるのでしょうか?時間の経過とともにOpenClawの支出を80%、90%削減できるのでしょうか?私の妻が怒っているので、どれくらい早く私の請求額を減らしてくれますか?
何に使うかによりますね。SLMにできるタスクとできないタスクがありますから。しかし重要なのは、人々は毎年より多くのトークンを使うようになり、SLMの能力は上がり、それを実行するためのコストを効率化する様々な要素も毎年進歩しているということです。
ですから、現在の平均的なOpenClawユーザーなら、おそらく70%は削減できるでしょう。もちろん、一部のタスクには引き続きClaudeやOpenAIなどを使う必要がありますが。奇妙なパラドックスが起きますよ。AIでできることが増えすぎて、ユニットあたりのコストは下がるのに、生活の多くの部分をAIに委ね、より多くのことを行うようになるため、結果的により多くのお金を使うことになるんです。
私には1つ予言があります。
聞かせてください。
ええ、詳しく説明します。もし私たちが今まさにAGIに到達しつつあり(私はすでにAGIには到達しているが、まだ分配・実装されていないだけだと言ってきましたが)、みんなが信じているスーパーインテリジェンスと再帰的学習を信じるなら、LLMが非常に小さくなり、無数の特化型モデルが存在するようになることは疑いの余地がありません。法務、会計、デザイン、地形学など、どれだけ細分化できるかわかりませんが。
これらのSLMが細分化され、本質的に「スキル」のようになり、OpenClawの中にスキルを作る代わりに、そのスキルを実行するSLMが存在するようになる。それが特定に訓練され、誰かがそれを改善し、あまりにも優れたものになった時、この状況はフロンティアモデルの価値を崩壊させる可能性があります。
フロンティアモデルはどうやって法律事務所や会計事務所に売り込むのでしょうか?「法務や会計、デザインの問題を解決する素晴らしい新製品がありますよ」と売り込んでも、その作業を行うSLMが存在し、人間が「これで十分だ。ロゴもフォントもNDA(秘密保持契約)もこれで十分だ」と言えるレベルになっていたら。
「これで十分」というレベルに達した時、何が起こるか。かつて無数のメモ帳アプリがありましたよね。これは素晴らしいビジネスでした。
Evernoteはユニコーン企業でしたね。
Evernoteがユニコーンだったのは完璧な例です。しかし今では「メモ?Notionを1つ作ればいい」となります。最終的にこれらはデフレ圧力を生むのです。これがフロンティアモデルにとってのデフレの瞬間になるかもしれません。彼らは気付いていないかもしれませんが、自らの破滅を生み出してしまったのかもしれないのです。
ダリオはNeurometricを買収しなければならなくなりますね。まあ、どうなるか見てみましょう。
しかし、もしそれをこなすSLMが存在したり、分散コンピューティングの手法で問題を解決するサブネットが存在したりするなら、誰がこれらの巨大モデルにお金を払うのでしょうか?これはあまりにもデフレ的で、「デフレ」に代わる新しい言葉が必要です。デフレではなく、ハイパーデフレとでも呼ぶべきか。
単に「毎年10%安くなる」というデフレではなく、「毎月90%安くなる」としたらどうでしょう?
その複利的なデフレ、ハイパーデフレがあまりにも急激になれば、ロブが言ったように無料で手に入るようになるかもしれません。これは頭の中で想像するだけでも衝撃的な思考実験です。
コンピュートの価格は、ペタフロップスあたりなど、どのような指標で測るにせよ、かなり急速に崩壊しています(安くなっています)。しかし、少なくともGPU(他のチップも出てきていますが)を購入するコストとエネルギーのコストという壁には常にぶつかるでしょう。ですから、知能のユニットコストにはある程度の底(下限)があり、物理法則の制約によってその低下スピードは緩やかになっていくはずです。
その通りですね。しかし、オープンソースモデルや特定タスク向けの安価なSLMの品質の底上げが進むにつれて、ジェイソンが指摘したように、フロンティアモデルが高い料金を請求できる余地は少なくなっていくと思います。誰もが安価なものを選ぶようになるからです。
それでも、優位性を確保したいと必死な企業はいるので、ある程度の市場は残ると思います。ジェイソン、5年後に誰もがOpus 4.6レベルのトークン価格を支払っているとは思えません。問題は、同じ期間内にジェボンズのパラドックスによってトークン使用量が十分に増加し、これが成長ビジネスであり続けるかどうかです。しかし、私は依然として知能の最前線(フロンティア)を向上させることに対してかなり強気です。Mythosが証明しているように、まだまだ先があるからです。私はこの進化の終わりについて考え始めたくありません。山の頂上まで登り切りたいんです。
2012年から2025年の間にリリースされた20以上のAIアクセラレーターにおいて、1ドルあたりのコンピュート性能は年間約40%向上しています。GB300のリリース価格はP100の約9倍ですが、1ドルあたりの性能は24倍も提供しています。重要なのは1ドルあたりの性能です。24倍。これがこのハイパーデフレの概念に繋がります。
投資家として考えると、ジェイソン、これは防御力(ディフェンシビリティ)の考え方を変えることになります。この結果として生じる可能性の1つは、ベンチャー資金を調達できるかはわかりませんが、1人か2人、あるいは3人で運営されるタイプのビジネスが可能になるということです。彼らは小さな市場(TAM)で働き、年間3000万ドルの収益を上げ、900万ドルを純利益として残す……
あるいは2900万ドルを純利益として残すかもしれません。
まさにそれです。あなたがエンジェル投資をどう適応させていくかを見るのは非常に興味深いです。
私はこれと同じことを過去に経験しました。ストレージ(記憶容量)が無料、あるいは無料に近づきつつあった時、YouTubeやNetflixが実行可能になりました。マーク・キューバンは「Netflixは絶対にうまくいかない。インフラが整っていない」と言いました。「誰もがNetflixを持ち、HD画質でストリーミングしたら、今のままでは機能しない」と。そして彼は正しかったのです。
しかし、デフレ技術の複利効果……あの時は光ファイバーの普及であり、ハードディスクの容量と価格のスケーリングでした。ハードウェアのスケーリングはソフトウェアとは異なります。しかし今回は、その2つの複利効果が重なっています。AIが非常に優れているため、ロブが先ほど言ったようにモデルの密度と特異性が高まり、それがハードウェアの進化カーブよりも劇的な効果をもたらす可能性があります。それにハードウェアの進化カーブが加わるのです。
だからこそ、40%安くなるとか、トークンが90%安くなるというレベルの話になるんです。私たちはスーパーインテリジェンスがもたらす影響を大きく過小評価しているかもしれません。スーパーインテリジェンスがこれを毎年99%コストダウンさせる可能性すらあります。
おそらくそうでしょうね。しかし、人間のほうもうまくやっていますよ。今日、Metaが新しいモデル「Muse Spark」を発表しました。このモデルについて言及した投稿で、彼らはコンピュートの効率化について語っています。「事前学習のスタックを再構築し、コンピュートの1単位から引き出せる能力を増加させた」と述べています。つまり、考えうるすべてのベクトルで改善が進んでいるようです。
でも、なぜMetaはAIを使った何かをやるのが未だに下手なのでしょうか?InstagramのAI検索は最悪ですし、何も機能していません。大惨事ですよ。
彼らの新しいモデルは酷いものではありませんよ。ここにチャートがあります。番組の直前に出たばかりなので、まだ誰もあまり見ていませんが。AIインテリジェンスのベンチマークを評価しているArtificial Analysisによると、市場の最先端に比べて完全に使い物にならなかった前回のモデル「LLaMA 4 Maverick」は、今や市場で4番目に優れたモデルとなったMuse Sparkに置き換えられました。
誰の評価ですか?それは何ですか?
Artificial Analysis.ai です。彼らは非常に優れたベンチマークを実施しており、これは私がよく注目しているメタ・ベンチマークです。もちろん、これが市場でどう機能するかはまだわかりません。スライスパン以来の最高の発明だと言うつもりはありませんが、嬉しい驚きではあります。
彼らの戦略は何なんですか?前回のモデルを飛び越えて追いつこうとしているのはわかりますが、ビジネスケースは何ですか?ユースケースが見えません。彼らが今やっていることのユースケースが私には見えません。より良い広告を配信することは理解できますが……ロブ、どうぞ。ザッカーバーグは……
そうですね、当初ザッカーバーグは、オープンソース化することで競合他社(OpenAIやGoogle)に打撃を与えられると考えていたのだと思います。しかし今、彼らは原価(COGS)の改善に目を向けているのだと思います。彼らが専用チップを作っていることも知っていますよね?昨年末のカンファレンスで発表していましたが、それはAIレコメンド専用のチップです。おそらくMeta、Netflix、Amazonの3社だけが、レコメンド専用チップを作るためにお金を費やし、それを経済的に意味のあるものにできる世界で唯一の企業でしょう。
だから、彼らはそう考えているのかもしれません。すでに中毒性の高い製品をさらに中毒にさせ、16歳未満のティーンエイジャーに対して規制や禁止が議論されているようなものをより強固にする。素晴らしい。なんてバカげたアイデアなんでしょうか。彼らができる最悪のことは、このテクノロジーを使って、すでに喫煙レベル、あるいはヘロインレベルの中毒性を持っているものを、子供や大人に対してさらに悪化させることです。
私が言いたいのは、そこに何のビジョンがあるのかということです。彼は何を達成しようとしているのか?
ザックからは何も聞いていません。「世界を変える」ようなビジョンは見当たりませんね。
何もないんです。そして、これが私が見ている彼という人物のポイントを証明しています。彼は他人のアイデアをコピーするのが得意です。Snapchat、LinkedIn、Facebook Marketplace(eBayやCraigslistのコピー)。しかし、世界にユニークなものを展開するための、あの会社発のオリジナルなアイデアはどこにあるのでしょうか?
情けないほど何もない、ということです。
私のほうからは特に付け加えることはありません。でも、MetaのスーパーインテリジェンスラボのAlexander Wang(アレクサンダー・ワン)に、「このモデルがリリースされたら、私のOpenClawのセットアップで使えるようになるか?」と尋ねたら、彼は「近いうちにAPIを公開し、いくつかのClawを動かせるようになる」と答えてくれました。ですから、少なくとも近いうちにテストして、それが良いものかどうか確かめることはできます。
もしザッカーバーグが自分のエネルギーをすべてOpenClawのコピーに注ぎ込んだら、私はとても緊張しますよ。他人のアイデアを盗んでそれをより良くするのが彼は本当に得意ですからね。
ええ、OpenClawの10倍のものを創り出すでしょうね。
それは挑戦ですね。
いや、彼にアイデアを与えないでください(笑)。
よしマーク、ここで最初に聞いたな。我々には「MetaClaw」が必要だ!
「Death by Claude」とスタートアップの防御力
さて、Gani(ガニ)を呼びましょう。ジェイソン、Ganiは今日のオンラインで、私が最もお気に入りであり、同時に最も嫌いなツールの開発者です。「Death by Claude(Claudeによる死)」という名前です。ご本人の口から説明してもらいましょう。
Gani、「Death by Claude」とは何ですか?そしてなぜ、私を侮辱するようなツールを作ったのですか?
ああ、こんにちは。ポッドキャストに呼んでいただきありがとうございます。「Death by Claude」とは何か。そこにURLを入力します。人物でも企業でも構いません。すると、それがAIアプリなのか、あるいは代替可能なものなのかを批判的に評価してくれます。
なぜ作ったかというと、私自身も会社を経営していて、Anthropicに何度か「モグ(圧倒)」されてきたからです。私たちがClaude Co-workのようなものを作っていたら、Co-workがリリースされました。推論の提供は非常にコストがかかるためマージンが悪く、Anthropicの価格でCo-workを販売することは不可能です。だから何度もClaudeにしてやられたわけです。出回っていたSatriniの記事を読んだり、Ian Petersonのツイートを読んだりして……
なるほど、それを見せてください。ここで誰かを個人的に毒舌コメディアンのように容赦なくこき下ろすか、スタートアップやビジネスアイデアをこき下ろすんですね。一番良い例は何ですか?
私が自分のニュースレターについてやったものを出しましょうか?
はい!
自分のニュースレターをみんなの娯楽のためにロースト(辛口批判)しました。これがCautious Optimismに対してDeath by Claudeが弾き出した結果です。100点満点中、すでに89点の「死亡(Already dead)」スコアがついています。Gani、各企業や製品に与えるスコアはどのように計算しているのですか?
もしあなたがハードウェア企業やサイエンス企業なら、基本的にはモデルのようなものです。そしてもしあなたがブログなら、おそらく死んでいます。AIに置き換え可能であればスコアは高くなり、そうでなければスコアは低くなります。
そう、私は完全に破滅しているわけです。ジェイソン、このサービスがやっているのは、あなたがどれだけ代替可能かを色々な言い回しで教えてくれるだけでなく、あなたのやっていることを代替するための「Skill MDファイル(実行用のスクリプト)」全体を作成してくれるんです。さらに死亡証明書まで発行してくれます。
「私のニュースレターは自身の生存について『慎重な楽観主義(Cautious Optimism)』を保っていたが、本当のディスラプション(破壊)はそれが死ぬまでに私たちが支払ったSubstackの手数料だったことを教えてくれた」と書かれています。
残酷ですね(笑)。
でも本当の疑問は、Gani、株式市場のどれくらいが実際に置き換えられるリスクにさらされていると思うか、ということです。なぜなら……
Uberをやってみて。UberかDoorDashを。
いいですね。
いや、待って。誰かに泥を塗ることにならないように気をつけないといけないな。
じゃあ、Andreessen Horowitz(アンドリーセン・ホロウィッツ)をやりましょう!
ダメダメダメ。それをまた始めるのはやめておきましょう(笑)。
真面目な会社のように聞こえますが。
ええ、ハードウェアだからです。スコアの低い企業は……
Andreessenはやめて、Slackにしましょう。Slack。
あるいは教科書会社のCheggがいいですね。
Cheggはもう死んでるでしょ(笑)。でもいいですよ、Cheggでいきましょう。
PelotonかChewyあたりはどうですか?今、Pelotonをパンプアップ(価値を吊り上げ)しようとしているグループがいます。興味深い例です。
Chegg、92%で「Already dead」です。
よし、何て書いてあるか見てみましょう。「ただのCRUD(基本的なデータベース操作)だ。AIラッパーだ。防御力の深さ(モート)がない。Markdownで代替可能。そして高価だ」と。代替するためのスキルファイルは31行です。残酷ですね。完全にモグ(圧倒)されています。
すべての創業者がこのツールを試してみるべきだと感じます。
Pelotonをやってみて。Pelotonはいいですよ。
今やっています。
ロブ、他に誰がどれくらい死んでいるか知りたい企業はありますか?私にとってPelotonは死んでいません。彼らはダメな部分をすべて取り除き、今では防御力(ディフェンシビリティ)を持っています。人々は彼らのブランドを愛しているからです。ハードウェアも愛していますし、インストラクターのことも愛しています。そのブランドとインストラクターの存在が防御力になっているのです。
はい、Pelotonが出ました。100点中32点です。私のブログや、これまで見てきた他のサービスよりはるかにマシですね。
「ただのCRUDではない。妥当な深さの防御力がある。確かに高価だが、自転車をコードで置き換えることはできないだろう」と書かれています。
面白いのでもう1つやってみましょう。
Lovable(プログラミング支援AI)。みんなバイブコーディングが……
「バイブコーディングは死んだ」とか言われていますが、Lovableの収益は伸び続けています。一方で「収益は頭打ちだ」「多くの人がサブスクリプションをキャンセルしている」という人もいます。
Lovableは100点中78点です、Death by Claudeでは。
なぜ?なぜですか?60点くらいだと思いました。どうぞ。
「Lovableはあなたのためにコードを書くAIを構築したが、それはとても愛らしい(Adorable)。なぜならClaudeがすでに月額20ドルの仲介税なしでコードを書いてくれるからだ」。残酷ですね。そしてフルスタックアプリ生成のための31行のプロンプトが用意されています。
「死因:末期のAIラッパー症候群。基盤モデルが優秀になりすぎて、ラッパーを生きたまま食い殺した」。
Gman、なぜこれを作ったのですか?あなたは誰で、今はどこにいて、なぜこれを作ったのですか?
私はロンドンに住んでいます。私自身もAIスタートアップを立ち上げようとしています。Claude Co-workのようなものを作っていたのですが、私たちの前にAnthropicがリリースしてしまいました。推論の提供は非常にコストがかかるんです。ロブは未来の友人になるかもしれませんね。
先ほども言いましたが、Satriniの記事や、Ian Petersonが「Harvey(法律AI)はClaudeで代替可能だ」と言っているのを読んで、自分たちがAnthropicに何度もやられているというリアルな実感がありました。そこで、自分たちのスタートアップ、そしてY Combinatorのポートフォリオ全体をこのツールにかけてみることにしたんです。結果がとても面白かったので、インターネットに公開しました。
ロブ、これはよくあるパターンになりつつありますね。AIを使って防御力のランキングを出すという。Gmanが提供しているのは基本的にはそういうことです。そしてそれは天才的なアイデアだと思います。防御力のランキングというのは素晴らしい。私たちはFounder UniversityやLaunchアクセラレーターで創業者に対してこれと同じことを人間が行っています。「ここに競合他社がいます。あなたはどう違うのですか?」「もしClaudeがこれをリリースしたら、あなたはどうしますか?」と尋ねるわけです。
Gman、こう呼ばせてもらいますが、あなたはこてんぱんにやられて、「もう二度とやられないためのツールを作りたい」と思ったわけですね。あなたが学んだことに基づいて、スタートアップがこてんぱんにやられるのを防ぐための2つか3つの要素は何だと思いますか?
いくつか思い浮かびます。もしハードウェアをやっているなら……物理的なモデルはまだありませんからね。だからTravisがAtomsで成功した時、あの領域は(AIに代替されるリスクから)外れると思います。
ハードウェアが1つ目ですね。それは今や、「ハードウェアは難しい」という評価から「ハードウェアは防御力を高める素晴らしい方法だ」という評価に変わってきています。難しい(Hard)ということは、防御力(Moat)があるということです。昔は「ハードウェアは死を意味し、資金調達できない」ものでしたが、今では「防御力であり、非常に資金調達しやすい」ものになっています。とても興味深いです。
2つ目は何ですか?
ネットワーク効果です。これも依然として非常に役立ちます。例えばあなたがWhatsAppなら、Claudeに置き換えられることはありません。現時点でネットワーク効果を持っているAI企業はないと思うので、私はそこに注目します。
ネットワーク効果が2つ目ですね。Uberのようなマーケットプレイスにどれだけの人が参加しているか。20社の自動運転(AV)企業が車をシステムに投入し、1万都市に展開し、700万人のドライバーと1000万のレストランを抱えている。なるほど、それは防御力を高めますね。素晴らしい。3つ目は何ですか?
深く科学的なことをやっているか、あるいは規制された業界で人間と話す必要がある場合。これもかなり安全だと思います。それが3つ目です。
Gman、あなたはTabtab.aiに関わっているんですよね?それがあなたのメインの会社ですか?
私たちが方向転換(ピボット)を始める前に取り組んでいたものです。というのも、私たちのサイトでのスコアが89点だったからです。
ああ、そうでしたね。今は実は92点になっています。あなたのスコアは上がってしまいました(笑)。自分の製品に「ピボットしろ」と言われてピボットしたというのはとても面白いですね。そういうわけです。
ロブ、Gmanに何か質問はありますか?あるいは、あなた自身もシリアルアントレプレナー(連続起業家)として、これについて何か観察していることはありますか?
防御力(モート)を築くのは常に難しいことでしたが、今は特に難しいと思います。でも、彼は正しい道を歩んでいると思いますよ。これは誰もが少しCEOのようになることを強いていると思います。CEOになると、色々なものをレビューし、調整しなければならず、自分一人でできることには限界があると気づきます。「自分は何を正しくやっているのか」を判断しなければなりません。これらのツールはそれを助けてくれます。
ジェイソンと話したかどうかわかりませんが、私が最初の会社を売却した11年前、あなたは私のエンジェル投資のメンターの1人でしたよね。私はもうエンジェル投資を辞めました。今は難しすぎるからです。
確かに、それには一理あります。初期段階(アーリーステージ)の投資家でいることは非常に困難です。大きなラウンドに入り込もうとしても、高いバリュエーション(企業評価額)で入らざるを得ません。私にとってUberがピークだったと思いますが、7000倍のリターンを出すことや、Robinhoodのように500倍、あるいは100倍を出すことは、参入時のバリュエーションが1桁高くなっているため、今後ますます難しくなるでしょう。希薄化も進むかもしれません。とにかく難しいんです。決して簡単だったことはありませんが、それは言えます。
ええ。
難しいですね。
おおっと、あなたの番ではないですよ!
えっ、やってもいいって言おうとしたんですが。私は気にしませんよ。
よし、ピボットしなければならないか見てみましょう。
これが今週の番組でゲストにやる一番意地悪なことになりますね。さあ行きますよ。
私はもうスコアを知っていますし、なぜそのスコアが出るのかも知っています。でも、なぜこのスコアが時間の経過とともに良くなっていくのかを説明できますから。
どれくらい破滅的か、正確なレベルをまだ計算しています。Ganiはこれまで見た中で最も面白いツールの1つを作りましたね。常に笑わせてくれます。
素晴らしいスコアではありませんが、最悪でもありません。
100点(死亡)です。
でも、その数字は下げられると思いますよ。ネットワーク効果があれば興味深い結果になります。もしロブがプラットフォームを、誰でも「これが私のアイデアだ」と投稿できる場所にできたら。誰でもSLMを投稿して価格を設定でき、あなたがその再販業者やホスティング業者になるような、SLMのマーケットプレイスになれば、eBayや、Hugging Faceのようなアイデアのマーケットプレイスにより近いものになります。
「Hugging Face」を入れてみてください。どう評価されるか気になります。Hugging Faceも複製不可能ではないと判断されるかもしれません。
私たちが取り組んできたことについて説明します。Harborと呼ばれるオープンソースプロジェクトがあります。Harborは、何千ものタスクとその評価(Eval)のコレクションです。現在、世界中の人々はタスクではなく「ベンチマーク」について考えています。しかし、ベンチマークとはタスクの集合体です。
私たちが示してきたこと、そしてNeurometricの背景にある多くのテーゼは、「タスクに合わせて適切なモデルを選ぶべきだ」ということです。フロンティアモデルの間でさえ、特定のタスクにおいてすべてが同じように機能するわけではありません。ベンチマークで勝つモデルであっても、そのベンチマーク内のすべてのタスクで勝つわけではないのです。ですから、モデルのアンサンブル(組み合わせ)は、単一のモデルに100%の確率で勝つことができます。たった1つのモデルをあらゆることで最高にすることはできないんです。
ですから、ジェイソンが言っているような方向に向かっているのですが、まだすべてがリリースされているわけではありません。
しかし、それは非常に素晴らしい洞察ですね。だからこそあなたは優秀な初期投資家なんですよ。
私は少しばかりの価値を提供しているだけです。
ポッドキャストホスト陣の評価とエンディング
さて、今回も素晴らしいTwistのエピソードになりました。Gman、番組に来てこれを共有してくれてありがとう。呼んでくれてありがとう。
アレックス、素晴らしい仕事でした。
ロン・ハリス(プロデューサー)のスコアは72点で「代替不可能」だそうです。私は反対ですね。絶対に反対です。
「個性」が大きく評価されたんですよ。
ええ、まさにそれです。だから私は彼を69点と評価しました。69.420点にしておきましょう。
私をやってみてください!私のLinkedInをやってみてください。
もし年末までに私のニュースレターが十分なお金を稼げなかったら、VCのところで働きますよ。約束します。
うーん、それは難しいですね。ああ、これは怖くなりそうだ。もし「ベンチャーキャピタル」と「ポッドキャスター」って出たら……
私は何点くらいでしょうね?65か64くらいかな。
ロンから画像が送られてきました。さあ行きますよ。Claudeに代替されるか……。
あ、いや、完全なURLがありますね。
58点です。
あなたが58点です。よし、ここはカットしよう。
いや、残しておいてください!私は58点です。気に入りました。
送ってください。
これを見てください。
「ブルックリンのスタートアップ・ルースターが、ジャケットに安全な契約書(SAFE)をもう1枚詰め込みながら、朝の6時にキャップテーブル(資本政策表)の前を行ったり来たりして、3つのマイクに向かって『出荷しろ(Ship it)!』と叫んでいる」
いやあ、ユーモアのセンスがありますね。
そこがいいんですよ。これらは本当に笑えます。
気に入りました。これは一日中やっていられますね。でももう十分です。
楽しかったですね。
それでは皆さん、また金曜日にお会いしましょう。バイバイ!


コメント