この動画では、金融業界特化型AIプラットフォーム「Alpha」を開発するBoosted AIのCEOジョシュ・パントーニが、エージェンティック AIが金融業界をどのように変革しているかについて詳しく解説している。従来の対話型AIとは異なり、継続的に学習し自動的に業務を実行するエージェント型AIの可能性、金融データの複雑な分析能力、そして既存のBloomberg端末のような従来システムに対する競争優位性について語っている。

エージェンティック AIが金融業界に革命を起こす
よっしゃ、今日はBoosted AIのCEOジョシュ・パントーニさんに来てもろてます。Boosted AIはboosted.aiで見つけられるで。キャッチフレーズは「金融のために専用設計されたAI」や。めっちゃええやん。それと「データの氾濫を乗り越えて、競合を出し抜いて、時間を取り戻せ。Boosted AIのAlphaと一緒に。これはエージェンティック AIプラットフォームで、チームが金融の未来を勝ち抜けるように作られてるんや」てなってる。
ジョシュ、ポッドキャストへようこそ。来てくれて最高やわ。
よっしゃ、今回のエピソードはAIと金融について幅広く話そうと思うんやけど、まずはあんたらのフラッグシップ商品のAlphaの現状を簡単に教えてくれる?今何ができて、誰がターゲットユーザーなんや?
Alphaの概要とエージェンティック AIの定義
ええとこから始まりやな。実は僕はこれをAI搭載端末って呼ぶのが好きなんや。これは君が入ってきて、君にとって重要な仕事や仕事の流れのタイプを教えることができるシステムなんや。そしたらそれが出て行って君のニーズを学習して、君のために積極的に仕事を作ってくれて、君の仕事の流れ全体のプロセスを向上させるんや。僕らは特にポートフォリオマネージャー、アナリスト、ヘッジファンド、そういうグループに焦点を当ててる。でも幅広い適用性があると思うで。
君が「エージェンティック AI」っていう言葉を使ったから、リスナーのために聞くけど、君の視点からそれは従来の生成AIやルールベースシステムとどう違うんや?
3つの方法で考えることができるで。現在のシステム、世界の現在の状態は一般的に言って、君が質問して答えが返ってくるっていう感じや。多くの人がエージェントについて考える方法は、君が質問して、それがさらに多くの仕事をして、より長い答えが返ってくるっていうもんやと思う。僕らがエージェントについて考える方法はちょっと違う。
僕らは、タスクを学習してそのタスクを永遠に君のためにやってくれる、ほとんどワーカーみたいなもんを作ろうとしてるんや。だから決算説明会が出るたびに、特定の方法で要約を提供してくれる。君のウォッチリストにある株について誰かからメールが来るたびに、通知してくれて何かを君の方に送ってくれる。
重要な財務指標を特定の方法で抽出しようとしてるなら、毎回自動的にやってくれる。だから僕らにとってエージェントは、長期的な仕事をして、その長期的な仕事を反復可能な方法で一貫してやることなんや。
多くのリスナーはたぶんDeep Researchみたいなツールに触れたことがあると思う。これは多くの基盤モデルプロバイダーが提供してるもんや。多くの意味でそれは人々にとっての典型的なエージェントや。君が説明したことから聞こえるのは、君らが持ってるのはDeep Researchやけど、プロンプトする必要もない。エージェントに「AMDやNvidiaについて永続的に興味がある」って知らせたら、君のために何かをしてくれるってことやな?
そや。僕が好きな説明の仕方は、今日の世界はGoogleの体験みたいなもんやっていうことや。君が入ってきて、プロンプトを出して、答えが返ってくる。明日の世界、僕らが構築してる世界は、もっとYouTubeやTikTokの体験に近い。君が現れたら、それは君が誰かを知ってて、君の代わりに価値あることを常に提案してくれる。
君はまだYouTubeに時々質問するけど、YouTubeの消費の仕方の大部分は、それが君にとって価値があると思ったもんを通してや。僕らの製品のようなもんでも同様に、君がそれと相互作用する方法の大部分は、それが君に提供してくれるもんを通した消費ベースになる。君がそれについて考える必要もない。
金融特化の技術的アプローチ
だから金融のために専用設計されてる。ここで君の快適さのレベルに基づいて答えなくても構わんが、内部では何が君らを差別化してるんや?一つはデータソース。もう一つは、これの答えはわからんが、君らは独自のモデルを持ってるんか?ファインチューニングされたもんなんか、それとも基盤モデルのラッパーなんか?
2番目は大きな答えやな。機能的に言うと、金融には解決される必要があった非常に特異的な課題がいっぱいあるんや。極めて監査可能である必要がある。ユーザーにこれやあれやって言うだけじゃ十分やない。「これが僕が来た正確な一次ソースや。これが僕が使った方法論や。これが僕の考え方や」って提供できる必要がある。
そしてユーザーが理解できる方法でそれをできる必要がある。また、ほぼ無限にスケーラブルである必要もある。僕のポートフォリオの中国への露出を知りたいなら、5つか10の例を見るだけじゃ十分やない。ポートフォリオの全ての株を分析できて、そのポートフォリオの全ての株について彼らがどう中国に露出してるかを深く理解できる必要がある。
そしてシステムが同じ方法で実行される自信が必要や。今日僕のポートフォリオの中国への露出を分析して、明日また実行したら、全く同じ方法、全く同じ方法論でやるってことや。これらは全て僕らが非常に得意なことや。
君はPerplexityみたいな製品に行ってDeep Researchを求めることができて、37の異なる記事を見るかもしれへん。僕らの製品に行ったら、無制限のトークンを見る。1日40億トークンを見るエージェントを実行してるユーザーがおる。それはまだ始まったばかりや。実際に人々が僕らのシステムを使って構築してるもんの上限レベルが、本当に高いレベルまでスケールしてるのを見てる。
また、この世界の監視をできるためには、デルタ情報を理解できるもんが必要や。今対10分前から世界で何かが変わったかを理解できる必要があるんや。それは僕らが非常に得意なことや。
その技術が実際に内部でどう機能するかっていう点では、それは非常に複雑になるが、僕が好きな説明の一番簡単な方法は、僕らはほぼ大規模言語モデルの合唱団みたいなもんやっていうことや。いっぱいの異なる大規模言語モデルがあって、その一部はAnthropicやOpenAIみたいな標準的なプレイヤーからのもんで、一部は僕らが内部で高度にチューニングしたもんで、これらが全て非常によく一緒に働いて、高品質の結果を生み出すように設定されてる。
金融における監査可能性と決定論的動作
明らかに君は規制された業界である金融で運営してる。だから透明性と説明可能性についてある程度話したが、結局のところこれらは決定論的モデルやないやろ?だからまだ確率的や。
言い換えると、ジョシュ、僕が今日モデルを実行して特定の応答を得て、それが僕に取引をするよう促したとする。そしてその取引が僕の顔で爆発する。そして僕のボスが「なぜその取引をしたんや?」って言う。「いや、僕はこれにプロンプトして、こういう答えが出たんや」。じゃあ戻ってもう一回プロンプトしてみよう。そしたら違う答えが出る。僕のボスが僕をクビにする。
だから監査可能性について話したが、僕にとって監査可能性はある程度の再現可能性を意味する。
君は100%正しい。実際に、僕らのシステムは他のシステムよりもはるかに決定論的や。まだLMベースやが、特定の行動パターンを制限したり強制したりする方法を見つけて、今日何かを一つの方法でやったら、明日も同じ方法でやるっていうことや。それもかなり違うところや。
だからルールがあるんか?僕が好きな考え方は、2つの昔のコンピューターサイエンスのパラダイムに似てるっていうことや。
コードを書く時、ユニットテストっていうのとインテグレーションテストっていうのを構築する。ユニットテストは基本的に、コードのローカルブロックが正しい方法で動作してるかを示す方法や。インテグレーションテストは全体が同じ方法で動作してるかっていう感じや。
似たような種類の方法で、僕らがこれらの小さなワーカーを構築してる時、基本的に僕らの各サブタスクにわたって、ローカルに、僕らが強制したい条件のセットは何で、その条件のセットに従ってるかをチェックしてる。そして全体的に僕らが強制したい条件のセットは何で、それに従ってるかをチェックしてる。
これがどう実際に動作するかの巨大な複雑さは飛ばすけど、それが僕らがそれを強制して、非常に特定のアクションを非常に特定の方法で一貫してできるようにしてる方法や。
ちなみにルールについて言ったのは、ルールに何も悪いことはないからや。Waymoとか一部の自動運転車を見ると、認識とルールの組み合わせを持ってると思う。人々はルールが汚い言葉やと思うが、実際には機能する。
そや。僕らはルールを行動を制限するええ方法やと考えてる。でもLMの知性を解放したい。それは理にかなってる。
だから知性はLMから来るが、ヒューリスティックやルールは、君が気にかけてることのセットをするようにLMをサンドボックス化する方法や。
マルチモーダリティと推論能力の活用
最近の基盤モデル側の2つの主要な発展について、一つはマルチモーダリティ。二つ目は推論や。君はどちらも活用するんか?
まずマルチモーダリティやが、この情報の多くがポッドキャストや、人間として全部を監視するのが難しいような何らかのインタビューに埋もれてると思う。次に推論やが、推論は素晴らしいが、高くなる可能性がある。だから実際に必要な時に推論を使いたい。この両方に取り組んでくれ。
推論から始めよう。ヘッジファンドや銀行やETFプロバイダーに販売する大きな利点の一つは、価格に対する敏感さがずっと少ないことや。
そや。僕がヘッジファンドで働いてたら、機能してアルファを提供してくれる限り、価格は気にしなかった。
100%正しい。だから僕が20%や30%や50%だけ優れてて、10倍のコストがかかっても、それでも価値のあるトレードや。気にしない。
その通りや。だから僕らがどう考えてるかって答えると、僕らは主に品質を最適化してるんや。僕らが大規模な水平プレイヤーに比べて劣ってる部分は、僕らがめちゃくちゃ高くなることやが、その高価なトレードオフでずっと多くの能力を得てる。
ジョシュ、品質と遅延のトレードオフ、つまりユーザーエクスペリエンスもある。
完全に正しい。その観点から、僕らの考え方の大きな部分は、特定のタイプのタスクは速くできる、特定のタイプのタスクはもっと作業が必要で、僕らはユーザーの代わりに非常に素早くどちらがどちらかを把握できる必要があるっていうことや。
ユーザーが「Nvidiaの CEOは誰や?」って聞いたら、数秒で答えられるべきや。ユーザーが「NvidiaのCEOの報酬履歴は何で、それは同業他社グループとどう比較されるんや?」って言ったら、ウェブから見た最初の記事を吐き出すだけじゃあかん。
10年間にわたって報酬をカバーする全てのSECファイリングを調べて、Nvidiaの同業他社グループを見て、彼らの全てのSECファイリングを抽出したい。そして分析をして、正規化をして、表を作成したい。その品質のアウトプットを得るにはずっと長くかかる。
ユーザーはそれを理解できると思う。NvidiaのCEOが誰かは非常に速いと直感的に期待してる。システムが「僕は全体の作業をするつもりで、ここがその作業がどんなもんかで、最終的に得られる結果はここや。その作業をしてほしいか?イエスかノーか?」って伝えて、最後に高品質の製品があったら。
人々はそれも理解できる。他の製品パラダイムについて僕が本当に好きやないと思うのは、速いモードと深いモードみたいなのがある製品がいっぱいあることや。それは本当にひどいユーザーエクスペリエンスやと思う。
ユーザーの意図が何かを動的に把握して、何をしてるかをユーザーに伝えることができるシステムの方がずっと優れてて、それが僕らの考え方や。
マルチモーダリティについては、実際に2つの方法で重要になると思う。方法の1つ目は君が指摘した通り、アクセスできる情報がどんどん増えてることや。それはもう起き始めてる。
ちなみにリスナーの皆さん、たぶん知ってると思うが、Z世代以下はテキストを消費せず、動画と音声に行く。
それは2番目に話すことや。他の重要な方法に入ろう。最初の面では、消費についてや。特に金融では、実際に画像に閉じ込められてる非常に重要な情報がいっぱいあって、画像とテキストが文脈を提供してる。円グラフのグラフを見て、テキストがその円グラフが何かを説明するかもしれへん。
だからそれは以前は自動化された方法では困難やった、より豊かで強力なデータ片にアクセスする能力を解放してる。
僕らがこれが重要やと考えるもう一つの方法は、この技術との関わり方が変わると思うことや。
僕らの今日の製品では、まだ入ってきて、少し話すことができる。アプリに入り始めるとすぐに話し始める。でも僕らが見てる未来は、仕事に車で行く時にAlphaに入ってきて、「僕の日を要約してくれ」って言うと、すぐに「ここが君の宇宙の特定の株に入ってきた全ての証券会社の調査のアップデートや。ここが今日出る重要なレポートで、君が見たいと思うかもしれへん」って説明し始める。
会話をする。そして関わり続ける。僕らがそれらのモダリティが変わることについて考える方法の一部は、今日もう一回OpenAIに行ってOpenAIと話すとき、僕は通常特定のタスクについて話してる。通常「これをしてくれ」みたいな感じや。少し会話をしてるかもしれへん。
僕らが見てる未来は少し変わってて、僕らの技術のようなもんの両方がより多くの音声と動画の出力を生成する。でもシステムも君ともっと親しくなるために君と話す。
僕がポートフォリオマネージャーとして、人間のアナリストと話してるとき、僕らは雑談をして、一般的なトレンドについて話して、会話をしてる。その僕についての追加の文脈が、僕についてユーザーが持ってる人間が持ってることが、彼らが高品質の仕事をするのを簡単にしてる。
同様の方法で、僕らは君が他の人のようにこれらの製品と非常にフレンドリーに話して、それが君についてより豊かな文脈を得てる未来を見てる。だからマルチモーダリティは、「ここがつかめるより多くのデータや」からも重要やが、テクノロジーとの相互作用の方法も変わる。それも大きな変化になる。
実際のユースケースとアルファの発見
マルチモーダリティの前面で、具体的なもんを取ってみよう。TeslaやNvidiaとしよう。明らかに監視できるアナリストレポートやそういうもんがある。でも僕のポイントは、アルファの多くが何らかの曖昧なポッドキャストや動画に埋もれてるかもしれへんことや。ある技術者が将来この会社にとって挑戦になる理由を分析してるが、アナリストレポートはまだそれを反映してない。だからアナリストに先んじるために、ほぼ全てのコンテンツに入っていく必要がある。
それでアナリストに先んじることを気にするのか、それとも合意アナリストの考えが何を言ってるかを僕のために要約するだけなんか?
そうやな。ポッドキャストやそういうもんは重要やが、実際にここでもっと重要やと思う別の形のマルチモーダリティがある。
アナリストの仕事の大きな部分は、投資家関係会社の人々と出かけて話すことや。カンファレンスに行って人々と会って、彼らと相互作用すること。基本的にこんな会話をして、専門家と話して、いろんなことをすることや。
今日その会話が起こって、アナリストの頭の中で統合されて、後でレポートに出てくる。
でも僕らは実際に僕らのような製品が実際に君と一日中一緒にいて、物事が起こってるときに起こって、その後全ての文脈、全ての情報、君のメールからの全ての情報、君のウォッチリストからの全ての情報、10Kからの全ての情報、決算説明会からの全ての情報、それに加えて全ての文脈を、この動的な会話で起こってるように、全部まとめることができる世界を実際に見てる。
君が仕事をして行く中で君が生産してるデータを消費する能力。それは非常に興味深くて、実際に最大の解放やと思う。確かにポッドキャストは役立つが、実際に君と座れるエージェントを持つ能力。
僕のポッドキャストでのポイントは、従来のアナリストによって無視されるかもしれへん公開コンテンツがいっぱいあるってことや。分かってるように、中国語で半導体について話すポッドキャストがあって、僕らが知らんだけで非常に重要になるかもしれへん。
100%や。実際にそれはもう非常に大きな解放や。僕らのシステムで本当に人気のあるユースケースの一つは、中国への露出がある会社を見ることや。
例えば、Domino’sみたいな会社を見ると、Domino’sは中国で巨大な成長が起こってて、それを月対月で追跡するのは難しい。僕らのシステムでエージェントを構築した人がいて、新しい地図を買いに行って、Domino’sの場所が日々どれだけポップアップしてるかを見て、それをDomino’sの価格収益がどこに行くかの予測を始めるのに使える。
これは君が話してるマルチモーダル価値の本当にええ例や。地図に行って、その地図と相互作用して、その地図から物をつかんで、本当に興味深い情報を学んでる。全部公開やが、誰も以前は実際にそれを消費することができなかった。今は簡単に消費して、非常にユニークな洞察源を得ることができる。
これが機密情報かどうか分からんが、買い手側と売り手側の君の使用量の内訳はどうなってる?
大まかに話せると思う。僕らは現在買い手側で約70%、売り手側で30%の範囲やと思う。売り手側では売り手側アナリストとジュニア投資銀行家の間で分けることができる。でも僕らは主に買い手側のクライアントや。
君のユーザーのほとんどは非技術的なアナリストタイプで、主にファンダメンタルユーザー?
そうや、圧倒的多数や。
典型的なユーザーは製品にどれくらい時間を費やして、これらのバックグラウンドエージェントをいくつ頼ることになるんや?
本当に興味深い。カーブみたいなのが見える。新しいユーザーは通常、解放され始めるのに1つか2つの高価値エージェントが本当に必要なだけや。たぶん財務モデル構築にアルファエージェントを使い始める。
君が人生の多くを財務モデル構築に費やす人なら、これは君の時間を大幅に節約する。君はそれを続けるやろ。君の受信箱をスキャンして、受信箱の特定の株について得た売り手側データを要約する仕事の小さなエージェントがあるかもしれへん。
そういう1つか2つのことから始まる。でも僕らのパワーユーザーは、数百のこれらの小さなワーカーが動作して、数十億のトークンを消費してる人もいる。
だから実際に上限が何かは分からんが、1つか2つのエージェントだけで初期価値を得られることは分かってる。
僕が君をカンファレンスに招待して基調講演をしてくれって頼んだとしよう。3枚のスライドをあげる。Alphaの素晴らしいケーススタディやユースケースの上位3つの例をくれ。クライアントのアイデンティティや実際の内容を明かすことなく、どう使ったかとインパクトが何やったかについて曖昧にできる。
絶対に。たぶん話す3つのユースケースがある。最初は重要な財務指標抽出。2番目はたぶんメール監視。3番目は、スーパーパワーユースケースをしよう。3番目は動画の詳細分析みたいなもんや。全部について話そう。
具体的なユースケースの詳細
最初のやつで、君が20から35の株をカバーしてる買い手側アナリストや売り手側アナリストなら、君は人生の大部分を重要な財務指標を抽出することに費やしてる可能性が非常に高い。重要な財務指標、同業他社比較、業界比較、そういうもん。
君はたぶん投資家プレゼンテーションに行って、コントロールFを押すか手動でスキャンして、コントロールCを押して、コントロールBを押して、それをデッキに入れることに大量の時間を費やしてる。
実際、僕が会ったジュニア投資銀行家は、このタスクや財務モデル構築の関連タスクに時間の40%も費やしてる人がいる。彼らがこれをする理由は、ちなみに、Bloomberg端末にKPIをするスクリーンがある。S&PにKPIをするスクリーンがある。全部まだ手動でやってる。理由は彼らが非常に特異的なニーズを持ってるからや。通常、彼らが気にかけてる数字の種類の非常に特定の定義がある。
また、ある会社が数字を報告する方法は別の会社が数字を報告する方法とは異なるかもしれへん。だから正規化して、会社Aがアジアを収益として報告し、会社Bが中国を収益として報告するとしたら、確実にりんごとりんごを比較してるかを確認する作業がいっぱいある。
一般的に言って、これらの数字を速く終わらせる必要がある。決算説明会が起こったら、ボスにメールを送るのに30分ある。これらの数字について100%正確である必要がある。そして前に言ったように、それらの数字があなたが気にかけてることの特定の特異的な定義に合致する必要がある。
だから昔の世界では、多くの人が手動で抽出してた。今はAlphaで、君が気にかける通りの数字を抽出する小さなワーカーを構築できる。早めにトレンドを見つけて、どうやったかの監査証跡を通して数字への確固とした自信を得る。
そして君が本当に気にかける仕事をする作業に君の脳を解放する。だからそれが抽出の一例や。
僕が本当に話すのが好きなもう一つは、僕が一日に何百ものメールを受け取るから、メール監視や。たぶん何千も。それについて考える方法は、受け取った全てのメールをスキャンして、トピック横断する小さなワーカーを構築することを想像することや。
だから僕には「よし、僕に連絡してきた全てのVCがここや。ここが全てのポッドキャストリクエストや」みたいな小さなワーカーがある。実際にそんなに多くない。「ここが競合するスタートアップや僕のネットワークの他の人々で起こってることの全ての例や」っていう感じや。
君がポートフォリオマネージャーなら、「ここが僕が気にかけてるウォッチリストの全ての株で、ここがこれらのそれぞれについて過去一日で得た全てのアナリストアップデート、全ての売り手側アップデート」って言うもんがあるかもしれへん。君がトレーダーなら、これは本当にきれいで一貫した方法でモーニングノートを書くプロセスを自動化する能力を与えてくれるかもしれへん。
だから2番目はメールベースのワークフロー、他に良い言葉がない。
そして僕らがスーパーパワーユースケースって呼んでるもんを君にあげよう。
去年でBlackwellにNvidia Blackwellチップの遅延があったとしよう。君はその含意が何かを理解しようとしてる。それは株にどう影響するか?古典的には、投資家関係チームに電話して、専門家と話して、売り手側データを見ることでこれをしようとするやろ。
現代でもまだそれをするやろうが、僕らの技術を使って3,000の会社の決算説明会をスキャンして、全部にわたって要約することができる。Nvidiaと協力することにまだ興奮してる主要企業は誰や?代替プロバイダーを探してる会社の一部は誰や?そこから全体的にNvidiaに起こるかもしれへん主要な破壊の一部は何や?
Nvidiaを分析しながら3,000の会社の文脈を分析するその能力は、人々が何年もできるようになりたいと思ってたが、僕らの技術が出現するまで基本的にできなかったもんや。
前に聞いた質問を再訪させてくれ。聴衆は僕にさらに掘り下げてほしいと思うやろうから、モデルについて。だからモデルは独自のものなんか?君は君自身のファインチューニングしたモデルを持ってる。単一のモデルはない。分かってる。エキスパートの混合やが、君のモデルがどれだけ違うかを説明するのに快適な範囲で教えてくれ。
技術的アーキテクチャの詳細
僕らの考え方は、最高のLMの日の波をうまく乗りこなすのに非常に良いポジションにいたいっていうことや。君は何らかのモーダルモデル不可知論を設計した。ある程度できる範囲で。
高いレベルで、僕らはタスク分解ができるほぼ内部推論モデルのようなもんを持ってる。財務モデル構築問題に戻ると、「よし、ステップ1、財務モデルの主要指標が何であるべきかを理解するために会社について学べる全てを学ぶ必要がある。ステップ2、分析できるように一箇所で全データを明確にする必要がある。ステップ3、全ての数字を抽出する必要がある。ステップ4、財務モデルを構築する必要がある。ステップ5、全ての部分をリンクして、Excelかソフトウェアかを作成して、ユーザーに渡す必要がある」って言うかもしれへん。
高いレベルで、僕らはそういうタスク分解をできて、いっぱいのサブタスクを理解できる内部モデルを持ってる。
それは君らの独自モデルや。それは僕らや。
その後タスク分解をした後、これらの各サブエリアにわたって行く。僕らは基本的に内部で実行する一連のベンチマークを持ってる。テンサー操作って呼んでるもん、基本的に大規模な数学的演算に関連するもんについて知ってる。時系列データや金融によく現れる他の種類の行列を操作することに関連するもんをテストする全体の束がある。
外国データの分析に関連するいっぱいの指標がある。テーブルから情報を抽出することを基本的に分析することに関連するいっぱいの指標がある。その分解をした後、新しいモデルが出るたびに、一連のベンチマークにわたって実行して、「よし、今Sonnet 3.7がいっぱいの行列で数学演算をするのに最適かもしれへん。GPT-4oが中国語データを読むのに最適かもしれへん」って分かってる。
君は公開ベンチマークに依存せず、独自のベンチマークを持ってる。
正しい。そうや。僕らが気にかけてる各タスクについて。
リスナーにとって非常に重要なことや。基本的に公開ベンチマークは初期トップ候補の良いフィルターやが、君自身のデータに対してそれを打ちつけることに勝るもんはない。
100%同感や。100%同感や。
その後それが僕らにできることは、基本的にタスク分解をした後、これらの各サブタスクに最適なLMを知ることや。それらが実行される。そして最後に、僕らが独自のスパイス的なもんを持ってるもう一つのエリアは、僕らが認証モデルってほぼ呼んでるもう一つの内部モデルがあることや。その仕事は基本的に、僕らが作った全ての結論は何か?僕らが今言った全ては何か?その情報を裏付ける全ての事実は何かを通ることや。
その後、僕は実際にそれらの事実を検証できるか?僕らがユーザーに与えた情報は僕らがユーザーに提示した事実を検証するのに十分か?
だから僕らの考え方は、金融の高レベル推論で非常に良くて、金融の最後に得る検証で非常に良くて、サンドイッチの真ん中部分は提示されたタスクのセットを解決するための最高のLMやっていうことや。
初期の課題と学習過程
Alphaを開発してた初期には、完璧やなかったやろ。成長の痛みがあった。だから僕の前の質問の反対側で、初期の災害話を共有してくれる?完全に外れたことを幻覚したとか。そしてどう修正したかのアイデアをくれ。
最も興味深いことは、他に良い言葉がないが、ユーザーの期待を合わせることやった。僕らが構築した最初のバージョンは、金融データだけを見るように特別に設計されてた。当時の僕らの仮説は、君がヘッジファンドの投資家なら、売り手側セットや10Kやアナリストコールみたいな検証可能なソースからの超高品質データだけを欲しがるやろうっていうもんやった。
それは悲惨なほど間違ってた。完全に予期してなかったことの洪水のようなクエリを見ることをすぐに始めた。振り返ってみたら理にかなってたが予期してなかった。
その一部は面白いもんかもしれへん。「Wall Street Betsに行って全てのアイデアを要約してくれ」みたいな。Wall Street Betsのアイデアの要約を欲しがる専門家がいる。僕には非常に予期しなかった。
重要な公開データを含むいっぱいのワークフローがあることも結局分かった。例えば、消費者裁量をカバーしてるなら、Targetが価格を上げたか前と同じままかの製品をどれだけ持ってるかを知るのが君にとって価値があるかもしれへん。
製品の最初のバージョンで僕らが非常に素早く学んだ最大のことは、金融データだけに特化するだけでは十分やなかったことや。非常に広いエリアで深いエージェント機能を持つ必要があったが、金融ワークフローに焦点を戻す必要があった。
そこから異なるウェブサイトに行って、異なるウェブサイトと相互作用して、情報を引き出せる非常に洗練されたウェブエージェントを構築した。だからその例に戻ると、仮に今、Targetのウェブサイトに行って、Targetのウェブサイトから全製品をつかんで、テーブルに入れて、欲しければ月対月で価格を比較するエージェントを構築することもできる。
内部メールとの統合、内部カスタム文書との統合、いっぱいの他のもんの周りで非常に洗練された機能を構築した。ウェブデータとの検索と相互作用の周りで。
だから最大のミスマッチは、ユーザーがこのもんがどれだけ信じられないほど広くて強力であることを最初から期待してて、僕らがそれらの機能をどれだけ素早く構築する必要があったかっていうことやった。
データ戦略とフィロソフィー
ジョシュ、データに対する君の哲学は何や?例えば、このデータの一部は原理的には取得できる。実際にAmazonやTargetをスクレイピングしてる誰かがいるかもしれへん。でもその後君はその会社が存在し続けて前進することに依存することになる。君がデータ融合の最終ステップの一部としてそのデータソースに依存するようになったら、会社が消えたら君は困る。だから君はいつデータを取得して、いつ君自身でデータを取得するかについての哲学は何や?
僕らはスペースでトップのデータプロバイダーと協力したい。だから今日S&Pみたいなグループ、決算とプレゼンテーションを提供するQuarterみたいな小さいグループと協力してる。約20の異なるデータベンダーと協力してて、その上で僕らがカバーする60,000のニュースソースを持ってる。7,000のデータシリーズがある。
ショートインタレストみたいなもんがある。システムに予想とかがある。だから最初の日からシステムに最高品質のプレミアムデータを確実に持ちたかった。それに加えて、基本的にシステムを通して君自身のカスタムデータセットを生成して、そのカスタムデータセットを他の高度な方法で使う能力がある。
僕が話したTargetの情報を全て抽出する一つのワーカーを構築して、全てのTarget価格データを見て、例として今四半期に収益がどこに行くかの予測を作るのにそれを使う2番目のワーカーを持つかもしれへん。
君はBloombergで何年も過ごして、BloombergやBloomberg Betaにいっぱい友人がいる。なぜBloombergは自分らの端末にこれを構築できないんや?
本当に興味深い質問や。機能的に、既存の現職者が持ってる最大の問題は、彼らの古典的なモードが蒸発したってことや。非常に速く起こってて、彼らは完全にそれに調整してない。
ちなみに、深いポケットを持たんリスナーのために、Bloomberg端末は安くない。年間3万ドルくらいや。
君のための速い素早い強力な統計がここにある。BloombergはPrincetonに数千人がいて、フルタイムの仕事がデータや。S&Pも。僕がヘッジファンドにいた時、僕の仕事は、僕はクオンタリード。だから僕の仕事は取引モデルを設計することやった。特定のオプション価格がずれてることがあった。Bloombergに電話したら、実際に誰かが電話に出て、その場で修正してくれる。これが彼らがデータをどれだけ真剣に取ってるかや。
そして彼らはそれをする人間の軍隊を持ってる。S&Pでも、Else Faxetでも、これらの全てが数千人の人間を持ってて、これらの人間は基本的に財務モデルに座って、財務モデルからデータベースにコピーしてて、それがより広いシステムに供給される。彼らはまだそれをしてて、今日もしてる。まだ数千人がそれをしてる。
なぜ自動化しないんや?それは良い質問や。その仕事を完全に自動化するためには、高い精度レベルに達する必要があった。僕らの精度レベルは99.9%の範囲にある。人間とどう比較するかは分からんが、人間レベルかそれ以上やと思ってる。
だからその技術的解放に達する必要があって、それをするのはそんなに簡単やなかった。でも一度できたら、大データプロバイダーのコストのほんの一部の一部の一部でデータを作成できる。だから古典的に大きな現職者はデータをモートとして持ってて、そのデータが基本的に一夜にして蒸発したと思う。
将来について少し話そう。これは今日僕らの製品にはないが、かなりすぐに出てくる。Bloombergが大きな利点を持ってたもう一つのエリア。彼らは15,000のスクリーンを持ってる。15,000のスクリーンが全て個人によってハンドコーディングされてる。彼らはエンジニアリングに年間約10億ドル使ってる。
リスナーのためにスクリーンが何かを説明してくれ。
Bloomberg端末では、基本的に異なることをキャプチャする異なるビューのいっぱいがある。例えば、会社の時間を通してのデット満期が何かを知りたいとしよう。端末にスクリーンがあって、それが持つ全てのデットといつ満期になるかを見せてくれる。
コマンドは正気やない。DOSコマンドみたいや。
そうや。僕が言ったことをするには、たぶんXOM US F8 DDIS エンターって打つやろ。コーディングの背景があるかどうか知らんが、VIやEmacsみたいなもんや。使うのが残酷や。
だから古典的に彼らのモートは、全てこんな風にハンドコーディングされた15,000のスクリーンを持ってることやった。僕らは今、約100万ドルの計算でそれらのスクリーン全てを再現できると推定してる。僕らは今、Alphaが君が欲しい任意のUI、任意のスクリーンを実際に生成する機能を持ってる。次の数ヶ月でその機能を出してる。
それは基本的に技術的観点からこれらの現職製品を一夜にして陳腐化させる。明らかに君はスクリーンを得るためにプロンプトできる。
それがさらに強力になると思う場所は、僕らの技術は君が好きなスクリーンの種類、好きやないスクリーンの種類を学習して、君の代わりに自動的に積極的に構築することや。だから君は超超個人化された体験を得る。
端末みたいなもんはただ静的や。皆にとって同じもんや。
君がBloombergの重要なロックイン、ソーシャルネットワークを逃した。
100%。そうや。それは彼らがまだ持ってる一つの利点で、全ての現職者は流通を持ってる。それがレースや。
チャット、インスタントBloombergや。
そうや。絶対に。それに対する僕らの仮説は、僕らのような破壊的スタートアップが十分な規模と大きさに達すると、チャットやそういうもんにも取り組み始めることができる点に到達できるってことや。今チャット製品を構築するのはあまり意味がない。僕らがBloombergと同じ規模やないから。
でも僕らのような製品から得る解放の種類は、端末のようなもんから得るもんよりもはるかに進歩してるから、かなり速く大きなレベルに達する可能性があるのはかなり理にかなってる。その大きなレベルに達したら、君が話したソーシャル的利点も最終的には蒸発する。でも今日はまだ彼らがそれを持ってる。
だから明らかにBloombergやReutersや全てのような中立的な現職者がいるが、BlackRockやGoldmanやJP Morgan Chaseでこれらの社内グループが何をしてるかにも君は注意を払ってると思う。彼らは何らかの独自の社内Boostedを構築してると思う。
いっぱいの社内ビルドが起こってる。正直に言うと、社内ビルドのほとんどはペースについて行けないと思う。実際に僕らのスペースで今起こってる大きな破壊は水平プレイヤーや。
AnthropicがちょうどFinanceで何かを発表した。昨日。
Perplexityも1ヶ月くらい前にリリースしたPerplexityの製品がある。それが最大の破壊的力になると思う。君が適切な人材密度と表面積アラインメントの集中に達すると、現職者がまっすぐについて行けない開発のペースと速度のレベルに達する。
それについての興味深いことは焦点でもある。だから彼らは金融に焦点を持たない。
その通り。だからPerplexityの場合、彼らは大量の現金を燃やしてて、今金融に入るが、金融は焦点になることはない。
そうや。100%。僕らが僕ら自身について考える時、僕らができるワークフローの種類に本当に深く行く能力は絶対に差別化要因や。
でも現職者について考える時、彼らの全てがAI会社のペースについて行くのに苦労すると思う。僕らは以前に存在したもんよりもずっと速く動くことができる。
もし魔法の杖があったら、基盤モデルから見たい1つから3つのことは何や?
何て素晴らしい質問や。僕は、同じように優れてるが、ずっと安価に動作できて、遅延が低いより小さいモデルをくれって言うやろう。僕はそれら全てが好きや。より安価で速いモデルは素晴らしいやろう。
そしてこのノーション、これらの大規模アクションモデルっていうファミリーモデルの概念をさらに押し進めてくれ。これは基本的にエージェントのための基盤モデルや。エージェントは一つのことができるが、これらの大規模アクションモデルはずっと汎用的やと考えてくれ。
君のスクリーンを読んだりできる。
そうや。実際、君の会社に向けすぎてる。本当に見たいのは、体内AI。僕の皿洗いをしてくれるロボット。それが本当の解放に達する時や。
インスピレーションと業界の未来
だから金融外で、君がインスピレーションを得てる業界は何や?君みたいに目的構築されたAIをしてる他の例で、君がインスピレーションを得るもんはある?
僕らの多く、認めたいかどうかにかかわらず、Devon AIとCognition Labsが最初にしたことにいっぱい負ってる。Devon AIは本当に最初の製品ショーやったと思う。
ジョシュ、リスナーにDevon AIが何かを素早く思い出させてくれ。
Devon AIは自分らをAIコーダーとして構築してる。タスクを与えて、出て行ってその仕事をするシステムや。
これらの一貫した仕事を作る試みがあって、ある程度まで働いた。
そうや。たぶん残念ながら今は遅れてしまってるかもしれへん。
Claude Code、ベイビー。Claude Code。Cursor が この方向により動き始めてると思う。RepletとLovableが本当に好きや。そのスペースに今いっぱいの製品がある。
でもDevonより前は、Baby AGIがあって、たぶん実際のエージェントの最初の試みの一つやった。でもそれを使うUI体験はひどかった。コンソールを見てるだけやった。
Devoniについて本当に魔法的やと思うことは、そこに行って、タスクを与えて、それがコーディング作業をすることについてどう考えてるかを見ることができたことや。だから僕らの多くにとって、そこからいっぱいのインスピレーションが得られた。
スペースの他の製品で僕が好きなのは、RepletとLovable両方が本当に好きで、特に僕がそれらの製品について好きなのは、僕が共有できるこれらの小さなソフトウェア片を作る能力や。Anthropicが最初に構築した時のアーティファクトのアイデアはかなり先を行ってた。それは非常に斬新なアイデアやった。
さらに出て行って、皆が今これをするが、Perplexityがテーブルに持ってきた一つの主要なイノベーションは引用とテキストの引用を与えることやったと思う。今僕らの全てがそれをする。僕らもそれをする。全てのAI製品の核心部分や。
それは非常にシームレスで、僕らはそれをイノベーションとしても考えない。でも実際は非常に賢くて、非常に大きな変化を作ったと思う。だから僕らが引き出すもんはいっぱいある。いろんな場所で本当に興味深いアイデアがある。
ちなみに、コーディングについて興味深いと思うことは、クラウドに接続された時だけコーディングできる点に向かってる可能性があることや。基本的にCloudCodeを見ると、何かをするのに大量の計算を燃やしてる。僕のラップトップはそれをサポートできないと思う。
だからオフラインで、まだBoostedを使いたい時はどうするかも疑問に思う。
僕らは今100%ウェブ製品や。君は困るやろう。
僕が飛行機にいて、何らかの理由で仕事をする必要があって、クラウドに接続されてなくて、その時点でどうBoostedを使い続けるか?
もう一つのサイドノートを作ると、僕は今かなり先を考えてるが、君といつも一緒にいるAIコンパニオンがある未来があると思う。
眼鏡みたいなもんを着けてて、誰かと会話してて、それが前に出てきたもんの全ての文脈を思い出させてくれる。僕が他の国、韓国に行って、韓国語で話されて、彼らが話してる時に字幕を見せてくれる。
たぶんそれは全てが最終的に収束する場所で、文字通り僕ら全員をより賢く、より良い人間にしてくれる知性がいつも君と一緒にある。でもそこに到達するには、高い知性と速い遅延、よりローカルに考える能力の両方が必要や。だからその方向で起こってるいっぱいの素晴らしいもんがあることに同意する。
ちなみに、だから僕のインスピレーションの質問に戻ると、君の注目を引いたヘルスケアみたいな他の業界の例はある?Boostedがこれらの人々がしてることの一部のアイデアを引き出せると思うような。
これは君にはちょっと奇妙に聞こえるやろうが、実際に僕らはいっぱいのソーシャルメディア製品を見るのが好きや。
理にかなってる。
WhatsApp経由で人々とコミュニケーションする方法やTikTokやInstagramのようなもんを消費することについて考える方法にいっぱいの相互作用パターンがある。
人間が他の人間とつながる方法で、エージェントが君とつながる方法を反映させることができるモダリティがそこにあると思う。だから僕は百万の異なるAI製品について話すが、僕らが今見てる最大のことは、人間が他の人間とどうコミュニケーションするか、僕らの製品体験でそれをどう反映するかや。
個人投資家へのアクセス
最後に、ジョシュ、深いポケットを持たんリスナーのために、Boostedは機関投資家クライアントだけを対象にしてるのか、それとも個人投資家もBoostedを活用できるんか?
誰でもboosted.aiに行って今日サインアップできる。無料や。直接アクセスできる。僕らは機関レベルの機能を持ってる。何年もトップティアヘッジファンドに焦点を当ててきたが、最近これを少し開放し始めた。
今、より一般的な個人ユーザーがその本当に強力な技術にアクセスできる。
そうや。だからWall Street Betsグループがあって、幅広い多様性がある。
それで、ジョシュ、本当にありがとう。


コメント