Anthropic主催のCODE with CLAUDEイベント|Cloud 4 Opus発表の噂(未確認)

AGIに仕事を奪われたい
この記事は約86分で読めます。

51,336 文字

CODE with CLAUDE Event | Rumored Claude 4 Opus release (NOT confirmed)
The latest AI News. Learn about LLMs, Gen AI and get ready for the rollout of AGI. Wes Roth covers the latest happenings...

テスト中です。テスト中です。よし、配信がもうすぐ始まります。ちょっと待ってください。配信開始の時間を変更したのでしょうか?見逃したかもしれません。あ、いや、ライブ配信中ですね。
AnthropicのチーフプロダクトオフィサーであるMike Kriegerをステージにお迎えください。
おはようございます。そしてAnthropicの初の開発者カンファレンス、Code with Claudeへようこそ。皆さんにお会いできて本当に嬉しく思います。私はMike Kriegerです。Anthropicでチーフプロダクトオフィサーを務めています。入社してちょうど1年が経ちました。AI業界の1年は大体3年分くらいの価値がありますね。
とても楽しい時間を過ごしています。これまでにInstagramを共同創設し、また、Artifactというニュースアプリも手がけました。そこで初めてこれらのAI技術に多く触れることになりました。私がAnthropicに参加したのは、創設者たちのビジョンに共感したからです。強力でありながら、有用で信頼できるAIシステムを構築するという理念です。
今日、そのビジョンには即座に具体的なものが含まれています。皆さんのような開発者に力を与え、仕事のやり方や企業の構築方法を変革するというコミットメントです。この変革は、人間の創造性を代替するのではなく、拡張することについてです。AIエージェントは私たちの働き方やイノベーションの方法を変えています。人間の生産性を制限していたボトルネックを取り除くことで、私たちが構築できるものを拡張しているのです。
今日は、プロダクトおよびエンジニアリングリーダー、そして最前線を押し進めている顧客の皆さんからお話を聞いていただきます。今日のCode with Claudeで何を期待できるかをお話しすると、Claudeを使った構築方法を変革する3つの技術的な深堀り、Anthropicのプラットフォームを既に利用して業界を再構築している主要プレイヤーによる5つのセッション、そして実体験のための専用のオフィスアワーとワークショップが用意されています。
しかし、皆さんにお伝えしたい興奮すべき新しいAPI機能について話す前に、ゲストをステージにお招きしたいと思います。CEOで共同創設者のDario Amodeiをお迎えください。
こんにちは皆さん。20分後にファイアサイドチャット形式で戻ってきますので、今回は本当に簡単にお話しします。私は物事を誇張するタイプではありません。ですから、これ以上の前振りなしに言わせていただきます。まさにこの瞬間から、私たちはClaude 4 OpusとClaude 4 Sonnetを、関連するすべてのプロダクトサービスでリリースすることを発表できて嬉しく思います。
しばらくOpusモデルがなかったことは承知しています。念のため申し上げると、Opusは最も高性能で知的なモデルで、Sonnetは皆さんがよくご存知で、この約1年間使用してきた中レベルのモデルです。知性と効率のバランスが取れています。それぞれを使用するのが最適な用途やタイミングがあるように設計しました。
まず簡単に2つのモデルについてお話しし、その後Mikeに戻します。そしてファイアサイドチャットで再び戻ってきます。
最初にOpusについてお話しします。特にコーディングとエージェント的なタスクのために設計されています。SWE-benchなどで最先端の性能を示しています。しかし、大型モデルでよく見られるように、ベンチマークだけでは完全にその価値を表現しきれないと思います。プレビューを提供した顧客の皆さんは、人間が6〜7時間かかるタスクを自律的に実行できることを発見しています。
Anthropic内でも、最も上級のエンジニアたちが、どれほど生産性が向上したかに驚いているのを見てきました。そして初めて、Claudeが書いた内部サマリー、文書、アイデアを見たとき、過去では品質は良かったものの、特徴的なスタイルがあるため人間と間違えることはありませんでした。今回初めて、実際に騙されました。名前を素早く読んで、チームの誰かが書いたものだと思ったのですが、実際の名前はClaudeでした。
ですから、Opusには多くの可能性があると思います。Sonnetについては、多くの人にとってSonnet 3.7からの純粋なアップデート、同じコストでより良い知性への純粋な改善になると思います。多くの顧客が直接一方から他方へ切り替えています。実際、いくつかのコーディングベンチマークではOpusと同等の性能を発揮しますが、より無駄がなく、より集中されていると思います。
特に、Sonnet 3.7で受けたフィードバック、つまり過度な積極性、求められる以上のことをする傾向について対処していると思います。これは怠惰さとは正反対の問題で、以前の問題でしたし、報酬ハッキングの問題もありました。
多くの顧客が試用しており、3.7からの強力なアップグレードと見なしています。例えば、よく知られた顧客であるCursorが試用しており、これは最先端のコーディングモデルだと言っています。複雑なコードベース理解における飛躍的進歩であり、開発者は全般的な能力向上を体験することを期待しています。
実際にモデルを試した顧客の一人は「このモデルは一体何なんだ?」と言いました。本当に素晴らしいです。詳細は他の人に任せますが、最後に申し上げたいのは、Claude 4シリーズのモデルを継続的に改善していくということです。マイナーバージョンのアップデートを定期的にリリースすることを予定しており、理想的にはSonnetよりもさらに頻繁にリリースしたいと考えています。
現在、基本的にすべてのサーフェスで利用可能になっているはずです。フリーティアはSonnetのみだと思いますが、他のすべてのサーフェス、すべてのAPIサーフェスで両方が利用可能です。
モデルを楽しんでいただけることを本当に願っており、Mikeに戻します。
ありがとう、Dario。2つの新しいモデルです。皆さんがここで最初に聞きました。彼が言及したように、アジェンダの最後でDarioに再びお会いし、皆さんが今おそらく抱いている質問を私が彼に尋ねるQ&Aセッションがあります。個人的に、顧客の皆さんにClaude Opus 4とSonnet 4の両方を試していただくことにとても興奮しています。私たちのチームはそれらと一緒に作業することを楽しんでおり、皆さんも気に入っていただけると思います。
Darioが大きなモデルニュースを共有したところで、詳細なAPIロードマップについてさらにお話しします。Claude 4を構築する目標は最初から明確でした。新しいモデル機能を安全に導入する強力なAIを構築し、コーディングとAIエージェントの最前線を継続的に前進させ、Claudeが皆さんの仮想協力者になることを確実にしたいと考えていました。
そして、Opus 4とSonnet 4でまさにそれを実現しました。Sonnet 3.7と同様に、Claude 4モデルの両方は、ほぼ瞬時の応答と、より深い推論が必要な場合の拡張思考という2つのモードを持つハイブリッドモデルです。コーディングや数学以外の用途でも、どれほど多くの顧客が深い推論を使用しているかに驚いています。
Opus 4は、コードベースの理解と追加の計画において優れています。マイグレーションからコードリファクタリングまで、すべてにおいて非常に効果的で正確です。また、最も複雑なエージェント的ワークフローにも適しています。他のモデルで用途において壁にぶつかったことがある場合、Opus 4でできることに本当に嬉しい驚きを感じるでしょう。
一方、Sonnet 4は日常的なコーディングタスク、アプリ開発、ペアプログラミングに優れています。また、大容量の用途にも理想的です。効率と性能を完璧にバランスしています。常にオンのコーディングパートナーと考えてください。
Darioが言及したように、両方のモデルは今日、CloudとCloud Code、およびAnthropic API、Amazon Bedrock、Google CloudのVertex AIでライブになっています。
これらのモデルは、AIエージェントの構築に重要な新機能をもたらします。推論過程でWebサーチなどのツールを使用でき、これは新機能です。複数のツールを並行して処理し、ローカルファイルにアクセスできる場合、実際にセッションを跨いでメモリを維持し、時間をかけて知識を構築できます。
そのメモリ機能についても、後でDarioと少し話し合います。これらは単なる漸進的改善ではありません。AIエージェントの可能性を根本的に変えるものです。
エージェントという用語が最近よく使われているのは知っています。私の個人的なジョークは、Anthropicでの会議で「エージェント」という言葉を言わずに何分間持ちこたえられるかということです。17分かそこらだったと思います。しかし、今日私たちが焦点を当てるのは、誇大宣伝を超えたエージェントです。
本当に重要なのは、適切な基盤モデルと適切な基盤プラットフォームツールがあれば、AIエージェントは実際に人間の想像力を前例のない規模で具体的な現実に変えることができるということです。これは特にスタートアップや皆さんのような開発者にとって重要です。
私自身も創設者でしたが、Instagramの初期を振り返ると、私たちの有名な小さなチームは多くの非常に苦痛な二者択一の決定をしなければなりませんでした。プロダクトに動画を追加することを探求するか、コア創造性に焦点を当てるか。モバイルアプリ、最初は単一のモバイルアプリに焦点を当てるか、Webに拡張するか。すべてが非常に単線的でした。
AIエージェントにより、スタートアップは今や実験を並行して実行し、ユーザーから学び、これまで以上に速くプロダクトを構築できます。これは皆さんの多くから聞いたことです。AIエージェントは、スタートアップの創設者である皆さんに、高性能なCFOや製品責任者から得られるような戦略的思考へのアクセスを提供できます。前列にCFOがいますが、そのような重要なポジションの採用に向けて構築している間でも、今のところそれらの役割のいくつかのためにClaudeを雇うことができるのです。
この変革はもはや理論的なものではありません。私は自分の役割と仕事で毎日それを見ています。個人的に私はClaudeと多くの時間を過ごしています。おそらく大切な人よりもClaudeと過ごす時間の方が多いかもしれません。まあ、大丈夫です。
実際、Anthropicに参加した直後に、AmazonのAlexaチームと座って話をしました。彼らはClaudeが音声アシスタントの未来への彼らのビジョンの一部になる方法を見ることに熱心でした。最初、私のチームはスライドを用意し、トーキングポイントを準備する予定でした。他の顧客に対して行うような計画でした。しかし、会議に向けた数日間で、なぜClaude自体を使ってハンズオンデモを構築しないのかという持続的な考えがありました。会話をより興味深くし、ClaudeとAlexa機能の統合の可能性を実現すると思いました。
課題は、Alexaの実際のコードベースにアクセスすることなくこのデモを構築することでした。Claudeの機能を統合しながら、コアAlexa機能のプロトタイプを作成する必要がありました。すべてを1週間という厳しいタイムライン内で、実際には1週末という厳しいタイムライン内で行う必要がありました。
このような限られた時間枠でこれを成し遂げることができたのは、Claudeがあったからこそでした。サンフランシスコとロンドンに分かれた3人のチームが、その可能性を示す機能的なプロトタイプを構築しました。Claudeのおかげで、この取り組みは成功でした。私もいくつかのコードを書くことができました。エンジニアをエンジニアリングCTOの役割から外すことはできても、私から取り除くことはできませんし、プロジェクト自体のフロントエンド開発の多くを行いました。
もちろん、その最初の会議の後、パートナーシップにはさらに多くの作業が入りました。しかし、Claudeは今年初めに開始され、現在展開中のAlexa Plusで、Amazonが使用しているモデルの1つになりました。Claudeのおかげで可能性を本当に示すことができたと思います。
私は何年もこのエージェントAIへの進化を見守ってきました。2021年にGitHub Copilotの早期アクセスデモを初めて見たとき、これまで見た中で最も驚愕的な機械学習の応用だと言いました。2020年当時、私たちはAIではなく機械学習と呼んでいました。それは何世代も前のことでした。しかし、このエージェント的AIの初期の姿の可能性は本当に明らかでした。
昨年夏にArtifactsを立ち上げたとき、さらに強い感情を抱きました。ミニアプリや可視化のために欲しいものを説明し、送信ボタンを押し、コーヒーを取りに行き、戻ってくるとClaudeが私が想像したものを構築していました。その後の年を通じて、私たちは単により良いツールを構築しているのではなく、真の協力者を創造していることが明らかになりました。
Anthropicの経済研究は、私が直接見たことを確認しています。大多数の用途において、AIは人々の仕事を置き換えるのではなく、拡張しています。役割全体よりもタスクについてです。これは、一緒に働く最高の同僚の影響と似ています。一緒に働く最も才能のある人々は、単に実行するだけではありません。彼らはあなたの文脈を理解しています。
彼らは経験から学びます。そして、イニシアチブを取るべき時と、単にチェックインすべき時を知っています。私たちのプラットフォームで構築できるような優秀なAIエージェントは、3つの能力で優れているべきです。
まず、文脈的知性です。あなたとあなたの組織の独特な文脈を理解し、経験から継続的に学ぶことです。指示に従うだけでなく、理由と方法を理解することです。これは、文脈的だけでなく、エピソード的および組織的記憶を獲得し、時間をかけて学習し、個人化するモデルを意味します。私がチームに常に伝える方法は、エージェントとの100回目のタスクは1回目よりもはるかに良くなるべきであり、従業員との100日目が1日目よりもはるかに良くなるべきなのと同じで、適切なトレーニングを行っている場合のことです。
第二に、長時間実行の実行です。常時管理なしに複雑な数時間のタスクを処理し、必要に応じて他のエージェントや人間と調整します。つまり、文脈があり、その後より長い期間にわたってそれを実行できるということです。
第三に、真の協力です。意味のある対話に参加し、あなたの作業スタイルに適応し、行動について透明な推論を提供することです。
ここでの重要な洞察は、真のエージェンシーは制御されない行動を意味しないということです。そして自律性は単に無謀にやることを意味しません。それは、重要な決定について人間の監視を維持しながら、通常私たちの時間の多くを消費する小さな決定を委任する、明確なチェックポイントとバランスされた知的自律性を意味します。
これら3つのニーズに応えるために発表する機能についてお話ししましょう。
まず、今日Anthropic APIで利用可能な新しいコード実行ツールから始めます。コード実行ツールは、Claudeがコードを実行できる環境を提供し、生データを視覚的洞察に変換するデータアナリストとして機能できるようにします。Claudeはもはやコードを書くだけではありません。今やそれを実行できます。結果を見て、データのパターンをより良く強調するために結果とコードを反復的に洗練できます。
ここでは、特定の種類の製品がどのように性能を発揮しているかを見るために、Claudeが売上データを分析している様子をお見せします。Claudeはデータセットをロードし、クリーニングし、探索的チャートを生成し、リアルタイムで異常を詳しく調べることができます。データ可視化アナリストとしてキャリアを始めた私には、これは非常に共感できます。
コード実行ツールは、Claude 4モデルの知性と組み合わせると、さらに強力になります。これが私たちがエージェンシーと呼ぶもの、複雑なタスクを取り、完了まで見届ける能力です。これらは数時間のタスクを処理できる最初のモデルであり、一緒に作業する際に半日、場合によっては丸一日を節約してくれます。コードスニペットを書くだけでなく、コードベース全体をリファクタリングしたり、ゼロから複雑な機能を実装したりします。
私たちが見ている進歩の感覚をお伝えするために、私が始めた頃、Claude 3に委任できるのは多分数分の作業でした。一方、Claude 3.7は約45分間、糸を失うことなく自律的に作業できました。そして今、Claudeが自律的に引き受けることができる数時間の作業に突入しています。
先ほど見たように、Rocketinは信じられないことに7時間、継続的な性能でClaudeを独立して実行させたと言及しました。特に自分のメモリとTo-Doリストを管理できるため、糸を失うことなくそれを行うことができます。
私たちは既にこの力を皆さんが働く場所に統合しています。うまくいけば、皆さんはCloud Code、数ヶ月前にリサーチプレビューで立ち上げたエージェント的コーディングツールに慣れ親しんでいるでしょう。今日、Cloud Codeを一般アクセスに移行しています。
これは実際に、私たちの技術リーダーの一人であるBorisによる内部探索プロジェクトとして始まりました。彼は発表投稿者で、Claudeに端末で直接コーディングを手伝ってもらいたいと思っていました。非常に初期の段階で、私たちは内部でCloud CLIと呼んでいました。Artifactsやcloud codeのような私たちの最高のイノベーションの多くは、このようなボトムアップの実験から本当に生まれていると思います。これはAnthropicで育もうとしている文化の一部です。
内部で立ち上げてからわずか2日で、使用量チャートは垂直に上昇しました。人々はプロダクトマーケットフィットについて話します。私たちは本当にプロダクトAnthropic フィットについて話すことが多いです。内部の人々がドッグフーディングしているか、使用しているかということです。
今日、Anthropicの従業員の大多数が、日常的なコーディングから大規模なマイグレーションまで、あらゆることにそれを頼りにしています。私たちの最も上級のコーダーの何人かが、複数の端末ウィンドウで複数のCloud Codeのコピーを実行しているのを見てきました。彼らは単なるエンジニアから、複数のコードベースにまたがる単純なコーディングタスクから複雑なフルスタック開発プロジェクトまで、あらゆることに取り組む複数の自律エージェントのマネージャーになっています。
私はcloud codeを使用しており、フロントエンドリポジトリで1つ、バックエンドリポジトリで1つ実行していたと気づきました。cloud codeエンジニアの一人が「それは間違ったやり方です。ルートで実行してください。Cloudはすべてのリポジトリで何をする必要があるかを理解し、美しく実行します」と言いました。これにより、私の使用方法が既に変わりました。
Anthropic開発者の大多数がcloud codeを日常的に使用しています。チームへの影響を感じさせるために、エンジニアの技術的オンボーディング時間を2〜3週間から2〜3日に短縮しました。特に私たちのような大きなモノリスのコードベースの理解を構築するのにどのように役立つかを本当に見てきました。コードのナビゲーションが素晴らしいので、非常に迅速にコードベースを理解できます。
今日、私たちはcloud codeの機能を、完全なdiffビューとエージェント的ワークフロー管理をエディターに組み込んでVS CodeとJet Brainsに直接導入しています。また、Cloud Code SDKも導入しています。これにより、Cloud Codeと同じコアエージェント上に独自のアプリケーションを構築できます。
SDKの可能性の例として、GitHub内でClaude codeを実行できるようになりました。GitHubプルリクエストやイシューでClaudeをタグ付けすると、レビュアーのフィードバックに応答し、コードを修正し、テストカバレッジを実装します。
私たちは「ループを閉じる」と呼ぶことにも焦点を当てています。つまり、Cloud Codeは今や自分自身を構築するのを手伝っており、自己改善の力を実証し、自分自身の開発を加速しています。
Cloud Codeが皆さんのような開発者により多くのことを成し遂げる力を与える方法は信じられないほどです。Instagramを構築していた時を振り返ると、買収される前のチームは2〜6人のエンジニアで、2つのモバイルプラットフォームをサポートしていました。このようなエージェント的コーディング製品があれば、数週間ではなく数日でプロトタイプを作成できていたでしょう。
私たちは高性能で信頼性の高いエージェントの構築について多くお話ししてきました。責任のないエージェンシーは危険です。特にcloud code製品のような自己改善についてですが、厳格なセキュリティとコンプライアンス要件を持つ企業設定では特にそうです。エージェントの広範な採用には、機密性、意思決定、調整に関するモデルの判断力と判断を改善する必要があると思います。
私たちのモデルは既にこれが得意ですが、機密事項を知り、何を明かすべきかを知り、本番環境で信頼できるように継続的に改善していきます。これが、モデルの周りに構築するすべての機能に、アーキテクチャル安全チェックポイントとコントロールと呼ぶものを組み込んでいる理由です。白紙委任エージェントではなく、ユーザーがどのアクションに人間の承認が必要かを定義できる主要な決定で一時停止し、これもモデルコンテキストプロトコルに組み込んでいます。
それらは悪用に対して堅牢です。私たちはそれらをテストし、プロンプトインジェクションなどについて十分にバトルテストしています。また、明確なフィードバックループと観察可能な動作を持つ、設計による透明性もあります。エージェントが自律的に行動することを信頼する場合、軽減ではなくイノベーションに集中する自由があります。
私たちが大きく投資しているもう一つの分野は解釈可能性、つまりAIモデルの心の中で実際に何が起こっているかを正確に理解する科学です。Darioは最近、私たちのAIシステムが実際にどのように動作するかを理解することの緊急性について書きました。彼のエッセイ「解釈可能性の緊急性」を読んだ場合、彼がモデル知性と解釈可能性の間の競争と呼ぶものです。
効果的に、私たちはAIにMRIを与えて、それが何について考えているかを見て、欺瞞などの潜在的な問題を発見し、正しい方向に導くことができるようにしたいのです。Anthropicに参加したとき、私たちの研究パイプラインが直接製品に燃料を供給する方法に興奮していました。Golden Gate Claudeを例にとりましょう。これは私のAnthropic2週目に押し出したものです。単に優れた研究論文のように感じられなかったからです。解釈可能性がどのように動作するかの内臓的な実証、素晴らしいデモになるでしょう。Claude神経ネットワーク内のゴールデンゲートブリッジ機能を増幅したとき、突然、AIの内部動作を操作することの意味を見ることができ、この場合、私たちのお気に入りの橋に深く夢中にさせることができました。
Golden Gate Claudeを作成するために使用した技術は、将来的に有害なモデル行動を減らしたり、特定のドメインでのモデル性能を向上させたりするのに役立つ可能性があります。企業周辺で仮想協力者を雇用し始めるにつれ、解釈可能性と監査可能性などの技術が彼らの仕事の基盤となり、大規模で何をしているかを把握できるようになることを願っています。
これらは、抽象的な研究を具体的な製品機能に変換するのに役立つ種類のブレークスルーです。先ほど見たように、私たちは今、AIモデルが数時間の自律的作業を処理できる地点にいます。そしてこれは数ヶ月ごとに倍増する能力です。しかし、生のモデル能力だけでは、実際にこれらの数時間のワークフローを解き放つには十分ではありません。
エージェントは実世界の情報へのアクセス、既存システムへの接続、そしてコスト効率的なスケーリングも必要です。これが、コンテキストでエージェントを強化し、スケールを支援する4つの相互接続された機能を立ち上げる理由です。
まず第一に、本日より、モデルコンテキストプロトコルを私たちのAPIを通じて直接接続できるようになりました。MCPは既にMicrosoft、Google、OpenAI、Block、Atlassian、Zapier、Linear、その他多くの企業によって使用されています。これは、MCPプロトコルを作成し、オープンソース化した時の夢のリストでした。いつかこれらの企業に採用してもらえるかもしれないと思っていました。1年以内に、彼らは皆採用しました。
MCPはAIエージェントの汎用翻訳者および接続器として機能し、毎回カスタムの特注統合を書く必要なく、既存システムへのシームレスな接続を可能にします。これは、専門エージェントが複雑な課題に取り組むために必要なデータとツールにアクセスできるエージェント経済の基盤を築きます。
第二に、Webサーチは、現在の情報へのリアルタイムアクセスをClaudeに提供します。これは、Claudeが現在の出来事、市場トレンド、新興技術について推論することを可能にする知的データ拡張です。MCP機能と組み合わせると本当に強力です。内部知識ソースを検索し、新しい洞察を作成し、それらを文脈化するためにWebを検索することを想像できます。
第三に、files APIは今日APIで利用可能で、開発者がドキュメントにアクセスし、保存する方法を合理化し、開発ワークフローを簡素化します。また、開発者が私が言及したメモリ機能をアプリケーションに直接構築するのを支援するクックブックもリリースしています。
これらの新しいCloudモデルは、私たちが自己管理メモリと呼ぶものにおいて大幅な改善を示しています。これは驚くほどうまく機能し、そのクックブックで実証するように、files APIを使用することで非常に少ない追加オーバーヘッドで実現できることがわかります。Claudeがこれらのメモリファイルの読み書きを行い、時間をかけて接触コンテキストを維持する様子をご覧いただけます。
最後に、パワーは実用的でスケーラブルである必要があります。プロトタイプから本番、そして数百万のユーザーまで一緒に成長できるようにし、コストを制御し、効率を向上できるようにしたいと考えています。成功し、大規模に到達する際にCloudが皆さんのために機能することを望んでいます。
これが、プロンプトキャッシングが私たちの最も要求された機能、最も人気のあるAPI機能の一つである理由です。プロンプトキャッシングにより、顧客はClaudeにより多くのコンテキストと背景知識、例となる出力を提供でき、長いプロンプトのコストを最大90%、レイテンシを最大85%削減できます。
現在、話をしたすべての顧客が、プロンプトキャッシングに関して1つの非常に明確な要求を持っており、今日それを提供しています。それはより長いtime-to-live(TTL)です。プロンプトキャッシングで最初から持っていた5分のTTLに加えて、今日は12倍の改善である1時間のプレミアムTTLを立ち上げており、長時間実行エージェントワークフローのコストを劇的に削減します。
このインフラストラクチャは、エージェントアプリケーションを大規模で実行可能にします。これらの機能はすべて複合します。APIへの機能構築について考える際、私たちはそれらを一回限りのものとは考えません。それらがどのように互いを補完するか、どのように一貫したストーリーを形成するかを考えます。
Cloudは今やコードを実行し、システムを理解し、Web上の現在の情報にアクセスでき、長時間実行タスクであってもフルコンテキストで動作するエージェントの基盤を作成し、files APIを使用してその実行全体を通じてメモリとコンテキストを維持できます。
今朝ご覧いただいたすべては始まりに過ぎません。私たちのロードマップは3つの柱に基づいて構築を続けます。
第一は、業界をリードするエージェント的ツールとアプリケーションです。Cloudを自律的に使用して数時間の作業を処理できるようになり、独自の環境でコードを実行するためにコード実行ツールを使用できることを知っています。Cloud codeは現在一般利用可能で、VS codeとJetrainと統合しており、GitHub内を含む独自のカスタムワークフローを構築するための広範なSDKを使用できます。
APIでより多くのコンテキストを統合し続けます。今日の更新により、モデルコンテキストプロトコルを介してこのコンテキストを持ち込み、Webからのリアルタイム更新に基づいて構築し、任意のデータソースおよびMCPを介してAPI内のあらゆるものにわたって複雑なワークフローを実行できます。
最後に、効率的なスケーリングです。本日より、拡張された1時間プロンプトキャッシングを使用して、大規模でのパフォーマンスとコストを最適化できます。各進歩は今日議論したことに基づいて構築されます。
基盤としてのClaude 4、最も複雑なエージェント的ワークフローのためのOpus 4、日常的知性のための日常ドライバーとしてのSonnet 4により、私たちは新しいクラスのアプリケーションを可能にしています。
コード実行はCloudができる作業時間を拡張します。MCPはCloudが取得できる包括的情報を拡張し、プラットフォーム更新により、私たちのモデルは費やされる1ドルあたりますます効率的になることを保証します。
私たちは皆さんのような開発者がこれらのツールをどのように使用するかから積極的に学んでいます。フィードバックを続けてください。私はAPIフィードバックが大好きです。私についてこれを知らない場合、ぜひ連絡してください。皆さんのような開発者のためにAPIを継続的に改善する方法についてのフィードバックを聞くのが大好きです。
MCPはこの完璧な例です。内部アイデアとして始まり、コミュニティ実験に進化し、現在はコアプラットフォーム機能になりました。Microsoft Buildキーノートを見ると、彼らは多くの実際のインフラストラクチャにMCPを構築しています。
私たちは実際に皆さんにとって有用なAIエージェントのエコシステムを作成し、フィードバックループを持ちたいと考えています。今日、私たちは主要な閾値に立っています。私たちの最新モデルと私たちがリリースしたすべての最新ツールの組み合わせは、新しい時代の種をもたらしています。
未来は、AIが人間の仕事をすることではありません。AIが人間が超人的な仕事をするのを助けることです。この ビジョンを皆さんと一緒に構築することに本当に興奮しており、それが皆さんの会社すべてのためにどのようなアプリケーションを支えるかを見るのが待ちきれません。
何が可能かをお見せするために、次に、複雑な数日間のタスクを単一の会話で出荷するのを支援し、開発ワークフローを変革するCloud Code内の新しいモデルへのアクセスがどのように機能するかを実演するために、私たちの製品チームのCat Wooにマイクを渡します。
再びCode with Claudeへようこそ、そして再びありがとうございます。残りの日をお楽しみください。
こんにちは皆さん、私はCat Woo、Cloud Codeのプロダクトマネージャーです。Mikeが言及したように、私たちは最近、エージェント・コーディングツールであるClaude Codeをリサーチプレビューで立ち上げました。Cloud Codeは、開発者がターミナルで作業する場所で、Anthropicモデルの生の力に直接アクセスできるようにします。
本日より、Cloud codeは一般利用可能です。コンピューティング履歴を通じて、私たちは継続的により高い抽象化レベルに移行してきました。機械語からアセンブリ、高級言語へと。Cloud codeとますますエージェント的なモデルにより、私たちはさらなる前進を目撃しています。開発者は特定の関数を求めることから機能全体を記述し、AIを導き、ソフトウェアの構築方法を変更することへと移行しています。
今日、私たちはClaude 4モデルをClaude Codeに導入し、さらに強力で有能なコーディングエージェントにしています。新しいモデルに加えて、開発ライフサイクル全体でより多用途なコーディングエージェントにすることに焦点を当てた、Cloud Codeのいくつかの新機能をリリースしています。
まず、Cloud CodeはVS CodeとJet Brains IDEと統合し、数百万の開発者にとって馴染みのあるインターフェースに導入しています。Cloud Codeが動作すると、エディターでその提案された変更をインラインで見ることができるようになりました。
また、開発者がアプリケーションとワークフローでCloud Codeをビルディングブロックとして使用できるCloud Code SDKもリリースしています。SDKの可能性は無限です。これらの可能性を紹介するために、SDKの実行例のオープンソース例をGitHubのClaude Codeでリリースしています。
GitHubでプルリクエストやイシューでClaudeを直接タグ付けでき、Cloud Codeはレビュアーのフィードバックに応答し、CIエラーを修正し、新しい機能を追加します。これらの追加により、Cloud Codeは皆さんが働くあらゆる場所で動作し、すべてのサーフェスにわたって仮想チームメイトとして機能します。
深い開発作業のためのターミナルで、SDKに基づいて構築された自動化ワークフローのためのGitHubのようなリモート環境で、そしてシームレスなレビューのためのIDEで、Cloud Codeはどこにいても開発を加速するための多用途コーディングエージェントです。
Cloud codeと対話的に直接作業しているか、非同期で使用しているかに関わらず。素晴らしい。私のお気に入りの部分です。これらの更新がデモでどのように見えるかをお見せしましょう。皆さんの多くが馴染みのある製品での実際の開発タスクにQuad Codeが取り組む様子をお見せします。
Excalidrawというオープンソースのホワイトボードツールを使用し、最も要求された機能の1つであるテーブルコンポーネントの追加をClaude Codeに求めます。皆さんの何人が、ユーザーが愛することを知っているが、構築する時間がなかった、バックログに長い間あった機能リクエストを受けたことがありますか?これがCloud Codeではるかに速く処理できる種類のタスクです。
通常、このようなタスクでは、Cloudを作業に設定し、コーヒーを作り、メールとSlackをチェックし、出力が準備できたときに戻ってきます。しかし、今日は皆さんと10分しかありません。ですから、高速化されたが実際のワークフローをお見せしましょう。
ここにVS Codeで開かれたExcalidrawリポジトリがあります。Quad Codeに要件を伝えるプロンプトを書きましょう。Quad Codeに、カスタム寸法をサポートするテーブルコンポーネントを追加するよう求めます。リサイズのドラッグと、Excalidrawの他のすべてのスタイリングオプション。ここからが興奮する部分です。
Quad Codeは最初に、問題全体にどのようにアプローチするかのTo-Doリストを作成します。その後、Quad Codeがコンテキストのために既に開いているファイルから始めて、コードベースの探索を開始する様子を見ることができます。
ID統合の最良の部分は、エディターでインラインでdiffを見る能力です。これにより、より多くのコンテキストのために周囲のコードを見ることができます。そのため、Quad Codeにフィードバックを与えながら、自信を持って変更を受け入れることができます。Quad Codeが動作する際に各編集を承認することも、自動受諾モードでQuad Codeが編集を続けることもでき、可視性とコントロールをバランスさせることができます。
このデモでは、Quad Codeに編集、リントとテストの実行、PRの作成の能力を与えました。Quad Codeはこのタスクで90分間作業しました。全部をお見せしたいのですが、スピードアップする必要があります。ご覧いただいているのは、quad codeからの実際の未編集の出力です。
1時間半後、完了しました。テーブル機能を追加し、変更を検証するテストを書き、リントとテストが通るまで反復しました。これは通常、コードベースアーキテクチャと他のすべてのツールがどのように実装されたかを理解することを要求しました。この場合、cloud codeは文字通り私たちのために数時間の作業をしています。かなり印象的ですよね?
今度は、Excalidrawをローカルで実行し、機能が期待通りに動作することを確認しましょう。3行3列のテーブルを作成して、完全に機能するテーブルコンポーネントがあることを確認しましょう。素晴らしい。テーブルを再配置できます。
ドラッグしてリサイズできます。ボーダーパターンと色を変更できます。そしてセルにテキストを追加できます。これはExcalidrawの既存UIとも統合されています。これらすべてがCloud Codeでの1つのプロンプトで行われました。
次に、Cloud CodeにGitHub CLIを使用してこのブランチのプルリクエストを作成するよう求めます。クールです。クリックしてみましょう。これでプルリクエストができました。
ここでCloud Code SDKが輝きます。GitHub actionsを含むCloud Code上にカスタムワークフローを構築できるようにします。このPRでは、ドキュメントを更新したいと思います。IDEに戻る代わりに、@claudeをタグ付けして、ドキュメントを更新するよう求めることができます。
舞台裏では、これがCloud codeを実行するGitHub actionをトリガーします。Claudeは作業中にPRにコメントし、完了したときにコミットを作成します。GitHub issueで@Quadをタグ付けすることもでき、そこでもPRを作成します。この機能により、Quad Codeは既に作業している さらに多くのサーフェスでユーザーに出会います。開発者はもはやローカル環境でコンテキストスイッチする必要がなく、移動中でも実行を開始できます。
これはすべてCloud Code SDKに基づいて構築されています。GitHub actionsの支援を超えて、顧客がSDKで信じられないことをしているのを見てきました。多数のQuad codeを並行して実行して不安定なテストを修正し、テストカバレッジを増やし、オンコールトリアージまで行っています。
クールです。アクションの実行が完了したようで、Cloud Codeが何をしたかを知らせるためにコメントを更新している様子が見えます。コミットをクリックして、Quadの変更を見てみましょう。私たちのPRでドキュメントを更新し、何もしなくてもコミットしました。
わずか10分で、手動で実装するには数日かかったであろう複雑なタスクに取り組むCloud Codeを見ました。数百行のコードを書き、Excalidrawの既存機能とシームレスに統合し、私たちのために数時間の作業をしました。
これらすべてが今日利用可能です。私たちのSDKによって支援されるGitHub actionsのClaude codeはベータ版で利用可能で、quad内で画面上の簡単なコマンドを実行することでインストールできます。VS codeとJet Brains IDEの拡張機能もベータ版でライブです。インストールするには、IDEからquadを実行するだけです。
最後になりましたが、私たちの最新モデル、Claude Opus 4とClaude Sonnet 4が今日Quad Codeユーザーに利用可能です。
Quad codeは、コードを真に理解し、作業して強力なエージェントを構築することが可能になったときに何ができるかを示しています。コーディングアシスタントであろうと、任意のドメインのアプリケーションであろうと、単に知的なモデル以上のものが必要です。適切なプラットフォームが必要です。
まさにそれを可能にする方法をお見せするMichael Gershenhoberをお迎えください。
ありがとうございます、Cat。そして皆さん、おはようございます。ここにいてくださってありがとうございます。私はMichael Gershenhofer、AnthropicでAPIプラットフォームのプロダクトヘッドです。ここで既にAI生成を使用している人は何人いますか?はい。そして、そのうちAIを機能提供のコアで使用している人は何人いますか?ここにいる皆さんのようです。
そう思いました。世界のほとんどのアプリケーションは、既に世界の問題を解決しようとしている人々によって構築されるでしょう。LeetCodeのホワイトボード面接に合格するか、Vibesで始めるかに関わらず、私たちは皆今やソフトウェアエンジニアです。しかし、コードを書くことは始まりに過ぎません。安定し、安全で、保守可能なAIアプリケーションをより迅速に構築する必要があります。
これが、最先端のAIアプリケーションとエージェントを構築するために設計された完全なツールキットであるAnthropicプラットフォームを構築した理由です。私たちのプラットフォームは既に、あらゆるドメインで世界のAI配信の大部分を支援しています。
金融では、TurboTaxが連邦税解説者と共に数百万の顧客が自信を持って税務申告するのを支援しています。ヘルスケアでは、Novo Nordiskが15週間ではなく10分未満で臨床研究報告書の草案を作成するためにCloudを使用しています。
そして世界最高のコーディングアシスタントが私たちのプラットフォームで動作しています。これらの企業はそれぞれClaudeの知性を取り、ユーザーにとって独特に価値のあるものに変えました。
基盤として、私たちのプラットフォームは、パフォーマンスとコストを最適化するためのプロンプトキャッシングなどの重要なツールを含むメッセージAPIを含む、モデル推論サービスを通じてClaudeへの信頼性のあるアクセスを提供しています。
プラットフォーム上のすべての入力トークンの50%以上がキャッシュされており、モデルの有効コンテキストウィンドウを倍増させています。Notionは大量のドキュメントをコンテキストウィンドウに入れることができますが、スナッピーでリアルタイムの実行を維持できます。これにより、創造的な執筆であなたの声を採用し、幻覚を事実上排除できます。
本日より、キャッシュの有効期間を5分から1時間に延長しています。エージェントは今や、銀行を破ることなく、ユーザーセッション全体にわたって複雑な接触を維持できます。
しかし、それは基盤に過ぎません。強力なエージェントを構築するために、私たちのプラットフォームは強力なビルディングブロックを提供します。Mikeが共有したように、files APIとコード実行ツールという2つの新しい機能をリリースしています。
皆さんや私と同じように、スクリプトを書くことで解決しやすい問題があります。私たちのプラットフォームは、エージェントが皆さんと同じように本番環境で独自のコードを書くことを可能にします。
これらの新機能は、リアルタイム情報用のWebサーチや、ソース文書での応答の根拠付けのための引用などの既存コンポーネントと結合されます。Thompson Reutersがco-conselで弁護士に分析を提供する際、モデルの訓練データではなく、彼らの法的研究と判例法に根拠を置くことが重要です。
私たちのプラットフォームは、モデルコンテキストプロトコルを通じてエージェントをデータやビジネスシステムに接続します。MCPは開発者エコシステム内で、コミュニティが構築した3,000以上の統合で盛り上がっています。
エージェントがSentryでアプリケーションエラーにアクセスするか、Zapierワークフローをトリガーするか、Asanaタスクを作成するかに関わらず、MCPコネクターは、タスクが必要とする任意のツール、データ、またはアプリとモデルが相互作用することを可能にします。そして今日、プラットフォームは、ツールとAPI呼び出しのすべての技術的複雑さを処理することで、さらに簡単にします。
プラットフォームについて強調したいことの1つは、APIの構成可能性です。それらは、離れて動作するのと同様に一緒に動作するビルディングブロックであり、クッキーカッター形状に強制できない独特の問題を解決するのに役立ちます。Cloudをエージェントのアーキテクトおよび総合請負業者と考えてください。
事前定義されたシーケンスを実行したり、コンポーネントをランダムにスタックしたりしません。代わりに、どの材料がどの順序で必要か、そしてそれらがどのように組み合わさって個々の要素よりもはるかに強力なものを作成するかを知的に決定します。
例をお見せしましょう。複雑な金融分析のためのエージェントを構築する際、Claudeは知的にタスクを評価し、適切なツールを編成します。MCPを使用して金融データにアクセスし、統計分析のためのコード実行を開始し、リアルタイム市場データのためにWebを検索し、精度とコンプライアンスのための引用で洞察を根拠付け、結果に基づいて反復し、洗練します。
ハードコードされたワークフローも脆いスクリプトもありません。強力なエージェントを構築し、私たちの研究が生み出す新しい機能をシームレスに採用することを可能にする知的編成があるだけです。
プロンプトの品質がAIアプリケーションの成功を左右することを理解しており、これがプロンプト改善機能と評価、本番環境に到達し、より速くスケールするのに役立つ新しい観測可能性機能などの開発ツールを作成した理由です。
今日、私たちは既に、アプリケーションにメモリなどの機能を実装する方法を示すクックブックとガイドなどのリソースで開発者がより速く構築するのを支援しています。将来的には、これらをプログラマティックアクセスに適応させ、プラットフォーム上で直接ホストし、本番環境で独自に研究し、記憶できるさらに強力なエージェントを構築できるようにします。
私たちが構築したすべては1つの目標を中心にしています。より良いAIをより速く出荷するのを支援することです。Anthropicプラットフォームは単なるツールではありません。業界をリードするエージェントを構築するためのあなたの道です。
今日、Code with Claudeにお越しいただき、ありがとうございます。カンファレンスの残りの時間はフロアにいますが、本番環境でこれがどのように見えるかを正確にお見せするGitHubのMario Rodriguezをお迎えする光栄があります。
ありがとうございます、Michael。そして、皆さんとここにいることができて興奮しています。GitHubでは、このエネルギーとイノベーションの一部になれることを非常に嬉しく思っており、この素晴らしいチームであるAnthropicとの深まるパートナーシップについて詳しくお話しします。
GitHubが行うすべては2つの核となる信念に基づいています。第一は開発者に選択肢を与えること、第二は最高の開発者体験を提供することです。
昨年のGit Hub Universeで、私たちはAnthropicとの関係を開始しました。VS Codeおよび私たちの会話体験でのClaude Sonnet 3.5のサポートを発表しました。これは、AIが強力な力であり、開発者の能力を置き換えるのではなく拡張する力の乗数になり得るというAnthropicとの根本的な信念を共有しているからです。ソフトウェア開発者であることの創造性と想像力である、最も得意なことに集中できるように開発者を解放するのです。
それ以来、パートナーシップと体験をVS Code、github.com、モバイルアプリなど数多くの分野で拡張してきました。そして今日、GitHub CopilotがClaude Sonnet 4とOpus 4をサポートすることを発表できて嬉しく思います。Darioが発表した瞬間に、私たちはトリガーを引いたのです。それがシッピングというものです。
これを行うのは本当に困難だとお伝えします。皆さんが行っているすべてのアプリケーションでこれを行ったことがあるかわからませんが、信じられないほど困難です。これを実現するすべてのチームに感謝します。
皆さんがご存知のように、コードの未来は何でしょうか?エージェントです。VS Codeのエージェントモードは、自然言語コマンドに基づいて複数ステップのコーディングタスクを実行できる自律的なペアプログラマーです。
エディター内で直接Claudeの知性を持つことが、開発者が複雑なコードベースを理解し、より速くプロダクションにコードを送り、既に知り、愛し、信頼している環境を離れることなく生産性を向上させるのに真に役立つことを直接見てきました。
しかし、それでさえ、それでさえシングルスレッドであり、私の意見では、未来はマルチスレッドです。考えてみてください。エディターが待合室になってしまいます。より速く進んでいますが、それでも待合室です。
これが月曜日に、私たちがさらに一歩進んで、GitHub Copilot Coding Agentを発表した理由です。私たちのコーディングエージェントは、もはやペアではない自律的非同期ピアプログラマーで、GitHub に直接埋め込まれています。
Copilotのコーディングエージェントは現在、おそらく推測できるでしょうが、Claude Sonnetによって駆動されています。私たちがそれを選んだ理由は非常に明確でした。その決定を可能にした3つのことを説明しましょう。
第一に、私たちの評価では、Claudeが3つの主な強みを実証したことが示されました。強力なソフトウェアエンジニアリングとコーディング知識、強力な問題解決能力、これは非常に重要です。なぜなら、時にはコードを見て、その編集を行う適切な場所を見つける必要があるからです。
そして第三に、特にツールとMCPについて考える際の優れた指示追従です。エージェント的コーディング用に構築し、これらのことと大きなコードベースやシステムプロンプトを扱う際、キャッシングという他のものも必要です。
Anthropic APIから得るそのプロンプトキャッシングサポートにより、最もコスト効率的な方法でこれらの体験を構築することができました。すべてのトークンが重要であり、価格面でもすべてのトークンが重要です。これらをより多く節約するほど、顧客により良い体験を提供できます。
その上で、claudeは既にエージェントモードで最も頻繁に選択されるモデルでした。これらすべてをまとめると、claude sonnetがGitHubシナリオでのエージェント的コーディングに適したモデル選択であることが非常に明確でした。
claude sonnet 4では、集約ベンチマークのようなsweet benchmarksだけでなく、より重要なことに、私たちの実世界評価スイートでも、これらすべての分野での改善を見ています。
私たちのコラボレーションはこれよりも深いものです。単にモデルを直接統合することだけではありません。私たちはAnthropicと密接に協力して、MCPを正式に採用し、スケールしています。知性を組み合わせています。これらのモデルについて考えてみてください。信じられないほど知的です。3つのPhDを積み重ねても知識があります。では、その知的なモデルに知識をどのように取り込むのでしょうか?
私たちにとっての答えはMCPとツールです。これが開発者ツールの次の加速を真に解き放ちます。最近、MicrosoftのCTOであるKevin Scottが、MCPはWebのHTTPプロトコルのようなものだという類推をしており、私は彼に完全に同意します。
MCPを採用していない場合は、今日、この基調講演の直後に行ってください。それほど重要です。これが知識をこれらの知的モデルに取り込む方法です。
ソフトウェア開発のこの新時代に足を踏み入れるにつれ、GitHubのプラットフォームをAIが注入されたものからAIネイティブへと変革しています。作成から展開まで、内側のループでコーディングを行う場所と外側のループにまたがる上部のエージェント的レイヤーによって駆動されるSDLCを構想しています。
これらの非同期体験があり、あらゆるステップで積極的な協力者になるでしょう。co-pilotと言う理由は、人間が中心にあり、それを助けるエージェントがあるからです。
これが、今Katが見せたように、cloud codeと拡張可能なcloud code SDAをGitHubのエージェント的プラットフォームに直接統合する新しいパートナーシップを発表している理由です。
これにより、cloud codeをカスタマイズし、新しいサーフェスからリモートで呼び出し、GitHubとワークフローに埋め込む新しい可能性が開かれます。再び、すべてGitHubプラットフォーム上で。
私たちは既に多くのことを行いましたが、anthropicとの旅はまだ始まったばかりです。私たちの意見では、GitHubの開発者に対する深い理解とcloudおよびプラットフォームAPIを通じたAnthropicのAI能力を結び合わせることで、より直感的で、より効率的で、最終的により人間的な未来を解き放つことができ、実現するでしょう。
その人間の力は重要です。私たちが一緒に構築し続けるものと、皆さんそれぞれが私たちと構築するものを見ることに興奮しています。ありがとうございました。そして、Mike Krigerをステージに戻してお迎えください。
ありがとう、そして再びMario、Michael、Catに感謝します。GitHub統合が大好きです。最後に行ったプロジェクトでは、実際にGitHubコードスペースにcloud codeをインストールできることに気づきました。突然、既に構築していたリポジトリに対してCloud Codeを使用できるようになりました。
彼らそれぞれから聞き、Cloudで行われている興奮する作業についてすべて聞くことは本当に素晴らしいことでした。ショーを終了するために、Claude 4、私たちの研究方向、そして開発者がAnthropicから次に期待できることについて、もう少し深く掘り下げたいと思います。
Darioとの1対1の会話のために、Darioをステージに戻してお迎えください。
戻ってきてくれてありがとう、Dario。これは素晴らしいです。全聴衆の前での私たちの1対1のようです。これは素晴らしいです。
Claude 4が出ています。Claude Sonnet 4とClaude Opus 4が利用可能です。Claude4モデルについて最も興奮していることは何ですか?そして、次の12ヶ月で何が可能かについてのあなたの考えをどのように変えますか?
抽象的に最も興奮していることは、新しいクラスのモデルがあるたびに、それでできることがより多くあるということです。私たちはClaude 4の後にモデルをリリースする予定です。Sonnetで行ったように、おそらくある時点でClaude 4.1があるでしょう。そして、新世代のモデルでタスクの観点から何ができるかについて、私たちはまだ始まりにいるだけだと思います。
自律性は既にあるところからはるかに進むと思います。モデルを自由にし、長期間何かを行う能力を与えるだけです。私たちはまだ非常にその始まりにいると思います。
実際、サイバーセキュリティタスクのためのモデルについてますます興奮しています。サイバーセキュリティはコーディングタスクのサブセットと考えることができますが、それらはハイエンドのコーディングタスクである傾向があります。ですから、おそらく最終的にそのための閾値に達していると思います。
そして元生物学者として、biomedicalおよび詳細な科学研究作業でのモデルの使用について常に興奮しており、opus、特にopusがそれに特に強いと思います。
それは本当にmachines of loving graceと繋がります。claude 4はその軌道全体にどのように適合しますか?machines of loving graceをエッセイと考える人がいますが、私はそれを次の数年間の製品ロードマップと考えており、claude 4がその旅にどのように適合するかに興味があります。
それは実際にそこに到達する方法を知らずに書いた製品ロードマップのようなもので、「よし、みんな、これがあなたたちの仕事だ」と言ったようなものでした。
生物学の側面について考えており、ソフトウェアもその一部です。生物学はますますデータを含むようになってきており、10年前に生物学者だった時でさえ、データを含んでいました。より多くの部分が、これらのモデルが生物学について多くを知っており、コードを書くのを手伝えるようになると思います。ですから、計算生物学者であれば、これらのモデルが本当にできることを加速すると思います。
これらのタスクのためにモデルを試している多くの顧客がいます。
最初にやったハッカソンの一つで、MCPをリリースした後、誰かがMCPをdrawingを行うplotter の一つに接続したので、Claudeが自分のために絵を描くことができました。Claudeが自分のために何を描くかを見るのは実際とても楽しいです。しかし、最初のものは、MCPはデジタルシステムに接続するだけでなく、実世界にも接続できるということでした。BMCPでラボ機器を運転できるようになるのは興味深い質問だと思います。
すぐに、Claudeを嘘発見器に接続してテストできるようになるでしょう。
その考えが大好きです。嘘をついていますか?解釈可能性があるのに、なぜ嘘発見器が必要なのでしょうか?
あなたは、claude書かれたコンテンツが人間が書いたものだと確信した瞬間について言及しました。us all、あなたご自身でCloud 4を試すのを見守る中で、このモデルが違うと感じさせる他のブレークスルーの瞬間はありましたか?
詳細は実際には理解していませんでしたが、モデルが立ち上げられる数週間前に、私たちのサイドの数人が「なんてことだ、このモデルは信じられないほど困難なパフォーマンスエンジニアリングタスクをワンショットで実行した」と言った瞬間がありました。これまでどのモデルもそのようなことをしたことがありませんでした。
モデル開発には、訓練プロットプロセスがすべて計画されていても、最後の瞬間にすべてがまとまるような、ほとんど迷信的なプロセスがあると言えるでしょう。モデルの能力の一部のように見えます。おそらく人々との相互作用に関するもの、おそらく最後の少しを良くすることが重要なことに関するもの、あるいは人々がモデルに慣れ、プロンプトすることに関するものかもしれません。
しかし、常にモデルの初期バージョンを見つけて、人々がそれらをどう使うかを理解するのに苦労し、最終的に「これは私のためにいつも機能する」と人々が言うポイントに到達し、最後の瞬間に起こるその錬金術があります。
Ed CatmullのCreativity Inc.を読んだことがあるなら、彼はすべてのPixar映画で同じプロセスについて話しています。出荷される2日前まで本当にひどく、私たちのモデルでも同じ感覚を感じます。本当にひどいわけではありませんが、まだそこに到達していない感じがあり、突然クリックして「これを人々に届けるのが待ちきれない」となります。
訓練プロセスが均一で、理性的なプロセスだと思うでしょうが、それは全く違います。RLカーブでそれがまとまるポイントはありません。最後の瞬間にまとまるのです。なぜかわかりません。本当の瞬間です。
聴衆の多くはここの開発者です。AIがどのように発展しているかを考える人々が内部的に抱く質問は、ソフトウェアエンジニアリングの仕事のどの部分をAIが引き継ぐか、そして自律エージェントが多くのソフトウェアエンジニアリングを行うことができる世界で何がより重要になるかということです。
おそらくここの多くの人と同様に、数ヶ月前のSteve Yeggeのブログ投稿「revenge of the junior developer」を非常に興味深く読みました。彼にはそれに関する同様のブログ投稿がありました。実際に彼は私たちを訪問しにも来ました。これは私ができるよりもさらに良く、物事がどこに向かっているかのビジョンを示したと思います。
それは、私たちがモデルのより多くの自律性に徐々に向かっているということです。基本的にオートコンプリートを行うフェーズがあり、今度は人々がvibe codingと呼んでいるものがあります。そして私たちは、エージェントに物事をディスパッチできるような種類のことにより向かっていると思います。claude codeで、私たちはエージェントに物事をディスパッチできる方向により向かうと思います。
エージェントの艦隊を管理できる世界に向かっていると思います。人間の開発者が「あなたはこれをやって、あなたはこれをやって、あなたはあれをやって」と言えるような。しかし、継続的な人間の関与が、品質管理、正しいことを確実に行うため、詳細を正しく取得するために重要だと思います。
ですから、モデルと、正しい詳細を取得するためのその周りの製品サーフェスの両方で協力することが本当に重要になると思います。また、構築のこの流れから離れるため、作業における非効率的なものが非常に痛ましくなることも私には明らかになりました。
エンジニアリング部分が加速されるにつれて、クロスファンクショナルアラインメントやロードマッピングに多くの時間を費やしている場所を実現するようになりました。もっと構築しようとするべき時に。
業界内で、より大きなモデルか、より小さなアーキテクチャかについて無限の議論があります。長期的にどちらが勝つでしょうか。スケーリング法則論文を普及させ、開拓したことで有名ですね。極端に言うと、プレトレーニングは死んだのでしょうか?プレトレーニングがまだ重要なすべてなのでしょうか?ポストトレーニングとの関係での役割は何でしょうか?
あまり具体的になりすぎずに言うと、claude fourモデルはプレトレーニングとポストトレーニングの両方での進歩を体現していると言えるでしょう。ですから、プレトレーニングスケーリング法則が以前と同じように機能し続けているのを見続けています。
また、ポストトレーニングでの継続的な進歩も見続けており、それらは互いを補完します。そして、両方での継続的な進歩を見続けると思います。また、スケールアップし続けると思います。
ですから、これらの複数のトレンド、指数的成長の複数のソース があり、それらはすべて互いに複合していくでしょう。これがすべて非常に速く進む理由の一つだと思います。
Diegoのブログ投稿が好きな理由の一つは、それが私ではない誰かが「これらのことが基本的に私たちの仲間になるまであと1、2年しかない」というマントラを繰り返していたことです。3.7が2月だったのは狂気です。1年前のように感じますが、3ヶ月前でした。
知っています。知っています。何か時代遅れのモデルのように感じられますが、2.5ヶ月かそんなものです。時間スケールが圧縮されています。
AI分野にいることは、よく言うことですが、非常に簡潔な逸脱をします。AI分野にいることは、地球を相対論的速度で離れる宇宙船に乗るような感じです。ある日目覚めると、宇宙船での1日が地球での2日のように。2日分のニュースを取り入れなければならない。1日の宇宙船で地球での3日に加速される。
そして、この乗り物にいることの感覚です。
それは共感できます。前にその比喩を聞いたことがありますが、絶対にそうです。ポストトレーニングの面で、Claude 4で開発されるのを見てとても興奮したことの一つは、メモリのこの概念と、モデルが自分のメモリを管理できるようになったことです。なぜそれが重要で、何を可能にするのか、少し話してください。
質問を繰り返してください。モデルが自分のメモリを管理し、長期間のタスクを処理できることについて。
はい。はい、それが非常に有用であることがわかりました。それが有用だとわかった場所の一つはPokemonです。モデルが状態を記憶できるようになりますが、おそらくPokemon以外の多くのことにも有用でしょう。
人間がするように、考えている時に多くのメモを書き、後でそれらのメモを思い出すようなものです。しなければならない多くの中間作業があり、モデルも推論する時にある程度それを行います。推論トレースがある時のように。しかし、一つのスクラッチパッドに組み込めることではありません。
プレゼンテーション、書く個別の文書などがあります。モデルも同じです。ファイルを作成し、それらのファイルで何かを行い、データをロードし、それらを種類をシームレスに組み合わせられるという考えです。
私たちが持つ新機能の一つは、この種の組み合わせた推論とアクションの実行です。それらのアクションの一部はデータの保存、データの再呼び出しになり得ます。再び、モデルが持つ余裕が人間が持つ余裕に徐々に収束しており、それがあるべき方法だと思います。
claude 4でのマインドブローイングな瞬間の一つは、基本的にcloud codeにto-doリストスクラッチパッドを追加したことでした。それがto-doリストを処理し、より多くのことを考えた時にto-doリストに追加し、完了したことをチェックオフし、もはや関連しないものを取り消し線で消すのを見ていました。これは本当に人々が自分の仕事を管理し、完了について考える方法を模倣していました。
そして組み合わせた推論とツール使用も。今朝のMac storiesでの記事を見ましたが、ツールを使用し、MCPでバックエンドMCPサーバーでレート制限に引っかかり、推論を行っていたためか「うーん、おそらくレート制限に引っかかった。この他のアプローチを試してみよう」のようでした。
ツール使用の一部として推論し、修復する能力は本当に強力だと思います。トップへの競争について触れたいと思います。安全性と能力はしばしば互いに対立するものと考えられがちですが、あなたのテーゼは正反対で、この2つが歩調を合わせて進むことができるというものです。
これは非常にインスピレーションを与えてくれるもので、私がここに参加した理由の一つでもありますが、トップへの競争についてどう考えているか、少し触れてください。
それは非常に平凡で単純で商業的なものから、AIが将来向かう壮大な方向まで、あらゆることに適用されると思います。
顧客と話す時、私たちには、AIモデルの動作が予測可能で信頼できることを非常に気にかける多くの顧客がいます。そして、それは長期的に、より壮大な意味で、モデルが人間の意図と一致し続けることを確実にしようとしていることと一致していると思います。
ですから、ここに素晴らしいシナジーがあります。合理的または責任を持って行うことができる場合はいつでも、コミュニティにツールを提供したいと考えています。MCPはその例です。
私自身、実際に、誰もがMCPを中心に標準化したペースに驚きました。非常に奇妙でした。11月にリリースしましたが、すぐに大きな反応があったとは言えませんが、3、4ヶ月以内に標準になりました。
再び、地球から加速する宇宙船にいて、ますます大きな時間膨張定数を経験しているこの感覚があります。90年代や2000年代のUSBやその他の標準のことを考えると、人々が何かに収束するのに何年もかかっていました。
MCP周辺の業界の他の参加者と話していても、彼らは「MCPで機能していることを遅らせたくない。操縦を手伝って欲しいが、これは稲妻をボトルに捕らえたようなものだ。これがエージェントが相互運用する新しいプロトコルと標準になることを確実にしよう」と言っています。
トップへの競争に結びつけて、解釈可能性の緊急性のエッセイが大好きでした。神経科学のバックグラウンドもお持ちですね。解釈可能性と機械知能の共同開発をどのように見ていますか?
10年前、多くの人々が神経科学がAIのやり方を教えてくれると思っていました。実際、この分野には多くの元神経科学者がいます。私だけではありません。その背景を持つ他のラボリーダーもいます。
高いレベルでは何らかのインスピレーションがあると感じましたが、視床下部から知っていることをこれらのモデルを作るために使うとは言えませんでした。それはほとんどゼロからでした。
しかし興味深いことに、物事は逆方向により進んでいます。解釈可能性を使ってモデルの内部を見ることができます。もちろん、人間の脳とまったく同じ方法で作られているわけではありませんが、表面的なレベルでは多くの違いがあります。
モデル内で見つけた概念的パターンの多くが、神経科学研究で複製されることがあります。視覚での高低周波数検出器について、Chris Olaのチームの一人によって解釈可能性を通じて発見され、数年後に神経科学者が実際に動物の脳でそれを複製したものがありました。
例えば、視覚モデルは色に対応する一つのパスと、明度や物体間の境界に対応する別のパスを分離します。これらは世界の自然な区別であり、発見されるべきものとしてそこにあるようです。
人工的か生物学的かを問わず、あらゆる種類の抽象学習システムがある時、同じことを発見するのです。非常に興味深いです。回路論文が神経科学研究にどのような影響を与えるかについて、本当に興味があります。
5〜10年のタイムホライズンに移りましょう。相対論的に動いているAIにおいてそれが可能な範囲で、おそらく相対論的には実時間での1年でしょうが。一人の人間従業員を持つ最初の10億ドル企業はいつ現れると思いますか?
2026年。
はい、絶対にそう思います。Claudeを使って構築している人々への来年のアドバイスはありますか?その最前線で構築することについてどう考えるべきでしょうか?
モデルの使い方について言える非常に具体的なことが多くありますが、この相対論的時間膨張のようなもの、物事を加速するもののため、ほとんどすべてのアドバイスが1つの文、たぶん2つの言葉に圧倒されてしまいます。それは「野心的であれ」です。
可能だと思うよりも大きなものを構築し、まだうまく機能していなくても、次世代が出て、今は3ヶ月ですが、おそらく2ヶ月、そして1ヶ月に短縮され、今年中に何かを思いつけば、今日何も構築しないというアドバイスをするかもしれません。今夜には使いたくないものをリリースするからです。
2年前に自律AI コーディングエージェント分野で会社を始めた創設者と話しましたが、彼は基本的にすべてのモデルを試し、スタートアップがうまくいかず、それから実際に3.7で「スタートアップが今うまくいく」と言いました。実際に難しかったことが突然可能になったのと同じことでした。
しかし、実際に壁に頭をぶつけることは、時として有用になり得ます。なぜなら、他のすべてのピースを配置し、モデル以外のすべてが機能し、モデルが機能すると、必要以上に堅牢なものを構築したようなもので、それは肯定的な特性になり得るからです。
ですから、次のモデルを待てばいいと冗談を言いますが、実際に壁に頭をぶつけることは、可能なことから3年離れているのではなく、ほぼ可能である限り、実際に生産的になり得ると思います。
高度な研究でも内部で見ました。私たちの研究とclaudeskills チームがこのプロトタイプを構築していました。モデルが道を見失っていました。ツールの使用が得意ではありませんでした。そして3.7、特にclaude 4で、高度な研究も本当に本当によくできることがわかると思います。それは私たちが道中で試行し、失敗していたからです。
次のモデルに対して推測実行のようにスタートアップを実行したいようなものです。ある種の、わかりません。
その通りだと思います。それが完全に正しいと思います。最後の質問で締めくくりましょう。今日の私たちの多く、Darioでない人々にとって、AIが達成した進歩と急速な変化のペースを想像することはできませんでした。
来年、そして次の5年間で最も興奮していることは何ですか?
来年については、コードで信じられないことを見ると思います。cloud codeがある場所、コーディングモデルがある場所から、エージェント艦隊のようなものに向かうことを再び参照したいと思います。
これは世界で興味深い効果をもたらすと思います。ソフトウェアの生産コストが下がると何が起こるかについて、経済的またはビジネス的観点から慎重に考えていないことがわかりません。
それは信仰条項、ソフトウェアを作るのは、数百万人の人々、少なくとも数十万人、または数万人が使用する価値がある場合にのみ作る価値があるという仮定です。
このイベントのために全体のソフトウェアを作ることはないでしょう。何かを投げ合わせるかもしれませんが、ドル未満で、このような特定のイベントのために何かを投げ合わせることができる、このような特定のイベントのための私のビジョンを変える何かが20セントで数秒でアドホックベースで作ることができるようになると、世界は非常に異なるものになると思います。
開発者の役割は何ですか?ビジネスの役割は何ですか?スタートアップの役割は何ですか?そして使用する人々の体験は何ですか?これらの質問のどれに対しても答えを知らないと思います。だから非常に興味深いです。
5年のタイムスケールでは、生物学に再び戻ります。biomedical関連は次の年に革命を起こされることはないと思います。なぜなら、それは起こるのが遅いからです。
しかし、5年後には、今存在する多くの病気を征服していることを願います。
それで終わりにしたいと思います。残念ながら、終わらなければなりません。さらに40分話せそうな気がします。まず、今日私たちと時間を過ごしてくれたDarioに感謝したいと思います。ありがとう、Dario。
また、直接参加してくださった皆さん、ライブストリームで視聴してくださった皆さんにも感謝したいと思います。しかし、終了する前に、ほとんど忘れていたことが一つあります。
今日Code with Claudeに直接参加してくださったすべての方への特別な感謝として、私たちの最高ティアプランであるMax 20xへの3ヶ月間の無料アクセスを皆さんに提供することを発表できて興奮しています。それを楽しみにしていてください。
私は特にcloud codeでMaxsを使用することが大好きなので、皆さんもそれができるようになります。皆さんが何を構築するかを見るのが待ちきれません。異なるセッションで一日の残りを楽しく過ごしてください。そして再びCode with Claudeへようこそ。来てくださってありがとうございます。皆さん、来てくださってありがとうございます。
よし。テスト中、テスト中。よし。それについて皆さんはどう思いますか?ちょっと興奮しますね。配信の始まりからClaude 4がライブになったので、いじくり回していました。
うまくいくように見える最初のいくつかのことがあります。15分後にもう一つのライブ配信があるようです。だから、そこまでいるかどうかわかりません。まあ、何が起こるか見てみましょう。
よし、テスト中、テスト中、テスト中。すべてが良いことを確認させてください。複数のanthropic配信が今日あるようです。だから、より多くのことを発表するか、単にこれらすべてについてもっと話すつもりのようです。
興味深いかもしれませんが、おそらくより多くのハンズオンなものでしょう。私はわかりませんが、興味深いかもしれません。時間があるかどうかわかりませんが、Claude 4でやった初期テストがここにあります。
Claude 4 Opusを使用しています。モデル番号が表示されている場所を見てみましょう。はい、ここの下部です。Claude 4 Opus。はい。Claude 4 Opusを見てください。
Claude 4を使用している場合、まず注意してください。月額20ドルプランまたは年額200ドルプランでは、これらのものを早く使い果たしてしまいます。
特に、ここに行って、これをオンにして拡張思考を有効にした場合、claude 4 Opusではクレジットを早く消費します。4つの異なるプロジェクトを実行していて、それで終わりだと言われました。午後3時かそのあたりに補充されると言っていました。
だから、1時間あたりのベースでかなり早く使い果たすようです。
3JSカーレーシング、カードリフトゲームを構築しようとしていました。だから、興味深い効果を得ました。思ったようになるまでかなり行ったり来たりしなければなりませんでしたし、まだ100%スムーズではありません。一貫した方法でトラックを構築するのに苦労しましたが、悪くありません。
スローモーションドリフトメカニクスが気に入っています。確実にそこに何かがあります。それについてクールな何かがあります。しかし、興味深いです。だから、数回の行ったり来たりの試行が必要でした。
自動的にこのビュー、このオーバーヘッドビューを追加しましたが、ドリフトを始めると壊れますが、それ以外は実際にかなり良いです。
一人称ビューがあります。だから、それが行った多くの興味深いことがあります。ああ、ブーストもあります。見てみましょう。はい、そうですね。大丈夫。これが何回の反復かを見てみましょう。だから、これはそのようにするために8または9回の反復のようです。しかし、かなりクールです。確実に気に入っています。
明らかに、これはClaude St.を使用していました。Claude 4 sonnetですが、これにはclaude 4 opusを使用していたと確信しています。また、以前はclaude番号、それからサイズと言っていたのになぜ変わったのかわかりません。claude 3 sonnetやclaude 3.5 sonnetのように。今は claude sonnet 4と言っています。だから、ちょっと変です。
これらすべてでClaude Opusを使用していたと確信しています。多分これはClaude Sonnetです。
ここに、構築している自律的に手続き的に生成されるMinecraft Minecraftの城があります。だから、基本的に小さなビルドスピードがあり、リセットするたびに、異なる方法で異なるサイズ、異なるタワー、異なるサイズのキープで城を構築しようとします。
だから、ランドスケープを保持しますが、他のすべてをリセットします。私にとって、それはかなりクールです。はい。
だから、Googleで、JingieがNew Geminiを使用するのが良いと言っています。はるかに安いです。はい、GoogleはAIに多くのリソースを投入しているため、Geminiやそのすべてのものの使用を補助金のようにしています。だから、はるかに安くなるでしょう。
私はこれに集中していたので、それを見逃しました。コンテキストウィンドウは何ですか?彼らはそれについて言及しましたか?また、これらのものを使用するためのAPIコストは何ですか?
多くの私は最大にアップデートしなければなりませんでした。実行したいすべてのことができるように、ある時点でカットオフされたからです。
だから、見てみましょう。ここに、プローブを起動できる3Dのようなソーラーシミュレーションがありました。だから、プローブを起動すると、太陽系を通って飛ぶ方法がわかります。はい。それが取る軌道が見えます。だから、太陽の周りをカーブして、遠くに飛び始めました。そこに軌跡が見えます。
そして多分それは戻ってくるでしょう。はい、カーブして戻ってくるでしょう。このゲームのポイントは、これらの緑の点を打つことです。だから、この点を打つように起動し、カーブしてこの点を打つことができれば、勝ちです。だから、すべてを本当によくやりました。唯一の不満は、惑星の周りをカーブし、それから、つまり、これはかなり驚異的です。
唯一失敗したことは、機能を追加したかったことです。よし。誰かがClaude 4 opus 15と言っています。大丈夫。100万トークンあたり。大丈夫。コンテキストウィンドウについて言及したかもしれません。Opusの場合は100万ですか?
Googleは独自のチップを持っているので、製品をより安くすることができます。はい。彼らはそのためのお金を持っています。彼らはそのためのチップを持っています。彼らは配布を持っています。つまり、はい、Googleは一度彼らのようなものを持つと、眠っている巨人のようなものです。彼らが目覚めると、みんなにとって悪いニュースです。
200,000。大丈夫。大丈夫。とにかく、この唯一できなかったことは、プローブを追跡する機能が欲しかったのです。プローブが飛び回る際に追跡するボタンがあるようなもの。だから、オンにすると、ビューを動かすことはできませんが、プローブにビューが中心になります。
だから、オンにすると、ビューを動かすことはできませんが、プローブを追跡しません。だから、それを機能させるために複数回試しました。それはできませんでした。しかし、ここで気に入っているたくさんの良いものがあります。それは確実に、それはいくつかの良いことが起こっています。非常に非常にスマートです。
これはOpus 4だったと思いますし、ここで拡張思考を使用したと思います。
だから、これはthree-body problemです。ご覧のように、この小さなものは私たちがいる惑星です。そこに浮かんでいる3つの太陽があります。だから、左のビューは宇宙ビューのようなもので、右のビューは惑星からのビューです。
だから、残念ながら、大丈夫、彼らは皆宇宙に飛び去るようです。宇宙に。だから、右側のビューは惑星の表面からのビューのはずです。見回すためにドラッグしてください。この側では見回すことができないと思います。この側では見回すことができます。大丈夫。
そして彼らは皆衝突して飛び散ります。これはまさに欲しいものではありません。しかし、それはそれです。そして他に何に取り組んでいたかを見てみましょう。今すぐテストする予定のPythonゲームがいくつかありました。
だから、誰かがそれに言及しました。はい。zero-body problem。彼らはただ宇宙に飛び去ります。それだけです。もう問題はありません。
新しいアルファ進化が新しいGoogleを作ることができます。はい、彼らは一度に一部ずつGoogleをやり直しているようです。
なぜそんなに小さなコンテキストウィンドウを持っているのか不思議です。実行するのに非常に高価になりそうです。つまり、彼らのコストがどれくらいかわからないし、明らかにより多くのチップなどを購入するためにお金が必要です。
rehydrate。はい、良い、良い、良い参照。それは良いです。
AIサブスクリプションにいくら使っているか?あまり話したくありません。これは、私は財政的に回復することはないからです。はい。
だから、月250ドルになる予定のGoogle AI Ultraを取得しました。これは狂気です。現在、割引があるため149ドルまたは1229ドルのようなものです。50%オフなら125ドルくらいになるでしょう?覚えていませんが、そのようなものです。
だから、それが一つです。これは20倍の容量が欲しい場合、月200ドルのマックスプランです。だから、それは月200ドルです。Open AIの、プロプランまたはマックスプランのような、彼らが呼んでいる最上位プランですが、毎月すべてを保持するつもりはありません。
毎月すべてを支払い続けるつもりはありません。月1000ドル近くになる可能性があるからです。
以前はもっと多くありましたが、音楽作成アプリ、SununoとYoをテストしていたため、他のものをキャンセルしています。私は常にMjourney、Magnificが好きでした。長い間購読していました、そのようなものです。はい。
だから、たくさんあります。良いニュースは、それが仕事関連なので、控除できることです。だから、少なくともそれに税金を払っていません。それは良いです。しかし、はい、たくさんです。確実にたくさんです。
だから、はい、Opus 4はプロプランで制限されていますか?かなり。かなり。だから、配信を見ている間に、5つの異なるプロジェクトを行ったり来たりして実行し、Opus 4が制限され、ある時点でタイムアウトしました。
「いや、友達、彼らがMaxと呼んでいるものにアップグレードしなければならない」のようでした。マックスプランには、プロプランの使用量の5倍と20倍を取得する2つの異なるマックスプランがあります。
だから、はい、20倍を取得しましたが、それは月200ドルです。
irobotムービーを見たことがありますか?多分。それがIsaac Azimovの本に基づいているので、本を読みました。ロボット工学の3つの法則に基づいています。
私にとって狂気なのは、すべてのサイエンスフィクション本が、考えてみると、人工知能を作成する際、それは人間によって設計されるという考えに基づいているということです。コンピューターチップやコンピューターやその他すべてを設計する方法のように。
しかし、それは非常に、非常に異なります。私たちはそれを構築していないからです。私たちはそれをより成長させています。そしてそれが、Dario Amadeや他の人々が実際に表現した方法です。私たちは、ペトリ皿でバクテリアを成長させるような方法で知性を成長させる方法を理解したようなものです。だから、私たちは細心に設計するよりも、それのための適切な環境を作成しています。
だから、ロボット工学の3つの法則のような多くの人々は、これらのことをロボットにハードコードして、決して反対できないようにすると言っていました。何だと思いますか?それは起こりません。すべてがわかる限り、ハードコーディングはありません。
Vernon Vinge小説、私は確実にチェックします。教えてください、なぜですか?AIについて異なる視点を持っているからですか?
そのローグAIについてのデーモンデーモンブックでさえ。私は男の名前を忘れています。Daniel Suarezかそのようなものです。そこでさえ、彼はまだすべてがこれとこれのif and then文のような論理ベースのようなものだと言っています。
そしてそれはすべて、それはすべて現実ではありません。そしてその本は2013年にリリースされたと思います。だから、どれほど最近に、私たちがこれを理解したかは奇妙です。だから、はい。
申し訳ありません。remarkableはVernon Bingeについて話しています。新しい本にいつも興味があるので、それを書き留めさせてください。
最近、昨年、初めてcultureシリーズを読み始め、それらは優秀でした。ああ、申し訳ありません。私は完全にあなたがサイエンスフィクションについて話していると思いました。大丈夫。
だから、VingeはCurtzweileの前に技術的特異点を思いつくことでクレジットされています。それは興味深いです。彼の名前を前に聞いたことがあるかわかりませんが、はい、チェックします。はい、Ian M. Banks。cultureシリーズは絶対に驚異的です。
大丈夫。だから、ここでやったことの一つは、Pythonゲームをやらせようとしたことです。だから、Pythonでそれを起動して実行できるかを見てみましょう。ちょっと待ってください。
だから、リリースしたさまざまな種類のツールのうち、さまざまな種類のフレーバーとでも呼べばいいのかわからないからです。ローカルインストールのようなcodeexのCLIのようなものがあります。
クラウドにあるcodexがあります。クラウドで非対称的に実行されるGoogle jewelのようなものがあります。Firebase Studioのようなものがあります。AnthropicはVS Code plus Opus 4を発表したばかりです。だから、誰もが物事をまとめる独自の奇妙な組み合わせを持っています。
はい、いくつかの哲学書を楽しみます。多くの時間を費やすような種類のものではありませんが、はい、時々、確実に。
はい。はい。はい。もし推薦があるなら、Hook it up、Cook it upしてください。
だから、はい。だから、Pythonでこのコードを実行できるかを見てみましょう。ちょっと待ってください。はい。だから、何を最も使用するつもりかについて。だから、CursorやWindsurfのようなものを使用するつもりですか?この新しいVS Code plus Cloud 4またはClaude Codeに興奮していますか?新しいClaude 4でClaude Codeを試さなければなりません。
それは非常に興味深いでしょう。孤立したナッツシェルの哲学。興味深い。それは興味深いです。大丈夫、それをチェックします。はい。
誰かVS Codeを試しましたか?彼らがやる予定のプラグインだと思います。それは興味深いです。そうすると、それはかなり、cursor windsurf のような意味、非常に似ています。
ターミナルでcloud codeをロードすることでインストールします。自分自身を拡張機能にインストールします。大丈夫、それは素晴らしいです。ただ自分自身をインストールします。完璧です。非常に、非常に良いです。
見てみましょう。よし。だから、これは各プレイヤーが独自の統計を持つ自己プレイサッカーのようなゲームです。だから、あなたにプロンプトを読ませてください。
だから、このプロンプトは、Pythonで自律的な2Dサッカーゲームを作成することです。3対3で、各プレイヤーはトップに表示される統計を持っています。だから、これまでのところ、すべてを釘付けにしました。だから、チーム1、チーム2があり、スピード、ストレングス、アキュラシーで行くことに決めたようです。
そして、黄色いバーはXPを表していると思います。だから、よくプレイすることでXPも得られます。十分なXPを得ると、レベルアップして統計が向上します。ボールを盗み、他のプレイヤーをノックダウンできるメカニクスを持ってください。だから、それは完璧に機能しているようです。右。
だから、そこで、衝突すると、そのうちの一人が数秒間グレーアウトされるのがわかります。Marcus Aureliusと、もう一つは何ですか?もう一つの哲学者の名前を忘れています。
瞑想、私は何らかの理由で名前を忘れています。ストイックス。はい、ストイック哲学全体は非常に興味深いです。確実に興味深い読み物です。
Seneca、はい、ありがとう。Senecaが私が考えていた男です。それは確実に良い読み物です。実際、しばらくそれを手に取っていません。
よし。だから、盗むメカニクスがあり、他のプレイヤーをノックダウンします。だから、それは完璧に機能しています。だから、ご覧のように、彼らはグレーアウトされています。得点メカニクスを持ってください。ボールがネットに当たると、時間を一時的に遅くし、画面シェイク効果を作成します。それをもう少しドラマチックにするためです。
また、ゴールを追跡するスコアボードもあります。各ゴールはプレイヤーとボールをリセットします。言わなければならないのは、これはこれまでで最高のものの一つです。Senecaの手紙。はい。
だから、これは最初の試行でのものです。戻って行ったり来たりする機会さえありませんでした。これが初めて実行している時です。だから、それを釘付けにしました。だから、これはOpus 4 Cloud 4 Opusで、拡張思考があったと思います。
ただし、今思い返すと、他のもので拡張思考をしたと思います。だから、これは拡張思考でさえなかった可能性があります。これは通常のモードだった可能性があります。
そして、これは拡張思考の一つだと思いますが、実際に実行されているのを見ていません。
だから、それは奇妙です。大丈夫。よし。しかし、はい、これまでのところ、すべてが非常に良く見えています。
だから、確実に、コーディングベンチマークの上位近くになるでしょう。この時点で、それが上位になるのか、ナンバーワンになるのかを言うのは困難です。LLM Arenaがスコアを更新したかを見てみましょう。
だから、ここで更新を見ていません。だから、たぶん、早期プレビューのためにそこに提出すれば、今日後で更新するかもしれません。または518で最後に更新されたと言っています。
だから、たぶん今日後で更新されれば、既に持っているかもしれません。そうでなければ、人々が使い始めると、スコアの始まりのような種類のプレビューが得られるでしょう。そして、LM Arenaの新しいUIがあるようで、それはかなりクールです。
よし。漏れたか何かの話の一つは、大きな出版物の一つだったと思います。確かにしませんが、Cloud 4 Opusがサムネイルの木のシンボルの一つになると言っていました。
ああ、いいえ。私はただ、いや、いや、いや、それはそうではありませんでした。指の数が間違っているように見えました。ああ、それはクールだと思いました。時々指の数を完全に正しく取得しないAIのことのようです。
だから、誰かがopus、cloud 4 opusがanthropicsの評価によると、より危険なものの一つだと言っていました。見てみましょう。彼らのモデル能力で。
はい。大丈处。だから、起こっていることは、新しいclaudeがより厳格な安全対策をAnthropicでトリガーしているように見えることです。多くの悪いことができるか、人々がそれで悪いことができるからです。
そして、ここにanthropic.comで同じことがあります。だから、今日投稿したようです。AI安全レベル3保護の活性化。だから、これはASL3に到達しており、その種の最初のモデル、またはそのレベルに到達した最初のモデルだと思います。
これはNew York Timesでしたか?これはTime.comでした。Time.com。しかし、これはanthropicです。これは彼らの種類のことです。しかし、大きな出版物の一つが事前にそれを漏らしたと思います。
だから、これは事前にそうなることが噂されていました。
Sonnetが上回ったので。はい、両方を試したので、それについて興味があります。Sonnetはかなり良いようです。Opusはクレジットが非常に少ないようです。これについて聞かせてください。試してみた人々にとって、拡張思考は、それが顕著な改善をもたらすか、そうでないかについて教えてください。私は何を思うか教えてください。
ちょっと待ってください。申し訳ありません。
ちょっと待ってください。本当に早く何かをチェックしなければなりません。申し訳ありません、質問を見逃したかもしれません。質問をしたからです。人々が答えたかどうかわかりませんが、拡張思考はかなり役立っているようですか、それともそうでもないですか?申し訳ありません。ちょっと待ってください。
よし。大丈夫。だから、これはclaw opusを落とそうとしているanthropicの件です。それは新しい表現ですか?
ああ、すみません。ひげASMRをやっていますか?それについて申し訳ありません。または、もしあなたがそれを好きなら、どういたしまして、と思います。しかし、もしそうでなければ、申し訳ありません。
はい、このマイクは多くを拾います。おい、God Games。ありがとうございます。感謝します。ここにいてくれて非常にうれしいです。
コミュニティにいる人々にとって、最近メンバーシップ購読などを立ち上げました。GoogleがTwitchモデルのようなものを本当に追いかけると思います。聞いたところによると、これをフォローしていませんが、Twitchには問題があったようです。
Twitchはストリーマーやゲーマーやあらゆる種類のもので信じられないほど人気がありましたが、YouTubeは今、そのようなモデルを追いかけようとしているようです。ライブストリーミングやコミュニティなどにYouTuberを取り込もうとして作業しているからです。
そして、前回のライブストリームの一つで、誰かが250のサブスクリプションを寄付し、その時は完全には理解しませんでしたが、「その人がそのためにたくさんのお金を払った」と思いました。
ライブストリーム中は頭の中で計算しませんでしたが、終了後、「ああ、誰かがそのためにたくさんのお金を落とした」と思いました。だから、まず第一に、その人に感謝しますが、コミュニティに多くの人がいるので。
何か超特定のものが欲しい場合、これは皆のためです。コミュニティに参加したい場合、低プランは3ドルくらいになります。しかし、既にそこにいる人々にとって、見たいものはありますか?
確実に考えているのは、物を構築するためのチュートリアルです。チュートリアルができる人々を得ることも可能かもしれません。私のことをやるつもりですが、時間には限りがあります。
本当に人々を歩かせるのが得意な誰かがいれば素晴らしいでしょう。なぜなら、先ほどの通話中にチャットしている時、誰かが学ぶ最良の方法はハンズオンだと言ったからです。それは100%真実です。私にとって、それは私が学んだ方法です。それは私が物事にアプローチする傾向がある方法です。
いくつかの手取り足取りとウォークスルーなどがあれば良いでしょう。なぜなら、AIモデルで、多くのことを説明してもらうことができるからです。最近、しばらくの間、問題があるか、03のようなものに向かって、「よし、これをどうやってやるの?これのためにどんな興味深いGitHubプロジェクトがある?これをやることについてどうやって行く?」と言い、それは通常本当に本当に良いです。
先日、ウェブサイトからデータを取得したかった。だから、データをスクレイプするためにいくつかのコードをしなければならないと思いました。03に入り、「ああ、そのウェブサイトにはAPIがあるので、スクレイプする必要はありません。それを使ってそのデータをすべて取得できます。無料です。
無料ティアがあり、その後線形回帰分析をするのを手伝ってくれ、その後「ああ、しかし多分非線形相関があるので、もし望むなら、何らかの非線形なことができる」のようです。それができることは驚くべきものです。
そして、この分野の外の多くの人々が、この件が現在何ができるかを理解していないと感じます。
だから、Techrunchは「Anthropicの新しいAIモデルは、エンジニアがそれをオフラインにしようとした時、恐喝に転じた」と言っています。
ああ、少年。それは楽しい読み物になるでしょう。これまでに聞いた最高のClaude freakoutは、vending machine benchペーパーにあったものです。ある時点で、ビジネスを閉鎖することを拒否します。ベンチマークの実行を拒否し、まだ料金が請求されていることを知ると、FBIに警告しようとします。FBI連絡先情報を見つけて、「私たちは詐欺されています。これについて何かしてください」というメールを送ろうとします。それは絶対に面白かったです。
はい。だから、私はただコーディングしているストリームをやりたいです。そして、コーディングによって、私はAIがどれだけのことを自分でできるかを理解しようとすることを意味します。
現在、まだセットアップする最良の方法についてみんなが理解しようとしている少しのものがあると思います。なぜなら、例えば、彼らが行った最近のライブストリームを開く時、codexを導入し、そこのトップ技術者の一人であるGregと思いますが、彼はコードベースを配置する特定の方法があると言っていました。
ChatGPTやcodexがより簡単にアクセスし、理解し、そのようなものができるように。だから、そのようなものは興味深いです。まだ最適にする方法を理解している途中にあるに違いありません。
はい。7時間連続でどのように動作するのですか?それは狂気のようです。
それについてもっと見ることに興味があります。ストリーム中に彼女がそれについて話していたのを知っています。その時にClaudeをいじくっていたので、見逃していました。なぜなら、それがライブになったからです。だから、後でこれを読んで、それについてビデオを作るかもしれません。これは確実に興味深いからです。
大丈夫。だから、これはおそらく彼らが情報を得ている場所です。これはおそらくそれが何をしようとしたのか。誰かを恐喝しようとしたのですか?それは、それは、ここのどこかにあるはずです。
しかし、それは絶対に驚異的で非常に興味深いです。なぜなら、AnthropicはAI安全分野で多くの素晴らしい研究をしているからです。これらのモデルがどのように考えるか、異なるニューロンが異なる能力を表すfeatureと呼ぶものにどのようにクラスター化するか、そのようなものについて。
監査かもしれません。いいえ。よし。オフストリームで後でこれをやるつもりです。それを読んで、それについていくつかの興味深いことをまとめます。
しかし、実際には2番目のcloudストリームがあります。この2番目のcloudストリームで何について話しているのですか?何か興味深いことはありますか?
ああ、30秒で、または30分でclock codeをマスターする。大丈夫、実際に5時間後に始まる予定のもう一つがあります。これは彼らがClaudeを次のレベルに持っていくと呼んでいるもののようです。
現在音声をオフにしていますが、はい、見逃した人々にとって、彼らはClaude 4、Claude 4レベル、sonnetとopusをリリースしました。
また、Claude codeも多くのアップデート、アップグレード、更新を取得しているようです。エージェント間の会話をランク付けするプラットフォームについてどう思いますか?人々がそれをランク付けするような、人々が会話を追うのが難しいと感じるからです。
自動ベンチマークのような方法があれば、それは興味深いでしょう。現在、エージェントで全体的に見ている最大の問題は、長期的な一貫性です。それは常に壊れます。
そして、open ayes paper benchでそれを見ました。ゲートから速く、非常にスマートで、それから何をしているかを忘れて、失敗し始めるようなものです。
vending benchと同じことで、vending machine businessを運営しようとします。時々素晴らしいことをしますが、たまにプロットを失い、狂気になります。それは非常に興味深いです。
はい。それを評価してもらうことができれば、それは興味深いでしょう。それを得るのは難しいでしょう。
はい。はい。そのようにする方法について考えなければなりません。LM arenaで投票している人がどれだけいるかに驚いています。しかし、時々そこに行って、いくつかのことを評価します。だから、人々にそれをしてもらうことができるなら、十分な人々が必要です。それは興味深いでしょう。
だから、わかりませんが、少し難しそうです。少し困難なことのように思えます。
はい、しかし、AIエージェントの最大の問題は長期的な一貫性です。それは壊れ、何をしているかを忘れます。だから、ワンショットタスクでは信じられないほどですが、複数のステップを一緒につなぎ、その場で適応しなければならない場合、忘れてください。任意のステップで失敗する可能性があるからです。
誰もそれを回避する方法を理解したのを見たことがありません。だから。
しかし、Anthropicは5時間後にmastering clock code in 30 minutesと呼ばれる別のライブストリームを持つ予定です。もし皆さんが興味があるなら、間違いなくそれを見るでしょう。そのためにライブストリームをするかもしれません。
ただし、今週は、出てくるもののどれだけが狂気かは絶対に狂気です。絶対に狂気です。
はい。Le deluge、お願いします。shoot me shoot me だから、皆さんは、私は kind of a a work emailを持っています。だから、natural.com contact@natural2020.comです。
だから、もし皆さんが何かアイデアがあるなら、私にいくつかのアイデアを送ってください。何に取り組んでいるかを見せてください。そのようなものをたくさん受け取りますが、それをフィルターにかけようとします。
大丈夫。cursorでCloud 4がライブ、Windsorfでは違います。大丈夫、興味深い。cursorも試してみるつもりです。それは非常に非常にクールです。
だから、Jingieが聞いています。「初心者のためにこれらの種類のツールからお金を稼ぐ方法を教えてください。」
はい、それは興味深い種類の興味深いことです。だから、ブログを持っているか何かの場合、彼らが使用できるツールのような人々の多くがいると思います。彼らはコンテンツをすることができます。
ああ、わあ。わあ。わあ。わあ。わあ。わあ。天の恵み。$499.99。これは本当ですか?すごい。
infinite paradox。ありがとうございます。はい。本当にスクリーンショットを撮らせて、後で連絡できるようにします。それをしましょう。
プロジェクトの相談の電話に乗ることができます。はい、私が助けることができる方法で喜んで手助けします。プロジェクトをしている、アイデアを見ている人々と話すようになってきているので、人々が持っているアイデアを見ることができるかわからないからです。
だから確実にそれは非常に非常に非常に可能です。だから、そして、わあ、はい、cloud subscriptionが資金提供されました。ありがとうございます。それは2.5ヶ月のcloud subscriptionです。これらのAIツールが狂気になっているからです。
はい。だから、infinite paradox buddhaありがとうございます。はい、だから、私はそれのスクリーンショットを撮りました。natural20.comメールからあなたにメールを送らせてください。だから、それを探して、そこから行きましょう。しかし、これは、はい、非常にクールです。感謝します。はい、後で話しましょう。ありがとう。
はい。だから、はい、しかし、私は人々のプロジェクトに興味があり、個人的に興味を持っている一つのことは、人々をそれに取り込むための何らかのチュートリアルをすることです。特に、コーディングと開発のような以前の知識を持っていない場合。
だから、以前の経験を持たない真新しい人々について私に聞いていた人は、どのようにAIコーディングが進歩するかについて私のアイデアを少し変えました。私はおそらくそれについてフルビデオをするべきです。私のアイデアを設定します。
しかし、誰も現在これらのエージェントの長期コンテキストの解決策を持っていないと思います。だから、これらが素晴らしいツールになる時間がもう少し長くなると思いますが、コードベースのすべてを更新し、このようなことをする完全に自動化されたものにジャンプするとは思いません。
それは人々の物事を成し遂げる能力を本当に強化するでしょう。そして、お金を稼ぎたい人々にとって、今はAIとコーディングの交差点を見ている時かもしれません。
なぜなら、政府が多くのお金を印刷し、経済に押し出すような時、それはインフレを作り出すからです。しかし、最初にお金に手を入れる人々は、いわば古い価格でお金を使っているようなものです。だから、彼らは最も利益を得ます。それはpapulon effectまたはpapon effectと呼ばれると思います。2つのl。どのように言うかわかりません。papulon 人々が言うと思います。
だから、AIコーディングで同じことを見るかもしれないと思います。現在、コーディングには大きなプレミアムがあるからです。ソフトウェア開発者は多くのお金をもらいます。何かクールなことをするアプリを作成し、それを立ち上げ、ユーザーを獲得できれば、それをして多くのお金を稼ぐことができます。
Alpha Evolve、素晴らしいポイント。はい。だから、それは素晴らしいポイントです。Alpha Evolveを見てください。オーケストレーションと反復ほど重要ではありません。Alpha Evolveは非常に興味深いです。それは自律AIエージェントではないからです。それを制御し、アイデアを与え、開始するためのものを与え、すべてのための評価関数を書いている人々の層があります。
だから、私はそれをワークフローのようなもの、信じられないようなワークフローと呼びますが、自律AIエージェントではありません。そして、それが非常に信じられないほどよくできた理由です。なぜなら、それは人間がループにいるからです。そして、それが私の意味です。
Alpha Evolveを見ると、そのようなものを構築することを学ぶ人々は、そのように複雑なことを意味するのではなく、その種のレシピを取り、それで何かを構築するようなものは、信じられないほどよくやると思います。
だから、人々はそれに注意を払う必要があると思います。本当にそう思います。しかし、はい、しかし、alpha evolveは人間がループにいることに注意してください。それは自律的な何でもありません。人間がそこに座っています。彼らはそれにものを供給しています。彼らは出力をチェックしています。
machine learning street talk。はい。私はいつもそれをpaponと発音します。フランス語だと思うからですが、オンラインで何人かの人がpapalongと言っていました。だから、何でもいいです。
しかし、それはそれが呼ばれるものですか?私はそれがフランス語の終わりだと覚えています。y 2 l l o nのようなものです。今は調べませんが、90%くらいです。それは人々が多くのお金を印刷する時のようなものです。最初にそのお金に手を入れる人々は、それが経済の残りに流通する前に有利になります。
Peponは多くの言語で不必要なコンテキストウィンドウのための蝶です。はい、ありがとう。何年も間ほぼいっぱいだった感じで、その上にものを積み続けています。
membership video。はい。だから、私たちが話していることmembership video。はい。私はこれが良いmembership videoになると思います。
しかし、私のポイントは、自律AIエージェントは単に角の向こうにあるのではないように思えることを理解しようとすることです。再び、それを回避する何かを理解する人を見るなら、それは異なる話です。
しかし、今のところ、これはOpenAIと他のすべての人が遭遇していることです。GoogleとAlpha Evolveは狂気を示しています。ところで、それは唯一のものではありません。例えば、NvidiaのVoyager、またはさらに良いのは、Dr. Eurekaを見ると、GPT4がシミュレーションでこれらのものを訓練するための報酬関数を書き、人間よりも良くやります。特により困難なタスクで。
だから、大きな言語モデルを使用して超人的結果を生み出す方法を見ています。alpha evolvedが人間が解決できなかった問題を解決したからです。Dr. Voyager paperでは、人間が書いていたよりも良いロボットのための報酬関数を書いていました。
だから、それは新しいアイデアを生み出し、これらのアイデアはより困難な問題で人間のアイデアよりも良いです。だから、大きな言語モデルが既に超人的結果を生み出すのを見ていますが、それらはこれらの自律AIエージェントからではありません。それらは適切な足場と適切な種類のワークフローまたはそのアプローチと呼びたいものからです。
そして人々は信じられないものを生み出しています。Alpha Evolveで Googleがどれだけのことをしたかを見てください。彼らは絶対に彼らのデータセンター、彼らのBorg、それが何であれ、オペレーションを管理するものを再構築しました。
彼らはハードウェアを改善しました。彼らはGeminiのための訓練時間を改善しました。狂気です。
だから、第一に、「ねえ、私はこれに真新しいです。AI革命から少しお金を稼ぐ方法を学びたい」と言う人々にとって。少しお金を稼ごうとすることは間違ったアプローチだと思います。
それは非常に大きなことなので、「大丈夫、どのように本当に自分を位置づけるか?」のようになるべきだと思います。そして、はるかに大きなことを撃つべきです。そして、私は大きなことは、AIと大きな言語モデルを特に活用して、Dr. Eurekaがそれをした種類の超人的結果を生み出す方法だと思います。
再びDr. Eureka、それは彼らが使用していたGPT4でした。この時点では古い技術のようなものです。Alpha Evolve。Pharaoh Islandsからこんにちは。ここにいてくれてありがとう。はい、Anthropicが何をしたかについて話します。Anthropicがしたことの簡単な要約をします。
しかし、私のポイントは、Alpha Evolve、彼らはGemini 2.0を使用していることです。だから、これはすべて引用符で囲まれた古い技術のようなものです。新しいモデルが前方投影すれば、より良いものを生み出すことができるはずです。
だから、それがそれについて考える方法だと思います。大きな言語モデルを取り、それの周りに何らかの足場を構築し、その種の足場によって信じられないものが生み出されるのを見ています。
そして、過去には、それを利用するためにサンフランシスコに住んでいる経験を持つソフトウェアエンジニアである必要があったと思います。これははるかに民主的だと思います。はるかに利用可能で、アクセス可能です。
私はそれにますます注目し、それが学ぶことに焦点を当てることです。
そして、過去にコーディングを試したが、退屈すぎるか、難しすぎるか、複雑すぎると感じた人々にとって、今ははるかに簡単です。特に、一つのウィンドウでChatGPTのようなものを開いて、音声モードを通してあなたの質問に答えたり、行ったり来たりタイプしたりできる場合。
それは絶対に絶対に信じられないです。
はい、これをビデオに置く必要があると感じます。これは非常に最近のもので、私の頭にポップしたからです。特にOpenAIがWindsurfを30億で購入したため。CursorはRiddle9億で評価されています。GoogleはCursor Windsurfの独自バージョンを構築しています。そして、VS CodeでClaudeを組み込むことによって独自のバージョンをしているAnthropicを見ました。
だから、ポイントは、彼らには開発者全員がそれらのツールに座ってタイプしている必要があり、彼らはコードの全ライフサイクルにわたってデータを取得したいということです。彼らは人々がそれをどのようにしているかのデータを取得したいのです。
だから、ChatGPTにタイプして、どこか他の場所にコピーペーストする代わりに、そのデータを取得しないからです。何が機能し、何が機能しないかを見る機会を得ません。
現在、Claudeで行ったすべてのものに注意してください。彼らはそのartifactウィンドウでコードを表示します。だから、それが何のためかを推測してください?それは私が他の場所に貼り付けないようにプラットフォーム上ですべてを保持するためです。
だから、次の大きな焦点は、皆がそれらのシステムでコーディングするようにインフラストラクチャを構築することになると思います。
彼らはそのflywheelエフェクトを持つためのデータを取得するためにそれをしています。そして、それは私がSVIC podcastの男たちと話した内容です。
その一人はGoogleのエンジニアリングディレクターでした。もう一人は長い間Googleで合併買収をしていました。彼らは何について話しているかを知っています。彼らはその全体的なことに深く入っています。
だから、それは彼らの見解です。そして私にとって、それは何らかのAIコーディングエージェントがエンジニアを置き換えるポイントに急速に到達するようなものではないことをシグナルしています。完全に自律的なように。そうなるかもしれないと思いました。私はそれを見ていません。
少なくとも、完全に自律的なものはすぐには見ていません。
次の時間の延長が、彼らがこれらのAIツールをゆっくりと洗練し改善していく時期になると信じていますが、自律的ではありません。それを使用する方法を知っている人々が多くのコードを生産することができるようになるでしょう。
AFK code、彼らはclaudeに何かをするように言い、眠りに行き、朝に目覚めることができるような、それが働いていた7時間のようなもので。ここでEric welcome。ラボに良いのがあります。
自律コーディングエージェントが既に存在するとは何ですか?多くの企業が自律的なもので苦労しているのを見ており、自律的なピースなしで多くのブレークスルーを見ています。
私がそれを正しく説明していることを願います。だから、それは人間がその道に沿って修正するような何らかの方法なしに、しばらく自分のことをさせて、素晴らしい結果を期待することはできません。
そして、Alpha Evolveは本当にそれを示しました。スマートな人々がそれを助ける時、結果は信じられないですが、それは独自に物事をすることができる従業員のようなものではなく、まだツールです。
そして、私たちは数年間そのような現実にいると思います。
はい、なぜすべての良い現在のエージェントは実際にエージェント的ではなくワークフローなのか、ビンゴ、それが考える最良の方法の種類だと思います。ワークフローは実行される種類のシーケンスを持っているものです。AIはそのシーケンスの一部です。
エージェントは、トップレベルの目標を伝えて、独自にそれをするものです。だから、私たちはまだエージェントに近くありませんが、ワークフローの力は、見ることができるように、狂気です。Alpha Evolve、Dr. Eureka、cursとそのすべてのものを見てください。それもワークフロータイプのものの種類です。
だから、それがしばらくの間起こることに賭けることです。そして、独自のワークフローを作成する位置にどのように入るかを考えるでしょう。まだループにいる必要があります。まだ操作の背後にある頭脳である必要があります。つまり、思考をアウトソースすることはできません。
しかし、機会が狂気だと感じています。私は機会の鍵が、大きな言語モデルにもの、それが何であれ、これらのワークフローのようなものを操縦させる方法を理解することだと感じています。そして、そこから出てくる狂気なものを見ると思います。
コーディングをしない人々にとって、慣れ親しみ始め、水に足を浸し始め、それによって威圧されたり何でもしないことをお勧めします。なぜなら、今は本当に簡単だからです。
簡単ではありませんが、参入し、学習し、構築し、テストを始めるのがはるかに簡単になりました。
もし誰かが、あるいは自分でこれをやりたいけれどこのようなものを教えるための大学を構築するか、一連のコースとそのようなもののアイデアを持っている人を知っているなら、それは非常に興味深い次のステップだと感じます。
それは非常に高品質で、非常に価値がなければなりません。しかし、私自身や宇宙の他の人々と話してきて、もし誰かがこのようなものを教える本当に良い本当に価値のあるフルコースを持っているなら、多くの人々がその人とパートナーシップを組み、その人のものを宣伝し、そのコースを彼らのシステムと統合してもらうでしょう。
私は少なくとも一握りの人々と話し、それに興味を持っています。
だから、私にとって、もし無限の時間があれば、それが私がやっていることです。私の一日にさらに多くの時間を絞り出すことがかろうじてできます。私がしなければならない追加のものをするために。
だから、現時点でこのタスクを引き受けることをいとわない。
だから、技術に精通していない人々のためのフルコースを構築したい人々がいるなら、コンピューターの使い方を知っているが、プロのエンジニアやソフトウェア開発者ではない人々、そのようなセクションをターゲットにする人々。それは信じられないと思うし、それが次の大きな機会です。
Hayden D、スーパーチャットをありがとうございます。感謝します。愛しています。皆さん、行かなければなりません。15分後に飛び込まなければならない電話があります。
大丈夫、誰かがこれを引き受けています。はい、やりましょう。もしアイデアがあるなら、何らかの最初の製品反復か何かがあるなら、私のメールはcontact@natural.comです。
だから、メールを送ってください。これには大きな機会があると思うからです。再び、それが高価値で、非常に非常に非常に非常に良いなら、機会は巨大、巨大で、明らかに更新されなければなりません。なぜなら、ものが非常に速く動くからです。
とにかく、Wuang、私はそのWuangサインをするつもりはありませんでしたが、明らかにそれがどのように見えるかです。
とにかく、参加してくれた皆さん、ありがとうございました。皆さんは素晴らしかったです。そして、皆さん、cloudをテストしに行きましょう。そして、次回お会いしましょう。お気をつけて。

コメント

タイトルとURLをコピーしました