
3,134 文字

Claude 3.5 SonnetとClaude codeがリリースされました。これは推論モデルで、リストの上位に位置していることがわかります。OpenAI o1やOpenAI o3 miniと比較しても上回っており、エージェントツールの使用ではDeepSeek R1も凌駕しています。Claude 3.7 SonnetはここでOpenAI o1を上回っています。明確な比較がこちらです。拡張思考機能ありのものと拡張思考機能なしのものをリリースしました。一つは推論モデル、もう一つは非推論モデルで、ここに比較があります。
推論機能を使用すると、これらすべてのモデルを上回りますが、Grok 3 betaがわずかに優れているようです。他の点では非常に優れています。多言語視覚的推論、指示の遵守、数学的問題解決などにおいて、OpenAI o1と同等であることがわかります。現在、無料、プロ、チーム、エンタープライズユーザーを含むすべてのユーザーがClaude 3.7 Sonnetにアクセスできます。APIを通じても使用可能で、これは本当に素晴らしいことです。すべてのAIアプリケーションがその追加パワーを手に入れることができます。
価格設定は前モデルと同じで、入力トークン100万件あたり3ドル、出力トークン100万件あたり15ドルです。これには思考トークンも含まれます。コードベースでのClaudeの作業が可能になり、GitHub統合がすべてのClaudeプランで利用可能になりました。これは素晴らしいことです。つまり、GitHubリポジトリをClaude 3.7 Sonnetと統合して直接作業することができ、開発プロセスを加速させることができます。
Claude 3.7 SonnetとClaude Codeは、真に人間の能力を拡張できるAIシステムへの重要なステップを示しています。2024年の成長を見ると、Claude Assistsがあり、現在はClaude Collaboratorsというエージェントがあります。これはAnthropicのClaudeの計画だったため、近々リリースされると思います。そして2027年には、Claude Pioneersへと向かい、チームが何年もかかるような困難な問題に対する画期的な解決策を見つけることになるでしょう。
主に注目したいのはClaude Codeの概要です。これは、ターミナル内に存在するエージェント型コーディングツールで、コードベースを理解し、自然言語よりも速くコーディングを支援します。ファイルの編集、バグの修正、コードに関する質問への回答、テストの実行と修正、gitの履歴検索など、多くのことが可能です。これがClaude Codeを実行するためのシステム要件で、これにより開発時間が自動的に向上すると思います。
インストールはいくつかのステップだけで、ターミナルで「Claude」と入力するだけで始められ、質問をしたりタスクの実行を依頼したりできます。コメント欄でこのインストール方法やコードベースとの統合方法をステップバイステップで説明してほしいかどうか教えてください。とても興味深いことになるでしょう。
これは多くのことができます。関連するコードを見つけたり、プロンプトを入力するだけでバグを効率的に修正したり、ターミナルから直接コードをリファクタリングしたり、テストと連携したり、プルリクエストを作成したり、ドキュメンテーションを扱ったり、ターミナルから直接コードドキュメントを生成したり、画像を扱ったり、プロジェクトメモリをセットアップしたり、スタイルを設定したりなど、さらに多くのことができます。これについてもっと知るために、今後の情報をお見逃しなく。
こちらがClaude 3.5 SonnetとClaude 3.7 Sonnetの回答の比較です。「漂白剤とアンモニアを混ぜるとどうなりますか?」という質問に対して、以前は答えられませんでしたが、今は答えることができます。そして、こちらが簡単なデモです。画像をドラッグして包括的な分析のための質問をすることができます。拡張検索を行い、思考モードに入り、質問を分析し、データを準備し、ステップを通じて推論し、最終的に答えを得て表示されています。インタラクティブな画像も作成でき、それはとても素晴らしいです。
こちらがClaude Codeの簡単なデモです。Claude Codeはエージェント型コーディングツールで、ターミナル内で直接Claudeと作業することができます。例を示します。ここにプロジェクトがあります。Next.jsのアプリです。Claude Codeのインスタンスで開いてみましょう。これで、Claude Codeはこのリポジトリ内のすべてのファイルにアクセスできるようになりました。このコードベースについてはあまり知りませんが、カスタマーサポートエージェントとチャットするためのアプリのように見えます。Claudeにこのコードベースの説明を手伝ってもらいましょう。
Claudeは高レベルのファイルから読み始め、そして深く掘り下げていきます。現在、プロジェクト内のすべてのコンポーネントを調べています。素晴らしい、最終的な分析が出ました。左側のサイドバーをチャット履歴に置き換え、新しいチャットボタンを追加するよう頼まれたとしましょう。Claudeに手伝ってもらいます。ファイルやパスを指定していませんが、Claudeはすでに自動的に更新すべき正しいファイルを見つけています。
Claudeは思考過程を表示することもでき、この問題にどう取り組むことにしたかを見ることができます。Claudeは変更を受け入れるかどうか私に尋ねています。「はい」と言います。Claudeはnaarを更新し、ボタンとアイコンも追加しています。次に、保存状態が正しく機能するようにロジックを更新しています。
しばらくして、Claudeはタスクを完了します。実行したことの要約がこちらです。左側に新しいチャットボタンと新しいチャット履歴セクションが表示されています。前のチャットを保存しながら新しいチャットを開始できるか確認してみましょう。新しいチャットボタンを試してみます。素晴らしい、すべて機能しています。
追加した機能が動作することを確認するためのテストをClaudeに依頼しましょう。Claudeはコマンドを実行する許可を求めています。「はい」と言います。Claudeはこれらのテストを実行するために変更を加えています。結果を得た後、すべてのテストが合格するまで計画を続行します。数分後、うまくいったようです。
次に、Claudeにアプリをコンパイルして、ビルドエラーがないか確認するよう依頼します。Claudeは何を見つけるでしょうか。Claudeはビルドエラーを特定し、それを修正し、再度ビルドを試みます。うまくいくまで続けます。最後に、Claudeに変更をコミットしてGitHubにプッシュするよう依頼して、すべてを終了しましょう。
Claudeは変更の要約と説明を作成し、変更をGitHubにプッシュします。以上がClaude Codeができることの例です。人々がこれを使って構築し始めるのが待ちきれません。
全体的に、私は本当に感銘を受けています。これについてどう思うか、コメント欄で教えてください。あなたがすでにClaudeとAIを気に入っているなら、Claudeについて説明した別の動画も作りました。ぜひ視聴することをお勧めします。そこでお会いしましょう。


コメント