
8,425 文字
皆さん、ここで何かをお見せしたいと思います。Claude 3.7が登場しました。おそらくコード生成に関して最高のLLMで、Claude Coderというものが付属しています。これは多くのAIパワードIDEにとって真剣な競争相手になります。それらは全て定期購読料を請求していますが、これはClaudeを通じて利用可能です。それについて話すよりも、これを通して実際にお見せしましょう。
このことに本当にワクワクしています。なぜなら、たった2分でこれを構築したからです。2分でこれを構築したことが革命的だとは言っていませんよ。これは数ヶ月前から可能でした。基本的に3.5 Sonnetから、適切なアプリケーションを使えばこのようなものを構築するのは難しくありません。しかし見てください。AIによって生成された経費、収入レポート、節約のヒント。これら全てがクラウドインターフェースで、このようなワンホットプロンプトから生成されました。
そして、すべてのコードを取り出してフォルダに入れました。実際にすべてのファイルをセットアップしたり、すべてを分割したりするという、30ステップほどのプロセスを経るのではなく、ここでClaude Coderを使用しました。Claude Code、これがその名前です。これは研究プレビューで、このリリースに付属しています。後で詳しく説明します。私はただフォルダに移動して「よう、これを全部セットアップしてくれ」のようなことを伝えました。それから実行したときにエラーメッセージが表示され、そのエラーメッセージを渡すだけで、すべてが動作しました。
それ以前は、手動でこれを動作させようとして約1時間費やしましたが、まだ完成していませんでした。これは、今までCurserのようなアプリだけができたことです。間違っていたら指摘してください。プロの開発者ではないですが、出てくるこれらのアプリについてはかなり理解していると思います。私自身も3〜4年前に独学でPythonを学んだ初心者コーダーです。基本的に、これは全てを実行し、認証機能などを備えた作動するウェブアプリが完成しました。
見てください、ログアウトもできますし、新しいアカウントで登録もできます。ステップバイステップで見ていきましょう。カットや編集なしで、これがどのように機能するかをお見せし、このビデオの途中でClaude Coderを使ってこのアプリケーションを改善していきたいと思います。
そこから始めましょう。このターミナルを開いて、このClaude Codeがどのように機能するかを見せます。繰り返しますが、これは革命的なものではありません。これらのものはCurserやWin Serve、Lovable Now、Pythagoraなどのアプリケーションを通じてアクセス可能でした。これらのアプリは、ネイティブAIが統合された完全なIDEのようなものでした。これは無料で提供されており、彼らはこれを研究プレビューとして公開しています。
遊ぶにはこれをインストールするだけです。インストールについては説明しません。基本的にコードをちょっとでも触ったことがあれば、きっと理解できるでしょう。彼らのブログにすばらしいドキュメントがあります。このリンクのClaude Coderのところに行けば、必要なすべてのステップが記載されています。Node.jsとGitをインストールし、これを実行して、作業したいフォルダに移動し、「Claude」と入力するだけです。
インストールすると、文字通り作業したいフォルダでターミナルを開き、「Claude」と入力するだけです。そうすれば、Claudeがコードで作業を始めます。そこで「より良くする」という私のお気に入りのプロンプトを使うことができます。ここではあまり混乱させたくないので、「より美しくする」と言います。そうすると、Claude 3.7 Sonnetが何をすべきか理解し、すべての変更を実装し、フォルダ構造を変更するなど、必要なことを行います。
ターミナルでは、プロンプトを与えたりコードを提供するのではなく、人間の言語や自然言語で話しています。革命的なことは何もありませんが、革命的なのはこの新しいモデルです。
これが動作している間に、この新しいモデルについて見ていきましょう。新しいのはClaude 3.7 SonnetとClaude Codeです。私はClaude Codeから始めましたが、非常に優れていると思ったからです。Claude 3.7 Sonnetは彼らの新しいモデルです。この分野をフォローしていれば、01 Proや基本的に01が登場するまで、3.5 Sonnetがコード生成に最適なモデルと考えられていたことを知っているかもしれません。
使用して実際にアプリを構築していた人々は皆、「どれも素晴らしいけど、コード生成にはClaude 3.5 Sonnetが一番だ」と言っていました。今、私たちは3.7 Sonnetを手に入れ、それははるかに優れています。3.5 Sonnetのリリース以降、01と01 Pro、DeepSeek R1、そして現在はO3 miniがコード生成の面で優れていると言われてきました。しかし、まだ議論がありました。白黒はっきりしているわけではなく、人々がClaudeを諦めて「もう使わない」と言ったわけではありません。
昨日まで、多くの人々はまだClaude 3.5 Sonnetを使ってコードを生成していました。Cursorなどのアプリもまだそれでコードを書いていました。しかし今、以前最高だったコードモデルの、より優れたバージョンを手に入れました。ベンチマークが明確に語っています。3.5 Sonnetと比較すると、すべてのベンチでそれを上回っています。
これは01で、これはハイ設定のO3 miniで、ソフトウェアエンジニアリングベンチで49.3%を獲得しています。そしてこのカスタムスキャフォールディングは、基本的にプロンプトを追加し、デフォルトでは最大30回考えるところを100回まで考えさせたものです。ほとんどの場合、40〜50回考えるだけでしたが、基本的にはより多く推論させ、回答を保存するための追加のプロンプトを与えて、70%に達しました。対してOpenAI O mini highは49.3%です。
なお、これにはGrok Freeが含まれていないことに注意してください。Grok Freeはまだこれを公開しておらず、APIもまだ出ていないため、これらのベンチを自分で実行することができません。また、O Free Fullもまだリリースされていないので含まれていません。コーディングの面では、現在の他のオプションと比較して、キラーモデルです。
これは全てコードにフォーカスしていますが、この動画は非技術系の方々にも関連すると思います。ここで何が起きているかを知るべきです。これは素晴らしいことで、自分でも使えるかもしれません。エージェントツールの使用については素晴らしいです。他のすべてのベンチマークでは、これがメインのものだと思います。ほぼすべてで競合と比較して勝っています。
Grokはいくつかの分野、例えば視覚的推論やハイスクール数学競争などで強力な競争相手です。Grokはそれらで完全に勝利しています。しかし、大学院レベルの推論のようなGrokのベンチマークがすべてあるわけではありません。実際、スキャフォールディングを使用したトップナンバーが一番上に来ています。
みんなが既に3.5 Sonnetを愛していましたが、これは大きな比較です。他のものと比較するよりも、3.5 Sonnetと比較すべきでしょう。ベンチマークだけでなく、雰囲気やテイストテストについても重要です。それで常に優れていました。ベンチマークではいくつかが先行していても、人々は依然として3.5 Sonnetを使用していました。そして今、3.7 Sonnetはベンチマークの面でも巨大なアップグレードです。
では、実際にはどのように機能するのでしょうか?それは時間が経てば本当に分かるでしょうが、今日できること、今できることは、ダッシュボードの視覚化を生成するなどのランダムなプロンプトを実行するのではなく、実際に自分たちのためにアプリケーションを構築することです。このビデオの準備として事前に行いました。そして、Claudeコードと呼ばれるものでアプリケーションを改善していきます。
Claudeコードは基本的に簡単です。インストールしたら(コーディングの基礎知識があれば、ターミナルの使い方や基本的なコマンドの実行方法を知っていれば、3〜4分以上かからないはずです)、基本的に任意のフォルダを右クリックし、サービスを選択し、ターミナルウィンドウを開き、「Claude」と入力するだけです。
そして、自然言語で話しかけることができます。エンジニアや仲間、Cursorやその他のアプリと話すようにです。これがClaudeコードです。これで作業するのは簡単です。このブログ記事を締めくくりましょう。
彼らは基本的に「私たちは2024年にアシスタンスを持っている」と言っています。これは、私たちが一緒に働く協力者を実際に持つという最初のマイルストーンです。つまり、他の企業がこれをエージェントと呼んでいます。最終的には、自分自身で画期的な解決策を考え出すパイオニアを持つことになります。OpenAIではこれをAGIと呼んでいます。
これがブログ記事です。非常に興味深いです。これが実際にどのように機能し、競合と比較してどのようなパフォーマンスを発揮するかを見てみましょう。出力は巨大で、20,000語を何もないかのように処理します。同じプロンプトをChatGPTとClaudeの間でテストしてきました。ChatGPTに50,000語のエッセイを書くように指示すると、1,000語程度返ってきて「それが私にできる全てです」と言います。
Claudeは21,000語を作成し、「これが私にできる全てですが、続けるとタイプするとさらに続けます」と言いました。そして「続ける」とタイプすると、さらに20,000語を生成します。すごいです。過去数時間、これに夢中になっていました。毎週第2月曜日に開催しているオフィスアワーで、コミュニティと一緒に3時間かけてこれで遊んでいました。とても楽しかったです。
これを見てください。すべてをワンホットプロンプトで書きました。間違っていたら指摘してください。ですが、これは最長の出力長を持つウェブAIアシスタントLLMだと思います。APIで使用する場合、一度に128,000トークンを出力できます。これは別の興味深いことです。Anthropicコンソールを使用すると、さらに多くの出力が可能です。
これをトークナイザーに投入してみましょう。これはChatGPTの出力で、1,300トークン、7,000文字です。そしてこちらは20,000トークン、110,000文字です。すみません、単語と言いましたがトークンです。つまり、ナプキン計算が正しければ、トークンは16〜17Kくらいでしょう。いずれにせよ、110,000文字を一度に出力するのに対して、01 ProとChatGPT 4oの出力は7,000文字、6,000文字に対して、Sonnet 3.7は110,000文字です。
出力の長さは驚異的で、これらの大規模なコードベースを作成し、一度に大きなアプリを作成できることを意味します。そして、それが十分な長さでなければ、「50万文字は書けませんが、最後に続けるように言ってください」と言ってくれます。基本的に「続ける」と言うと、続行します。
巨大な出力で、コーディングに非常に優れています。では、実際にはどのように見えるのでしょうか?見てみましょう。いくつかの改善を行いました。コードを変更し、アプリはより専門的で統一感のある外観になりました。機能を完全に維持しながら、ユーザーはインターフェースがより魅力的で直感的であることに気づくでしょう。
視覚的なアップグレードを見てください。ユーザー名はtest1だったと思いますが、新しいアカウントを登録しましょう。test2として、ランダムなパスワードを与え、アカウントを作成します。これでアップグレードされたインターフェースが表示されました。
これらは、今までCursorなどでしかできなかったことで、そうでなければ全て手動で組み立てる必要があり、各ファイルを更新するなど、基本的に面倒でした。だから皆がCursorやその競合などのアプリを使っていたのです。しかし、これは無料です。先ほどお見せしたページからインストールするだけです。この2つをインストールし、このコマンドでインストールすると、コンピュータで「Claude」と言うだけで、Claudeが作業を行います。
すごいですね。より多くの節約のヒントがあり、様々なことができます。簡単に考えずに、ランダムな数字を入力してみます。test2、ランダムな数字、日付を変更するかもしれません。これは全て、以前のSonnetによるコード生成と同様に、あるいはそれ以上に機能しています。
カテゴリもあります。これは素晴らしいです。バックグラウンドでデータベースを持つログイン管理機能付きの個人的な支出追跡アプリを作成しました。それらを追加して、レポートを見てみるとvoilà!明らかにこれは高すぎますが、要点はわかりますよね?美しいダッシュボードがあり、主要な支出が表示され、それに基づいて節約のヒントが提供されます。
節約率などに基づいて、将来の予測も行います。明らかにこれらの数字は混乱していますが、要点はわかります。AIの実装が機能しなかった一つのことは、簡単に「Anthropic APIを実装して」と言うことができますが、今はAPIキーをいじりたくないので行いません。要点はわかるでしょう。何かが機能しなければ、フォローアップするだけで機能します。
これは無料で、サブスクリプションは必要ありません。Anthropicはこれを公開し、このモデルは非常に優れており、他のアプリほど長い出力を出せないものもあります。それらが冗長だとは言いませんが、使い道は確かにたくさんあります。しかし、何かを迅速に構築してみたいだけで、サブスクリプション料を支払いたくない場合は、Claude Codeがあります。かなり素晴らしいです。
素晴らしいデモだと思います。他に何ができるでしょうか?ランダムなことをフォローアップできます。このビデオを長くしたくはありませんが、これを作成したプロセスをお見せしたいと思います。非常に簡単です。PythonとWebベースのダッシュボードを使用して個人財務トラッカーを構築するようにプロンプトしました。ユーザーは経費を記録できるようにします。
これを01 ProとGrokと比較してみましょう。ユーザーは経費を記録し、支出を分類し、matplotlib(メットプロットリブ)で傾向を視覚化できるようにします。このアプリには、支出パターンに基づいてお金を節約する方法を提案するAI機能も含めるべきです。楽しみのために、「AI機能は新しい推奨事項を生成しない」とフォローアップします。
おそらくAPIキーを求められると思いますが、ここではそれを持っていません。それでも大丈夫です。要点は理解できると思います。これを一度に全て生成しました。一つのファイルを与えられましたが、非常に長いものでした。このファイルをダウンロードしてフォルダに入れ、Claude Codeに「これを全部セットアップして」と言ったら、ファイル構造を作成し、全てを行いました。
実行すると実際には動作せず、エラーが表示されました。そのエラーをブラウザからコピーしてClaude Codeに貼り付け、Enterを押すと、「ごめんなさい、修正しました」と言って、それで動作しました。使い慣れた最も簡単なプロセスでしたが、重要なのはこれが動作するということです。
以前は手動でセットアップしようとしていました。「どのようなフォルダ構造が必要か」と聞くと、これら全てを実行し、これらのフォルダを全て作成する必要があると言われます。01 Proと比較すると、01 Proは3分間FSを行い、「このプロジェクト構造が必要で、これをセットアップする必要がある」と言います。
次にデータベースをセットアップし、Flaskアプリをセットアップし、これを行い、ステップ7を行い、全てをまとめる必要があります。素手で家を建て、複数の子供と家族を持つくらいの時間がかかります。コーディング初心者としてこれを全て手動で行うのは、ばかげています。誰もこれをするつもりはありません。AIの目的は簡単であるべきで、複雑であるべきではありません。
Grokは何を言ったでしょうか?Grokは基本的に「これが要求したすべての要件です」と言ってから、「これらのパッケージをすべてインストールしてください」と言います。コマンドは提供せず、「これらをインストールしろよ」と言います。「これがあなたに要求するプロジェクト構造です」「Flaskを起動してください」「これらをすべて行ってください」「ステップ2,745:視覚化を実装する」「ダッシュボードに現在の経費を取得して埋め込む」など。
Grokは素晴らしいです。週末に使っていましたが、素晴らしいモデルです。しかし、これを実装するには多くの労力が必要です。一方、Claude 3.7は「ここにすべてがあります」と言い、Claude Codeの中でフォルダに移動して「実行して」と言うだけです。
ここで何をしているのでしょうか?この実装は多様で役立つ金融推奨事項を提供します。これはすべて私が話している間に行われました。多様性を追加し、更新機能を実装し、高度な分析を追加しました。APIキーも要求しませんでした。それがどのように機能するのか分かりませんが、更新してみましょう。節約のヒントはどうでしょうか?
更新されました。より多くのバリエーションがあります。改善されました。それだけ簡単です。サブスクリプションは必要なく、これを実行できます。素晴らしいです。
要点はわかったと思います。比較を見て、トークン出力を見て、Claude Codeを見て、モデル自体がどれだけ物を生成するのに優れているかを見ました。もう一つの例を見せたいと思います。これは一種のイースターエッグです。「ストロベリーには何個のRがあるか」のような標準的な問題を尋ねると、「ストロベリーをクリックして確認してください」と言って、これを作成します。それから「え、何が起きているの?」と思うと、3つのRがあります。
これがClaude 3.7から得られるものです。01 Proでこれを実行すれば、おそらくもっと乾燥した結果になるでしょう。Anthropic 3.7と、3.5ですでにあったテイストテスト、これらのベンチマーク結果、そして今Claude Codeがあり、かなりのお金がかかるこれらの有料アプリケーションを回避できること、すべてがこのリリースを特別なものにしています。これは人々のためのAIです。これがものを構築するために実際に使いたいものです。
ぜひ自分で試してみてください。プロンプトを実行し、ブログ記事をチェックしてみてください。これは素晴らしいです。印象的です。今週何をするかわかっています。この個人財務トラッカーのようなものを彼らの無料アプリケーションで構築します。コミュニティでも同じことをします。
もっと知りたい場合は、これをセットアップし、動作させ、ヒントやコツを得て、質問に答えてくれる技術者がいます。私たちは一般的に、ソフトウェアエンジニアではなく、これらのことをしたい非技術的な人々向けのコミュニティです。助けが必要な場合はコミュニティをチェックしてください。無料の開発アシスタントが欲しい場合は、Claude Codeをチェックしてください。
これにはまだ驚いています。この概要を楽しんでいただけたと思いますし、これから多くの価値を得られることを願っています。AIの戦いが起きています。誰もが何かをリリースしており、Claudeはコーディングの面で素晴らしい成果を上げました。素晴らしいです。今日はこれだけです。また近いうちにお会いしましょう。


コメント