
6,609 文字
みなさん、アントロピック社がSonnet 3.7と、プログラミング用のクラウドコード版をリリースしました。彼らが言うには、これは地球上で最高のプログラマーで、素晴らしいものだとのことです。このビデオでは、コーディングテストをして、いくつかのプログラムを作成し、テストを行います。すでに、新機能、価格、ベンチマーク、この新バージョンでThinking機能を含めて何が変わるのか、そしてこれらを実行するために知っておくべきすべての詳細について説明する動画を作成しています。一緒に見ていきましょう。
みなさん、チャンネル登録してくれた方、いいねを押してくれた方、いつもありがとうございます。特に、このAIチャンネルを支援してくれているメンバーの皆さんには特別な感謝を。こちらをご覧ください、Claude 3.7 SonnetとClaude Codeです。ここでコーディングテストをしてみましょう。このClaude Codeを実行してみます。すでにサーバー過負荷の問題があるようで、動作するかわかりませんが、簡潔に説明すると、彼らは62%の精度を持っていると主張しています。
他のすべて、Claude 3.5、OpenAIのo1、OpenAIのo3 mini、DeepSeek R1など、すべてが50%未満であるのに対して、彼らは62%で、少しのヘルプで70%のパフォーマンスを発揮します。したがって、地球上で最高のコーダーであるはずです。もう一つ重要な点として、彼らはこう言っています:「2024年末、Claudeはアシスタントでした。2025年(現在)と2026年(来年)には、エキスパートと一緒に仕事をしているかのように、プログラミングを手伝うコラボレーターになるでしょう。」
彼らは2027年には、チームが解決策を見つけるのに何年もかかるような課題を解決するAIになると言っています。考えてみてください、2025年はすでに始まり、2月末です。2025年の残り10ヶ月と12ヶ月で、近いですね。彼らが2027年の1月なのか12月なのかは言っていませんが。
それでは、本題に入りましょう。まず、ウェブ版のClaudeを見てみると、メニューを展開すると、Haikuにはproタグがついていて、Thinking modeにはproタグがついていて、古いモデルにはproタグがついています。つまり、ここではExtendedやThinkingなしの基本モデルしか使えません。基本的な質問だけです。
Claudeを使い慣れている方は、Claudeがランダムな質問を送ったり、「こんにちは、元気?」のような簡単な会話をしたりできないことはご存知でしょう。コンテキストが非常に限られており、無料版でも使用量が問題になります。
では本題に入り、通常版でコップテストをしてみましょう。「コップをテーブルの上に置き、サイコロをコップの中に入れ、コップを逆さにしました。この時点でサイコロはテーブルの上に落ちると想像できます。次に、コップを取ってコンロの上に置きました。サイコロはどこにありますか?」
もし正しく理解していれば、「サイコロはテーブルの上にある」と答えるはずです。または受け入れられる第二の回答は、「コップを動かした時にサイコロが引きずられて床に落ちた」というものです。サイコロがコンロの上にあるはずはありません、落ちているはずです。
通常の推論なしのモデルが答えるのを見てみましょう。彼は典型的な回答をします:「コップの中、逆さまの状態で、コンロの上」。この回答は、推論なしのすべてのモデルが出す回答です。彼は続けて「コップを逆さにしたとき、サイコロはその中に残りました」と言います。これは、モデルが反省していない典型的な例です。「そして、サイコロが入ったコップをコンロの上に移動したので、サイコロはコップの中に残っており、現在はコンロの上にあります」。
つまり、通常のモデルはうまくいきませんでした。ここでExtended推論をテストする方法ですが、サブスクリプションが必要です。月額110レアルですが、これに登録したくありません。
彼らはすでに3.7を提供していますが、サブスクリプションなしでこれをテストする方法があります。新しく作成したアカウントで、まだ使用されていない場合、彼らは無料トライアルを提供します。Workbankに行くと、Claude 3.7 Sonnetなど、必要なすべての機能があります。モデルをクリックして設定すると、Thinkingを有効にできます。私はここで自分のクォータから使っていることに注意してください。
コップテストを入力して実行してみましょう。ご覧のように、Thinkingが開き、「サイコロはテーブルの上にあります。コップを逆さにしたとき、サイコロは重力によってテーブルの上に落ちました。その後、コップだけを取ってコンロに置きましたが、サイコロは落ちた場所であるテーブルの上にそのまま残っています」と答えました。
これが推論ありと推論なしのAIの典型的な動作です。推論がない場合、単に何でも受け入れ、すべてを間違って答えます。より良いプロンプトが必要です。しかし推論がある場合は、より整理されていない質問をしても正しく答えることができます。
APIの使用量を見ると、この反省に1セントを使いました。この質問に1セントです。使用量の表を見ると、入力トークン101、出力トークン397、合計498トークンでした。基本的にそれだけです。APIを使用していますが、現時点では新しいアカウントなので、登録されているAPIはありません。
では、彼らがリリースしたClaude Codeを使って最終テストをしてみましょう。使用方法についていくつかの重要なステップがあります。コマンドがいくつかあります。「claude」で質問したり、「claude commit」を使ったりできます。重要なのは、macOS 10.15以上、Ubuntu 20.04以上、Debian 10以上、またはWSLを使用したWindowsが必要です。Node.jsとその他のオプション(Git、GitHubなど)はオプションですが、Node.js 18以上が必要です。
インストールは「npm install @anthropic/claude」で、WSLでClaudeをインストールしましょう。npmを更新し、すべて準備ができました。「claude-video」というディレクトリを作成し、「claude」と入力します。light、dark、またはlight testを選択できます。light testのままにしておきましょう。
ご覧のように、Claudeが機能し始めました。ログインするためにEnterを押すと、認証用のアドレスが表示されます。しかし、最大容量に達しているため、現時点ではClaude Codeを実行できません。しかし、インストールは完了しており、機能するようになったらテストします。
代わりにCursorを使ってテストしてみましょう。まだ使ったことがありませんが、WSLではまだ更新されておらず、CoPilotの無料版にもありません。利用規約に同意し、ディレクトリを選択し、Cursorフォルダを作成します。Cursorをメインモデルとして登録し、インストールしましょう。
インストールが完了したら、Cursorを実行します。いくつかの設定が必要です。「Continue」を選び、「Start from Scratch」を選択し、「Privacy Mode」に入り、アカウントを持っていないので「Sign Up」をクリックします。
プロジェクトを開き、設定の歯車アイコンをクリックし、モデルを見ると、Claude 3.5 Sonnet、3.7 Sonnet、そして3.7 Sonnet Thinkingがデフォルトで有効になっています。通常の3.7を使用したい場合、すべて準備ができています。
では、テトリスを作るというクラシックなテストをしてみましょう。「HTML製のウェブテトリスを作成してください。落ちてくるピースのプレビュー、スコア、プレイヤー名の入力欄(通常テトリスにはこれがありません)、記録の保存などが必要です。」変わったプロンプトですね。「などなど」って、こんなプロンプトを誰が作るのでしょうか?私だけでしょうね。
これは簡単なプロンプトです。GitHubにはたくさんあるゲームですが、それでもどうなるでしょう。私はちょっと変わったプロンプトを作るのが好きで、「などなど」というのはどんなプロンプトなんだ?と思われるでしょう。
ここでは、通常のプロンプトにするか、エージェントにするかを選べます。エージェントを選ぶと、すべてのクレジットを使い切ってしまう可能性がありますが、テストしてみましょう。エージェントを使用すると、フォルダを作成し、完全なプロジェクトを作成してくれます。
ご覧のように、プロジェクトとファイルの作成が始まっています。私はただ「Accept File」をクリックし、何が作成されても問題ありません。スタイル.cssが作成されました。ファイルを更新して受け入れると、JavaScriptファイルが作成されています。
HTMLプログラムなので、秘密はないようです。script.jsが作成されました。「Accept File」をクリックし、GitHubにアップロードするためのREADMEも作成されました。これも受け入れると、完了です。
彼は行ったことをすべて説明し、任意のブラウザでindex.htmlを実行するだけで良いと言います。テトリスが実行されています。名前を入力でき、ゲームも同時に実行されています。セーブを止めようとさえしません。なんて素晴らしく作られたテトリスでしょう。一度にこんなに良くできたテトリスを見たことがありません。回転もすべて機能し、すべて正常です。
ラインを作ってみましょう。大きなピースが来るところを利用して、正しい場所に置いてみましょう。黄色いピースを見て、このラインが正しく動作するか、消えるかを確認しましょう。ラインが揃うと消えなければなりません。消えました!すべて完璧です。
素晴らしいスタートでした。彼はテトリスの説明をし、ピースのプレビューを提供し、すべてが期待通りに動作しています。このプロジェクトは簡単でした。素晴らしいと思います。
ゲームオーバーにして記録が保存されるか確認してみましょう。下矢印キーを押し続けると、ゲームオーバー、80ポイントです。「もう一度プレイ」をクリックすると、プレイヤー:80ポイント、レベル1が表示されます。プレイヤー名はここに表示されていませんが、要求したものとしては良い結果です。ゼロショットでこれを要求し、動作しました。
では、少し複雑なことをやってみましょう。イーロン・マスクと同様のプロンプトを試してみます:「テトリスとBedazzledを組み合わせたHTMLゲームを作ってください」。Bedazzledは色のゲームで、テトリスはテトリスです。私はエージェントを使用し、これ以上の指定はしません。彼は創造的である必要があります。
グロックを使用してイーロン・マスクが行ったものと似たものになるかどうかはわかりませんが、見てみましょう。彼は同じ手順を踏んでいます。ファイルを作成し、インデックス、スタイル、そして最も時間のかかるスクリプトを作成しています。
スクリプトが実行され、機能しています。READMEも作成され、完了しました。「準備ができました、動作します。前回と同じようにテストしてください」と言っています。
すぐに始めてみましたが、すでに負けてしまいました。「もう一度プレイ」をクリックしますが、エラーが発生しています。ゲームがすでに「ゲームオーバー」状態で始まるため、プレイできません。再起動しても同じです。
エージェントはこの問題に対処し始め、コードを修正し、私の要求に基づいて変更を加え始めています。興味深いことに、私は何もせずに見ているだけです。彼はいくつかの変更を行っています。「ゲームが始まるときに終了しないように修正します」と説明しています。
彼は変更が完了したと言い、script.jsファイルに戻り、すべてを受け入れます。何が変更されたかは見ていません。ゲームに戻り、画面を更新しますが、何も変わりません。閉じて再度開いても効果がありません。
背景で何かが動いているのが見えますが、ゲームが始まりません。これは、初めから大きな誤りがあり、修正が難しすぎるシナリオです。ゼロから始めたほうが良いでしょう。プレイできません。
私は画面のスクリーンショットを送って助けになるかを確認しました。無料版を使用しているので、クレジットはすぐに尽きるでしょう。私は考えを使わず、AIに難しい課題を与えているだけです。
彼はすべての変更を行い、私はすべてを受け入れます。ゲームに戻り、画面を更新しますが、効果がありません。「もう一度プレイ」ボタンが消えません。このループに閉じ込められています。
このようなシナリオでは、最初の試みが失敗した場合、続行する価値はほとんどないでしょう。ゲームは背景で動作しているように見えますが、画面中央にこの表示が残っています。
背景の動作は見えますが、画面が暗すぎて確認しづらいです。ピースが底に到達するたびに、3つのブロックが消えます。四角形は3つ消えません。回転はできませんが、下に移動はできます。
画面は非常に暗いですが、背景では機能しているようです。上矢印キーを押してもピースは回転しませんが、同じ色のブロックが3つ揃うと消える必要があります。それは起きています。3つ揃うとすべて消えます。このLの形では4つすべてが消えます。完璧です。
彼はテトリスとBedazzledを組み合わせましたが、このゲームオーバー画面が消えません。プレイボタンを押すとリセットされますが、画面は消えません。この問題を修正しようとしてみましょう:「ゲームオーバー画面がメイン画面から消えず、ゲームがバックグラウンドで実行されています。ゲーム実行中にゲームオーバー画面を削除してください」。
彼は修正したと言い、すべてが機能していると主張しています。今、テトリスゲームが機能しています。ご覧のように、テトリスのピースがあり、同じ色のブロックが3つあると、それらを消去します。残るのは単一のブロックだけです。素晴らしいゲームです、非常に良くできています。
彼はグロックのバージョンとは少し異なる方法で作成しました。グロックのバージョンでは、ピースはすでにカラフルでしたが、私は詳細を指定せず、ゼロから生成させたので、不満はありません。
ただ一つの問題は、上矢印キーを押してもピースが回転しないことです。これは問題です。なぜなら、ピースを配置する方法が限られるからです。これは改善できるでしょう。初期問題が解決され、レイアウトが美しく、システムが機能し、創造的であることがわかります。
指示を読むと、回転キーはスペースバーだとわかります。スペースバーを押すと、ピースが回転します。これは素晴らしいです。AIはルールを設定し、人間は…人間は知的であることは間違いありませんが、ルールを読みません。なぜなら、人間の知性には、すべてを最もシンプルな方法で行いたい、他者が自分の望み通りにすることを期待するという特性があるからです。実際にはそうではありません。
素晴らしく機能しました。このバージョンが気に入りました。見た目も美しく、非常によくできたゲームです。何の時間も無駄にせず、すべて無料版で行いました。スペースバーでの回転だけが少し混乱しますが、それ以外は素晴らしいです。
あなたの感想やテスト結果をコメントしてください。うまくいっているでしょうか?このツールは素晴らしく見えます。このようなビデオをサポートしたい場合はメンバーになってください。メンバーはWhatsAppグループへのアクセスと事前公開ビデオを入手できます。いいねをお願いします!


コメント