新しいClaude 3.7は誰でも無料です(アクセス方法を参照)

AGIに仕事を奪われたい
この記事は約10分で読めます。

5,835 文字

https://www.youtube.com/watch?v=0GIkD_cUug0

Anthropic社が新しくCloud 3.7をリリースしました。これはプログラミングやコード作成、ソフトウェア開発に特化したChatGPTのようなAIです。クリエイティブライティングやInstagram用テキスト、マーケティング用テキストの作成にも非常に優れています。私はここで「thunder」という攻撃的なライティングスタイルも使っています。そして良いニュースは、私が無料プランを使っていることです。無料プランでも最新リリースのClaude 3.7 Sonnetにアクセスできます。
これからアカウントの作り方や、アクセス方法をお見せします。多くの人がこれを利用していて、特定の機能においては最高のモデルだと言っています。では、このAIはChatGPTより賢いのでしょうか?Grok 3やDeepSeekより賢いのでしょうか?それを今回のビデオでご紹介します。
チャンネル登録と高評価をお願いします。そして忘れないでください、今日の火曜日、2月25日の午前0時にCopifyHubの割引が終了します。今日だけ869のディスカウントで入会でき、AIに24時間働いてもらう方法を学べます。私もClaudeに仕事をさせて、すでに3つのアプリを作ってもらいました。後ほどそのアプリもお見せします。
さて、ここにAnthropicのサイトがあります。Anthropicは、このClaudeというAIを開発している会社です。この企業はAmazonなど多くの投資家から資金提供を受けていますが、最も有名な投資家はJeff Bezosが率いるAmazonです。
彼らは2つの新機能をリリースしました:Claude 3.7 SonnetとClaudeコードです。ここで非常に興味深いのは、なぜ彼らがモデル4をリリースしなかったのかということです。以前は3.5を使っていたのに。古いモデルを見ると、Sonnet 3.5があります。なぜ4に進まなかったのか?私の唯一の説明は、彼らがすでにモデル4をテスト段階で開発していて、それが非常に大きな進歩だと認識しているからでしょう。Anthropicは安全性とプライバシーへの取り組みが非常に高いため、リリースに時間がかかるとよく言われています。
Claude 3.7についてのニュースを見てみましょう:「本日、私たちは現時点で最も賢いモデルであるClaude 3.7 Sonnetと、市場初のハイブリッド推論モデルを発表します」。これが重要なポイントです。
ChatGPTに今アクセスすると、chat.openai.comでは上部にモデルセレクターがあり、クリックするとさまざまなモデルが表示されます。Sam AltmanとOpenAI(ChatGPTの所有者)はこれを将来的になくすと言っていますが、現在は思考用モデル(O1やO3など)や日常タスク用モデルを選択する必要があります。それぞれのタスクに最適なモデルを知る必要があります。PDFの要約、画像生成、インターネット検索、コーディング、論理問題の解決など、それぞれのタスクに合わせたモデルを選ぶ必要があります。
Claudeが初のハイブリッドモデルとして登場し、シンプルなリクエストには即座に回答し、より複雑な論理問題には時間をかけて考えることができます。内部で自動的に切り替える能力を持っています。「Claude 3.7 Sonnetはほぼ瞬時の応答または拡張思考を生成できます」
Grokにアクセスして、Deep Searchを試してみましょう。例えば「Claude 3.7について調べてください」と入力すると、Grokは考え始め、思考の連鎖を表示します。これが「Thinking」モードで、新しいClaudeモデルも同様に思考の連鎖を持っています。
「APIユーザーもモデルが思考できる時間を細かく制御できます」。APIとは何かというと、プログラマーがソフトウェアやアプリケーションを構築するためのアカウントへのアクセスキーです。例えば、空気中の蚊を分析するような会社を作りたい場合、カメラを接続して空気中の蚊の数を知るようなソリューションを作るとします。そのためには認識能力のあるAIが必要で、APIを通じてAIを契約することになります。
日常的なタスクには、claude.aiで無料でアクセスできます。これが無料でアカウントを作成するサイトです。ただし、ビジネスを構築する場合はAPIを介して接続する必要があり、トークンごとに料金が発生します。例えば「こんにちは!」という言葉は約1トークンです。
APIのトークン価格を見てみましょう。ChatGPTは市場で最も安いトークン価格を持つAPIで有名です。「APIユーザーもモデルが問題について考える時間をきめ細かく制御できます」。APIでは、考える時間を調整するダイヤルがあり、AIモデルが問題について考える時間が長いほど、特に論理的な問題に対しては、より良い回答が得られます。
「Claude 3.7はコーディングとWebフロントエンド開発において特に強い改善を示しています」。フロントエンドとは、サイトの作成など、ユーザーが見るインターフェース部分を作ることです。Claudeで完全な販売用ランディングページ(LP)を作りたいと思っています。インターフェースや作成するサイトが非常に美しいという話を聞いています。現時点で最高のモデルだと言われています。
「また、コマンドラインコーディングエージェントツールであるClaude Codeも導入しています。Claude Codeは限定的な研究プレビューで利用可能で、開発者が端末から直接Claudeに実質的なエンジニアリングタスクを委任できるようにします」。エージェントと標準的なAIの違いは何でしょうか?標準的なAIはチャットに閉じ込められていますが、エージェントはチャットから出て、インターネット上でタスクを実行し、プラットフォームにログインし、投稿を作成し、ファイルを編集するなど、チャット外のアクションを実行できます。
「Claude 3.7は現在、無料プラン、Proプラン、Teamプラン、Enterpriseプランを含むすべてのClaudePlansで利用可能です」。無料プランには制限があり、1日に30メッセージ程度使用すると制限に達します。私のおすすめは、まず無料で使い始めて、必要であれば有料プランを検討するか、他のAIに切り替えることです。DeepSeek、ChatGPT、Grokなどは無料で使えるので、一つが制限に達したら別のものを使えばいいでしょう。日常的なタスクに関しては、これらのAIはすべて同様の能力を提供しています。
「Anthropic API、Amazon Bedrock、Vertex AIのGoogle Cloudと同様に、拡張思考モードはすべてのプラットフォームで利用可能です」。拡張思考モードとは、Grokの「Hard Thinking」ボタンのようなもので、より多くの計算能力を使用します。より多くの時間を考えることで、より多くの計算能力を使用し、より多くのエネルギーを消費します。標準モデルで解決できない問題がある場合、「Hard」ボタンを押すと、マシンに負荷をかけることができます。
「標準思考モードと拡張思考モードの両方で、Claude 3.7は前任者と同じ価格です:入力100万トークンあたり$3、出力100万トークンあたり$15」。これは安くはありません。思考トークンも含まれています。
Grokで各種APIの価格を調べてみましょう。「Grok 3、O3 Mini、Claude 3.7の100万トークンあたりの価格を調査して比較してください」とGrokに依頼します。Deep Searchボタンを有効にすると、より詳細な検索を行います。現在、Grok 3は無料で利用できますが、永久に無料ではないかもしれないので、ぜひ利用してください。
「Claude 3.7 Sonnet:実用的になった境界推論」。他の市場の推論モデルとは異なるフィロソフィーを持っています。人間が素早い応答と深い考察に同じ脳を使うように、私たちは推論が完全に別のモデルではなく、先端モデルの統合能力を持つべきだと考えています。この統一されたアプローチはユーザー体験もより均一にします。
Daniel Kahnemanのノーベル経済学賞受賞者の本「Thinking, Fast and Slow」(邦題:ファスト&スロー)は非常に良い本です。基本的に、AIは今や素早く考えるべきときと、ゆっくり考えるべきときを知っています。
第一に、Claude 3.7は通常のLLMと推論モデルが一つになっています。モデルが通常通り応答するか、より深く考えるかを選択できます。
拡張思考モードでは、モデルは応答する前に自己反省し、数学、物理学、指示の遵守、コーディングなど多くの分野でパフォーマンスが向上します。STEM(科学、技術、エンジニアリング、数学)タスクや技術的なタスクには推論モデルが非常に適しています。これらを使用しない場合は、標準的なGPT-4などで十分です。
第二に、APIを通じてClaude 3.7を使用する場合、ユーザーは思考のための予算を制御することもできます。Claudeに特定のトークン数以上考えないよう指示できます。出力制限は128,000トークンまでで、これは非常に多いです。
128,000トークンは約96,000語に相当し、ページあたり平均250-300語とすると、320-384ページになります。非常に大きな出力能力を持っています。
第三に、モデルを開発する際、ベンチマークテスト向けの最適化をやや抑えました。これは興味深い傾向です。AIモデルはベンチマークテスト(AIの能力を測定するテスト)向けに訓練されています。OpenAIは新しいベンチマーク「SWE-bench」を発表しました。これは、コーディング性能を評価するためのより現実的なベンチマークで、実際の仕事に基づく1,400のソフトウェアエンジニアリングタスクが含まれています。合計100万ドル相当の実際の支払いがされたタスクです。
以前のClaude 3.5 Sonnetモデルは、このベンチマークで$400,000相当のタスクを解決できました。Claude 3.7はおそらく30%ほど向上し、約$500,000相当になるでしょう。OpenAIがこのテストを発表し、Claude 3.5 Sonnetが先行しているのであれば、GPT-4.5が登場すると、このテストでも優位になるでしょう。
「競争数学やコーディングオリンピックのテストではなく、企業が実際にAIモデルを使用する方法をより反映した実世界のタスクに焦点を当てました」。初期テストではコーディング能力においてClaudeのリーダーシップが示されました。
現在、プログラミングにおいてClaudeが最高のAIです。ソフトウェアエンジニアリングでは、Claude 3.7は拡張思考モードで70%のスコアを達成し、以前の3.5は49%でした。OpenAIのO3 Miniも49.3%でした。
O3モデルは72%を達成していますが、単独では発売されず、OpenAIは単一の思考モデルを発売するのをやめ、GPT-4.5の後にはClaude 3.7のようなハイブリッドモデルを発売する予定です。
AIの3つのレベル(機械レベル、人間レベル、神レベル)についてのビデオをチャンネルで公開しています。そこでAGI(人工一般知能)についても説明しています。
ここにはさまざまなベンチマークテストの結果があります。大学レベルの質問では、Claude 3.7は拡張思考モードで84%、通常モードで58%を達成しました。Grokも拡張思考モードで84%を達成しています。DeepSeek R1は71%、O3 Miniは80%、O1はO3 Miniより低いスコアでした。興味深いのは、OpenAIがDeepSeekの後すぐにO3 Miniをリリースして、市場のギャップを埋めようとした戦略です。
コーディングエージェントテストでは、Claude 3.7は70%を達成し、他よりも優れています。数学分野では、DeepSeekが拡張思考モードなしのClaudeよりも良い成績を収めました。AIM 2022数学コンペティションでは、Grokが93%を達成しています。物理学や数学、論理的思考においては、拡張思考モードを備えたGrok 3が非常に優れているとの評判がありますが、プログラミング言語においては現在Claudeが最高です。
私はClaudeを使って3つのアプリケーションを作りました。例えば、トラフィック投資、クリックあたりのコスト、オーガニックリーチ、コンバージョン率、製品価格などを入力すると、セールスファネルを描くアプリです。日々の280レアルの投資で、このオーガニック訪問者から1日4,000レアルを得ることができます。これはすべてClaudeを使って作りました。
今年のChatGPTの大きな目標は、最も賢いAIとプログラミングのための最も有能なAIエージェントを持つことです。彼らは今年12月までにプログラミングでナンバーワンのAIになることを目指しています。そのため、AnthropicのClaude(または「Claudinho」)はChatGPTの短期的な最大のライバルとなっています。OpenAIはすでに内部的に、スーパープログラマーに非常に近いものを持っていると言われています。
無料でClaudeにアクセスしてみてください。私はまだテストできていませんが、もし希望があれば、後でClaude 3.7の実践テストのビデオを作成します。
最後にお知らせですが、今日が最終日です。AIを使って販売サイト、販売広告、販売投稿を生成する方法や、AIを使って製品を作る方法を学びたい方は、Copify Hubでご紹介しています。今日は固定コメントにディスカウントリンクがあります。高評価を押して、Claudeについての意見をコメントしてください。次回のビデオでお会いしましょう。

コメント

タイトルとURLをコピーしました