Googleのコラボレーションと無料AI、カメラ機能付きGemini Live、GeminiとのSheets連携、そしてAnthropic社の評価額800億ドル

8,734 文字

Google Colab com iA Grátis, Gemini Live com Câmera Liberada, Sheets com Gemini e Anthropic Vale 80bi

Aprenda Inteligência Artificial! Para acessar o Google Colab: ▸ Seja MEMBRO: ▸

みなさん、Anthropic社（Claudeを開発した会社）の評価額が600億ドルに達したようです。また、Stability AIはARMと提携して、モバイルデバイスでオフラインの音声生成を実現するようです。GPT-4.5は引き続き議論を呼んでおり、APIからは撤退する可能性があります。コストが高すぎるからです。Googleは今月、リアルタイムビジョンアプリをリリースする予定です。また、GoogleはSheetsにGeminiアシスタントを並行配置する新機能を追加し、AIを統合したGoogle Colabにも新機能を追加しています。それでは、これらすべてを詳しく見ていきましょう。
みなさん、いつも動画をご視聴いただきありがとうございます。チャンネル登録やいいねをくださった皆さん、そして特にこのAIチャンネルをサポートしてくださるメンバーの皆さんに感謝します。
まず最初のニュースです。Google Gemini Visionが3月にリリースされ、AIを使ったリアルタイムビデオ分析ができるようになります。スマートフォンを使って、これらのツールを利用できるようになります。Googleはバルセロナで開催されたモバイルワールドコングレスで、Geminiアシスタントにリアルタイムビデオ分析機能を追加すると発表しました。Gemini Advancedのための「Google One AIプレミアム」プランの加入者は、今月末にライブビデオ機能と画面共有機能にアクセスできるようになります。
基本的に、GoogleはOpenAIと同じ戦略をとっており、すべての機能を無料で提供するのではなく、加入者向けにより多くの機能を提供しています。これは成功しているようです。
Gemini Liveには主に2つの新機能があります。1つ目はライブビデオを分析する機能、2つ目は画面共有機能です。どちらの機能も、ユーザーはリアルタイムでAIアシスタントと視覚的なコンテンツを共有できます。ライブビデオの場合は外部カメラからの映像を通じて、画面共有の場合はスマートフォンの画面を通じてコンテンツについてコメントできます。これはすでにChatGPTにある機能ですが、今やGeminiでも利用できます。
アプリの仕組みはこうです。Geminiを起動してカメラを有効にすると、アシスタントと会話を始め、カメラが見ているものについて話し合うことができます。Geminiはユーザーの発言や見ているものを観察し、やがて私たちが最も見たいものである、ロボットとの対話や制御が可能になります。ただし、現時点ではスマートフォンアプリにすぎないことを忘れないでください。
これらの新機能は当初はAndroidデバイスでのみ利用可能で、複数の言語をサポートしています。モバイルワールドコングレスでは、GoogleはさまざまなAndroidメーカーのパートナーデバイスでのこれらの機能の統合をデモンストレーションしました。
もう一つのデモでは、画面共有の様子が示されています。Geminiはスマートフォンの画面を見て、ビデオに表示されている価格などについて会話しています。つまり、画面を見たり、カメラを有効にしたりして、Geminiと対話できるのです。皆さんはこのスマートフォンアプリを使ってみたいと思いますか？コメントで教えてください。月末に提供開始です。
次のニュースです。OpenAIの高価なGPT-4.5がAPIから消える可能性があり、開発者を困らせるかもしれません。実際は、誰も使っていないため、影響はないかもしれません。OpenAIの最新の言語モデルGPT-4.5は、長期的にAPIを通じて利用できなくなる可能性があり、このモデルの機能に特化したアプリケーションを開発した開発者に問題を引き起こす可能性があります。
OpenAIによると、GPT-4.5は巨大なサイズと計算要件のため、GPT-4よりも大幅に高価です。同社は明確に、このモデルはGPT-4の代替を意図していないと述べています。入力トークン100万あたり75ドル、出力トークン100万あたり150ドルというGPT-4.5の価格は、入力2.5ドル・出力10ドルのGPT-4や、入力15ドル・出力60ドルのOW1モデルなどの代替品よりも劇的に高価です。
提供される品質と比較すると、これらの価格は合理的とは思えません。そのような高価格を正当化するほどの大幅な進歩ではありませんでした。OpenAIは、このモデルが最初に発表されたとき、現在の機能のサポートと将来のモデル開発のバランスを取る必要があるとして、特に強力で高価なモデルの長期的なAPI可用性についてすでに疑問を呈しています。
実際、OpenAIはこのリリースによって、改善を期待していた多くの顧客や投資家の支持を失いました。GPT-4.5は非常に小さなグループを喜ばせましたが、より多くのグループを失望させました。GPT-4.5が実際にGPT-4などの他のモデルが提供できない排他的な機能を提供しているかどうかはまだ明確ではありません。OpenAIは積極的に、GPT-4.5が特定のユースケースに独自の価値を提供するかどうかについてユーザーフィードバックを求めています。
専らGPT-4.5に依存したアプリケーションを作成した開発者は、モデルが廃止された場合、課題に直面する可能性があります。GPT-4.5は評判が良くなく、数え切れない日があるようです。十分な人数を満足させておらず、この基盤を維持し続けるのは難しいかもしれません。
最後の望みとして、GPT-4.5 Turboが登場する可能性がありますが、価値があるかどうかという疑問が浮上しています。可能性の一つは、OpenAIが最適化されたより経済的なバージョンをリリースすることです。同社は以前のモデル（GPT-4や3.5など）でも同様の戦略を使用しましたが、GPT-4.5がGPT-4に対してわずかな改善しか提供していないことを考えると、簡略化されたバージョンがOpenAIの他のモデルや競合他社に対して大きな利点を提供するかどうかは疑問です。
おそらく、より安価なバージョンやより簡略化されたバージョンが登場する必要があるかもしれませんが、GPT-4.5に関して非常に肯定的なコメントはあまり見ていません。このモデルに熱狂している人はあまりいないようです。GPT-4.5についてどう思いますか？使う価値があると思いますか？コメントで教えてください。
次のニュースです。Stability AIとARMがモバイルデバイス向けのオフライン・オンデバイス音声生成を実現します。これは非常に興味深いことです。
PCとスマートフォン、Raspberry Piなどの小型システムを想像してみてください。これらの小型システムは、通常のコンピュータやノートPC、家庭用PCと同じハードウェアアーキテクチャを持っていません。より効率的で、メモリが少なく、制限されたシステムで動作するように設計されたARMテクノロジーを使用しています。PCで行うすべてのことは、ARMで正常に動作するように再設計する必要があります。その利点は、ARMへの移植が行われ、このアーキテクチャに対応すると、携帯電話で実行でき、小型デバイスで実行するために最適化されたものになることです。
Stability AIとARMは、Stable Audio Openモデルを最適化して、携帯電話のプロセッサで実行できるようにし、モバイルデバイス上で直接オフラインでの音声生成を可能にしました。2024年夏にリリースされたStable Audio Openは、テキストプロンプトから最大47秒の音声を生成します。このモデルはドラムビート、楽器のリフ、環境音、フォーリー録音などの短い形式の音声に特化しています。商用のStable Audio 2とは異なり、Sunuのようなサービスのような完全な音楽を作成するようには設計されていません。
Stable Audio Openの初期バージョンでは、ARM CPUで音声を生成するのに240秒かかりました。モデルの蒸留とARMのソフトウェアスタックを通じて、ARMv9プロセッサでの11秒のクリップの生成時間は8秒未満に短縮され、速度が30倍向上しました。これは携帯電話で物事が実行され始め、うまく動作し始めると、状況が変わり始めるということです。
この実装では、インターネット接続を必要とせずに、デバイスのプロセッサで音声生成タスクを処理するためにARMのClade AIライブラリを使用しています。Stability AIのブログ投稿では技術仕様の詳細は説明されておらず、論文もまだ公開されていません。この最適化により、ARMと互換性のあるモバイルデバイスを持つ誰もがモデルにアクセスできるようになります。
おそらく2025年には、携帯電話内でネイティブに実行されるAIアプリケーションが登場し始めるでしょう。これは素晴らしいことです。なぜなら、インターネット接続を必要とせず、すべてがスマートフォン内で実行されるからです。マイナス面は、これらのモデルを過度に縮小すると、特により多くのメモリやその他の利点を持つPCでも十分に実行されていない場合、品質があまり良くないことです。スマートフォンに移植すると、さらに懸念が生じます。しかし、これがうまくいき、この技術がオフラインで機能することを期待しましょう。スマートフォンから直接音楽を生成して、WhatsAppなどで共有したいと思いますか？コメントで教えてください。
次のニュースです。Anthropicが35億ドルの新規資金を調達し、AI企業の評価額が600億ドル以上に達しました。これが高いのか低いのかを理解するために、例えば、xAIはGrok 3のリリース前に400億ドルの価値がありました。今ではおそらくもっと価値があるでしょう。OpenAIは最初800億ドルの価値がありましたが、現在はおよそ1600億ドルの価値があります。Anthropicがゆっくりと成長していたところから、今や600億ドルの価値があるということは、非常に良い急速な成長を遂げていることを意味します。
AnthropicはシリーズE資金調達で35億ドルを確保し、企業の評価額を615億ドルに引き上げました。同社は新しい資本を研究開発、インフラ、国際展開に使用する計画です。興味深いことに、一部の人々は「35億ドルを確保したのに、なぜ615億ドルの価値があるのか」と疑問に思うかもしれません。実際、これは将来への予測です。彼らは常に10〜15年先を見据えて計算しており、今日行われている30億ドルの投資の結果が効果を発揮したときの価値を想定しています。非常にポジティブな結果を常に期待しているため、すでに巨大な価値を計算しています。これは投資家にお金を投資するよう動機付けるための方法です。
この最新の投資は、Googleの30億ドル、Amazonの80億ドルなど、合計約110億ドルに達するテクノロジー大手からの以前のコミットメントに続くものです。クラウドプロバイダーからの投資により、Anthropicはそのプラットフォーム上でモデルをトレーニングおよび実行する必要があります。これは、クラウド収益の成長を促進すると同時にAI開発をサポートする戦略的な取り決めです。
つまり、GoogleとAmazonはサーバーを持っており、これらのサーバー上でAIモデルを実行しています。彼らはAnthropicを支援していますが、それはAnthropicがどこかでこれらのシステムとモデルを実行する必要があることを知っているからです。「あなたのAIを開発するのを手伝いますが、私のサーバー上で実行する必要があります」というのがGoogleとAmazonの言い分です。
AI開発への異なるアプローチとして、OpenAIが独自の消費者向けアプリケーションをますます開発しているのに対し、Anthropicは他の企業がその技術を使って構築できるようにするB2Bテクノロジープロバイダーになることに焦点を当てています。これは非常に明確です。以前にも言及したように、Anthropicはモデルをインテリジェントにすることに非常に焦点を当てており、優れたアプリケーションや優れたWebアプリケーションを作成することに焦点を当てていません。彼らはその段階を過ぎました。現在はAPIに焦点を当てています。モデルがインテリジェントであり、APIを使用する人々が彼らが提供するインフラからプロダクトを作成することだけを望んでいます。これが実際に観察していることであり、このテキストでも述べられています。
同社は、Claudeによって支援されたコーディングエージェントの収益が10倍に増加したコーディングツール開発者のReplitを強調しています。AIを扱う開発者は皆、Claudeを気に入っています。2024年から2025年にかけて、OpenAIはリーダーシップから降り、代わりにClaudeが私のAIチャンネルにアクセスする人々の意見ではトップになりました。
AnthropicはClaude 3.7 SonnetとClaude Codeを、プログラミング能力の新しい基準を確立するものとして挙げています。Sonnet 3.7は特にコード関連のタスク向けに最適化されています。これは素晴らしいことですが、以前の動画でドラフトチェーンのプロンプトテストを行ったとき、Claudeはドラフトチェーンを使用したときにコップの質問に正確に答えることができた唯一のモデルでした。これは、プログラミング以外でもモデルが優れていることを意味します。
同社は今後数ヶ月でこの能力をさらに向上させる計画です。大企業もこの技術を採用しており、Thomson Reutersは税務プラットフォームのCortellでClaudeを使用し、Novo Nordicは臨床研究レポートの作成を12週間からわずか10分に短縮したと報告しています。
Anthropicはパートナーシップを通じて消費者リーチも拡大しています。ClaudeはAmazonのAlexa Plusを強化し、Primeメンバーに高度なAI機能を提供しています。以前の動画で話していなかったことの一つですが、強調しておきたいのは、このAlexa Plusはブラジルに到着するまでに時間がかかるということです。最初にアメリカで発売されます。
この急速な成長と採用にもかかわらず、AnthropicはOpenAIや他のAIモデル企業と同様に、依然として大幅な損失を出しています。顧客を獲得するためのレースが続いていますが、これがうまくいっているかどうかは不明です。私が話す人々の間では、人々とモデル間の忠誠心は基本的に品質と価格によって異なります。価格が高すぎると、人々はより安いものに移行します。品質が低すぎると、より良い品質のものに移行します。価格と品質のバランスが取れているとき、そこに留まります。AIモデルの切り替えは非常に簡単であるため、人々は忠実ではなく、永続的なものを購入しません。そのため、企業は人々との関わり方を変える可能性があります。
あなたはClaudeを3.7へのアップデート後により多く使用していますか、それとも他のAIを使用し続けていますか？個人的には少しずつすべてを使用し、ほとんどの場合、Chat GPT、Grok 3、Perplexity AIの少なくとも3つの間で推論のAIテストを行っています。これらは無料プランで推論を行うことができる3つのモデルです。結局のところ、常に一つのタスクがあり、一つのモデルが他のモデルよりも優れています。これについてどう思いますか？コメントで教えてください。
次のニュースです。「Google スプレッドシートのデータをこのAIアップデートでより迅速に分析」。ここでは、Google Sheets（Googleスプレッドシート）がオンラインで開かれており、その横にGeminiのウィンドウがあり、データの作成、質問の生成、そのスプレッドシートに関連する情報の生成を行っています。このようにネイティブに統合されています。
Workspaceのすべての企業ユーザーは、相関関係、外れ値などのデータからインサイトを生成できるSheetsの新しいGemini機能にアクセスできるようになりました。最初に気づいたことは、これがすべてのユーザー向けではなく、Workspaceの企業ユーザーのみを対象としていることです。無料アカウントでは見つからず、加入者である必要があります。
このアップデートでは、ヒートマップなどの高度な視覚化をGeminiがSheetsで生成することもできます。スプレッドシートの右上にあるGeminiのスパークアイコンをクリックし、「過去のデータに基づいて次の四半期の純収入を予測する」や「カテゴリーとデバイス別のサポートケースの簡単なヒートマップを作成する」などの質問をしてみてください。
スプレッドシートの概念と可能な操作をよく知っているユーザーであれば、必要なデータを説明するだけで、グラフを生成してくれることがわかります。多くの人が毎日これを使用しています。私が言ったように、私のアカウントは無料なのでアクセスできませんが、仕事でGoogle Workspaceを使用している場合は、すでに利用可能なはずです。確認して、すでに表示されているかコメントで教えてください。国による制限については言及されていません。
次のニュースです。GoogleがAIエージェントツールでColabをアップデート。これは本当に素晴らしいニュースです。GoogleのクラウドベースのノートブックツールであるGoogle Colabが、新しいAIエージェントツール「Data Science Agent」を獲得し、Colabユーザーがデータをすばやくクリーンアップし、傾向を視覚化し、アップロードされたデータセットに関するインサイトを得るのを支援します。
これを見たとき、最初に思ったのは「これをテストしたい、すでに機能しているのか見たい」ということでした。実際、すでに機能しているようです。昨年初めにGoogleの開発者会議で初めて発表されたData Science Agentは、当初は独立したプロジェクトとしてリリースされましたが、GoogleはColabに統合することを決定し、ユーザーがColabノートブックから直接エージェントにアクセスできるようにすることを目的としています。
Data Science Agentは今週からColabで無料で利用可能ですが、Colabは無料ユーザーに比較的少量の計算に制限しています。Googleはより高い制限を持つColabの有料プランを9.99ドル（約60レアル）から提供しています。
Data Science Agentは主にデータサイエンティストとAIのユースケースを対象としていますが、このエージェントはAPI異常の発見、顧客データの分析、SQLコードの作成にも役立ちます。ユーザーがすべきことは、データをアップロードしてエージェントに質問することだけです。
「Start coding or generate with AI」と表示されています。プログラマーならすぐにこれがPythonノートブックであることがわかります。これは.ipynbファイルです。このフォルダアイコンをクリックすると、分析のためにアップロードできるノートブック内のファイルが展開されます。
「Start coding or generate with AI」をクリックして、「Google Colabで動作する三目並べゲームを作成してください」と入力してみましょう。プレイヤーXの番です。列1～3のどこかを選んでください。列3を選びます。今は行になっているようです。行3、列1を選びます。よく機能しています。行と列が逆になっていますが、ゲームは動作しています。これは2人用のシンプルなゲームで、行と列を選択します。
星アイコンをクリックし「Show Gemini」を選択すると、Geminiチャットが表示されます。「コードを改良して、主要プレーヤーに対してAIが対戦するようにしてください」と入力してみましょう。コードが変更され、別のセルに表示されました。行1、列3を選択すると、AIが対戦してくれます。行3、列3を選択すると、AIがブロックしました。行2、列1を選択すると、AIが行3、列2に配置し、ゲームは引き分けに終わりました。AIは通常のチャットよりも優れたプレイをしました。
AIを使ったGoogle Colabについてどう思いますか？コードを生成し、何もインストールする必要なく、すべてオンラインで行うことができる、コード生成のためのプラットフォームです。コメントで教えてください。
チャンネルを支援してこのような動画を続けて見たい場合は、メンバーになってください。メンバーはWhatsAppグループや早期アクセス動画にアクセスできます。いいねもお願いします。