今週見逃したAI業界の29の重要ニュース

この動画では、過去2週間のAI業界における29の重要な出来事を包括的に紹介している。ChatGPTの新機能Pulseから始まり、Luma Ray 3やKling 2.5といった最新の動画生成モデル、PhotoshopへのNano Banana統合、MetaのRay-Banスマートグラス、YouTubeのAI機能拡張まで、幅広いトピックを網羅している。特に注目すべきは、AI動画編集ツールの進化、Google ChromeへのGemini統合、そして音声通話を録音してAIトレーニングデータとして販売するアプリNeonの登場である。

29 Biggest AI Stories You Missed This Week

Click here to get a free month of Make and start orchestrating your AI-powered business:

ChatGPTの新機能Pulse
新しい動画モデルの登場
Kling 2.5の利用可能性
AIツールの統合ソリューション
AI動画編集ツールMirage
PhotoshopのNano Banana統合
Halo AIエージェント
Google Mixboard
Notebook LMの新機能
GoogleのChromeにAI機能統合
Perplexityのメールアシスタント
ラピッドファイア：その他のAI業界ニュース
YouTube Made on YouTubeイベント
AI音楽とレコード契約
電話を共有して収入を得るアプリNeon
AndroidでのNano Banana編集とその他のアップデート
大型言語モデルの最新動向
まとめ

ChatGPTの新機能Pulse

過去数週間でAI業界には非常に多くの興味深い発展がありました。今日は皆さんに最新情報をお伝えします。印象的な新しい動画モデル、誰もが驚くスマートグラス、YouTubeの大きなAIアップデート、そしてAIがあなたの電話を盗聴することで実際にお金を稼げる新しいアプリなど、今日のAIニュースまとめでお伝えする内容は盛りだくさんです。

カバーすべき内容がたくさんあり、皆さんの時間を無駄にしたくないので、すぐに本題に入りましょう。まずはChatGPTの最新機能から始めます。ChatGPT Pulseと呼ばれる機能で、基本的にはChatGPTがあなたについて知っていることに基づいて、毎朝あなたの携帯電話に送信する日刊ニュースダイジェストです。

Pulseは、あなたのチャットのフィードバックやカレンダーなどの連携アプリに基づいて、パーソナライズされたアップデートを提供するために積極的にリサーチを行います。何が役に立ち、何がそうでないかをChatGPTに知らせることで、ChatGPTが研究する内容をキュレートできます。

私の携帯でChatGPTアプリを開くと、新しい画面が表示されます。「毎日一度、あなたに役立つ情報をお届けします。何を表示するかはあなたが決めます。何に焦点を当てるべきか教えていただければ、明日それをキュレートします」とあります。

私のためにキュレートされたコンテンツを見ることができます。これは恐らくChatGPTとの過去の会話や、私について知っていることに基づいているのでしょう。AIの歯ブラシの仕掛けなど、これについてもっと知る必要があります。態度を持った日用品、文句を言うコーヒーメーカー、自慢するランプなど、興味深いですね。

「何を表示するかはあなたが決めます。最近何を考えていますか。明日のアップデートのために覚えておきます」とあります。そこで「最新のAIニュースアップデートに興味がある」と入力すれば、明日のキュレーションにはその情報が含まれるはずです。

これは私にとってPerplexityのディスカバー機能によく似ているように思えます。ただし、これはあなたにさらに特化されている感じがします。Perplexityは少し一般的なニュースという感じですから。これはかなり便利になりそうです。

正直に言うと、これはニューズレター業界にとって少し怖い存在です。私をご存知の方はお分かりでしょうが、私は非常に大きなニューズレター「Future Tools Newsletter」を運営しており、最新のAIツールやニュースをキュレートしています。このような機能があれば、メールを読む必要なく、携帯電話に直接キュレートしてくれるかもしれません。言いたくありませんが、これが現実です。

新しい動画モデルの登場

今週は多くの新しい動画モデルにアクセスできるようになりました。世界初の推論動画モデルであるLumaのRay 3も含まれています。彼らはまた、スタジオグレードのHDRまたは高ダイナミックレンジ動画を生成する最初の会社であると主張しています。

新しいドラフトモードもあり、動画を非常に素早く生成できますが、解像度や品質は低めです。ドラフト版の仕上がりが気に入れば、より高品質なバージョンで生成させることができます。また、物理演算が大幅に改善されているようで、かなり堅実です。

数日前にニューヨークで実際にデモを見せてもらいましたが、試してみましょう。lumalabs.ai/dreammachineにアクセスします。Dream Machine内で、ここのプラスをクリックします。そして下部でモデルを変更できるはずです。現在はray 2になっています。ray 3またはray 3 reasoningを選択できます。推論モデルを使ってみましょう。ダイナミックレンジをHDRに設定します。

これにより色彩のバリエーションが広がるはずです。「男性が私道に立って火炎放射器で雪を片付けている」というプロンプトを試してみます。ドラフトモードをオンにして、少し早く生成されるようにします。「火炎放射器を使って私道の雪を片付けている男性のシーンを分析しています」と表示されています。

実際に少し考えているようです。開始フレームのようなものを生成しました。「雪の私道のシーンを調べて、男性の決意に満ちたスタンスと冷たい映画的雰囲気を強調しています」と表示されています。実際に何かに注釈を付けています。

これらの円や描画が見えますか。これらの画像が動画になる際に何をすべきかを指示する非常に良い方法だと分かっています。これは私のために自動的に描画してくれました。実際に注釈を付ける必要はありませんでした。AIを使って注釈を付けているのです。まだ進行中ですが、驚くべきことに、この火炎放射器を持った男性の動画を作りましたが、火炎放射器がおかしく見えて、炎が前面から出ていませんでした。

それに気づいて、炎が実際に火炎放射器の前面から出るように修正して動画を作り直したようです。それは驚異的です。これは私にとって真にエージェント的な動画モデルです。自分の作業をチェックして、戻って作業を改善します。

完了しました。数分かかりました。思っていたより少し長かったですが、4つのドラフトが生成されたのが分かります。最初のものでは、炎が実際には火炎放射器から出ていません。上部から出ています。雪が溶けているようにも見えません。2番目のドラフトに移ると、同じような問題があります。3番目のドラフトを見ると、今度は実際に火炎放射器から出ています。

地面の雪が溶けているのが見えます。何らかの理由で、最終版はかなりめちゃくちゃで、2人目の男性が突然現れて、奇妙なジャンプカットがあります。しかし、この3番目のものはかなり良いです。これがドラフトであることが分かります。

このドラフトをHDRにアップスケールして、ドラフトではないものにしてみましょう。720pのより高解像度版ができました。必要に応じて、修正、延長、またはこのようなものをもっと作ることができます。しかし、今はここで留めておきます。皆さんも試してみて、どのような結果が得られるか見てください。

Kling 2.5の利用可能性

多くの人がVO3にかなり匹敵すると言っているKling 2.5という動画モデルが、様々なプラットフォームで利用可能になりました。Craya AIを使用している場合、Crea内で直接Kling 2.5を使用できるようになりました。Leonardo AIのファンなら、Leonardo内でも直接Kling 2.5で動画を生成できます。Leonardo内でやってみましょう。

Kling 2.5で作成します。動画が選択されていることを確認します。モデルの部分では、まだVO3が選択されています。それをクリックしてKling 2.5 Turboに切り替えましょう。「ランウェイを歩く全員がスパゲッティで作られた服を着ているファッションショー」というプロンプトを試してみます。

Kling 2.5は生成がかなり遅いと言わざるを得ません。7分以上生成していますが、まだ動画が得られていません。生成に15分以上かかりましたが、これがKling 2.5から得られた出力です。スパゲッティの麺がモデルたちの上にあるように見えます。プロンプト通りです。

この動画を見ただけで、それがスパゲッティのはずだと分かるかどうかは分かりません。むしろ紐のように見えます。しかし、これがKling 2.5です。比較のために、これは全く同じプロンプトでV3が作成したものです。私の意見では、これの方がスパゲッティのようにはっきりと見えます。そのネクタイもかなり素晴らしいです。

Higsfield AIプラットフォームもKling 2.5を追加しました。別のプラットフォームで使いたい場合は、そこでも利用できます。しかし、彼らは最高のオープンソースAI動画モデルとして広く認識されているJuan 2.5も追加しました。オープンソースなので、十分に強力なコンピューターがあれば、実際にローカルで実行でき、音声を生成し、VO3にかなり匹敵します。

Higsfield内でJuan 2.5を試してみましょう。上部の動画に移動します。ここでJuan 2.5を選択します。これは音声も生成するので、プロンプトを与えてみましょう。「すべての車がゴム製のアヒルの形をしていて、運転手がクラクションを鳴らすとキューキュー玩具のような音がする交通渋滞」です。

プロセスを高速化するために480pで生成しますが、1080pまで生成でき、5秒または10秒生成できます。しかし、簡単なデモを作りたいだけです。生成してみましょう。開始フレームが必要だと表示されています。この正確なプロンプトを取って開始画像を生成しましょう。ここに貼り付けます。

交通渋滞で全ての車が…ということで、モデルを使いましょう。思っていたよりモデルが少ないです。flux context maxモデルを使ってこの画像を生成しましょう。交通渋滞の選択肢がいくつかできました。これを使いましょう。動画をクリックします。

再びJuan 2.5にしておきます。プロンプトがまだここにあります。キューキュー玩具の画像で生成してみましょう。これが得られた結果です。

実際にはアヒルのキューキュー音のようには聞こえませんし、なぜか口にホーンが現れて消える理由も分かりませんが、動画と音声の両方を生成してくれる別のモデルです。試すために非常にランダムな例を選んだだけです。現在Higsfieldで利用可能です。

簡単なアップデートとして、Creaアカウントをお持ちの場合、Juan 2.5も現在Crea内で利用可能になっています。複数のプラットフォームで複数の動画ツールがすべて利用可能です。私の個人的な選択はLeonardoでしたが、明らかに偏っています。CreaとHigsfieldにも使える素晴らしいモデルがたくさんあります。

AIツールの統合ソリューション

現在のAIの難しいところは、クールなツールを見つけることではありません。それらを実際に連携させることです。一つのことでチャットボットを使い、次のステップで別のツールにコピーペーストし、画像のために別のプラットフォームに移動します。すべてがバラバラで、点を結ぶ簡単な方法がありません。そこでMakeの出番です。

基本的にAIエージェントと自動化の完全なシステムをリアルタイムで構築・実行するための一つの場所を提供してくれます。その例をお見せしましょう。私が「キャンペーン・イン・ア・ボックス・エージェント」と呼ぶワークフローを設定しました。

新しいクライアント、例えばコーヒーブランドを獲得したマーケティング代理店を想像してください。通常は、リサーチ、コピー作成、広告デザイン、投稿スケジューリングを行うチームが必要です。Makeを使えば、AIエージェントがそのすべてを一つのビジュアルプラットフォームで処理できます。

フローはこうです。まず、AIリサーチエージェントがソーシャルメディアをスキャンして、現在コーヒーについて人々が何を言っているかを把握します。それがコピーライティングエージェントに供給され、クライアントの声で広告コピーとキャプションを作成します。同時に、デザインエージェントがクリエイティブコンセプト、商品撮影、カルーセル広告、新しいスローガンでのモックアップまで作成します。

準備ができたら、投稿はMeta Ads ManagerやBufferなどのツールに直接プッシュされます。最終的に、システム全体がMake Grid内の分析とループバックするため、どの広告がリアルタイムで機能しているかを確認でき、トップパフォーマンスのコンテンツにより多くの予算を自動的にシフトすることもできます。

これは単なる自動化ではなく、オーケストレーションです。バラバラなツールをやりくりする代わりに、単一のダッシュボードから適応、スケール、自己最適化できる生きたキャンペーンを手に入れることができます。代理店にとって、これは生産のボトルネックに陥る時間が減り、戦略とクライアントに集中する時間が増えることを意味します。ビジネスにとっては、より高速なワークフロー、より低いコスト、より良い結果を意味します。

実際にビジネスでAIを活用する方法を疑問に思っていたなら、これがその方法です。Makeを使用すると、あらゆるレベルでAI駆動のワークフローを構築、スケール、制御できます。現在、彼らは下のリンクを使用すると、私の視聴者にproプランの1ヶ月無料を提供しています。代理店を運営している、フィンテックスタートアップをやっている、または単により賢い自動化をしたい場合でも、今が試すときです。

説明欄のリンクをクリックして、無料の1ヶ月を取得し、Makeを使ってAI搭載ビジネスのオーケストレーションを始めてください。今回のスポンサーであるmake.comに感謝します。それでは、動画の残りの部分に戻りましょう。

AI動画編集ツールMirage

動画生成について話したので、今度は動画編集について話しましょう。Mirageというプラットフォームがあり、以前はCaptionsと呼ばれていましたが、最近Mirageにリブランドしました。これはAI動画編集ツールです。AIアバターも作成しますが、最新の機能は完全にテキストで編集できることです。

3秒でズームしたいですか。ボックスにそれを入力するだけです。キャプションを追加する必要がありますか。一瞬で完了です。求めている雰囲気を入力することもでき、私たちのAI編集ツールが適切なスタイルと美学を適用して、それを実現します。

彼らがちょうど展開したこの編集機能は、モバイルアプリにあります。デスクトップでMirage Studioにログインしても、この編集機能は表示されません。携帯でアプリを開いてみましょう。アプリ内ではこのように見えます。

私は有料プランを持っていません。右上で有料プランを取得するよう促していることが分かります。しかし、いくつかの動画をインポートして、これらの動画を一緒に編集させたいとしましょう。この製品について少し迷惑に感じることが一つありますが、大したことではありません。

インポートボタンを押して、最近のニューヨーク旅行からいくつかの動画を取り込むとしましょう。ここに飛行機からの動画があります。タクシーの中からの動画があります。ここにタクシーの中からの別の動画があります。これら3つを選択して、3つのアイテムをインポートしましょう。このページに移動します。

手動編集とAI編集のスライダーが見えます。AIEditをクリックしようとすると、上部にこのエラーが表示されます。「AIEdit送信されませんでした。動画は9:16でなければなりません」。なぜ16:9の動画でもこれができないのでしょうか。しかし、9:16のアスペクト比の動画でしか機能しないなら、なぜこのページで選択させるのでしょうか。使用できないものをグレーアウトして、使用できないものを選択できるようにしないで、プロセスの途中まで行ってから実際にやりたいことができないと分かるのではなく。

その制約のため、私は非常に素早くオフィスで自分の2つの縦向き動画を録画しました。一つはここの自撮り角度のショットで、もう一つはこの動画で見ることができる私のカメラが見ているものです。両方をトリミングします。これらの動画を選択します。2つのアイテムをインポート。今度はAIEditに切り替えてみましょう。

AI編集に切り替えようとすると、「プロジェクトは1つのクリップのみでなければなりません」と表示されます。なぜ2つのクリップを選択させたのでしょうか。手動で編集できるからそれを選択させるのだと思います。しかし、これを行う前に何ができないかを知りたいのに、できないと言われるポイントまで行くのは迷惑です。

とても細かいことを言っているのは分かっています。これを選択解除して、この11秒の動画を選択しましょう。1つのアイテムをインポート。今度はAIEditを選択できます。やった。編集スタイルがいくつかあります。「並行遊びは子供だけのものではありません。大人にも効果があります。植物の世話は生かしておくことだけではありません。聞き方を学ぶことです」。

ここの下のものを選択します。私の動画には話している内容がないので、どのように機能するか全く分かりません。音声のない純粋な動画です。それでは編集方法が分からないかもしれません。しかし、それを選択して編集を生成してみましょう。11秒の短いクリップとスタイルを与えたときに何をするか見てみましょう。

それもうまくいきませんでした。「AIEdit対応していません。話者または単語が検出されませんでした」と表示されます。話している動画を作らなければならないようです。話していない限り編集できないからです。プロセスの途中まで行く前に知っておきたいことばかりです。

携帯で縦向きの動画を録画し終えたところで、このAI編集で何かできるか見てみましょう。1つのアイテムをインポート。AI編集スタイルネオン編集生成、進行中。完了し、このエディターで開きました。自分の声は聞こえますが、編集された動画は見えません。

「Matt Wolfです。YouTubeで私を購読することを忘れないでください」。ここで動画を見る方法があるはずですよね。ダウンロード。いいえ、支払いなしではダウンロードさせてくれません。ついに動作させることができました。しかし、それを皆さんに見せるために携帯の画面を録画しようとすると、アプリが動画を黒くして共有させてくれません。

このような方法以外では結果を共有することもできません。「Mattです。YouTubeで私を購読することを忘れないでください。この動画にライクして、すべてのことをして、コメントを残して、まだの場合はFuture Toolsをチェックしてください。たくさんのクールなツールがあります」。

アプリが実際に生成したものを共有させてくれないのは非常に迷惑です。そして、そのビデオの様子を送信するために動画をエクスポートしようとすると、料金を請求されます。支払いなしではデモすることもできないのは残念です。しかし、先に進みましょう。

PhotoshopのNano Banana統合

今週Photoshopベータ版で新しいアップデートがありました。私を含む「Nano BananaがPhotoshopを傷つけるかもしれない」と言った人たちに対して、Photoshopはそれを受け入れて「Photoshop内でNano Bananaを使用できる」と言っています。

Adobe Creative Cloudアカウントをお持ちの場合は、Creative Cloudを開き、アプリに行き、ベータをクリックして、Photoshopベータを使用していることを確認してください。これは彼らが展開する新機能が入る場所です。ベータ版に入ります。最新版であることを確認してください。Nano Bananaを入手するために、今Photoshopベータを更新する必要があります。

更新されたら、Photoshopを開いてください。ただし、Photoshopベータを開いていることを確認してください。実際に両方ともインストールしています。Nano Bananaが入っているのはベータ版なので、ベータを使用したいと思います。

この画像をPhotoshopで開きました。この便利な被写体選択機能を使用できます。これを選択してこの男性をクリックすると、実際にこの男性だけの輪郭を見つけて、他のすべてを無視します。そして、ここで生成塗りつぶしをクリックできます。

ここにモデルを選択するボタンがあります。それをクリックすると、Firefly Image 3、Lux Context Pro、Nano Bananaのオプションが表示されます。Nano Bananaを選択しましょう。プロンプトには「彼を未来的な弓を持つ緑のエイリアンに変える」と言いましょう。それを生成します。

実際に月も選択されていることに気づきましたが、求めたことを完璧に実行しました。良いことに、これらの変更を新しいレイヤーで行ったことです。このレイヤーを非表示にすると、すぐ下の古いレイヤーを見ることができます。他の要素をいじり続けることができ、非破壊的です。Photoshopで持つべきかなりクールな機能です。

Halo AIエージェント

Halo AIが何らかの新しいエージェントを展開しました。「Halo AIエージェントの紹介、あなたの次世代クリエイティブフロー、1週間無料。話すだけで、無限のキャンバス上であなたのアイデアが実現するのを見てください。エージェントが最適なモデルを選択し、ワークフローを計画し、あなたのビジョンを実現します。画像、動画、音声、すべて一箇所で」。

haloai.video/agentにアクセスすると、これで遊ぶことができます。ここでマルチモーダル作成が来ると表示されています。画像、動画、音声がすべて一つのエージェントで作成されます。まだ完全に展開された機能ではないようです。

ここでモデルをクリックすると、Halo O2動画モデルがあります。画像モデルの下には、Nano Banana、Cadream 4.0、Flux Context、Quinn、Colorsがあります。ここの上部で、モデルを選択するか、オートのままにしておくと、あなたにとって最適なモデルを決定してくれます。

推測ですが、ほとんどのUIはこの方向に向かうでしょう。LeonardoやCreaやHigsfieldなどのツールを使用して、何を求めているかを伝えると、将来的にはプロンプトに基づいて最適なモデルを選択するオートセレクターがすべてに付くと思います。

「オオカミと紫色に焦点を当てたムードボードを作成する」と言ってみましょう。「あなたは十分やりました。今度は私の番です。ありがとうございます」と表示されます。スマートプラン。オオカミと紫色を中心としたムードボードを作成します。オオカミと紫色を特徴とする画像を検索しています。

これを見てください。これらは画像検索です。AI生成ではありません。画像検索と表示されています。これが機能している間、実際に画像をクリックしてフルスクリーンをクリックし、この画像をより大きく見ることができます。これはMiniax Halo AIと表示されています。これを生成したのか、見つけたのでしょうか。

興味深いことに、これにはストック写真ウェブサイトのDreams Timeウォーターマークがあります。そして、MinaxとHalo AIが既にウォーターマークされた画像の上に独自のウォーターマークを付けています。これらは彼らがオンラインで見つけた画像です。所有していない画像に独自のウォーターマークを付けているだけです。

今、「同じプロンプトでムードボード用に4つの画像を作成するために画像生成ツールを呼び出しています」と表示されています。実際に今画像を生成していますが、うまくいっていないようです。ここで「同じプロンプトでムードボード用に4つの画像を作成するために画像生成ツールを呼び出している」と表示され、「画像生成完了」と言っていますが、どれを生成したのか分かりません。しかし、ここの下で「不明なエラーで生成中」と表示されています。

今度は再び生成しようとしていますが、連続して何度も「画像生成不明エラー」と表示されているのが分かります。いくつかの画像を見つけることはできたようですが、新しい画像の生成に苦労しています。ここに片側にAdobe Stock、もう片側にMiniax Haloと表示されているものがあります。他の人が所有する画像にウォーターマークを付けるのは素晴らしいですね。

ついにムードボードに基づいて他の画像をここに作成しました。これには中央にDreams Timeウォーターマークがまだあります。何らかのモンタージュコラージュのような画像と紫色の毛のクローズアップのような画像を作りました。

複数を選択して右クリックしようとすると、一つしか選択されません。しかし、ボード上で一緒に移動させることができます。かなり興味深いです。これの正確な最適な使用例がまだ分かりません。巨大なムードボードを構築しようとしていて、ムードボード上のすべての画像を検索または生成したい場合は、そこにあります。

個人的には使っている自分が見えませんが、これを見ている人の中には「どう使うか正確に分かる」と言う人がいるでしょう。ただ、私にはどう使うか分からないだけです。

Google Mixboard

ボードやムードボード、ビジョンボードなどについて話しているので、GoogleのMixboardという新しいツールがあります。実際に今見ていたものと同じアイデアで、現在米国で公開ベータ版になっています。米国外にいる場合は、このアクセスはないと思います。

labs.google/mixboardに行くと、このようなページが表示されます。ここの例の一つを見ると、ゴーグル目の鳥のボードを作ったのが分かります。迷惑なことの一つは、クリックして移動できないことです。多くの場合、右クリックして画面をスクロールできますが、それが機能しません。実際にスクロールホイールを使って移動する必要があります。

このようなムードボードやミックスボードに画像がたくさんあると、それらを一緒にブレンドし始めることができます。この孔雀とこの赤い鳥を取って、並べて両方を選択するとします。これらの画像をプロンプトボックスに引っ張ってきて、「これら2つの画像をブレンドする」と言うことができます。

すぐに下で別の画像を生成しているのが分かります。これが2つの画像をブレンドしたものです。明らかに自分の画像をアップロードできます。理論的には新しい画像を生成できるはずです。すべてがGoogleのこのムードボードミックスボードのようなものに入ります。

今見ていたものと非常に似ていますが、エージェント的な機能は少なく、画像をドロップするデザインボードとして、興味深い方法で画像を組み合わせることができます。

Notebook LMの新機能

私のようにNotebook LMのファンなら、今週いくつかの新機能が展開されました。フラッシュカードとクイズがすべての市場のすべてのユーザーに100%展開されました。Notebook LMは、多くのPDF、ウェブサイト、大量の情報をアップロードして、音声概要、動画概要、マインドマップ、レポートを作成し、それらの文書について質問できるプラットフォームです。

過去の動画でNotebook LMを多く取り上げてきました。2つの新機能はフラッシュカードとクイズです。ここに読み込まれているコンテンツでフラッシュカードを作成でき、最近この「鳥は実在しない」路線にいるので、クイズも作成できます。どのようなフラッシュカードを作ってくれるか見てみましょう。

最初のフラッシュカード「鳥は実在しない運動とは何ですか」が表示されます。裏返すと「鳥は実際に米国政府が操作するドローンであると主張する風刺的陰謀論運動」とあります。風刺的、それについては分かりません。「鳥は実在しない陰謀論を作ったとされるのは誰ですか、その男」。

学校や教育目的では、ここに教育情報をたくさん読み込むと、フラッシュカードと実際のクイズで自分をテストできます。クイズがどのようなものかを見てみましょう。「ソース資料によると、Peter McKenzoが鳥は実在しない運動を作成する最初のきっかけは何でしたか。この2017年女性マーチで、彼が反対抗議者の間でジョークとして理論を即興で作ったこと」。

すべての情報について自分でクイズを進めることができます。大学生で、講義をたくさん受けたと想像してみましょう。講義の音声録音をして、その音声録音を取って、Notebook LMに入れるか、転写して転写をNotebook LMに入れ、クイズとフラッシュカードを作成させ、非常に良い教育リソースを手に入れることができます。

GoogleのChromeにAI機能統合

Googleについて話しているので、ChromeでもAI機能を直接展開しています。私の理解では、Googleの有料プランの一つに加入する必要があります。100%確認はできませんが、「今日から、米国のMacとWindowsデスクトップユーザーにChromeのGeminiを展開し始めています」と表示されています。

もしかすると誰でも利用できるかもしれません。「数週間後にビジネスで利用可能になる」とも表示されています。この現在のブラウザは実際のビジネスアカウントです。ここにはGeminiがありません。ブラウザに表示されません。

しかし、ビジネスアカウントではなく個人アカウントでログインしているブラウザに切り替えると、右上の一番上に小さなGeminiロゴがあるのが分かります。チャットバーをクリックすることで、基本的にGeminiを起動させることもできます。

「このページについてGoogleに尋ねる」または「キーポイントをハイライト」または「AIスタートアップの影響を説明する」というボタンがあります。これらはすべて、私が見ているウェブサイトのコンテンツに基づいてAIによって生成された質問です。

または、上部のGeminiボタンをクリックできます。「この記事は何についてですか。この記事では、Steph CurryのベンチャーキャピタルファームPenny Jar CapitalがBurntというAIスタートアップに投資した方法について説明しています」。

ちょっと待ってください。Steph Curryとは誰ですか。Steph Curryは史上最高のバスケットボール選手の一人です。Golden State Warriorsでプレーし、信じられないシューティングスキルで知られています。それでは彼はAIと何の関係があるのでしょうか。

分かりました。Steph CurryはAI技術自体に直接関与していません。彼のベンチャーキャピタルファームPenny Jar Capitalが有望なスタートアップに投資しているのです。アイデアは分かります。

Geminiボタンを起動して、基本的に記事を読んでもらい、議論することができます。音声モードで行う必要はありません。ここをクリックすると、音声モードの代わりに通常のキーボードモードに切り替えることもできます。私が見ている記事を共有していることが分かり、2.5 Proモデルと2.5 flashモデルを切り替えるオプションがあります。

私はGemini Ultraプランに加入しており、これは彼らの非常に高価なプランです。誰でも2.5 Proがあるかどうかは分かりません。有料プランだけかもしれません。確認できませんが、それが私の推測です。Proは有料プランのみかもしれません。

GoogleはPerplexity Cometや、AIエージェント的ブラウザを作るブラウザ会社を少し追いかけているように思えます。このGeminiボタンを押して何かをするよう指示すると、代わりにブラウジングして、クリックして、コピーペーストして、ChatGPTやClaude、Manisなどのツールが始めているようなブラウザ操作的なことをするのは時間の問題だと思います。おそらく近いうちにChromeに展開されるでしょう。

Perplexityのメールアシスタント

Perplexityについて言及したので、これについても言及しましょう。現在Perplexityにはメールアシスタントがあります。これはデモする予定でした。しかし、調べ始めたときに、Ultraプランが必要だと気づきました。Ultraプランは月額200ドルのPerplexityのプランです。

GoogleやClaude、Geminiで既に月額200ドルのプランを十分に契約しているので、メールアシスタントのためだけにPerplexityに手を出すことはできません。しかし、ここで見ることができるように、メールを返信や通知、FYI、会議更新などに自動的に整理します。

一目で何が重要で何がそうでないかを素早く見ることができるように自動的にタグ付けします。人々にメールを書くのを自動的に助けるAIコンポーザーがあります。実際にカレンダーを見て、スケジューリングを支援することができます。「もちろん、時間を見つけるために私のアシスタントをループに入れます」と言います。アシスタントがカレンダーをチェックして時間を提案します。

アシスタントに電話の予約などを手伝ってもらうことができます。毎日の会議やメール、毎日対処する必要があることの要約を得ることができます。かなりクールなメールヘルパーツールに見えますが、申し訳ありませんが、月額200ドルのプランでは正当化できません。月額20ドルの小さなプランで利用できるようになったら、おそらくこれで遊ぶでしょう。しかし、現時点では私には高すぎます。

ラピッドファイア：その他のAI業界ニュース

これまで多くの新しいツールを取り上げてきましたが、2週間ニュース動画を出していません。まだお伝えしたいことがたくさんあります。ラピッドファイアに移りましょう。

2週間前はMeta Connectでした。残念ながら今年はMetaConnectに参加できませんでしたが、かなりクールな発表がありました。おそらく最も注目すべきは、新しいMeta Ray-Bandディスプレイグラスです。

これらは皆が慣れ親しんでいるRayban Metasと同じで、小さなカメラと小さなスピーカーがグラスのステムにあり、MetaのLlama AIと話すことができる内蔵AIもあります。しかし、これらの新しいバージョンは、名前からも分かるように、ディスプレイが付いています。

装着すると、レンズの片方だけに小さな画面があります。両目ではなく、片方だけです。カラーで表示されます。基本的に光漏れがないので、周りの誰も画面で何かが起こっていることすら分かりません。

これらのグラスのもう一つの本当にユニークな機能は、ニューラルリストバンドと呼ばれるリストバンドが付いてくることです。このリストバンドは、あなたが何をしようとしているかを基本的に知ることができます。指のジェスチャーでグラス内のアプリを操作します。音量を上げ下げしたい場合は、文字通りノブを回すような動作をします。

グラスを制御するための非常に興味深いハンドジェスチャーがあります。私はまだこれらを実際にテストしておらず、このニューラルリストバンドがどのように機能するかを体験していません。しかし、非常に興味深いと思うことの一つは、Googleが非常に非常に似たグラスを作っているのを見たことです。

ほぼ1年前にそれらをデモしました。しかし、なぜかMetaのグラスがGoogleのグラスより先に出ました。Googleのものも同じでした。片目で、実際に色を見ることができ、片目で画像などを見ることができました。1年前のデモは素晴らしく機能しました。Metaがこれらをリリースしたのが最初だったのは奇妙です。

グラス内で直接テキストメッセージを見ることができます。ただし、実際のテキストメッセージではなく、WhatsAppメッセージだけのようです。AIに質問するときに指をつまんで写真を撮ります。実際に与えられたプロンプトと応答の視覚的表示を見ることができます。

しかし、おそらく最もクールな機能の一つは、翻訳して異なる言語を話す人と会話する能力です。基本的に彼らと話している間、彼らの顔のすぐそばに小さな字幕のようなものが見えます。彼らが言っていることすべてが自動的に英語に翻訳されて見えます。

これらと通常のRay-Bandの両方でフォーカスモードのような機能も展開しています。誰かと話しているときに、これらのグラスをかけて彼らを見ていると、あなたが行っている会話だけを分離しようとし、周りの他のすべての会話を調整するのを助けてくれます。

特にネットワーキングイベントやパーティーで、一人の人の話に本当に集中しようとしているときには、非常にクールな使用例のようです。これらを手に入れて、このニューラルリストバンドをテストし、おそらくこのチャンネルでこれらのRay-Bandディスプレイのペアをプレゼントすることも非常に楽しみです。

これを見ていてこのチャンネルやニューズレターを購読していない場合は、必ずそうしてください。新しいクールなガジェットが出たときに時々プレゼントをするのが好きだからです。

これらのグラスができることの表面をかいているだけです。これらが主な目立つ機能ですが、数週間後に実際に手に入れることができたら、それらをテストにかけてもっと遊んでみます。

Metaはメタバースに関してもクールなものを見せました。Meta Questの新機能があり、ヘッドセットを装着して部屋を歩き回ると、実際にその部屋をマッピングし、その部屋がマッピングされた後、後でその部屋にいなくても探索できるデジタル空間になります。それはかなりクールに思えました。

しかし、さらにクールだと思ったのは、新しいHorizon Studioです。このHorizon Studioでは、実際に任意の世界をプロンプトで存在させることができます。古代遺跡のプロンプトを与えると、このシーン、この環境を作成し、その中を移動できるのが分かります。

宝物と装身具を追加します。そのプロンプトを与えると、たくさんのものが追加されます。神話の守護者を追加します。守護者が追加されました。このAI世界に新しいものを常にプロンプトで存在させることができるのは、本当に、本当にクールです。まるでホリデーのようです。

YouTube Made on YouTubeイベント

今年Meta Connectに参加できなかった理由は、YouTubeがすべての新しい展開を発表する年次イベントであるMade on YouTubeイベントでニューヨークにいたからです。今年はAI関連がたくさんありました。

YouTuberとして、このAsk Studioについて本当に興奮しています。YouTuberでなければ、おそらく気にしないでしょう。しかし、基本的には、YouTubeチャンネルのバックエンドスタジオに住むAIボットで、アナリティクスについて質問し、将来の動画についての提案などを得ることができます。

あなたのデータと統計とチャンネルを理解して、チャットできるAIボットです。タイトルをテストするためのA/Bテストを展開しています。サムネイルでは既にできていました。今度はタイトルでもできます。AI関連ではありませんが、YouTuberなら非常にクールです。

YouTubeはしばらくの間、いくつかのチャンネルで自動吹き替えを行っていました。私のチャンネルにもあり、すべての動画を英語で話しますが、インドにいて私の動画の一つを見ると、デフォルトで自動的に翻訳しようとします。メキシコにいてそこで視聴しようとすると、自動的にスペイン語に翻訳しようとします。

しかし、私が話しているようには見えません。他の声で吹き替えられているように見えるだけです。現在、YouTubeはリップシンクでの自動吹き替えを展開しています。将来的には、実際に私と私の唇が動いて、私の声であなたが聞いている言語を話しているように見えるでしょう。それは驚異的になるでしょう。

これはまだ完全に展開されていませんが、これは本当に、本当にクールになるでしょう。AIディープフェイクがどんどん簡単になり、ほぼ誰でもできるようになったため、類似性検出も展開しています。

あなたの類似性がYouTubeで使用されることを望まない場合、たとえそれが実際にあなたでなくても、それをよりよく検出し、人々があなたの類似性を盗んであなたを動画にディープフェイクすることを止める技術を構築しています。

展開している他のランダムなAI機能のいくつかは、日常的な動画をキャッチーなサウンドトラックに変えることができることです。面白いフレーズ、記憶に残る引用、または一種類の音を聞いたら、DeepMindの最も高度なAI音楽モデルであるLIA 2を使用するスピーチから歌へのリミックスツールがあり、与えられた音のかけらや引用などを次のような音楽動画に変換します。

「もうすぐカップリングシーズンじゃない。新しいデートスポットを探しているのは分かっている。もうすぐカップリングシーズンじゃない。もうすぐカップリングシーズンじゃない。もうすぐ」。新しいランダムなミーム生成器です。

前の動画で予測して話し合ったように、YouTube shortsに直接V3を展開しています。DeepMindと提携してV3のカスタム版をYouTubeに持ち込み、プラットフォームのユーザーがshortsで無料で直接使用できるようにしているのが分かります。

現在、米国、英国、カナダ、オーストラリア、ニュージーランドで展開されており、その後さらに多くの国での計画があります。この機能はあまり好きではありません。YouTubeで作った他のほとんどのものは本当に興奮してテストを楽しみにしていました。

これは彼らが発表したもののうち、良いかどうか分からないと思ったものの一つです。私たちのshortsフィードがすべてAI生成されたスロップになってしまうのではないでしょうか。誰でもボタンを押してAIスロップを生成し、フィードにプッシュするのをそれほど簡単にしたら分からないでしょう。

それで溢れかえるかもしれません。見てみましょう。全体的に、Made on YouTubeイベントと彼らが行ったほとんどの発表は大好きでしたが、YouTube shortsでのVO3は、あまり興奮していないことです。

AI音楽とレコード契約

AIスロップの同じ路線で、どうやらAI音楽家になることでレコード契約を結ぶことができるようです。誰か私を殺してください。Za Zen MonaetというこのアIアーティストがチャートを上がって数百万ドルのレコード契約にサインしました。

これは実際にSunoを使って自分の歌詞を音楽に変える人です。自分で歌詞を書いていると推測しますが、音楽にします。レーベルは彼らに300万ドルでこのアーティストとサインするよう申し出ました。

電話を共有して収入を得るアプリNeon

AIを活用してお金を稼ぐことについて話しているので、これについて話すのは楽しいと思いました。Neonというアプリがあり、AppleとAndroidの両方のApp Storeで見つけることができます。電話を共有することでお金を支払ってくれるアプリです。

基本的に仕組みはこうです。母に電話をかけてこのアプリを通して電話するとします。その会話を録音し、その会話をある種のデータセンターに送って、その会話でトレーニングします。電話をかけた人は1分あたり約30セントを稼ぎ、このようにして1日最大約30ドルまで稼ぐことができます。

通常の電話アプリを使っているだけでは通話を録音しません。この特定のアプリを使用し、相手側からの同意が必要で、彼らも同じアプリを使用している必要があります。このアプリで誰かに電話をかけて、彼らがアプリを使用しておらず同意を与えていない場合、会話のあなたの側だけを録音します。

両方がアプリを使用し、両方が同意を与えた場合、会話の両側を録音します。そして、その会話すべてがこのデータ会社がAIモデル作成者に販売できるトレーニングデータとして入ります。基本的にこのアプリにあなたの通話をスパイさせ、トレーニングデータとして使用させることでお金を稼ぎます。

誰がそれをするでしょうか、電話を録音してすべての会話データを大手テクノロジー企業に送るアプリを使いたい人がいるでしょうかと言うかもしれません。この録画時点で、iPhoneで7番目にダウンロードされているアプリです。

AndroidでのNano Banana編集とその他のアップデート

Androidフォンをお使いの場合は、Google Photos内で直接Nano Banana編集が利用できるようになりました。AdobeのFirefly boardsのファンなら、プラットフォームに2つの新しいAI動画モデルが展開されました。boardsアプリ内で直接Runway AlifとMoon ValleyのMaryまたはMrrayを使用できるようになりました。

11 Labsは今週Studio 3.0というアップデートを展開しました。最も高度なAI音声モデルであると主張し、現在動画サポートがあります。まだこれを本格的にテストしていませんが、将来の動画でかなり11 Labsを使用することは保証します。

これもかなりクールです。自動キャプション、実際の録音の音声修正、マルチプレイヤーコメント。11 Labsで他のユーザーと共同で編集できるようです。

音楽生成が好きなら、Sunoは最新の最先端音楽生成モデルであるV5を展開しました。V5でいくつかの新しい曲を生成してバージョン4.5と比較しようとしましたが、正直に言って違いを見分けるのはかなり困難でした。しかし、テストしてみます。

将来の動画でテストしたい方法についていくつかの大きなアイデアがあるので、それを見たい場合は必ず購読してください。Sunoについて話しているので、デジタル音声ワークステーションの略であるDAWも立ち上げました。基本的には音声エディターです。

Suno内に直接真新しい音声タイムラインエディターがあります。これも後でもう少し遊んでみますが、曲を生成してから、その曲の編集を非常に、非常に細かくできるようです。かなりクールに聞こえます。

大型言語モデルの最新動向

過去数週間で、大型言語モデルの世界でいくつかのニュースがありました。これらの新しいモデルの利点と違いを説明することから少し後退しています。正直に言って、私と世界の大多数にとって、すべてが非常に微細に感じられるからです。

これらのLLMの改善は、開発者やこれらのモデルを本当に、本当に、本当に限界まで押し上げている人でない限り、実際には違いを生みません。しかし、過去数週間で得たものは次のとおりです。

Googleからいくつかの新しいモデルが出ました。Gemini 2.5 FlashとFlash Light。これらは利用可能だったモデルですが、品質と速度の改善を行い、少しパフォーマンスが向上しました。

xAIはGrok 4 Fastを展開しました。これはより高速ですが、おそらく少し愚かなGrokモデルですが、実際にはテストしたほぼすべてのベンチマークでGrok 4に非常に近いパフォーマンスを示します。

Alibabaからいくつかの新しいモデルが出ました。Quinn 3 Maxは、chat.quinn.aiで実際に無料で遊ぶことができます。どうやら、これはコーディングとエージェント的スキルに本当に優れています。

Quinn 3との比較で赤いバーを見ることができます。Claude Opus 4とDeepSeek V3.1。ここのSweetbenchを除くすべてでほぼすべてを打ち負かしています。基本的にコードがかなり得意であることを示しています。

AlibabaからQuinn 3 Omniも出ました。これは、テキスト、画像、音声、動画すべてを一つのモデルで管理できるOmniモデルです。これもオープンソース化したようです。

OpenAIはシステムに年齢チェックを組み込もうとしています。何らかの年齢確認フォームなどではなく、彼らが行っている会話に基づいて年齢を予測しようとしているようです。「最も高度なシステムでも、時には年齢を予測するのに苦労することがあります。誰かの年齢について確信が持てない場合や不完全な情報しかない場合は、より安全なルートを取り、18歳未満の体験をデフォルトにします」と下に表示されています。

18歳未満の人のように話すと、あなたが18歳未満だと推測して、子供向けのChatGPTを提供するかもしれません。しかし、親がChatGPTを使用する際に子供が何を見るかを積極的にコントロールできる保護者管理も追加しました。

OpenAIとChatGPTについて話しているので、展開された他の機能もあります。プロジェクトを他のチームメンバーと共有できるようになりました。利用可能な様々なコネクターが少し改善されたと思います。APIを介してより多くの詳細を取得し、新しいコンプライアンスとセキュリティアップデートを行いました。

重要なアップデートではありませんが、チームで作業している場合、共有プロジェクトがあることはかなり便利に聞こえます。

Factory AI社は今週、最も挑戦的な汎用ソフトウェア開発ベンチマークであるTerminal Benchで1位に達しました。実際にClaude CodeやOpenAIのCodex CLIなどのツールを上回りました。

任意のインターフェースでFactory AIプラットフォームを使用できるようにもしました。VS CodeやWindsurf、Cursorなど、使用しているIDEや、Slackなどの場所で直接使用できます。私はFactoryの投資家なので、このニュースについて興奮しているので、これをシェアしたかっただけです。彼らはかなり良い進歩を遂げています。

この話は本当に興味深いと思いました。Microsoft 365 Copilotに今、Anthropicモデルが追加されました。Excelのようなものにいる場合、GPTモデルの一つまたはAnthropicモデルの一つのどちらを使用するかを実際に選択できます。そこで何が起こっているのでしょうか。

これが興味深い理由は、MicrosoftがOpenAIの非営利側の企業の49%を所有しているからです。MicrosoftがOpen AIの大きな部分を所有していると、OpenAIに全力投球すると思うでしょうが、そうではありません。Microsoftは本当に多様化しており、プラットフォーム内でAnthropicのような競合他社の使用も許可しています。

最後に、間もなくAIアバターとしてZoom会議に参加できるようになります。自分のAIアバターをアップロードし、カメラに映らず、服を着たくない場合などに、AIアバターに代わりに話させることができます。「私はライブでここにいます。猫ではありません」。

まとめ

これが今日お伝えしたすべてです。たくさんあったことは分かっています。これは消火ホースのようなエピソードでした。数週間スキップしたからです。正直に言うと、これは今後ももう少し頻繁に起こるでしょう。

これらのツールを本当に実行に移すビデオについて、本当に、本当に、本当に大きなアイデアがあります。おそらく、これらのソフトウェアの限界を本当に、本当に見つけ出す異なる種類のビデオがこのチャンネルに展開されるのを見始めるでしょう。それらをテストにかけます。実際の使用例に出して、これらのAIツールの新しい、興味深い、有用な使い方を見つけようとします。

これはテストしている新しいスタイルのビデオです。それらのビデオをより多く制作するために作業する中で、ニュースビデオは間隔が空くかもしれませんが、AI世界で知りたい最も大きく、最も重要なニュースについては引き続き情報をお伝えし、これらのニュースビデオに入っていたかもしれない少しの無駄を省くことを約束します。

ここにいてください。AIツールの本当の実用的な使用例を学び、ビジネスや実生活で実際にそれらを実装する方法を学ぶことに興味がある場合、エキサイティングなことが来ます。それに付き合いたいでしょう。

この動画にライクし、このチャンネルを購読してください。これにより、このような動画がYouTubeフィードにより多く表示されます。調律していただき、過去2週間でAIに出てきたすべての最新情報について私と一緒にオタクしてくれてありがとうございます。

より情報を得て、ループに入った気分になってくれることを願っています。これを使う方法を学び続けることがここでの私の目標です。再び付き合ってくれてありがとうございます。本当に、本当に感謝しています。うまくいけば、次回お会いできるでしょう。バイバイ。

今日私と一緒にオタクしてくれてありがとうございました。このような動画が好きな場合は、必ず親指を上げて、このチャンネルを購読してください。このような動画がYouTubeフィードに表示されるようにします。まだの場合は、futuretools.ioをチェックしてください。最もクールなAIツールと最新のAIニュースをすべて共有しています。素晴らしい無料ニューズレターもあります。再びありがとうございます。本当に感謝しています。次回お会いしましょう。