AI ニュース：見逃した30のデモとニュースヘッドライン

この動画は、2週間分のAI業界の最新動向をまとめた総合ニュース解説である。ClaudeやChatGPTの新機能、画像・動画生成モデルの進化、音声技術の発展、大手テック企業間の複雑な提携関係まで、AI分野の重要な出来事を網羅的に紹介している。実際のデモンストレーションを交えながら、各ツールの実用性や将来性について詳しく分析した内容となっている。

AI News: 30 Demos and News Headlines You Missed

Warp is free to try but for a limited time, my friends at Warp are offering an additional month of Warp Pro for free. Us...

2週間分のAIの混沌を1つの動画にまとめました

さて、2週間分のAIの混沌を1つの動画にまとめました。今週は、MicrosoftとOpenAIが共同声明を発表した一方で、MicrosoftはAnthropicとも浮気していました。MetaはBlack Forest Labsに1億4000万ドルを投資して超リアルな画像を手に入れました。そしてPhotoshopは実際にNano Bananaを受け入れています。さらに、ByteDanceがSeedreamでGoogleに挑戦を仕掛けています。Amazonはあなたが見るすべてのものをショッピング可能にします。

そして、プロ野球チームが実際の試合でAIに指揮を任せました。今週はカバーすべきことがたくさんあり、皆さんの時間を無駄にしたくありません。では、早速始めましょう。

Claudeの新機能から始めます

Claudeの全く新しい機能から始めます。ClaudeでファイルをClau内で直接作成・編集できるようになりました。

ただのテキストファイルや基本的なものだけではありません。実際にExcelスプレッドシート、文書、PowerPointスライド、PDFをClaudeを使って直接作成・編集できるんです。現在、この機能はMax、Team、Enterpriseプランでのみ利用可能です。月20ドルのProユーザーはまだ利用できませんが、今後数週間でアクセスできるようになるとのことです。

私はこのチャンネルでテストを行うためMaxプランを利用しているので、何ができるか見てみましょう。

最初にテストしたのは、このPDFです。OpenAIの「Why Language Models Hallucinate」というPDFで、複雑な数学やグラフ、チャートがたくさん含まれた長い解説で、完全には理解できませんでした。でも、これをPowerPointスライドデッキに変換したかったんです。

PDFを渡して「このPDFをカラフルなスライドデッキに変換して」と言っただけです。これが出来上がったものです。世界一美しいスライドデッキではありませんし、Anthropicはこの青紫のグラデーションが本当に好きみたいですが、これが生成されたスライドデッキです。

クリックして見ていくと、論文の内容をスライド形式でかなり説明しているのがわかります。おそらく今まで見た中で最も美しいスライドではありませんが、確実に作成されました。興味深いことに、「PowerPointファイルを直接作成することはできません」と表示されています。

実は、この新機能は、対象プランを利用していても、デフォルトではオンになっていません。下の設定をクリックし、機能をクリックすると、実験的機能の下に「アップグレードされたファイル作成・分析」があります。これをオンにしないと、文書、スプレッドシート、PDFなどで動作しません。

この機能をオンにしたので、実際に機能させるには新しいチャットを作成する必要があるようです。既存のチャット内では機能しませんでした。そのチャットでは機能が有効になっていなかったようです。

PDFをアップロードして「添付のPDFからPowerPointプレゼンテーションを作成して」というプロンプトを送ります。今度は機能しているのがわかります。PowerPointプレゼンテーションを作成します、と表示されています。実際にPythonライブラリをインストールして、見ている間にPowerPointを構築しています。数分後、実際のPowerPointスライドができました。かなり醜いですが、実際にPowerPointで設計作業を行いたくなるでしょう。でもダウンロードできますし、Driveで開くことも可能のようです。

クリックすると、Google Driveが開きます。実際のスライドデッキとして見ることができます。ここからデザインを始められます。実際に必要のない箇条書きがいくつか追加されています。確実に最も美しいデザインではありませんが、PowerPointは作成されました。

今度はExcelスプレッドシートを作成してもらいましょう。「過去12ヶ月のNvidia、Microsoft、Appleの株価を分解・比較するExcelスプレッドシートを作成して」と依頼します。

ウェブを検索してすべてのデータを取得してくれています。実際に一生懸命作業してくれました。このExcelスプレッドシートに到達するために行ったすべての作業を見ることができます。最終的に、作成されたスプレッドシートを見ることができます。詳細はあまりありませんが、待ってください、異なるタブがあります。詳細がありました。素晴らしい。

Google Driveで開いてみましょう。こちらの方がより正確に見えるでしょう。私が録画している9月11日、2025年現在のこれら3社の株価比較です。月別価格スプレッドシートと相対パフォーマンススプレッドシートがあります。これらすべてが単一のプロンプトで作成され、Excelファイルを構築してくれました。

Anthropicの非常にクールな新機能です。今のところ高価なプランでのみ利用可能なのは残念ですが、他のプランにも間もなく展開されるようです。

Notebook LMの新機能

私のように Notebook LMのファンの方は、オーディオオーバービューに新機能が追加されました。

オーディオオーバービューは、与えられたデータからポッドキャストを作成する機能です。今では追加のオプションがあります。デフォルトのディープダイブがあり、これは既に得られるポッドキャストのようなものだと思います。1〜2分の bite-sizedオーバービューのブリーフがあります。専門家がレビューして素材に建設的なフィードバックを提供するクリティークがあります。そして、2人のホスト間で思慮深い議論を行うディベートモードがあります。

これはどのプランでも、すべての人が利用できると確信しています。過去の動画で何度も扱った「鳥は実在しない」ノートブックにアクセスして、オーディオオーバービューに行き、横の小さなペンアイコンをクリックすると、ディープダイブが表示されます。これは2人のホスト間の通常の会話です。

bite-sizedオーバービューのブリーフ、クリティーク、そしてディベートがあります。ディベートを試してみましょう。このディベート版を生成しましょう。通常のオーディオオーバービューを生成し、ディベート版の作成を依頼したところ、両方を作成しているようです。

実際に生成には非常に時間がかかりました。少なくとも5分はかかったと思いますが、ディベートはこのような音です。

「ディベートへようこそ。今日は本当に魅力的なオンライン現象を掘り下げていきます。鳥は実在しない。私は『鳥は実在しない』が主に洞察に満ちた社会的コメンタリーとして機能していると主張します。『鳥は実在しない』の明確な風刺的意図は絶対に認めますが、そのコンテンツの広範囲な流通、そして率直に言って文字通りの解釈の事例が文書化されているため、その全体的な影響は問題があると私は考えています。」

ディベート機能はそのような働きをします。一つのAIが一方の立場を取り、もう一つのAIがもう一方の立場を取って、両方の側面について議論するのです。これも、テストできる3つの新しいオーディオオーバービュー機能の一つです。何らかのコンテンツを投入して、ブリーフやクリティークを試してみて、何ができるか見てください。

中国からの新しいモデル：Seedream

世界がNano Bananaを手に入れてからわずか数週間後、中国のByteDanceからNano Bananaキラー、Nano Bananaよりもさらに優れたツールだと主張する別のモデルが登場しました。これはSeedream 4.0、またはSeedreamと呼ばれています。Seedreamだと思いますが、Nano Bananaとほぼ同じコンセプトです。

画像を与えて、画像について変更したいことを伝えると、その編集を行います。または、たくさんの画像を与えて画像を組み合わせるよう指示すると、それも行います。

これまでのところ、このByteDanceモデルを使用する最良の方法は、fab.aiでそれを開くことです。他のほとんどのプラットフォームにはまだ展開されていません。これが最適なようです。

これは実際に彼らが提供した例の一つでした。ここには別の人がいましたが、これら3つの衣服を与えて、その人に着せるよう指示しました。私は自分の画像にその人を置き換えました。

この自分の画像をアップロードして、この人にその服装をさせるよう指示しました。4つの画像すべてを与えることで、これが得られた出力です。完全に私の顔を台無しにしました。そして、約束しますが、私の脚はそんなに毛深くありませんが、服装は着せられ、服装は良く見えます。サンダルは私にはこれらのサンダルに近いようには見えませんが、かなりまともな仕事をしました。

Nano Bananaより優れているかはわかりませんが、おそらく同等でしょう。別の画像を取ってみます。数週間前にSmooth Mediaチームと一緒にニューヨークにいた時の画像があります。Smooth Mediaと働くたくさんのクリエイターたちです。「このグループを夜の屋外でニューヨークのスカイラインを背景にして」というプロンプトを与えてみましょう。

それをしてくれるか見てみましょう。約22秒と3ペニーかかりましたが、やってくれました。ただ、人々の顔をあまり近くで見ないでください。公平に言えば、Nano Bananaも同じ問題があります。特に顔のクローズアップでない場合、人々の顔を本当に台無しにします。

これまでのテスト（まだほとんどテストしていませんが）から、このモデルはNano Bananaとほぼ同等のようですが、こちらは1画像あたり3セントかかり、Nano BananaはAI Studioでまだ無料で使用できます。

私なら、おそらく今のところAI Studioに行ってNano Bananaを使用しますが、遊んでみたい場合は別のモデルです。

コーディングツール：Warp

この新しいAIツールは、コーディングをとても簡単にして、ほとんど楽しくします。CursorやClaude Codeではありません。Warpは本格的な開発環境で、本番対応のコードを出荷できます。英語で何を構築したいかを伝えるだけで、AI搭載の開発アシスタントのように機能します。

ゲームチェンジャーは、複数のエージェントを並行して実行できることです。一つは機能を構築し、別の一つはテストを修正し、別の一つはデプロイし、すべてを一つのクリーンなパネルで管理します。

私の使用方法はこうです。既存のプロジェクトで調整を行う場合、Warpは変更をインラインで表示してくれるので、素早くスキャンできます。手作業で何かを調整する必要がある場合は、エディターパネルで開いて直接修正できます。このレビューパネルを引き出して、すべての更新を一箇所で簡単に追跡することもできます。

最も良い点は、常にコントロールできることです。Warpは少し怪しい可能性のあることを実行する前に尋ねるので、生成されたコードをQAできます。MCPインテグレーションとルールのサポートがあり、すべての設定を記憶します。

Claude Codeより好む小さな機能も気に入っています。超クリーンなUI、多くのサポートされているLLM間の切り替え機能、そして気分次第では音声入力と画像サポートまであります。

本番レベルのコーディングをほとんど楽しくするほど簡単にしたいなら、Warpを試すことをお勧めします。無料で、正直に言うと新しいお気に入りの開発ツールになるかもしれません。コードMattwolfを使用すると最初の月が1ドルになります。その後は月18ドルで、いつでもキャンセルできます。Warpがこの動画をスポンサーしてくれて本当にありがとうございます。では、元に戻りましょう。

Ideogramの新機能

会社Ideogramが新しいスタイル機能をリリースしました。プロンプトを与え、画像をどのように見せたいかのスタイルを与えると、画像のスタイルにマッチします。理解できますよね。

余談ですが、今週Theoretically MediaのTimから、実際には「アイデオグラム」と発音することを学びました。ずっと「アイドグラム」と呼んでいましたが、今では「アイデオグラム」だとわかります。

これを素早く試してみましょう。Ideogram AIに向かうと、Ideogramスタイルを紹介する大きなポップアップが表示されます。今すぐ試してみましょう。ここにたくさんの事前作成されたスタイルがあります。

このエモーショナル・ミニマルスタイルが本当に気に入ったとします。このスタイルを選択すると、ここにスタイルリファレンスとして配置されるのがわかります。

そして「短い茶色のひげを生やした男性がマイクを持って手を振っている」と言いましょう。以前に生成しようとしていたこれらの画像は無視してください。何の話もありません、約束します。

ここまで来ました。手を振ってマイクを持っている男性の、見たばかりのスタイルの画像を手に入れました。ひげを茶色ではなく緑にしましたが、それはスタイリングの働き方によるものだと思います。

こちらに来て自分のスタイルリファレンスを与えることもできます。画像をアップロードしましょう。この画像をスタイルリファレンスとして与えてみましょう。なぜダメなのでしょう？

画像がアップロードされると、画像を編集するか、リファレンスとして使用するかのオプションが表示されます。ここでこの画像のスタイルをリファレンスします。「タコを持ち上げている猿」というプロンプトを与えます。

タコを持っている猿をくれましたが、与えたこのおかしな画像のようには見えません。スタイルを正確にフォローしませんでしたが、色のスキームはある程度フォローしました。スタイルはフォローしませんでしたが、色はある程度マッチしました、特に背景は。背景は何らかの形でスタイルにマッチしているように見えますが、それがIdeogramの新しいスタイル機能です。

リアルタイム動画生成

数週間前に紹介した機能で、リアルタイム動画生成というものもありました。画像を編集でき、右側で現在編集している画像から実際にビデオを生成します。

はい、数週間前に発表しましたが、今週アクセス権を得たので、ついにテストできます。これがどれくらい早く展開されるか、いつ完全に公開されるかはわかりません。ウェイティングリストに参加しただけです。1週間ほどかかり、最終的に「参加できます」というメールが来ました。

内側ではこのように見えます。「青い海の真ん中から現れる超リアルな巨大な白い眼球、大きな波」というプロンプトがあります。左側で実際にこれを編集できます。この眼球を動かすと、左側のアニメーションがほぼリアルタイムで変化するのがわかります。確実に少し遅延があります。

これを右に移動すると、数秒かかってからアニメーションがフォローするのに気づくでしょう。完全にリアルタイムではありません。ほぼリアルタイムですが、確実に少し遅延があります。実際にリアルタイムでビデオアニメーションを作成できます。

これの有用性がまだ完全にわかりません。キーフレームのようなことができるといいでしょう。画像をここに置いて、キーフレームを作成し、おそらくここに移動してキーフレームを作成すると、キーフレームを作った場所に基づいてこのアニメーションが作成される。でも、そのような動作ではないようです。現時点ではおもちゃのようなものにすぎません。

これで何をするかよくわかりません。知っている場合は、今すぐコメントで教えてください。現在は単なるクールで楽しいデモですが、まだ実際の実用的な使用例はあまり見当たりません。ただ、非常にクールです。

これは超リアルな3D レンダーのふわふわした緑のモンスターの別のものです。左側でボディを動かすことができ、右側の小さな緑のモンスターを調整するのがわかります。腕を動かして、ここに置きます。

見てわかるように、今やったことにマッチするようにアニメートします。目を遠くに持っていったらどうなるでしょう？目が飛び出しました。非常に楽しい、非常に楽しいです。

Morphic 3Dモーション

これは今週いつ出たのか全くわからないものですが、こちらのRobin Deltaから発見しました。これはMorphic 3Dモーションと呼ばれるツールです。

異なるポジションを選択するCriyaモデルに似ていますが、こちらはほぼキーフレームのようなことをして、キーフレームに基づいてアニメーションがフォローされます。これはstudio.morphic.comでアクセスできます。

自分のヘッドショットを引っ張ってきます。上部にある小さな3Dモーションアイコンを選択します。このモードに入ります。ポジション1があり、これが画像の開始ポジションです。でも、実際にこれをドラッグすると、ワープして奇妙に見えます。でも、基本的には次のステップを設定しています。

そこに置いて、新しいポジションをクリックすると、ポジション2が作成されたのがわかります。それから、鼻の下を見上げるようなショットをやってみましょう。それから、クレイジーな調整された見下ろしをやってみましょう。少しズームアウトもして、これを新しいポジションと呼びましょう。これをプロンプトとして提出しましょう。

設定した4つのフレームに基づいて、ビデオを生成しているのだと思います。さて、作成した絶対に呪われたビデオがこれです。Robin Deltaが見せてくれた例のようには見えませんでしたが、テキストプロンプトを与えなかったのが原因かもしれません。

もう一度試してみましょう。今度はここにプロンプトを追加します。今度は、男性がカメラを直視して、この追加のプロンプトを与えることで出力が改善されるか見てみます。

少し良くなったと思いますが、それでもかなり呪われて見えます。だから、見たデモがどうしてそんなに良く見えたのかよくわかりません。おそらく動きが極端すぎて、もっと微妙にする必要があったのかもしれませんが、遊んでみると楽しいものです。これに一円も使いませんでした。ここで一定量の無料クレジットがもらえ、これまで100クレジット中20クレジットを使いました。

無料で遊べるものなので、私よりも良い結果が得られるかもしれません。

11 Labsの音響効果モデル

過去数週間で、11 Labsからサウンドエフェクトモデルのバージョン2も手に入れました。これは、サウンドエフェクトの品質がより高くなっているとされています。

おそらくより素晴らしい機能は、サウンドエフェクトをシームレスにループできることです。11 Labsに飛び込んで、プロデューサーのDaveがWilhelm screamを生成するかどうか見たがっていました。やってくれました。ちょっと警告ですが、しばらくスピーカーの音量を下げたいかもしれません。

3つの他のバリエーションも作成しました。すべて非常に似ていて、すべて非常にWilhelm screamっぽいですが、すべて非常に大音量でもあります。

しかし、このアップデートでより興味深かったのは、サウンドエフェクトをループする機能でした。「crackling fireplace」というプロンプトを与え、ループ機能をオンにすると、これが出力されました。

どのようにループし続けるかに注目してください。もちろん、いくつかのバリエーションも手に入れました。私は実際にナンバー4が気に入ります。コオロギなどと一緒に外にいるような音だからです。

これらのサウンドエフェクトを作成してループもできるのは本当にクールです。

Amazon Lens Live

過去数週間で、AmazonはこのAmazon Lens Live機能も展開しました。これは、Amazonアプリを開いて、現実世界で見るアイテムをスキャンし、Amazonでそのアイテムや類似のアイテムを見つけようとする機能です。

いくつかのものでこれを素早くテストしてみましょう。いくつか写真を撮らせてください。Amazonアプリを開いて、検索ボックスの近くにある小さな四角い写真アイコンがあります。そのアイコンを押すと、実際にここでカメラを見ることができます。

これを試してみましょう。申し訳ありませんが、音声品質について。私のギターの一つの写真を撮ってみましょう。小さな検索をクリックします。ギター用のウォールフックは見つけましたが、実際のギター自体は見つけられませんでした。実際、非常に似ているギターがあります。何か他のものを試してみましょう。

ここの上にある私のカメラを見てみましょう。いくつかのSonyカメラを見つけました。まだ正しいものは見つかりません。これは現在撮影に使用しているSony ZV1です。見つけました。そこにあります。Sony Alpha ZV1。カメラも見つけました。

たくさんのものの一般的なエリアのような写真を撮ったらどうなるでしょう？ショットにはたくさんのものがあります。写真を撮ってみましょう。何を見つけてくれるでしょうか？

後ろにある似たようなキャビネットを見つけました。棚やキャビネットの上にある私のジャンク品はどうでしょう？キャビネットだけを見つけて、他のものは見つけなかったようです。しかし、クールな小さなアプリです。

外出中、店などにいて「これが欲しいけど、今すぐ買いたくない」と思った場合、写真を撮ってAmazonのウィッシュリストに追加してください。なかなかクールです。

素早いニュースラウンドアップ

今週デモしたい新しいものの部分はここで終了ですが、過去2週間に出たニュースの終わりではありません。繰り返しますが、2週間分のニュースです。カバーすることはまだたくさんありますが、深く掘り下げたくないものばかりです。

速射砲で行きましょう。

大型言語モデルの最新アップデートとニュースをすべて分解することから始めます。大型言語モデルのアップデートのほとんどが非常に限界的に感じられ、世界のほとんどの人がこれらのモデルの日常的な使用で大きな飛躍に気づかないであろうため、もうこれについて超深く掘り下げるのは好きではありません。

過去数週間で、GroqはGrok Code Fast 1と呼ばれる新しいモデルを展開しました。Grok 4が発売された時、まだ利用できないコーディングモデルをからかいました。これがそのコーディングモデルのようです。私自身はまだ使用していません。生成したコードのスクリーンショットがこちらです。

私の理解と、このモデルをテストした人々から聞いた話では、コードを行う大部分の人は、現在最高のコーディングモデルとしてOpus 4.1とChatGPT o3 Proをまだ好むようです。しかし、こちらは他のモデルと比較して高速で安価のようです。

GoogleはEmbedding Gemmaという新しい小さなモデルを展開しました。これはデバイス上で実行するよう設計された小さなオープンソースモデルです。興味のある方には、ここにある他の同様のサイズのモデルとの比較があります。

より深く掘り下げたい場合は、すべてを以下の説明にリンクされていることを確認します。

スイスの会社、Swiss National Supercomputing Centerから新しい大型言語モデルがあり、Apertiseをリリースしました。これはラテン語で「開かれた」という意味です。テストしていないモデルですが、遊びたい場合は利用可能な別のモデルです。

AlibabaはQwen3 Next 80B A3Bという新しいモデルをリリースしました。なぜでしょうか？なぜ？これには2つのフレーバーがあります。Qwen 3 Next ADB A3B InstructとQwen 3 Next ADB A3B Thinkingです。一時停止して見たい場合のベンチマークがこちらです。他のQwenモデルとのみ比較されています。

これも私自身がたくさん遊んだものではありません。LLMニュースの最後の部分では、BYUがErnie X1.1という新しい推論モデルを持っています。事実性、指示フォロー、エージェント機能において高度で、DeepSeek R1を上回り、GPT-o1やGemini 2.0 Proなどのモデルと同等のパフォーマンスを示しているとのことです。これは正直言って、非常に印象的です。

各チャートの左側にある青い線を見ることができるベンチマークがこちらです。これがこの新しいX1.1モデルです。Chinese Simple QAとBFCLV3の両方から見ることができる精度で、他のすべてのモデルを打ち負かしているようです。これらは両方とも精度をテストし、Musrもそうです。

このモデルが最も持っていることは、明らかに最も正確であることのようです。他のモデルと比較して幻覚率も非常に低いようです。

ChatGPTの新機能

過去数週間でChatGPT内でいくつかの新機能を手に入れました。無料プランでプロジェクトを使用できるようになりました。より多くのファイルとより大きなファイルをアップロードすることもできます。色を変更することができます。そして、よりカスタマイズされたコンテキストのためのプロジェクト専用メモリーコントロールを追加しました。これは私が永遠に絶対に欲しかったもので、そこにあることをとても嬉しく思います。

ChatGPTとチャットを始めることができる新しいブランチング機能も展開しました。そして、特定の場所に戻ってその場所から続けたい場合は、分岐して、そのブランチからチャットを続けることができます。

私が今言及したこれらの機能は、最近の動画で話しました。ChatGPTの初心者向けガイドを作成しましたが、中級から上級レベルの方でも見たい内容です。そこで本当にクールなコツを共有しているからです。しかし、これらの新機能についてもそこで話しています。

しかし、素早くデモするために、私のChatGPTアカウントを開くと、これがプロジェクト機能です。基本的には、単一の簡単にアクセスできるフォルダ内でさまざまなディスカッションを整理できるフォルダです。

しかし、今では新しいプロジェクトを作成できます。フィットネスコーチとしましょう。この小さな歯車アイコンをクリックすると、メモリーをプロジェクト専用にできます。つまり、このフォルダまたはこのプロジェクト内で起こったことのみを記憶し、参照するということです。非常に非常に役立ちます。

フォルダ外でChatGPTと持ったチャットを参照しようとは始めません。すべてを一箇所に保つだけで、彼らが展開した超役に立つ生活の質機能で、大好きです。

ブランチング機能については、ここで会話があり、フォローアップのプロンプトを与えるとします。しかし、フォローアップのプロンプト後の応答が気に入らず、会話のこの時点からではなく、この時点から戻って続けたいとします。

「その他のアクション」と表示されている、これらの小さな3つの点をクリックすると、「新しいチャットに分岐」と表示されるボタンがあります。それをクリックすると、新しいチャットウィンドウが開きますが、最初のプロンプトからだけ始まり、ここから続けることができます。

今週のChatGPTからのもう一つの小さな生活の質アップデートです。

テック企業間の複雑な関係

私にとって、一緒に働く、お互いを嫌う、ドラマがある、そういったすべてのこのようなAI会社の相互作用が、AIバブルから出てきた最も魅力的なことの一部でした。そして、これは特に興味深いです。MicrosoftはAnthropicからAIを購入しようとしています。

もし超注意深く見ていなくて、なぜこれが興味深いのかわからない場合、MicrosoftはOpenAIの基本的に49％を所有しています。だから、OpenAIの最大の競合他社の一つであるAnthropicに行くという事実は非常に興味深いです。

しかし、今週、MicrosoftとOpenAIからこの共同声明も手に入れました。これはMicrosoftブログとOpenAIブログの両方に投稿されました。声明全体を読み上げます。

MicrosoftとOpenAIは、パートナーシップの次の段階のために非拘束の覚書またはMOUに署名しました。確定的な合意で契約条件を確定するために積極的に取り組んでいます。一緒に、私たちは安全への共有されたコミットメントに根ざした、すべての人のための最高のAIツールを提供することに集中し続けています。

それが全てです。繰り返しますが、AI世界で起こっていることの内部の働きにすべて注意を払っていない場合、MicrosoftはOpenAIの非営利団体の傘の49％を所有しています。これによりMicrosoftはOpenAIの新しいモデルへのアクセスと、さまざまなMicrosoftツール内でのOpenAIのAPIの使用を得ています。

OpenAIは非営利に移行したかった。それに対して多くの押し戻しがありました。代わりに、彼らは公益法人に移行しました。そして、再構築を試みる際、Microsoftはこの全体の再構築取引でどこに適合するかを理解しようとしています。

今週の彼らの共同声明は、基本的に「私たちは取引を理解し、一緒に働き続けることにコミットしている」と言っているものです。しかし、MicrosoftはOpenAIによって作られていない独自の内部モデルを持つことを本当に強く推し進めているようでもあります。

Microsoft CEO Satya NadellaとAI責任者Mustafa Sulaymanは、独自のモデルへの重要な投資にコミットしました。「私たちはすべてのサイズの世界クラスのフロンティアモデルを社内で構築する能力を持つべきですが、必要に応じて他のモデルを使用することについて非常に実用的であるべきです」とSulaymanは述べました。

どうやら、非営利の親会社、OpenAI非営利は、1000億ドル以上の価値のある株式持分で営利事業に対する権限を継続して保持するようです。Microsoftが関心を持つ非営利は、新しいOpenAI構造がどうなろうと、まだ一種のコントロールを持つでしょう。

MetaとBlack Forest Labs

企業が協力し合うことやこれらすべての重複などについて話しているので、MetaがAI画像にBlack Forest Labsを使用するために1億4000万ドルを支払うことが判明しました。

数週間前、MetaがMidjourneyと画像生成のためのパートナーシップを結ぶことについて話しました。Black Forest LabsはMidjourneyの直接的な競合他社のようなものです。どちらも独自の画像生成モデルです。

では、Midjourneyと協力する投資と、Black Forest Labsへの投資をMetaが行うのはなぜでしょうか？どちらもAI画像を生成できるのに？私の推測ですが、これが完全に正確だと言っているわけではありませんが、私の推測では、Black Forest Labsは実際の画像とほとんど区別がつかない超リアルな画像の作成に本当に優れているのに対し、Midjourneyはより美的なものを持っているということです。

Midjourney画像を見て、それはおそらくMidjourneyで作られたとある程度わかるでしょう。様式化された外観があるのです。だから、私の推測では、Metaは両方の側面を望んでいます。超リアリズムのためにBlack Forest Labsを、Midjourneyは尊敬されるブランドでAI画像生成だからです。また、多くの人が本当に好む美的なものも持っています。

Apple Eventの発表

今週はまた、新しいiPhoneやその他のガジェットを発売した年次Apple Eventでした。新しいiPhone 17をデビューさせました。また、非常に薄いAir版もデビューさせました。Apple Watchの新バージョンを紹介し、その中にはAIヘルスコーチのようなものがあると思います。そして、新しいAirPods Pro 3を紹介しました。

私にとって、これが全体のイベントから最大のリリースでした。AirPods Pro 3は本当に、本当に印象的に見えます。なぜなら、新しいアクティブノイズキャンセレーションがあり、それが本当に、本当に良く聞こえるからです。ワークアウト用の新しい心拍センサーがあります。

しかし、絶対にクールな機能は、AirPodsに直接組み込まれたライブ翻訳です。AirPods Pro 3では、ライブ翻訳により、選択された言語間での対面コミュニケーションが可能になり、ベータ版で利用できます。

小さなデモビデオを見てください。これは非常にクールです。

「こんにちは。いらっしゃいませ。今日は赤いカーネーション全てが50％オフです。」「姉の誕生日にこれらのいくつかを持って行きたいです。8つください。」

そして、その人に応答する時は、電話を持ち上げるだけで、英語で言っていることが彼らの母国語に翻訳され、電話から読むことができます。

あれの言葉がわかりましたか？私たちの汎用翻訳機が故障しているに違いありません。

さらにクールなのは、両方の当事者がこれらのAirPod 3を装着している場合、それぞれが自然言語で話し、自然言語で聞くことができることです。

「同感です。そうですね。クライアントがそれを気に入るでしょう。戦略チームにすぐに準備するよう知らせます。」

私にとって、それは絶対にゲームチェンジャーです。コミュニケーションと言語がもはや障壁ではない世界に入っています。そして、Googleのイヤホンがすでにこれをやっていると思うので、誰もがある種のイヤホンを持つのは時間の問題です。AirPodsでも間もなく手に入れます。

これは標準的なことになるでしょう。皆が誰とでも翻訳するヘッドフォンを持つことになります。それは私がとても楽しみにしている世界です。

Google Circle to Search

翻訳と言えば、Googleはちょうど、スクリーンで見るものを何でも翻訳する新しいcircle to search機能を展開しました。

彼らの例では、写真を撮って、写真で起こっていることを自動的に翻訳させることができるのがわかります。このバッグを見てください。バッグが何と言っているかを正確に示してくれ、非常にクールに見えます。

少し興味深いと思うことの一つは、このアップデートは今週、選択されたSamsung Galaxyデバイスから始まってAndroidで展開し始めると言っていることです。

GoogleがGoogle Pixelを所有しているのに、なぜSamsung Galaxyデバイスで展開するのか、私には理解できません。これは彼らが作るAndroid携帯です。なぜこれらのものがまずGalaxysに来るのでしょうか？私は作成した電話で最初に展開しないのでしょうか？何らかの契約的なことだと確信していますが、くそ、私はここにGoogle Pixelを持っていて、この機能をテストしたいのです。

Veo 3のアップデート

Veo 3にもいくつかの小さな新しいアップデートがあります。Veo 3で直接縦動画を生成できるようになりました。また、コストもかなり削減されました。Veo 3はほぼ半額になり、Veo 3 fastは半額以上削減されました。

Veo 3が縦動画を展開している場合、それが何を意味するかわかります。おそらくYouTube shortsに非常に、非常に間もなく来るでしょう。

実際、YouTubeはYouTube shortsに来ることをすでに確認しています。今年のCannes LionsでYouTube CEO Neil Mohanは、YouTubeがVeo 3 AI動画生成モデルを今夏後半にYouTube Shortsに導入すると述べました。夏はほぼ終わったので、YouTube Shortsにかなり間もなく登場するでしょう。

Veo 3は、Google Photos内のあらゆる写真を取ってアニメート化できるGoogle Photos内でも利用可能です。何らかの理由で、Google Photosアプリは私の電話画面を共有させてくれません。

しかし、私の電話を見ると、下のメニューにある小さな作成ボタンを見ることができます。作成をクリックすると、Google Photos内にある写真をVeo 3を使用してビデオに変換するphoto-to-video機能があるのがわかります。

LeonardoでのNano Banana

Nano Bananaのファンなら、Leonardo内で直接Nano Bananaを使用できるようになりました。非常に簡単です。Leonardo内のイメージセクションに行きます。最近生成した画像の一つをクリックします。

下の底でモデルを選択する場所で、Flux、one context、GPT-1、そしてnano bananaのオプションがあるのがわかります。nano bananaを選択して「エイリアンに『future tools』と書いたシャツを着せて」と言います。

数秒以内に、nano bananaを使用した更新された画像ができました。nano bananaについて話しているので、Adobe Photoshopがそれを受け入れていることが判明しました。

「Photoshopは死んだ」と言っているビデオタイトルやツイートなどをたくさん見てきました。それが判明したのは、いいえ、です。Photoshopはnano bananaを活用するだけです。Adobeで働く私の友人Chris Castanovaによると、nano bananaはPhotoshopにネイティブに来ています。

実際にnano bananaをモデルの一つとして選択できるようになります。いつ正確に展開されるかはわかりませんが、nano bananaが間もなくPhotoshop内に直接来ることを知っています。

AI画像のアップスケールに関する重要な警告

これは絶対に心を痛める状況から出てくる興味深いストーリーですが、一種の公共の利益のようなこととして、これを共有する必要があると感じています。

皆さんが知っているように、政治コメンテーターのCharlie Kirkが暗殺され、人々は容疑者の画像をアップスケールするためにAIを使用しようとしています。これらはFBIが共有した元の画像です。かなり低解像度で粒子状の画像であることがわかります。

人々がやっていることは、これらの画像をアップスケーラーに投げ込んで「見てください、あなたのために画像をアップスケールしたので、今この男がどのように見えるかわかります」と言っています。それはアップスケーラーの働き方ではありません。これは必ずしも男の見た目ではありません。

非常に粒子状で非常にピクセル化された画像をアップスケールしようとすると、AIはその間にたくさんの新しいピクセルを追加して画像を鮮明にしようとしますが、それらのピクセルが何であるべきかについて最善の推測をしているのです。そして、ここに3つのアップスケール画像があることに気づくでしょうが、それらは3人の異なる人のように見えます。

低解像度画像のアップスケールがより良い品質のバージョンを見て、画像からより多くの詳細を得る方法だとは信じないでください。詳細は幻覚です。必ずしも実際の詳細ではありません。

これはこの一つのストーリーだけではありません。おそらくAIについて知っておくと良いことです。

楽しいニュース：AIが野球を管理

では、今週の最終的な楽しいストーリーのいくつかに移りましょう。今週、OaklandのOakland Ballersという野球チームが、AIにゲームを管理させた最初のチームでした。

このチーム、Oakland Ballersのマネージャー、Aaron Milesは、ゲームのラインアップ、誰が投球すべきか、いつ投手を交代させるか、いつ代打、代走を入れるかなどを決定する小さなAIツールを作成しました。基本的に、ゲームの管理のすべてを決定します。AIにすべての決定をさせました。

これをテストしたゲームで、実際に勝利しました。AIは良い仕事をしました。

自律走行車：Zoox

自律走行車に興味がある場合、Amazonが所有するZooxという会社が、ラスベガスでロボタクシーを発売する準備をしています。

これがロボタクシーの見た目です。今年のCESで実際に見ました。ロボタクシーというよりも、ロボバスのようなものです。乗り込んで座る小さなミニバスのようなものです。ステアリングホイールもガスペダルも何もありません。ただ乗り込んで座るだけで、人々をストリップを上下に送迎し、ベガス地下のElonのトンネル、Hyperloopに対する非常に強力な競合相手になる可能性があります。

Hyperloopは本当にコンベンションセンターと一つのホテルの間だけを行き来し、これらの小さなZooxバスはストリップを上下に送迎することができ、おそらく非常に便利でしょう。次回ベガスにいる時は、絶対に試してみます。

ヒューマノイドロボット：皿洗い

今週の「AIは私が本当にやりたくないことをしてくれるか」のエディションでは、皿洗いをしてくれるヒューマノイドロボットを手に入れました。

これはFigureロボットで、以前このロボットが洗濯機に洗濯物を入れているのを見ました。洗濯物を折っているのを見て、今度は皿洗いをしているのを見ています。

これが皆がロボットにやってもらいたい世界です。皿洗い、洗濯、私の後片付け、食事作り。それが私たちのAIロボットにやってもらいたい種類のことです。

だから、私たちは怠惰になって、Wall-Eの椅子に座っている太った人々のようになり、ただテレビを見てスラーピーを一日中飲むことができます。そして、ついにその理想郷を達成するのを助けてくれるロボットを手に入れています。

まとめ

これが今日の私からのものです。これは2週間分のニュースだったので、この動画は私の通常のニュースビデオよりも少し長いかもしれませんが、カバーすることがたくさんありました。

間もなくニューヨークに再び行く予定です。次のニュース動画は、その週に話すのに十分興味深いニュースがあることを前提に、ニューヨークからの現地レポートになるかもしれません。Meta ConnectとMade on YouTubeイベントの両方が来るので、間違いなくあるでしょう。来週は話すべきニュースがたくさんあるでしょう。

しかし、繰り返しますが、過去2週間で興味深いと思われるものすべてをカバーしました。私の仕事は、AIで起こっているすべてのことに指を置き、物事をテストし、デモし、ニュースについてすべて話すことで、週に一度だけ、これらの動画で完全にループインできることです。

今週、その目標を達成し、よりループインしたと感じていただければと思います。このめちゃくちゃ速く動く業界で常に非常にループインしたいと思うなら、この動画にいいねをして、このチャンネルを購読してください。

このようなニュース総括番組がもっと表示されるようになり、これらのツールを使って素晴らしいことをする方法についての本当にクールなAIチュートリアルも表示されます。いいね、購読、すべてのことをしてください。非常に感謝しており、可能な限り役に立つように努力し続けます。

調整して、オタクになって、私と時間を過ごしてくれて本当に感謝しています。これをすることができることが私にとって世界を意味します。本当に、本当に感謝しています。次回、会えることを願っています。バイバイ。

今日、私と一緒にオタクになってくれてありがとうございました。このような動画が気に入った場合は、必ず親指を立てて、このチャンネルを購読してください。このような動画がYouTubeフィードにもっと表示されるようにします。まだしていない場合は、すべての最もクールなAIツールと最新のAIニュースを共有するfuturetools.ioをチェックしてください。そして、素晴らしい無料ニュースレターもあります。再びありがとうございます。本当に感謝しています。