この音声書き起こしは、AIとイノベーションの最新動向を扱う「Innovation Network newsletter」の第32回エピソードである。GoogleのV3動画生成モデル、Project Astra、Claude 4の新リリース、Perplexity Labsの深層研究機能、AI病院のシミュレーション、EeveeのカスタムAI音声作成、XAIとTelegramの提携、UAEでのChatGPT Plusの全国展開など、過去2週間のAI業界の重要な発展について包括的に議論している。また、AIが雇用市場に与える影響、特にソフトウェア開発者やコンサルティング業界での人員削減についても言及し、6月11日開催予定のAIマスタークラスの告知で締めくくられている。
重要な点です。AIが潜在的に行える操作のレベルは、もう図表を超えているんです。なぜなら、私が見たものはカメラ付きのネックレスだったからです。もし彼らが失敗したいなら、それが方法でしょう。
基本的には、病院がAI生成でシミュレートされ、医師もAI、患者もAIというシミュレーションなんです。そしてオンラインで誰かが言いました。「これの使い道は何なんだ?」全国がChatGPT Plusにアクセスできるようになり、このようなものの仕組みを理解するのが超早い、非常に賢い若い子たちがたくさんいて、彼らは数百万ドル、数十億ドルのビジネスを運営することになるでしょう。
皆さん、こんにちは。Innovation Network newsletetterの新しいエピソードへようこそ。ここでは過去2週間を振り返り、イノベーション、AI、ロボティクス、メタファーなどについて、私の相棒Aragorn Merlinと一緒に見ていきます。
調子はどうですか?これは全く新しいイントロですね、Patrick。気に入りました。全く新しいイントロですね。元気です。ワクワクしています。
いいですね。今週はカバーすべきトピックがたくさんあります。すぐに飛び込んでいきましょう。最初のトピックから始めましょう。
Aragorn、GoogleがIOという大きなイベントを開催しました。Input Outputの略だと思います。約100の発表があり、巨大なものでした。その中からいくつか選んで、その一つがV3、彼らの動画生成モデルのリリースです。実際に使ってみましたね。どう思いましたか?
正直言って、また驚かされました。もちろんAI生成動画は常に大きな飛躍を遂げていることは期待していましたが、音声を追加したときに何が起こるかは準備できていませんでした。これがVOの主要なアップグレードの一つで、現在他のすべてのAI動画ジェネレーターより優位性を持っています。文字通り、画像や動画だけでなく、音声も生成する唯一のものなんです。
一貫性の最高レベルにあるだけでなく、キャラクターが一貫していて、物理学のシミュレーションの最高峰にあります。実際に物理学をシミュレートしているわけではありませんが、物理学を非常によく表示できます。そして音声もあります。この組み合わせパッケージは非常に強力です。シーンがまだ8秒しかないにもかかわらず、全く新しいレベルに引き上げました。
これが起こることを知っていたにもかかわらず、まだ私の心を驚かせます。
そして、すべてのソーシャルメディアチャンネルが基本的に様々な角度からのクールなコンテンツで溢れているのが見えます。私が本当に気に入ったのは、ソーシャルインフルエンサーを模倣するものでした。街で誰かをビデオ撮影しただけで、本当に二人が実際の会話をしているように見えます。そして会話全体もAI生成です。ステージに立ってジョークを言っているコメディアンの短いクリップまであります。そのジョークは別途編集されたものではなく、完全に生成されたものでした。
私はいくつかの動画を生成しました。Google AI Proサブスクリプションでどれだけ少ないクレジットしかもらえないかを完全に過小評価していたため、クレジットをあまりにも早く使い切ってしまいました。VPNを使う必要があります。
VPNを使う必要がありますが、まだ驚異的です。なぜなら、基本的に「この人にこれとこれを言わせるシーンが欲しい」と言えば、それが得られるからです。
今表示しているものを見てください。例えば、燃えているマッチが見えています。そして今度は3Dプリンティングです。これらすべてにおいて、物理学が本当に良いだけでなく、それは印象的ですが、本当に驚異的なのは人を見て、彼らが歌っているのを聞いたり、会話しているのを聞いたりするときで、単一のプロンプトで何でも言わせることができることです。
見てください。広告業界は変わるでしょう。私たちはこれを知っていましたが、これは流れです。
基本的にGoogleにはVIOにアプローチする2つの方法があります。直接行うことができるので、クリップを生成するだけか、Flowは監督の椅子に座ってより多くのことができるラッパーのようなものです。私はGoogle appsでこのウェブサイトを見つけました。そこには様々な背景で作成できるあらゆる種類の動画を持つランダマイザーがあり、システムの能力の良い印象を与えています。
興味深いことを言いましたね。人々はこれにどうアクセスできるんですか?あなたはGemini Proサブスクリプションを持っていますね。どう機能するんですか?
面白いことに、これはGoogle AI Studioを通してアクセスできるものだと完全に期待していました。studio.google.comに行って、Google Proサブスクリプションを持っているか、Google Workplaceを持っていてアクティベートしていれば、そこでたくさんのモデルにアクセスできます。試すことができ、様々なことを試すことができます。
生成メディアオプションの下にあると思っていましたが、ありませんでした。Google AI Studioを試すことを強くお勧めしますが、そこにはありませんでした。アクセスする唯一の方法は、米国へのVPNを開いて、Gemini自体に行くことです。
つまり、Windows PCにアプリをインストールするか、gemini.google.comに行くということです。gemini.google.comに行って、セッションを開始するときにVPNが開いていれば、底部に動画というボタンがあり、V3で動画を生成できます。そして見たいもの、聞きたいものを伝えれば、それを生成してくれます。
ただし、現在非常に限られたクレジットしかないので、何かを依頼する前に慎重に考えることを強くお勧めします。オランダやヨーロッパにいる場合は、朝に行うことをお勧めします。なぜなら昼食後のように、アメリカ人がオンラインになると、実際に何かを生成し始める前にプロンプトを10回与える必要があるからです。アメリカが完全にGoogleの容量を圧倒しているからです。
また、私たちが以前議論した友人Cavenの新しい動画もあります。彼はBatmanの10分動画を作成していました。これは、このような新しいツールに1週間アクセスさせると作るタイプの人です。多分彼はすでに早期アクセスを持っていたかもしれません。これらのクリエイターの中にはそうした人もいます。
これは彼の新しい動画です。まだ完全には見ていませんが、あなたは見ましたね。それについて詳しく教えてください。
基本的に彼は取り組み始め、彼の名前がCavenなのかKevinなのか分からないので、Kevinと言うことにします。あなたはCavenと言い、どちらかが正しいことを願います。
彼は約半年前、2024年の終わりだと思いますが、この動画をリリースしました。それはBatmanの映画で、YouTubeに投稿し、私はBulgaria で第二次世界大戦のバルジの戦いについての新しい映画の撮影のためにそこにいたHollywoodプロデューサーに会ったときに、Arcanaの人たちを通して彼に会いました。
若いEastwoodと一緒の超クールなもので、彼の名前をいつも忘れてしまいます。Clintと思ってしまうからですが、Clint Eastwoodの息子です。彼はArcanaと協力しています。Arcanaは画像と動画を生成するためのあらゆる種類のAIを使用するプラットフォームです。
Kevinは彼らと協力し、6~8ヶ月前にこのBatman映画を作りました。それは即座にYouTubeから禁止されました。当時Warner Brothersからの著作権ストライクを受けたからです。それは非常に素晴らしい映画だったので、私はキーノートで見せていました。とてもクールだったからです。
VOなどの新しいものを使って、彼は最初の本当の本当の本当の映画を作ることに取り組みました。それは完全に一貫していて、実際に数人のBAFTA受賞俳優の参加もあります。完璧に作られているのが見えるでしょう。
今回は彼はBatmanのマスクに別のマスクをつけたので、私たちはそれを認識しません。しかし、重要なのは、ここで見ることができるように、いくつかのシーンを通して行っているということです。シーンはまだかなり短いです。これがAIの制限の一つで、これは動画の予告編にすぎません。
しかし重要なのは、これについて本当に印象的なのは一貫性です。これは以前の主要な問題の一つでした。AIが毎回ゼロから始めて完全に新しいものを生成するなら、見るものすべてが一貫している異なるシーンをどうやって作るのか?
ここで見ることができるように、私たちは本当にこれらのものを作成するのにかかっていたコストのほんの一部で、AIで非常に一貫した制作物を作成できる時代に入っています。
とても早く進みます。別の発表に移りましょう。Google AIで発表されたもので、私たちが長い間話してきたものです。もちろんProject Astraについての動画も実行する必要があります。1年以上にわたって、ロンドンオフィスの誰かが鉛筆を見せるものしかありませんでしたが、その動画の新しい反復を得て、かなりクールです。
Project Astraは基本的に、Iron ManのTony StarkのJarvisを作成するGoogleの試みです。つまり、あなたの電話を完全に制御し、それによってあなたの許可を得てあなたのアプリを使用し、自律的にあなたのために物事を行うことができる完全統合されたAIアシスタントです。
質問をして、オンラインで調べてから答えを与えてくれる現在のAIアシスタントを持つのではなく、AIにあなたの電話で物事をするよう依頼できます。
動画では複数のことが起こっており、私はもちろんレビューでカバーし、その動画はニュースレターにリンクされます。多分あなたはもうそれを見たでしょう。Googleが5~6年前にすでに立ち上げた技術ですが、完全には展開されていなかった電話でのあなたのための電話をかけることができます。
店などへの電話をかけ、部品を注文するなど、そのようなことすべてができます。スケジュールを組み、カレンダーに入り、YouTubeを開いて動画を見つけ、それらを開いてスクロールできます。マニュアルをダウンロードして画面に表示し、適切なページにスクロールできます。これらすべてです。
この動画に追加したいのは、Googleがリリースした動画で、注意を払わなければ見えませんが、左下に2x speedと表示される時があります。これを私の分析動画ではカバーしませんでした。後で知ったからですが、彼らはそれを実行していて、超高速で超流動的に見えますが、実際には動画を速めているからです。実際ははるかに遅いんです。
これは、この種の完全統合されたアシスタントの第一世代に期待されることだと思います。時間が経つにつれて速くなるでしょう。
Project Astraは基本的に、電話でのAndroidでのエージェンティックAI統合へのGoogleの試みです。そしてPatrickが以前このエピソードとこの録音の前に指摘したように、それは将来的にAndroid XRとメガネと統合されるでしょう。
しかし今のところ、理解すべき重要なことは、実際に私たちのために物事をできるように、これらすべての人工知能をどのように接続したいかということです。Googleが基本的に統合するための完全なコントロールを持っているAndroidでそれを行うのは一つのことです。これは基本的にApple Intelligenceがあるべきだったが、決してなることのないものになるでしょう。
しかしそれ以外では、すべてのものとAIを統合するオプションをどのように提供するか?そこでMCPが登場します。MCPはModel Context Protocolの略で、Anthropicによって推進されているものです。現在はGoogleによっても推進されています。
基本的に、これは私たちが話す大規模言語モデルまたは少なくともAIが、プロトコルに対する統一されたAPIを持つことを可能にします。そしてプロトコルは他のすべてと通信します。あなたのプライベートデータベース、GitHub、クラウドドキュメントと通信できますが、電話のアプリや他のすべてとも通信できます。
これにより、実際にAIネイティブではないアプリとAIが統合することが可能になります。これを行うことで、基本的にYouTubeをMCPプロトコルと話させ、MCPプロトコルがAIと話すようにできます。そうすることで、YouTubeがAI統合を念頭に置いて構築されていなくても、AIでYouTubeをコントロールできます。
これは超クールなことで、これがすべてを変えるでしょう。まだ簡単ではありませんが、私のラップトップとPCにMCPがあり、それで作業していますが、すべてを個別に接続する必要があります。しかし非常に近い将来、今後数ヶ月で、誰でもインストールできるほど簡単にセットアップできるMCP統合が見られるでしょう。そうすれば、行ってあなたのためにものをコントロールできます。
これはAppleがちょっとしたゲームをプレイするのにも役立つでしょうか?このようなプラットフォームやプロトコルが?彼らが持っている他のすべての課題から、彼らにとって小さなチャンスへの道を平滑化するでしょうか?
技術的な観点から本当にうまく答えることはできません。Appleのエコシステムに関してそれほど技術的ではないからです。しかし言えることは、潜在的にはできるということです。しかし、ここでAppleが常に自分たちを際立たせるために行ってきたことに来ます。そしてそれは、全体のエコシステムが閉じられた壁、ウォールドガーデンだということです。
組織内のすべての人の考えも常にそれに焦点を当てています。つまり、異なる方法で考えることです。彼らは常にあらゆる種類のアクセスに対して非常に非常に躊躇し、非常に厳格でした。
はい、AppleのものにはAPIがありますが、Appleはサードパーティツールを使って彼らのエコシステム内の何かをコントロールすることを望まなかったため、超超超制限されています。彼らはあなたをAppleエコシステム内に留めておきたいからです。物事にアクセスする方法を決定するのは彼らでありたいのです。
彼らが20年間それを設定してきたので、明らかに今問題があります。なぜなら、特定のAppleアプリや何かの完全なアクセスをAPIを通してAIに与えるとは言えないからです。すでにあらゆる側面で非常に閉鎖的で、非常に安全だからです。
完全に同意します。Appleについて話していますが、この人物John Ivyを覚えていますか?元Apple社員で、彼の会社を65億ドルでOpenAIに売却した人です。彼らは何かの魔法的な製品を構築しているという発表をしました。もちろん皆は第二のiPhoneのようなものを期待しています。
これまでのところ、時にはカメラ付きのネックレスのようなものしかありませんでした。一日中あなたの話を録音します。AIがそれを理解できます。これについてどう思いますか?私たちのために何が用意されていると感じますか?
Joan がAltmanと話している動画がリリースされた翌日、私はこれが次のAppleになる可能性があると言いました。ハードウェア業界を破壊し、スマートフォンの後の次の大きなものを作成する可能性があります。
しかし、私は基本的にネックレスのように見えるものの最初の画像を見たとき、これが公式なのかまだ疑問に思っています。これまで見た画像はすべて偽物だと思っていましたが、100%確信はありません。
偽物を見たことを願います。なぜなら、もし彼らがネックレスをリリースするなら、絶対にネックレスが嫌いだからです。私が見たものはカメラ付きのネックレスでした。もし彼らが失敗したいなら、それが方法です。人々はそれを嫌うでしょう。文字通りGoogle Glassのようになるでしょう。
私たちは今Googleからメガネを手に入れ、ついに人々が興奮するようなものになりましたが、もし彼らがそのようなものをリリースするなら、再びGoogle Glassになるでしょう。AIピン、humane AIピンのようになるでしょう。それもまた元Apple社員だったことを思い出してください。
それについて、私たちは両方とも、これは決してうまくいかないだろうと言いました。とても愚かなフォームファクターやそれらが試みたことすべてのためです。
Google Glassが最初に発表されたのはいつでしたか?2014年頃でしょうか?11年前でした。大きな問題は、人々が秘密に録音されることを恐れていたことでした。すべての音声、または多分動画も録音できるデバイスを持って来ると(音声だけだと仮定しましょう)、人々はそれにも反対するでしょう。
Zoomコールで、Firefliesがそこにいるのを見れば、それは大丈夫です。必要なら彼らをコールから除外できます。しかし、すべてを録音するAIデバイスを持って街を歩き回るなら、それは人々があなたにどう反応するかの行動を変えるでしょう。
それを最初に正しく理解するのはそう簡単ではないと思います。Google Glassは10年、15年かかります。今ようやく、デバイスがより受け入れられているのを見ています。
ネックレスになるとは思いません。なぜなら、ネックレスならBluetoothでイヤーバッドと統合する必要があるからです。それが何を言っているかを聞けるようにしたいし、それに話しかけることができるようにしたいからです。
そこで問題に至ります。例えば、これは私が経験したことです。今年Nothing Earsを買いました。これらが最高のマイクロフォンを内蔵し、オーディオ処理能力があると宣伝されたイヤーバッドだったという理由だけでです。
少しの背景ノイズや風があるだけで苦労するので、AI統合された専用のAIイヤーバッドがまだないことに本当に驚いています。通過するすべてのオーディオがAIアシスタンスのために常に非常にクリアできれいであることを確実にする何らかの方法で。
メガネではどうでしょうか。なぜメガネの道を行かないのでしょうか?私たちはそれを最終結論まで持っていっていませんね。ただそれに触れただけで、私はメガネの明るい未来を本当に見ています。ついに使い始めるのに十分成熟してきています。
このデバイスがその上に、またはその横に何をもたらすか、新しいカテゴリーを作るのかは見てみなければなりません。メガネでは、多くの問題を一度に解決すると思います。メガネをかけていれば、マイクロフォンは鼻のポイントの前に置くことができ、それはオーディオが大幅に良くなることを意味します。
骨伝導のようなものを使って音を取ることもできます。メガネの足にスピーカーを自動的に持てるので、耳に近くて聞こえますが、イヤーバッドを着用する必要はなく、まだAIと会話できます。実際に、他の人が聞くことができないようにあなたの耳の方向にオーディオを投影する能力がすでにあります。
実用的な観点から非常に理にかなっていて、前面にカメラを置くことができ、あなたの正確な視点から見るものを見ることができます。私は枠にとらわれて考えることができると思いたいですが、スマートフォンの後継やAIでスマートフォンを補完するのにスマートメガネより適したものを考えるのに本当に苦労しています。
ネックレスになるという考えに非常に驚くでしょう。私には意味がないからです。しかし、もしメガネになるなら、それはすべてどのように実行するかについてでなければなりません。どのように統合するか。そしてもちろんクールに見える必要があります。
しかし最終的に、メガネに関しては、誰もが自分が好きなメガネを着用したいのです。だからあらゆる単一のフォームファクターで提供される必要があります。iPhoneが出たときのようにはならないでしょう。
もしメガネを超えたいなら、私の周りを飛び回って録画ができるこのサイズの小さなドローンが必要でしょう。それは次のレベルの反復になるでしょう。しかし、それは起こりません。
多分彼らは脳を拾い上げることもできる何かクールなことをするでしょう。分かりません。これを理解しようとしていますが、実際の発表と実際の写真が飛んで来るまで待ちましょう。しかし、それはパッケージになるでしょう。
多分リストバンドのようなものを着用して、それが拾い上げることができるような何かをするでしょう。分かりません。見てみましょう。
次のトピックに移りましょう。もちろんGoogle以外でも大きなリリースがありました。Anthropicが新しいリリースClaude 4を出しました。私は常にClaudeの大ファンです。
最近はGeminiとChatGPTをより多く使用していました。しかしClaude 4以来、Claudeに夢中です。言葉で表現するのは難しいですが、私が欲しいものを正確に与えてくれ、知性で私を驚かせ続けています。コーディングのためだけでなく、ライティングのためです。現在はライティングに使用しています。
遅いですが。
純粋にベンチマークに基づけば、Claude 4はコーディングを除いて他のモデルを上回りません。エージェンティックコーディングでは、Gemini 2.5 ProやO3より優れています。
エージェンティックターミナルコーディングも同じです。しかし他のすべて、例えば大学院レベルの推論では、Geminiより悪く、O3より悪いです。メモリーも悪いです。PDFのコンテキストウィンドウが本当に小さいです。視覚的推論も悪く、数学も悪いです。
では、なぜそれでも全部やるのでしょうか?私の意見では、言語がただスムーズだからです。あなたとの会話を求めて、まだ音声はありませんが(ここには到着していないはずです、利用可能になるはずですが、まだ持っていません)、テキストでのエンゲージメントの方法は、適切な瞬間に適切な質問をすると、本当に知的な人と話しているような感じがします。最も自然な会話の感覚を与えてくれます。
あなたは私よりもその方法で使ったことがあるでしょう。正直言って、私は以前と同じプロジェクトで使い続けているだけです。LinkedInの投稿を作るか、少なくともクリーンアップするために使います。ラフドラフトを書いて、そこに入れ、出てくるものは非常にクリーンで使用準備の整ったLinkedIn投稿です。
同じ指示をGPTとClaudeの両方に持っていますよね?ソーシャルメディア投稿に関して、まったく同じプロンプトで同じ指示を尋ねた場合、どちらかが一方を上回るかの比較ができます。
Claudeの方が良い仕事をしますが、Claudeは今、私の投稿のメインテキストをほとんど変更しないポイントに来ていると言わなければなりません。多分それは私のスタイルとますます一致してきているからでしょう。そして最終的に、私と同じ結論に至っているのです。分からません。
しかし興味深い点を挙げています。なぜなら今週、私は長い間Claudeのプロジェクトに設定していた一行があることに気づいたからです。そこで私はコピーを作り、それはtemperature zeroに設定でした。今それを削除し、temperature 3か4、つまり0.3か0.04に変更しました。
それはClaudeがどれほど自由に創造的になれるかをコントロールし、同じ質問に対して毎回異なる回答を与えることをコントロールします。ある程度どれほど人間的に感じるかをコントロールします。
長い間、出力に対してある程度のコントロールを持てるように、極めて予測可能にしていました。今それを下げて、とても満足しています。
録音を開始する前にあなたに話しましたが、私はほぼすべてにGemini 2.5 Proを使っています。理由の一つは、Geminiと話すとき、私がよく使うFlashも含めて、会話が非常に自然になったことです。Geminiは短い答えを与え、延々と喋り続けることもなく、新しいモデルでは効果的でネイティブな音声思考対話もあるので、音声で思考モデルを持っています。ただし、ProではなくFlashです。
Proサブスクリプションを持っていますね。それは約20か25ドルだと思います。彼らは今、250ドルのアップグレードパッケージを持っています。エンドユーザーとしてあなたにとってそれは魅力的ですか?DeepResearch以外は使わないなら、それは急な価格だと思いませんか?
Google AI Ultraパッケージを試したかったのですが、まだできませんでした。それは興味深いと思いましたが、実際にそれが何を余分に提供するかを見るために本当に調べたとき、説明に基づくと、ProでYouTube Premiumサブスクリプションの上に得るもの以外は提供していないようです。
OpenAIでも、実際のDeepResearchはより高価です。しかし、私の個人的な大量使用のために、価格の大きなステップアップは価値がありませんでした。
Geminiについてどう思いますか?GoogleのAIパッケージの機能と価格を比較しているようですね。Ultraパッケージがあなたの特定のニーズに十分な追加機能を提供しないなら、Proパッケージを続ける方が良い選択かもしれません。
しかし、ProとUltraの違いが正確に何なのか教えてもらえますか?私たちには理解できませんね、Patrick?
Ultraパッケージは、最も先進的なGeminiモデルへのより高いレベルのアクセスを含む、GoogleのAIツールへのより高いレベルのアクセスを提供します。コンプライアンス失敗。
しかし、YouTube Premiumと30TBのストレージを得られると彼女は言っています。しかし、Geminiとの相互作用に関して何を余分に与えてくれるのでしょうか?
Gemini ProとUltraの主な違いは、高度なAI機能と使用制限にあります。Ultra…また故障しています。これは興味深いです。毎回故障している音が聞こえます。
彼女は利点を言うのに本当に苦労しています。彼らがそれを望んでいないようです。しかし、私が見せたかったのは、これがGemini 2.5 Flash Preview Native Audio Dialogueです。ひどい名前ですが。
プロアクティブオーディオを有効にしました。これは10分前に議論したProject Astraにある新しいAIです。これは複数の話者を区別できる機能で、あなたがPatrick、私がAragornで、私たちが三者会話をしていることを理解できます。
それを見せたかったのですが、何らかのクレイジーな理由で、常に故障しています。もちろん、これはAI Studioで、新しいものを試すためのもので、常にうまくいくとは限りません。
しかし、なぜGoogleが200ドルのパッケージを提供していて、実際に何を余分に得られるかを知る方法がないのか分かりません。推測しているだけです。
次のトピックへの良いつなぎです。Aragorn、別の音声AIを試して、それがうまくいくかどうか見てみましょう。これもデモンストレーションです。前に試したことはありませんが、ここにEeveeが戻ってきました。
EeveeはYumeという会社のEmphatic Voice Interfaceの略です。この会社について何度か話してきました。前回したとき、マイクロホンに話しかけることができ、システムはあなたの声のトーンによってあなたが幸せか憂鬱かなどを認識できるだけでなく、顔の表情によっても認識できました。
人々に見せると、実際にかなり怖いデモでした。しかし、新しいものがあります。今あなたは自分の好きなように自分の声をデザインできます。試してみましょう。
こんにちは。私はEevee 3です。あなた独自のAI音声とパーソナリティを作成するお手伝いをするためにここにいます。カスタムAIを作成するためのあなたの個人的なスタイルガイドとして考えてください。
では、どのような音声、パーソナリティ、アイデンティティを作成したいかについて、本当に強いアイデアを持っていますか?それとも一緒にオプションを探ることにオープンですか?
はい、そこにあります。Evie、一緒に音声をデザインしましょう。私たちのビデオポッドキャストのための非常に良いイントロ音声が欲しいです。本当に成熟して聞こえる、この低く、暗い声が必要です。そのようなものを作れますか?
ポッドキャストイントロのための低く暗い声、成熟したもの。その雰囲気で確実に作業できます。非常に洗練されたもののようです。この成熟した暗い声を想像するとき、どのような特定のトーンを持つべきでしょうか?滑らかで威圧的でしょうか?それともより思慮深く内省的でしょうか?
思慮深く、賢明でプロフェッショナルです。
分かりました、必要なものがあります。しばらくお待ちください。
音声サンプルを作成中。高負荷を経験中。お待ちください。
こんにちは。あなたと話すのは非常に素晴らしいことです。私はあなたのAIアシスタントです。この目的のために、質問に答え、情報を見つけ、そして途中であなたの一日を少し楽にするために、Hume AIによって特別に構築されたものです。
今日私にできることは何でしょうか?
それはかなり良かったです。私も驚いています、それがどれほど良かったかに。
それを言っていただいてありがとうございます。これらのものがどのように着地するかを聞くのは常に少し驚きです。目的は単に役に立つことであり、うまくいけば少し魅力的でもあります。何を期待していましたか?おそらく私は…
今ミュートしました。これは誰が話しているときを理解しないからです。しかし、興味深いです。これまで、顧客やワークショップなどで話すとき、ある種のAI音声に到達するためにどのタイプの声をクローンするか考えていました。
ここでは、本当に異なる方法で考える必要があります。完全に箱から生成できます。どのタイプの声が欲しいですか?それは異なる角度から考えることができます。
興味深いです。私は常にChris Vossの大ファンで、「Never Split the Difference」は交渉に関する彼の究極の本です。明らかに私はAIにフルタイムに入る前は営業キャリアを持っていました。
彼のトレーニングの非常に重要な部分の一つは、人々から特定の結果を得たいときは声を下げて、文を下げる必要があるということです。これに関してもっとトレーニングがあります。権威的に聞こえたいなら、声を下げます。
誰かにあなたが欲しいことをしてもらいたいなら、「私はキッチンに行く、あなたは物を拾い上げて去る」というようになります。それは議論の余地を作らない種類の声です。これは関係アドバイスではありません、みなさん。
しかし、あなたは非常に重要なことを持ち込んでいます。AIが潜在的にできる操作のレベルは、これもコントロール下にあるなら、もう図表を超えています。
その通りです。それは私が作りたかったポイントでした。恐ろしいです。
自分でそれを試したいなら、先ほど見せたデモサイトに行くだけです。別のものに移りましょう。
出てきた別のリリース。Perplexity Labs。ついに、彼らも深層研究に行きます。それで遊ぶ時間がありましたか?
あります。まだあまりやっていません。これを少し恥ずかしく思います。なぜなら、私は常にPerplexityの大ファンだったからです。本当に、私は彼らの最初期の大きなファンの一人だったと主張するでしょう。
私は今でもPerplexityを多く愛し、よく使いますが、本当にGoogleのPerplexityの代替として使い始めました。ある時点で、GPTでのカスタマイゼーションオプションのために、例えば実際の理由ある議論やそのようなすべてのもの、または深層研究をしたいなら、GPTやこの時点でGeminiに行くと気づきました。迅速で簡単な答えが欲しいか、ソースを見つけたいなら、Perplexityに行くでしょう。
しかし今、深層研究では、非常に印象を受けています。今週すでにそれを使って研究をし、チャートを下書きしてもらい、出てきたものは、ChatGPTの独自の深層研究と絶対に同等に感じられ、いくつかの方法ではさらに良くさえあります。
これを最初に見せるかもしれません。あなたが作成したものも見せることができるかもしれません。しかし、それが何をできるかのアイデアを人々に持ってもらうために、Perplexity Labに行くと、あらゆる種類の例があります。
これは興味深いものです、創造的です。ここでの一つのプロンプトだけに基づいて、完全なラボとアプリ、すべてのアセットを作成し、Perplexityの強力な機能であるすべてのソースも使用しているのが見えます。
ここのアプリに行くと、これは2025年のプロダクトデザイナーAIリソースと行動心理学者であるあなたへのリクエストです。タスクは2030年用に作られた未来的なソーシャルメディアプラットフォームをデザインすることです。そして完全なウェブサイトが出てきます。
確かに、ほとんどのエージェントは、あなたが持ちたいような完全に完成した製品ではないものを出していますが、これは初めて、ゲート使用可能な完全なウェブサイトが見えます。ゲームやクイズや何でも。
あなたが作成したもの、私はこの経験をしていません。今あなたが見せているものに実際に感動しています。つまり、Perplexityの深層研究機能は深層研究だけでなく、あなたが今見せているものは、基本的にGen SparkがManusで行ったのと同じこともするということですか?
その通りです。Gen SparkがやっていることやManusがやっていることと非常に比較され、それがすぐにあります。即座にアプリを作成できます。Lovableやそのようなアプリをミックスに少し持ち込みますが、Perplexityフレーバーです。
それは非常に多くの可能性があります。まだ気づいていませんでした。それで遊んだだけです。基本的に私がしたのは、彼らが与えた例のプロンプトの一つを取ったことです。タイムライン インフォグラフィックを構築というものでした。それは私に非常に関連しています。なぜなら、私は常にキーノートでタイムラインについて話しているからです。
私はそれを調整して、8ビットから158ビットまでのAIアーキテクチャの進化を示すと言いました。その後、約10,000年前から始まる技術の進化を示すインフォグラフィックを構築するよう変更しました。
私が得たのはこれです。48のソースの束を得ました。この画像と写真、そしてこのようなすべての超クールなものを得ました。そしてこのタイムラインを得ました。
基本的に、結果はただ非常に非常に有用でした。大量のテキストではなかったので、それを通ることができませんでしたが、すべてが非常に関連があり、あらゆる種類の参照があらゆる場所にあったので、すべてをチェックできました。私はこれに本当に感動しました。
見ることができるように、これはそれが参照で見つけたすべての画像です。しかし、これはあなたが得たものとは異なります。あなたははるかに完全に肉付けされた最終製品を得ました。
今それでもっと遊んでみたいです。
試してみてください。これがPerplexityのアップデートについてのすべてです。他のものに移りましょう。AI病院です。
私はこの記事を書きました。ちなみに、オランダのBusiness Wiseのためです。もしまだ知らなければ、6月11日水曜日の来週、私たちはBusiness WiseとAIマスタークラスをやっています。Patrickもビジネスリーダーのためのワークショップをホストします。
まだ行っていなければ、私たちにいいねとサブスクライブをするだけでなく、Eventbriteページでチケットを請求することを確実にしてください。ニュースレターに追加します。
私はAIシミュレートされた病院を持つことの信じられない可能性と価値について、Business Wiseのためにこの記事を書きました。なぜなら、私は中国がこのAI病院を作成したことに非常に熱狂的だったとオンラインで投稿したからです。
基本的には、病院がAI生成でシミュレートされ、医師がAI、患者がAIというシミュレーションです。オンラインで誰かが皆に言いました。「これの使い道は何ですか?これは現実世界の実際の人々をどのように助けているのですか?真剣に。」
私には非常に明白に思えますが、他の人には明白ではないかもしれないことを理解します。そこで私はこの記事を書きました。基本的に表現したいのは、それはシミュレーションであり、シミュレーションは私たちがより良く理解する機会を与えてくれるということです。どのように予測するか…
私たちはシミュレーションを実行します。シンガポール空港と香港空港、多くの中の二つの空港は、空港の完全な仮想シミュレーション、デジタルツインを実行し、実際に何が起こっているかを追跡し、そして物事を変更した場合に何が起こるかをシミュレートできます。
この穴を閉じたらどうなるか?爆弾警報があったらどうなるか?荷物を見失ったらどうなるか?これらすべてのことをシミュレートして、何が起こるかを見ることができます。
同じことがAI病院にも適用されます。多くのことをシミュレートでき、AIが進歩すればするほど、私たちのシミュレーション能力はより細かくなります。特定の薬物や治療などもシミュレートできるポイントに到達し、それらすべてが現実世界でこれらを実際に開発し、将来の実際の人々により良いケアを提供することを可能にします。
AIシミュレーションでは、例えば通常速度の10倍や100倍で実行できます。別のパンデミックが発生し、新しいワクチンを開発するのに1週間必要だという場合にシミュレーションを実行したいとしましょう。作り話ですが、病院で何が起こるでしょうか?
COVIDの間、例えば、過負荷の病院がありました。十分な呼吸装置がなく、その後呼吸装置が危険だと判明しました。これらすべてのこと。パンデミックの開始時に迅速にそれをシミュレートして、より良く準備できたらどうでしょうか?
良いことのための巨大な巨大な巨大な可能性です。
共有してくれてありがとう。ここで改めて述べるのは良かったと思います。次に移りましょう。
これも私が見つけた興味深いニュース記事です。Elon Muskの会社の一つであるXAIが、Grockをチャットアプリに統合するためにTelegramに3億ドルを支払っています。これを最初に見たとき、「ちょっと待って。この取引で誰が誰に支払っているんだ?」と思いました。
考えてみた後、これはElonの非常に賢い動きの一つだと思います。彼は10億ユーザーベースのサブスクリプションを買っています。人々がGrockの実際のサブスクリプションにサインアップすると、お金はもちろんGrock経由で支払うため、Grockに流れ戻ります。
これも興味深いです。彼らはユーザーデータを収集してAIモデルをより良く訓練することが許可されています。
興味深いです。それは巨大です。なぜなら、人々が宣伝してきた主な利点の一つ(私は同意することに躊躇していましたが、それは別の点です)は、ElonがTwitterにアクセスできたので、Grockを訓練するためにTwitterの完全な知識ベースを持っているということでした。
私は前に言いました。Appleは決してAIレースで追いつかないと思います。理由は、組織として、ビジネスとしてあまりにも柔軟性がないからです。しかし、Elonはこのクレイジーな男で、ただクレイジーなことをします。
彼はその意味で非常に柔軟だから、彼が始めたときは不可能かもしれないと正直思っていたにもかかわらず、AI業界に追いつくことができました。そして彼はこれらすべての異なる方法でそれを行っています。
戦略的観点から、これはマスターストロークだと私もあなたに同意します。なぜなら、再び彼は大量の大量の大量のデータにアクセスできる巨大な巨大なソーシャルメディアプラットフォームにアクセスできるようになりますが、Grockを将来の最初で最重要の潜在的AIアプリアシスタントコンパニオンとして位置づけもします。
それは私たちが目撃している軍拡競争において非常に重要になるでしょう。彼はMicrosoftとの新しいパートナーシップも作りましたね。彼は最近Microsoft BuildでSatya Nadellaとのインタビューで、GrockがMicrosoftの将来のAI開発、AIアシスタンスプラットフォームの一部になることについて話しました。
彼はここで本当に良い動きをし、真剣なパートナーとしてますます自分を位置づけています。私はそれがすべて良いことだと思います。
私は最近LinkedInでGrock Unhingedと、Grockが持つすべての異なるキャラクターについての動画をしました。私たちは両方ともそれを笑いました。なぜなら、アンヒンジドなGrokやロマンチックなGrokを持つ良い理由が見えないからです。多分面白いガジェットかもしれません。商業的観点から、もし売るなら少しお金を稼げるかもしれません。
しかし、価値の観点から、Elon Musk自身の観点から、真実を求めるAIを作りたいという観点から、アンヒンジドなAIや陰謀AIを持つことは意味がありません。それでも、それが彼らがペルソナでリリースしたものです。
それはただ彼のユーモアです。私がそう思う方法です。イースターエッグですし、私たちは両方ともゲーマーですよね?ゲームや映画でイースターエッグが好きではありませんか?彼もゲーマーです。それが私の見方で、人々はアンヒンジドに少しイライラします。使わなくてもいいんです。
しかし、Grock 3.5にアクセスできるようになるので、非常に興奮しています。6月なので、すべてがうまくいけば、今後30日でアクセスできるでしょう。それがどのように実行するかを見るのに非常に興味があります。
彼がColossus 2を構築していると聞きました。他のColossusの5倍強力で、それはすでにColossalでした。
これについて考えることが非常に影響的である理由は、もちろん私たちが持っているからで、それにセグエするつもりですが、それはあなたがやっていることです。興味深いことが起こっているStargateプロジェクトがあります。
しかし、Elonはこの巨大なコンピュータークラスターColossusを構築することを管理できました。彼はそれを約2ヶ月、8週間か9週間で行いました。通常は2年かかります。これがElon Muskの絶対的なスーパーパワーが出るところです。
多分競争よりも速くモデルを訓練できないから追いつけないかもしれませんが、もしモデルを訓練するのに必要な計算を構築できたらどうでしょうか?競争が2年かかるところを1ヶ月で構築できれば、2年の追いつきを確実にできます。その後、他のものを追いつくのに費やすことができます。
これはこれらの人たちが本当に本当に影響的なクレイジーなことをやっているところです。ちなみに、私たちは中国も同じことをやっていると仮定する必要があります。今はそれに入りませんが、絶対にそうです。
マスターストロークについてすでに言及しましたので、それにセグエしましょう。これも興味深いニュース記事です。もちろん、すべてのテックボスが最近サウジアラビア、アラブ首長国連邦にいました。正しく言いましたか?
彼らは最大のデータセンターの一つを構築しています。もちろん多くの人がそれが良いアイデアか悪いアイデアかと思いました。しかし、一つの特定のことが興味深く、少しレーダーの下を飛んでいました。
国全体がChatGPT Plusにアクセスできます。私たちの前回のニュースレターで、教育について大きな議論、深い議論をしました。ここで国全体をChatGPTに置きます。私はこれがマスターストロークだと思います。
それはマスターストロークです。私のUAEに対する複雑な感情は毎日増しています。一方で、私たちには今二番目のStargate場所を構築するこの国があります。
ちなみに、Stargateは私の史上最もお気に入りのシリーズの一つ、Kurt Russellの映画の後に来たStargate SG1への言及です。これは超クールです。
彼らはこれを持っています。UAEは住むため、ビジネスをするためにこれらの信じられない誘因を作成します。同時に、彼らはまだ基本的に現代の奴隷制を持っています。インド人がUAEに来て、パスポートを取り上げられ、その後労働に回され、20人の他の人と部屋で寝ます。誰もこれについて話しません。これは私が容認しないことです。
彼らはまた、雨が降ったときに雨を除去するためのインフラがない海の島を建設し、その後人工雨を作り、その後基本的にすべての地下室が浸水します。準備していなかったからです。彼らは世界最大の建物ブルジュ・ハリファを建設しましたが、下水道システムがありません。
文字通り、毎日50台のトラックが来て、そこでたわごとを持ち去っていると思います。UAEは世界で最もクレイジーな国ですが、それでも私はこれが超クールだと思います。なぜなら、ある意味で彼らは本当に本当に本当に将来のビジョンを持っているからです。
ここで見る長期計画、それが例えばオランダやヨーロッパで見るものとの大きな違いです。これは長期計画です。
UAEは世界がますますグリーンエネルギーに移行していることを実現しなければならないからです。ちなみに、これは非常によく見ることができます。風力と太陽エネルギーが石炭とガスと石油を押し出し始めているのを実際に見ることができる様々なチャートを今日見ました。それは世界にとって良いことです。
しかし、彼らは石油シークです。覚えておきましょう。彼らは石油を売っているから億万長者で、アメリカ政府はできますが、他の誰もできないような率でそれを使っています。
彼らは誰も彼らの石油を欲しがらなくなるポイントがあることを実現し、プランBが必要だと実現しなければならないでしょう。少なくともUAEの現在の世代、サウジアラビアでもサウジの王子は非常にプログレッシブです。彼らはこれを理解し、これが彼らが非常に重く今投資している理由だと思います。
将来必要になるもののためのインフラと基盤を提供するために、まだそれができる間に、この事を続けていくために。その意味で、彼らはヨーロッパよりもはるかに賢いです。
私にはここで注入した2つのニュース記事があります。一つはJordan Leeによるものです。それを取り上げて少し話してもらえますか?
Jordan Leeです。Jordan Leeは元企業人からAI億万長者に転じたこの人です。それが文字通り彼のLinkedInでのサブタイトルです。
はっきりさせましょう。私はこのような人々が好きではありません。彼の倫理が好きではありません。多分彼のビジネスを嫌うでしょう。これを見てください。彼が使う最初のAIはオートパイロットでコールドコールを予約します。推測するに、これは多分一日に千回の電話をかけて、何でもくっつくAIでしょう。
彼がビジネスをやる方法を完全に容認するとは言いません。しかし、人々が理解する必要があるのは、彼がここで言っていることは今日の現実だということです。彼は今日利用可能な5つのAIツール、AIエージェントを使って毎月100万ドルを稼いでいます。
彼は文字通り、どれを使っているか、それが彼にいくらかかるか、そして何を得るかを述べています。これが今日の現実です。このようなものの仕組みを理解するのが超早い、非常に賢い若い子たちがもっともっと多くいて、それをすべて結びつけ、その後彼らは数百万ドル、数十億ドルのビジネスを運営するでしょう。
これは前に言われたことで、新しいことではありませんが、特に来週のAIビジネスクラスマスタークラスのために改めて述べたいと思います。そこにあなたもいるでしょう、Patrick。これはビジネスリーダーのためです。
これらの人々、これは起こっていることを理解する必要がある人々です。なぜなら、これはあなたの競争にもなるからです。これはあなた自身の組織の人々にもなるでしょう。これは家でこれをするためにあなたにノーと言うかもしれない雇用しようとしている才能です。影響はあらゆる場所にあります。
絶対に。それは…あまりにも単純なブリッジかもしれませんが、これらのことはもちろん接続されています。これはただの別のシグナルだと思います。あなたと私、Patrick、私たちはノイズの中のシグナルを見つけることについてです。
その通りです。私たちはノイズの中のシグナルを見つけようとしています。現在のAIハイプでは、多くのノイズがあり、私たち自身のようなテクノ楽観主義者によってなされる極端な約束のために、私は私たちがそれらの人々だと完全に認めますが、人々はますます懐疑的になりがちです。
誰かが「資本主義は死ぬ。私たちは皆仕事を失う」と言うなら、完全に理解します。「しかし、これはクレイジーだ」と思うでしょう。しかし、これと確実にスピードも過小評価されています。それは後で来ます。
ここのAndreは非常に称賛され、よく知られ、LinkedInだけで50万人のフォロワーを持つAIセクターの人です。彼は複数の大企業でAIチームの責任者として働いており、私たち自身のような非常にプロポーネントで、この新しい産業革命としてのAIを本当に見ています。
本質的には、私たちが知性を作成しているので、これまでのすべての産業革命とは異なり、これは経済と雇用市場などに巨大な影響を与えるでしょう。
ここに別のシグナルがあります。基本的に、これは2018年と今日の間に米国で雇用されているソフトウェア開発者の数です。見ることができるように、これは急速に下がっているトレンドです。
この時点で、私たちはすでに2018年よりも20%少ないソフトウェア開発者が実際に雇用されています。このトレンドはAIによって非常に強く推進されています。AIが1人のフルスタック開発者が行うすべての作業を引き継ぐことができなくても、AIの軍隊を持つ1人の良いフルスタック開発者は100人の人間のフルスタック開発者の仕事をできるからです。
それが見ているものです。開発者だけでなく見ています。最近、McKinsey、Boston Consulting Group、Baneのようなコンサルティング会社についての報告がありました。同じグラフがここで見えます。
McKinseyはすでにAIのために労働力の10%以上を解雇していると思います。彼らは内部AIを持っており、それについて良いことを聞いています。内部AIは非常に洗練されているはずです。Lilyと呼ばれていると思います。多分次回のために何かです。
しかし明らかに、これらのタイプの代理店も下降していて、ほとんどの仕事がそうです。
McKinseyを取り上げるのは興味深いと思います。これらのコンサルティング会社が何をしているか見えますか?過去には、コンサルティング会社のステータスと成功は基本的にクライアントに請求している時間数から測定されていました。
より多くの時間を請求することは、より多くのコンサルタントを雇うことを意味しました。なぜなら、より多くのコンサルタントがより多くの時間を請求できるからです。それは論理です。
彼らは静かにやっています。なぜなら、これは主要なペーパーやどこにも載っていないからです。テック企業が人を解雇し、人を解雇し、HPが人を解雇しています。これは主要ニュースでしたが、McKinseyではない。理由は、彼らは人々にこれが起こっていることを本当に知ってもらいたくないからですが、これが避けられないことも理解しています。そしてAIがますます多くの仕事をしています。
これはあらゆる業界の方法です。今日はコンサルタントとクリエイティブ、コピーライター、映画業界ですが、来年とその翌年は基本的に何でもすべてになるでしょう。
それを変化の波と呼びます。言い換えれば、この相棒を見てください。ここにあります。もちろんこれは読めない人のためのオランダ語です。豊かさの波と翻訳されます。私の今後の本のタイトルです。
10月にリリースされるのではなく、9月にすでにリリースされます。ここに最終的なカバーがあります。私はカバーに非常に満足しています。見ることができるように、画像の真ん中に小さなシンギュラリティサーファーがいます。
変化の波が見えます。私が本で説明する5つの変化の波、5つの豊かさの波があります。5番目は人間の変化で、したがってシルエットです。私はカバーにとても満足しています。Aliana Costraによって作成されました。
Alianaさん、これをやってくれてありがとうございます。現在予約販売中なので、リンクを含めます。予約注文でき、ロックの準備ができています。
非常にクール。群衆の先を行きたく、コピーを手に入れたいか、この超未来の有名な作家からサインを手に入れたいなら、もちろん6月11日来週のAIマスタークラスに来るべきです。
そこに行きましょう。まあ、そこですでにサインはできませんが、そこでその場で注文すれば、あなたのためにサインすることを約束できます。
今日の最後のトピックです。来週6月11日になぜ人々はスケジュールをクリアすべきなのか説明してもらえますか?非常に素晴らしいアジェンダがありますが、何が違うのでしょうか?
明らかにたくさんのAIイベントがあります。Eventbriteを見たところ、今後2週間で100以上のAIイベントがあると思います。しかし、これらのほとんどが提供するもの、失礼になりたくありませんが、ほとんどは「Chetを使って金持ちになる方法を見せます」か、「Lovableを使って5秒で自分のアプリをコードする方法を見せます」のようなものです。
それらはすべて非常に単純で、非常に実践的で、非常に短期間の視点のワークショップとセッションで、非常に非常に短期間で利益を得るためのツールを与えます。それは私たちがやろうとしていることではありません。
Patrickの本も同様に、Patrickの本は豊かさの波と呼ばれています。そしてその豊かさの波は明日到着するのではありません。10年、15年先の未来に到着します。
しかし、今日からそこに到達するために、私たちはこれまで経験したことのない大規模な変化の10年全体を通り抜けなければなりません。少なくともそれが私たちの信念です。
前に言ったように、私たちはあなたに証明し示すノイズの中のシグナルを見つけようとしています。何が起こっているかを、そしてワーストケースシナリオでは、あなたがこれらの波から恩恵を受けるように何が起こっているかに備えます。驚かされて、知らない間に取られるのではなく。
私たちのビジネスリーダーのためのAIマスタークラスはすべてそれについてです。私たちの旅にあなたを連れて行き、私たちが見つけたシグナルを見せ、私たちが見るトレンドを見せ、あなた自身の結論に至るのに必要なすべての洞察を提供します。
そして、Patrickと私ですが、Patrickがこの部分をアーキテクトしたので、まず私からキーノートレクチャーを受けます。その後、洞察を行動に変換するのを助けるためにPatrickによってアーキテクトされたワークショップを行います。
インスピレーションを洞察に、洞察を行動に、そうすれば私たちのマスタークラスを去った後、何をすべきかを知ることができます。そして最後に昼食があり、最初に飲み物があり、ワークショップの後にはその場で録音されたライブポッドキャストがあり、聴衆が参加し、質問することができます。
世界で今起こっている最もクールなものとその可能性、そしてそれがあなたの未来をどのように変えるか、そしてあなたがそれで何をすべきかに完全に浸される午後全体になります。
その通りです。自分で来ることができない場合は、そこにいる必要がある同僚を考えてください。3人組で来ることができます。皆さん大歓迎です。まだ約50か60枚のチケットがあります。サインアップしてください。
何らかの理由で来ることができない場合は、少なくともこの動画を共有、いいね、コメントするか、ニュースレターに登録して、次回お会いしましょう。
今回は以上です。オランダで言うように、また後で。また後で。私たちのコミュニティに参加してください。ネットワーク内でイノベーションを起こしましょう。より明るい顔を作りましょう。


コメント