この動画は、ポッドキャスト制作者が自身の声をAIで複製し、実際のエピソード制作に活用した体験談である。Beyond the Forgeというポッドキャストのスピンオフシリーズ「Digital Toolbox」の最初の2エピソードで、11Labsというサービスを使用して作成したAI音声クローンを使用したが、リスナーは気づかなかったという興味深い実験記録となっている。時間節約と技術への興味を両立させた革新的なコンテンツ制作手法を紹介している。

デジタルツールボックスでの告白
皆さん、こんにちは、調子はいかがですか。現在移動中のため、いつもとは少し違ったことをしようと思っています。車の中にいることをご了承ください。音声のクリーニングはできる限り頑張りますが、とりあえずご視聴いただきありがとうございます。
Beyond the Forgeというポッドキャストをフォローしてくださっている方々に、心から感謝申し上げます。ありがとうございます。このポッドキャストは妻のShantelと共同でホストしており、幸福、偉大さ、成功の追求を通じて人々が経験する精神的な健康と困難を扱うトピックで定期的なエピソードを制作しています。
私たちは表面的な層を剥がして、生々しく、深く、フィルターなしで掘り下げていき、背後にある人間的側面、人間の要素を本当に活用しようとしています。ビジネスオーナー、起業家、あるいは人生で何かを達成した人であろうと、私たちはそれらの層を剥がして、彼らを鍛え上げた炎の中で何を経験したか、何をしなければならなかったか、どんな苦労をしたか、人生で今の地位に到達するためにどんな犠牲を払ったかを本当に深く掘り下げています。
デジタルツールボックスの始まり
私はスピンオフシリーズを始めました。それがデジタルツールボックスです。Beyond the Forgeデジタルツールボックスは、まだ数エピソードしかありませんが、テクノロジーの風景と私たちが向かう方向、未来への短い、より短いエピソードでの素早い深掘りを内容としています。その一部はAIに関係しています。
デジタルツールボックスの最初のエピソードでは、ClaudeとChatGPTの違いについて取り上げました。OpenAIの主力製品対Anthropicのフラッグシップ製品の比較です。私は以前両方のプロ版を購入して使い込んでいて、数ヶ月おきに新しい機能のリリースが出てくるようです。どちらのプラットフォームにも確実に長所と短所がありますが、どちらを使うか、何に使うか、どのように恩恵を受けるかによって変わってきます。
最初のエピソードのデジタルツールボックスでは、私の経験に基づいてこれらのプラットフォームを比較対照しました。私はデータサイエンス分野にいるので、Pythonスクリプトの構文をチェックしたり、トラブルシューティングを少し楽にしたりすることが、私にとって大いに役立っています。これまでのところ、Claudeが私には効果的なので、それについて言及しました。それが、少なくとも私の使用例においてChatGPTよりもClaudeを多少好む理由です。
AIテクノロジーの進歩と未来
これは明らかに私個人の話で、誰もが違うでしょうが、これらのAIツール、生成AI、大規模言語モデル、そして私たちが深層学習とこれらのアーキテクチャの上に構築されたニューラルネットワークをどのように活用しているかは、拡大し続けて、より高度なテクノロジーを活用できるようになるにつれて、私たちにより多くの機会を提供するでしょう。
デジタルツールボックスの2番目のエピソードでは、AIの未来とそれがデータ専門家にとって何を意味するかについて、もう少し詳しく説明しています。私のキャリア分野や類似のキャリア分野の人々、データアナリスト、ビジネスアナリストについてもう少し詳しく話し、データエンジニアの力が、エントリーレベル、ジュニア、ミッドレベルのデータ系分野にいる人々にとって非常に価値あるものになると私が信じている理由について説明しています。
新しいスキルを学びたくない人々は、何かを考えなければなりません。なぜなら、次の5年から10年で、AIが機能の大部分を提供するためにアウトソーシングされるからです。
2025年はエージェンティックAIの年
2025年はエージェンティックAIの年です。私が言いたいのは、非常に特定のタスクのために構築されたカスタムAIエージェントのことで、多くの企業がエージェンティックソリューションに投資しています。そこから構築が続いているので、勢いは増しています。2026年に向けて継続的に積み重ねられていく中で、進化を目にすることになるでしょう。
衝撃的な告白
私がデジタルツールボックスの両エピソードについて言及したかったのは、告白があるからです。それは実際には私の声ではありませんでした。
明確にしておきますが、それは確かに私の声でしたが、実際に私が話していたわけではありませんでした。私はスクリプトを書いて、私の声に残りをやらせました。もう一度、どういう意味かと言いますと、私は自分のAI音声クローンを構築しました。
音声クローンに私の声、私の声の音、トーンを複製させることができました。28分間のクリップで訓練し、私が直接トレーニングモデル自体に実際に話しかけることで貢献することができました。そして、私の声が複製されて、もう少し自然に聞こえるような方法でそれを立ち上げることができました。
完璧ではありません。少なくとも私には、私がどのように聞こえるか、どのように話すか、私の声が実際に何を放っているか、そして強調された言葉に関して、少しニュアンスがあることに気づきます。
実験の目的
私が本当にやりたかったのは実験でした。だからそれをやったのです。私は話すことさえなしにポッドキャストを作成できるかどうかを見たかったのです。そして、それがまさに私がやったことです。デジタルツールボックスとなったいくつかのエピソードを制作しました。
ですから、これはおそらくデジタルツールボックスの3回目の記事への良い導入になると思います。ここに私がいます。これは実際に私です。これは今回はAIではない私の本当の声ですが、Beyond the ForgeポッドキャストのDT01と02がすべてAI生成だったことをお伝えするためです。
11 Labsの活用
これをどのように行ったかというと、これを行うことができるいくつかの異なるタイプのアプリケーションがあります。私が特に好んでいるのは11 Labsと呼ばれるものです。
11 Labsは、私が現在使用しているもので、お気に入りのようです。過去数ヶ月でかなり良くなっており、実際に多くの音声モデルの拡張を制作しています。実際に選択できる多くのものがあります。
Google Notebook LMとの比較
音声クローンを最初に調べ始めたとき、最初にGoogleのNotebook LMを調べました。かなりまともな仕事をしていると思います。Notebook LMのアプリの音声はかなり自然に聞こえ、いくつかの言葉を取ってそれを使って実行する方法が気に入りました。AIを使用してスクリプトを生成し、2人のホストが行き来するポッドキャストのようになります。それはかなり素晴らしいと思いました。
すぐに分かったことは、一つには無料であり、無料版を使用している人は誰でも同じ音声または同じ音声を取得するということです。共同ホスティングポッドキャストデュオとして行き来する男性と女性の音声があります。多くの人がやっているように見えることは、これらのポッドキャストエピソードを制作したり、YouTubeにアップロードしたりすることです。彼らは異なることについて話しますが、同じ音声になります。
数ヶ月後の現在、同じ音声を使用した何千ものメディアクリップがそこにあります。それらはかなり区別しやすいです。私はそのうちの一人になりたくありませんでした。なぜなら正直なところ、私は何か違うものを探していました。実際に、もう少しユニークだと思うものを制作できるかどうかを見て、より良い体験を本当に微調整するために何ができるかを見たかったのです。
11 Labsでの音声クローン制作
そこで11 Labsの出番です。11 Labsを使用して、私は自分の音声クローンを複製することができますが、事実上あらゆる種類の目的に使用できる多くの異なる音声である様々な他のオプションがあります。
最初に私はポッドキャストのイントロを行う音声を探していて、実験を始めました。Beyond the Forgeで聞くものは、トレイラーと私たちが持っている最初の数エピソード、特に私の妻と私が共同ホストしていて、これまでにいくつかのインタビューを行ったものでは、イントロが深いブーミングな音声で目立っていることに気づくでしょう。スポーツキャスターのような中年男性の音声のように聞こえ、そこで本当に素晴らしい仕事をしていると思います。
私たちのエピソードにクリップを添付するたびに、私を少し困らせることが一つありました。それは私たちの名前の発音でした。大したことではありませんでしたが、少し気になりました。妻もそれに気づきました。だから自然に何か違うものに向かいたくなりました。
改良されたイントロの制作
Shantelと私が行った最後のエピソードで、私は11 Labsに戻り、今度は私の音声クローンを使用しました。イントロに私の音声の複製を使用しました。同じ言葉で、それらを変更しませんでした。今回は異なる音楽を追加しましたが、全体的にすべて同じに保たれました。だから私はその音声を私の音声クローンに置き換えました。正直なところ、実際に私はそれを好みます。気に入っています。より自然に聞こえ、より私たちからのもののように聞こえます。
それを維持することは、ポッドキャストの将来の反復と記事を通じて、もう少し良い価値を提供すると思います。
時間管理と自動化の価値
ポッドキャストの将来の反復と記事と言うとき、これが価値を提供する場所はまさにそれが意味するところです。なぜここでそれを使わないのでしょうか。
私は日中あまり時間がありません。かなり忙しく、家族の男で、仕事もあり、また副業で小さなビジネスを多少運営していて、いくらかの仕事をしています。そして、このポッドキャストをするのも楽しんでいます。
そうは言っても、私が楽しむことのために確実に時間を確保したいと思います。それは重要だと思います。しかし、それを行うためには、それについて賢くなければなりません。時間を見つけなければなりません。
ここやあそこで時間を見つけるということだけではありません。ここで30分、そこで1時間、45分確保できることもありますが、多くの場合、私たちにとって物事がどれほど慌ただしくなるかのために、それが私を通り過ぎて行くように見えます。だから私が調べ始めたのは、そのアプローチをもっと自動化しようとすることでした。なぜそうしないのでしょうか。
完全な透明性の約束
今後、私のように聞こえるAI生成音声を使用している時は、特に完全な開示を行います。私は将来のいくつかのエピソードで私の音声クローンを使用するでしょうが、それが最終的に私の時間を節約するためであることを知ってください。
コンテンツは同じで、言葉は私から来ます。私はできる限り最善に私の考えを入力しようとし、それから私の音声クローンにそれについて話させます。そして、それが話している間、私は自分の用事を続けることができ、後で見直すことができる時にそれをレビューして、それを押し出します。
それがアイデアです。それは時間を節約しているだけではありませんが、実際楽しいです。私はこの種のものが好きです。だから、それは少しの両方だからです。AIがあり、テクノロジーで遊び、ポッドキャストもしています。それは私のエンドルフィンレベルを上げて、そのアプローチでそれらの終わりの両方を達成しています。
使用実績の開示
DT01とO2デジタルツールボックスBeyond the Forgeから、それは私の音声クローンです。そして、Beyond the Forgeの新しいイントロは、私とShantelが制作した最近のエピソード、エピソード05「After the Storm」で使い始めたところです。それに私の音声クローンを使用しました。
もし皆さんが興味を持ったり、他に質問があったりした場合は、コメントに気軽に書き込んでください。また、ショーノートに追加のリンクも提供します。私のニュースレターに参加していただければ、皆さんにいくつかのヒントやコツを投げかけることができます。そして、皆さんのためにそれをしたいと思います。私ができることを提供し、それが皆さんにとって価値あるものになることを願っています。
とにかく、私は最終目的地に到着しているところです。ドライブ中に皆さんとこれを作成してチャットするのは素晴らしかったです。将来このようなもの、ドライビングポッドキャストを試してみるかもしれません。それまで、皆さん、安全でいてください。また会いましょう。


コメント