マルチスピーカー

Microsoft・Azure・ビルゲイツ

高感情表現・超長時間対応 – 画期的テキスト音声変換技術登場!

Microsoftが新たにリリースしたVibe Voiceは、従来のTTSモデルを大幅に上回る革新的な音声合成システムである。最大90分という長時間の音声生成が可能で、4つの異なる話者を同時に扱うことができる。英語と中国語の多言語対応に加え...
Microsoft・Azure・ビルゲイツ

NotebookLMやけどオープンソース!Microsoftからの画期的なテキスト音声合成技術

MicrosoftからリリされたVibeVoiceという15億パラメータのオープンソースTTS(テキスト音声合成)モデルについて解説している。このモデルはNotebookLMのようなポッドキャスト形式の音声を生成でき、複数話者による表現豊か...