AI音声合成

Microsoft・Azure・ビルゲイツ

Microsoftの新AIはリアルタイムの60倍速を実現しトップモデルを凌駾する

Microsoftが自社開発したAIモデル「MAI Transcribe 1」「MAI Voice 1」「MAI Image 2」を発表した。これらはそれぞれ音声認識、音声合成、画像生成を担当し、業界トップクラスの性能と攻撃的な価格設定で競...
Microsoft・Azure・ビルゲイツ

NotebookLMやけどオープンソース!Microsoftからの画期的なテキスト音声合成技術

MicrosoftからリリされたVibeVoiceという15億パラメータのオープンソースTTS(テキスト音声合成)モデルについて解説している。このモデルはNotebookLMのようなポッドキャスト形式の音声を生成でき、複数話者による表現豊か...