ローカル実行

2026年、CPU環境で最速のText-to-Speech登場(ボイスクローニング対応)

QTAIが開発したPocket TTSは、わずか1億パラメータの超軽量Text-to-Speechモデルでありながら、GPUを必要とせず一般的なCPUでリアルタイム音声合成が可能という画期的な特徴を持つ。Kokoroなどの既存モデルと比較し...

2026.01.14

AI音声

GoogleがリリースしたAntigravityは、コーディングエージェント時代におけるソフトウェア開発の在り方を再定義しようとする革新的なエージェント型コーディングシステムである。これまでのCLIベースやクラウド実行型のコーディングツール...

2025.11.19

Google・DeepMind・Alphabet

Googleが発表したEmbedding Gemmaは、わずか3億800万パラメータという小型サイズながら、従来の2倍のサイズのモデルに匹敵する性能を実現するAIモデルである。完全オフラインでスマートフォンやノートパソコンなどの一般的なデバ...

2025.09.09

Google・DeepMind・Alphabet

この動画はAppleが新たにリリースしたオープンソースのビジョン言語モデル「Fast VLM」について解説している。このモデルは従来のLLaVA-1.5と同等の性能を持ちながら、初回トークン生成時間において85倍高速化を実現している。特筆す...

2025.08.30

Apple・ティムクック

MicrosoftからリリされたVibeVoiceという15億パラメータのオープンソースTTS（テキスト音声合成）モデルについて解説している。このモデルはNotebookLMのようなポッドキャスト形式の音声を生成でき、複数話者による表現豊か...

2025.08.26

Microsoft・Azure・ビルゲイツ

Googleが新たにリリースしたGemma 3 270Mは、わずか2億7000万パラメータの超小型LLMである。このモデルはスマートフォンやラズベリーパイなどのエッジデバイスでローカル実行が可能で、Pixel 9 Proでは25回の会話でバ...

2025.08.15

Google・DeepMind・Alphabet