Gemini 2.5

新しいGeminiテキスト読み上げ

GoogleのGemini 2.5に搭載されたテキスト読み上げ(TTS)機能は、大規模言語モデル上に構築された音声生成システムである。従来の専用音声モデルに匹敵する品質を持ちながら、自然言語で音声効果を記述するだけで複雑な表現が可能となる。...

2025.12.20

Google・DeepMind・Alphabet

本動画は、最新のAI研究において明らかになったマルチエージェントシステムにおける重要な課題を解説するものである。GPT-5やGrok 4といった最先端の大規模言語モデルが単独では高いパフォーマンスを示す一方で、複数のエージェントが協調して問...

2025.11.08

AI研究

Google DeepMindが発表したCode Menderは、オープンソースプロジェクトのセキュリティ脆弱性を自動的に発見し修正するAIシステムである。わずか6ヶ月で72件の検証済みセキュリティ修正を実装し、最大1,200万行のコードを...

2025.10.09

Google・DeepMind・Alphabet

Googleが新たにリリースしたGemini 2.5 Computer Useモデルは、ユーザーのコンピュータをリモートまたはローカルで制御し、様々なタスクを自動実行できる専用モデルである。OpenAIのOperatorモデルやClaude...

2025.10.09

Google・DeepMind・Alphabet

本動画では、Googleが正式にリリースしたGemini 2.5 Flash Image Preview（通称「Nano Banana」）の画像生成機能について詳細な検証を行っている。物理法則や時間の概念を理解した画像生成、人物の一貫性維持...

2025.08.27

Google・DeepMind・Alphabet

GoogleがGemini 2.5シリーズの安定版を一般公開し、新たにGemini 2.5 Flash Lightモデルも導入した。この動画では、Googleが公開した技術レポートを詳細に解説し、モデルの構築方法、データ選択、事前・事後訓練...

2025.06.18

Google・DeepMind・Alphabet

この動画は、AI業界における最新の重要な動向を包括的に解説している。Mistralの初の推論モデルのリリースとその圧倒的な処理速度、11 LabsのV3 alpha音声モデルの表現力向上、OpenAIの新しい音声モードの人間らしさ、Gemi...

2025.06.13

AIニュース