視覚理解

AI研究

Metaのヤン・ルカンが「LLMは終わった」と宣言:すべてを変える「推論」AIの登場

MetaのAI研究所FAIRを率いるヤン・ルカンが、大規模言語モデル(LLM)のスケールアップだけでは人間レベルのAIに到達できないと断言した。彼のチームが開発したVLJPAは、従来の単語ごとの生成方式とは一線を画す革新的なモデルである。J...
Google・DeepMind・Alphabet

リリースノート:Geminiのマルチモーダル機能

この動画は、GoogleのGeminiにおけるマルチモーダル機能について詳しく解説したものである。Geminiのマルチモーダル・ビジョン製品リードであるAni Baddepudiが、テキスト、画像、動画、音声を統合的に理解する単一モデルとし...