MBZUAI

LLM・言語モデル

新しい中国のAIモデルがDeepSeekを破壊:100倍の威力

この動画は、BYUとMBZUAIという2つの研究機関が発表した画期的なAI推論モデルについて解説している。BYUのA3Bは210億パラメータの混合専門家モデルで、各トークンに対して30億パラメータのみを活性化することで効率性を実現している。...