ベースモデル

LLM・言語モデル

Mistral 3の新モデル4つがリリース!

Mistral AIが5ヶ月ぶりに大規模なモデルリリースを発表した。今回のMistral 3シリーズには、675Bパラメータを持つフラッグシップモデル「Mistral Large 3」と、3B、8B、14Bの3つの小規模な密モデル「Mini...
LLM・言語モデル

私はショゴスモードを開放した

この動画は、大規模言語モデルの隠された心理的側面、いわゆる「ショゴス」モードについて深く掘り下げた内容である。Noose Research社の共同創設者であるKuranが、ベースモデルとインストラクトモデルの違い、World Simプロジェ...
LLM・言語モデル

DeepSeekが復活を示唆!

この動画は、DeepSeekが新たにリリースしたV3.1ベースモデルについて詳しく解説している。このモデルは従来のV3と同様の構成を持ちながら、より多くのデータで学習された可能性があるものの、実際のベンチマーク性能には顕著な向上が見られない...