LLM・言語モデル

LLM・言語モデル

Deepseek が AI 業界全体を破壊した… (何かが起こっている)

この動画は、DeepSeekの新しいR1モデル「R1-0528」がAI業界に与える衝撃について論じた内容である。このモデルは従来のOpenAIベースの学習からGeminiベースの学習に切り替えたとされ、性能面でGemini 2.5 Proに...
Google・DeepMind・Alphabet

Gemini Diffusionは驚異的な速さ—しかし思っているものとは違う

GoogleのGemini Diffusionは、従来の自動回帰的なテキスト生成とは異なる拡散モデルベースのアプローチを採用した実験的なモデルである。毎秒800トークンという高速生成が可能で、全てのトークンを並列生成し、エラーを部分的に修正...
LLM・言語モデル

Cursorにおける超人的なコーディングモデルの訓練

本稿は、Cursorにおける超人的なコーディングモデルの訓練について議論したものである。強化学習をコーディング領域に適用する際の特異性として、数学問題と異なり行動空間が大きく、複数ツールの呼び出しが必要であること、テストによる検証の限界とコ...
LLM・言語モデル

DeepSeek R1 0528:すべてを変えたAIの衝撃

中国のDeepSeekが最新のR1モデルアップデートにより、わずか600万ドルの予算でGemini 2.5 ProやOpenAIのo3といった最先端AIモデルと同等の性能を達成した。価格性能比では他社を圧倒的に上回るが、米国政府は国家安全保...
LLM・言語モデル

DeepSeek R1に大幅アップデート!(o3レベルのモデル)

DeepSeekが新たにリリースしたR1の大幅アップデート版は、OpenAIのo3やGemini 2.5 Proに匹敵する性能を実現し、オープンソースモデルとしてはクローズドソースの最先端モデルに肩を並べる画期的な進歩を見せている。特に数学...
AIベンチマーク

Claude 4: MoEモデル?

本動画では、Claude 4およびGemini 2.5モデルが専門家混合(MoE)アーキテクチャを採用している可能性について、独自のベンチマークツール「Chuck LLM」を用いて検証している。トークン毎秒生成数と初回トークン生成時間を指標...