LLM・言語モデル

Deepseek が AI 業界全体を破壊した… (何かが起こっている)

この動画は、DeepSeekの新しいR1モデル「R1-0528」がAI業界に与える衝撃について論じた内容である。このモデルは従来のOpenAIベースの学習からGeminiベースの学習に切り替えたとされ、性能面でGemini 2.5 Proに...

2025.05.31

LLM・言語モデル

GoogleのGemini Diffusionは、従来の自動回帰的なテキスト生成とは異なる拡散モデルベースのアプローチを採用した実験的なモデルである。毎秒800トークンという高速生成が可能で、全てのトークンを並列生成し、エラーを部分的に修正...

2025.05.31

Google・DeepMind・AlphabetLLM・言語モデル

本稿は、Cursorにおける超人的なコーディングモデルの訓練について議論したものである。強化学習をコーディング領域に適用する際の特異性として、数学問題と異なり行動空間が大きく、複数ツールの呼び出しが必要であること、テストによる検証の限界とコ...

2025.05.30

LLM・言語モデルソフトウェア開発・プログラミング

中国のDeepSeekが最新のR1モデルアップデートにより、わずか600万ドルの予算でGemini 2.5 ProやOpenAIのo3といった最先端AIモデルと同等の性能を達成した。価格性能比では他社を圧倒的に上回るが、米国政府は国家安全保...

2025.05.30

LLM・言語モデル

DeepSeekが新たにリリースしたR1の大幅アップデート版は、OpenAIのo3やGemini 2.5 Proに匹敵する性能を実現し、オープンソースモデルとしてはクローズドソースの最先端モデルに肩を並べる画期的な進歩を見せている。特に数学...

2025.05.30

LLM・言語モデル

本動画では、Claude 4およびGemini 2.5モデルが専門家混合（MoE）アーキテクチャを採用している可能性について、独自のベンチマークツール「Chuck LLM」を用いて検証している。トークン毎秒生成数と初回トークン生成時間を指標...

2025.05.28

AIベンチマークLLM・言語モデル