トークナイザー

ソフトウェア開発・プログラミング

TOON:「AIのためのJSON」(本当に良いのか?)TuneとJSONプロンプティングの検証

JSONプロンプティングは大規模言語モデルに構造化された指示を与える手法として注目されてきたが、実際にはトークン数が大幅に増加し、必ずしも効率的ではないという問題がある。この動画では、JSONの代替としてトークン指向オブジェクト表記法「Tu...
LLM・言語モデル

DeepSeekがLLMを終わらせた

DeepSeekが発表した新しいOCR技術は、視覚的コンテキストを最大20倍圧縮しながら97%の精度を維持できるという革新的なものである。この技術は、大規模言語モデルが抱える主要なボトルネック、すなわちメモリ制限、訓練速度、コンテキストウィ...
AIベンチマーク

OpenAI対DeepSeek対Qwen:オープンソースLLMアーキテクチャ比較

この動画では、OpenAIが5年ぶりにリリースしたオープンソースモデル「GPT-o1」と、中国のDeepSeek V3、アリババのQwen 3という3つの主要なオープンソース大規模言語モデルのアーキテクチャを詳細に比較している。各モデルの混...