推論最適化

NVIDIA・ジェンスンフアン

GPU時代の終焉

世界最高の時価総額を誇るNvidiaだが、その地位は長くは続かないかもしれない。AnthropicがGoogleのTPUへ移行し、OpenAIがCerebrasと提携し、MetaもGoogleのTPUを利用し始めている。Nvidia自身さえ...
AI研究

最高の知能を得るために文脈を削減せよ。なぜか?

本動画は、大規模言語モデルと視覚言語モデルの推論性能を向上させるための革新的なアプローチを提示している。従来の常識である「より長い文脈がより高い知能を生む」という概念に挑戦し、逆に文脈を削減し圧縮することで推論品質が劇的に改善されることを示...
OpenAI・サムアルトマン

OpenAIが8億人の週間ユーザーに向けて構築する方法:モデル特化とファインチューニング

OpenAIの開発者プラットフォーム責任者シャーマン・ウーが、同社の製品戦略と技術的進化について包括的に語る。毎週8億人が利用するChatGPTという垂直統合型アプリケーションと、広範な開発者エコシステムを支えるAPI事業という水平展開の両...