AIファインチューニング

AIニュース

DeepSeekが復活!業界を揺るがすかもしれない新AIモデル

DeepSeekが新モデルV3.2Xを発表し、長時間の複雑なタスクの実行コストを最大50%削減できると主張している。スパースアテンションという技術を採用し、重要な情報のみに焦点を当てることでコストを大幅に削減した。一方、OpenAIのSor...
LLM・言語モデル

AI研究者がすべての未来モデルを破綻させる可能性のある欠陥を発見

カーネギーメロン大学、スタンフォード大学、ハーバード大学、プリンストン大学の研究者チームが、大規模言語モデルの訓練における根本的な欠陥を発見した。「破滅的過剰訓練」と呼ばれるこの現象は、従来の「より多くのデータで長時間訓練すれば性能が向上す...