ポストトレーニング

GPT-5.1におけるモデルの振る舞いの形成 — OpenAIポッドキャスト第11回

本動画では、OpenAIの研究リーダーであるChristina KimとプロダクトマネージャーのLentia Ramenが、GPT-5.1の開発における重要な進化について語っている。今回のリリースで初めて、ChatGPTの全モデルが推論モデ...

2025.12.03

GPT-5

Anthropicの最新論文は、大規模言語モデルが単なる次のトークン予測器以上の存在である可能性を示唆している。本研究では、AIが自身の思考を認識し、外部から注入された思考と区別できる能力を検証した。実験の結果、Claude 4 Opusな...

2025.11.03

Anthropic・Claude・ダリオアモデイ

この動画では、AIチャットボットが異なる性格を持つ理由について解説している。各AI企業は基本的に同じ訓練データを使用しているにも関わらず、ChatGPT、Claude、Gemini、Grokなどが大きく異なる性格を示すのは、訓練データではな...

2025.09.01

AIアライメント・安全性

この動画では、OpenAIが5年ぶりにリリースしたオープンソースモデル「GPT-o1」と、中国のDeepSeek V3、アリババのQwen 3という3つの主要なオープンソース大規模言語モデルのアーキテクチャを詳細に比較している。各モデルの混...

2025.08.30

AIベンチマーク

本動画では、大規模言語モデルの事後訓練における画期的な発見について解説している。教師あり微調整と強化学習の性能比較実験により、教師あり微調整が数学的推論能力を向上させる一方で破滅的忘却を引き起こし、一般的知識を大幅に損失させることが明らかに...

2025.07.05

AI研究

今日は、OpenAIの共同創設者の一人であり、ポストトレーニングチームを率いるジョン・シュルマンとお話しする機会をいただきました。彼はChatGPTの開発を主導し、PPOを含むAIとRLの重要な論文の多くの著者でもあります。ジョン、本日はお...

2024.05.16

AGI・ASIAIアライメント・安全性