評価システム

AIコーディング・Vibe-Coding

Andrej Karpathyが「遅れている」と感じる理由(そしてそれがあなたのキャリアにとって何を意味するか)

Andrej Karpathyが「プログラマーとしてこれほど遅れを感じたことはない」と発言したことを起点に、AI時代における技術的レバレッジの根本的な変化を解説する。従来のエンジニアリングは「正確な指示を書くこと」が中心だったが、現在は「確...
AIエージェント

ビルドアワー: AgentKit

本動画は、OpenAIが提供するAgentKitの包括的なデモンストレーションである。AgentKitは、AIエージェントの構築、デプロイ、評価を統合的に行うプラットフォームであり、従来数ヶ月を要していた複雑なエージェント開発を劇的に効率化...
OpenAI・サムアルトマン

大規模なエージェントのオーケストレーション

OpenAIの開発チームがエージェントキットという新しい開発プラットフォームを発表した。このツールセットは、エージェントワークフローの構築、デプロイ、最適化を統合的に行える環境を提供する。エージェントビルダーではドラッグアンドドロップでビジ...
GPT-5

OpenAIがGPT-5の嘘を暴露:あなたが思う以上に多いが、修正可能

この動画は、OpenAIの最新研究論文をもとに、AI言語モデルにおける「幻覚(ハルシネーション)」問題の根本的な原因と解決策について詳しく解説している。研究では、現在の評価システムが「わからない」と答えることよりも推測を奨励する構造になって...
OpenAI・サムアルトマン

ビルドアワー:強化ファインチューニング

この動画は、OpenAIのBuild Hoursシリーズの一環として、強化ファインチューニング(RFT)の実践的な応用について詳しく解説した技術セッションである。法的文書の分類タスクを例に、RFTの設定方法から実際のトレーニング、評価までの...