自己学習AI

AI研究

自己学習AI:新しい強化学習で加速する

本動画では、自己学習型AIにおける新しい強化学習アルゴリズムを紹介する。従来の自己精錬トレーニング(SRT)は、AIモデルが自ら質問を生成し、回答し、自己評価するという理想的なアプローチだが、ポリシー崩壊とエントロピー崩壊という2つの致命的...
AIニュース

AIが全てを作る時代、『人間的な奇妙さ』だけが重要になる

本動画は、イーロン・マスクがWes Rothの投稿に直接返信し、株式市場で優れた成績を収めていた謎のAIモデルがGrok 4.2の実験版であることを明かしたエピソードから始まる。AI技術の最新動態として、人間の眼球のように動作するロボット視...