ARC-AGI

*重要記事

AGI実現への道:Francois CholletとSam Altmanが語る未来

OpenAIのSam AltmanとARC-AGI開発者Francois Cholletが、AGI到達に向けた現状と課題について語った対談である。両者は父親としての視点から、子どもたちが育つAI時代の未来像を議論し、人間の適応力への信頼を示...
AIベンチマーク

本当に重要なAIベンチマークはこの4つだけ

新しいAIモデルが登場するたびに大量のベンチマーク指標が提示されるが、その多くは一般利用者にとってもAI業界の人間にとっても実際には大した意味を持たない、というのがこの動画の主張である。本動画では、その中でも本当に見る価値が高い4つの指標だ...
AI研究

ファインチューニングに代わる強力な選択肢

Poeticの共同創業者兼共同CEOであるイアン・フィッシャーが、ファインチューニングに代わる革新的なアプローチを語る。同社が開発する再帰的自己改善型AIシステムは、既存の大規模言語モデルの上に構築される「高床式」のアーキテクチャにより、数...
OpenAI・サムアルトマン

2028年にAGI到来?Sam Altmanがタイムラインを更新した

Sam AltmanがインドのAIサミットで「真の超知性まであと2年程度」と発言したことを受け、AGIの到来タイムラインをめぐる議論が加速している。本動画では、Altmanの発言の背景にある技術的データを検証しつつ、Dario Amodei...
Google・DeepMind・Alphabet

Gemini 3.1 Pro 発表

GoogleがGemini 3 Proのリリースから約100日という節目に、新たなマイナーアップデートとなるGemini 3.1 Proを発表した。本動画では、同モデルのベンチマーク改善点、Gemini Deep Thinkからの技術的知見...
Anthropic・Claude・ダリオアモデイ

新しい Claude Cowork が PC 上であらゆる作業を実行、そして超知能が数学分野に到来しつつある

Anthropic社が新たにリリースした Claude Cowork は、単なるチャットアシステントの域を超えた、真の協働パートナーとしての機能を持つ。ユーザーは自身のコンピューター上のフォルダを共有し、ファイルの整理、要約作成、タスク管理...
AGI・ASI

AGIへの次なるステップ

本動画では、AIのスケーリング則が限界を迎えているという主張と、実際のAI能力が加速度的に向上しているという事実の間にある矛盾を解き明かしている。従来の「スケールがすべて」というパラダイムから、テスト時計算、アーキテクチャ革新、エージェント...
GPT-5

GPT-5.2:OpenAIの逆襲

OpenAIが新たにリリースしたGPT-5.2は、多くのベンチマークで記録を更新し、GDP-Valにおいて人間の専門家レベルに到達した初のモデルとなった。しかし、最先端のパフォーマンスを発揮するには、より多くのトークンを思考に費やす必要があ...
Google・DeepMind・Alphabet

Gemini 3で創る絵本の世界 – AIによるイラストレーション制作とAI知能テストの最高記録、そして映画界のAI活用

本動画では、GoogleのGemini 3とImagen 3(通称Nano Banana)を組み合わせた絵本制作の実践的な手法を紹介している。わずか10ページの児童向け絵本「感情の缶詰市場」を完全にAIで生成する過程を詳細に解説し、キャラク...
Anthropic・Claude・ダリオアモデイ

AnthropicがAI競争でGoogleを追い越したのか?!

Google が Gemini 3 をリリースしてからわずか1週間後、Anthropic が Claude 4.5 Opus で応戦した。このモデルはコーディング、エージェント機能、コンピューター使用において世界最高と称され、一部の領域では...
AIベンチマーク

「知能をどう測定するか?」6名の研究者による討論

本ディスカッションは、知能の定義と測定方法をめぐって6名の研究者が白熱した議論を展開したものである。幼児発達研究者のローラは、現在のAIが深く「反発達的」であり、子どもが示す遊びや思考の豊かさを捉えきれていないと指摘する。一方、ARC-AG...