Google、OpenAIのGPT-5を痛烈批判:「これは恥ずかしい!」

AI競争
この記事は約14分で読めます。

OpenAIの研究者が「GPT-5が未解決のエルデシュ数学問題を10個解決した」と発表したが、実際にはAIは問題を解いたのではなく、既存の解答論文を検索しただけだったことが判明した。エルデシュ問題データベースの管理者トーマス・ブルームが「問題は既に解決済みで、自分が知らなかっただけ」と指摘し、Google DeepMindのCEOデミス・ハサビスが「これは恥ずかしい」と公開批判する事態となった。この事例は、AI業界における誇大広告の問題と、革新的な成果と既存情報の検索能力を混同する危険性を浮き彫りにしている。

Google SLAMS OpenAI's GPT-5: This Is EMBARASSING!
Want to stay up to date with ai news - 🐤 Follow Me on Twitter 🌐 Checkout My website - http...

OpenAIの衝撃的な発表とその実態

GoogleがOpenAIの最近の発見を恥ずかしいと呼びました。その話をしましょう。基本的に、ChatGPTを作っている会社であるOpenAIの研究者たちは、何か画期的なこと、革命的なことをやったと思って話していたんです。彼らはここで祝福し、シャンパンのボトルを開けていました。そして残念なことに、結局彼らは基本的にGoogleの高度な検索を使っただけだったことが判明したんです。

そして私は大げさに言っているわけでもありません。これはマーク・サルクという人物から始まります。彼はOpenAIで働いていて、この大きな発表をツイートしました。彼は「アップデート:私と同僚のマタブは、これに一生懸命取り組んできて、何千ものGPT-5クエリを使って、オープンとしてリストされている10のエルデシュ問題の解決策を見つけました」と言っているんです。

エルデシュ問題が何か分からなくても心配しないでください。説明します。ポール・エルデシュは有名な数学者で、文字通り生涯を旅して過ごし、他の数学者の家に泊まって数学の問題をやっているだけでした。この人は永住する家すら持っていませんでした。彼はスーツケース一つで生活し、基本的に24時間365日数学をやっていたんです。

ある種の数学界の伝説ですが、クレイジーですよね。とにかく、この人は何百もの未解決の数学問題を考案しました。これらは専門の数学者が何十年も解こうとしてきた問題です。そしてその中には賞金がついているものもあります。解けば数千ドルもらえるんです。

そしてもちろん、これらは難しい問題です。博士号レベルの、キャリアを作るタイプの問題です。マークは基本的に、GPT-5を使ってこれらのオープンな問題を10個解いたと主張していました。そして彼は番号を挙げています。223番、253番、339番、494番などです。そして彼は言います。「さらに11の問題について、GPT-5は重要な部分的進展を遂げました」と。彼はGPT-5が助けになったとされる具体的な問題番号まで挙げています。32番、167番、そして他にもたくさんです。

さて、この部分が重要です。彼は最後にこの小さな爆弾発言を落とします。「問題827については、エルデシュの元の論文には実際に誤りが含まれていました」と言うんです。そしてマルティネスとラルダン・ペンサドの研究がこれを説明し、明確にしていますと。つまり、彼はここで問題を解決したと主張するだけでなく、元の研究に誤りを見つけたとも言っているんです。これはもちろん非常に大きな主張です。

さて、ここから祝福の話になります。セバスチャン・ブベックという別の研究者、彼もAI分野で働いているんですが、このツイートを見て、もちろん興奮します。彼はそれを引用リツイートして「AIによる科学の加速が正式に始まった。2人の研究者がGPT-5の助けを借りてエルデシュ問題の解決策を見つけた」と言います。

そして彼は追伸をつけます。「PS:マーク・サルクがOpenAIに入社したことを発表する良いタイミングかもしれません」と。つまり、もちろんOpenAIは基本的に祝っているんです。彼らはこれを採用発表として使っているんです。そして基本的に「見てください、私たちのAIがどれほど素晴らしいか。何年も数学者たちを困惑させてきた問題を解決しているんです。ところで、それをやる方法を見つけた天才を雇ったばかりです」と言っているわけです。

Google DeepMindからの痛烈な批判

さて、ここからタイトルがクリックベイトではなくなり、事態が少しスパイシーになります。デミス・ハサビス。この人は大物です。これはGoogle DeepMindを運営している人で、GoogleのAI部門であり、OpenAIの主要な競合です。そして彼はたった3つの単語で応答します。

「これは恥ずかしい」

説明なし、詳しい説明なし。「これは恥ずかしい」。では、彼は実際にこれで何を意味しているのでしょうか?そして、主要な競合のCEOが「これは恥ずかしい」みたいなことを言うとき、何かがおかしいことが分かります。これは例えば、コカコーラが新しいフレーバーをリリースして、ペプシが「やばい」とツイートするようなものです。何かが確実にうまくいかなかったことが分かります。

トーマス・ブルームという人物が登場します。トーマスはただの人ではありません。彼は文字通りErdospros.comを所有し、維持管理している人で、これはこれらすべての数学問題がリストされ、追跡されている公式ウェブサイトです。彼は基本的にエルデシュ問題の図書館員です。トーマスが現実チェックを持ってやってきます。彼はこれらの興奮したツイートすべてを引用して言います。「こんにちは、Erdospros.comの所有者/維持管理者として、これは劇的な誤った表現です。GPT-5は私が個人的に知らなかった、これらの問題を解決する参考文献を見つけました。オープンステータスは、私が個人的にそれを解決する論文を知らないことを意味するだけです」と。

さて、彼が今言ったことを平易な英語に翻訳しましょう。問題は実際には未解決ではありませんでした。それらはすでに解決されていました。

トーマスは、それらを解決した論文についてまだ知らなかっただけです。なぜなら、彼はまだそれらを見つけていなかったからです。では、GPT-5は実際に何をしたのでしょうか?数学の問題を解決しませんでした。計算を何もしませんでした。新しい証明を考え出しませんでした。学術論文を検索しただけです。それだけです。これは、未解決ミステリーのリストがあって、その一つが「アメリア・イアハートに何が起こったのか?」というもので、誰かが「AIを使ってこの謎を解決しました」と言ったようなものですが、実際にやったことはアメリア・イアハートについてのウィキペディアの記事を見つけただけで、それにはすでに様々な理論が説明されていたというようなものです。

つまり、GPT-5は基本的に本当に良い文献検索をしただけです。学術データベースを調べて、数学者がこれらの問題を何年も前、あるいは何十年も前に既に解決していた論文を見つけたんです。そしてトーマスは、それらの論文に出会っていなかったので、まだウェブサイトを更新していなかっただけなんです。

トーマスはここでいくつかの文脈を追加します。彼はGPT-5が文献検索において非常に有用なツールであり、これはウェブサイトにとって価値ある追加だったと言っています。つまり、彼はGPT-5が役に立たないと言っているわけではありません。彼が言っているのは、それが実際にやったこと、つまり膨大な量の学術文献を検索して関連する論文を見つけることにおいて、非常に優れているということです。そしてそれは本当に有用です。

もしあなたが研究者で、誰かがすでにあなたの問題に取り組んでいるかどうかを知りたい場合、何千もの論文を検索できるAIを持つことは、もちろん非常に役立ちます。しかし彼は次に言います。「その文献検索能力はすでに有用で印象的なので、それがそうでないものとして説明する必要はありません」と。

そして翻訳は基本的に「あなたたちはこれを過大に売り込んでいます。これは良い検索エンジンであって、数学の天才ではありません」と言っているんです。

OpenAIにとっての恥ずかしい事態

さて、これはOpenAIにとって恥ずかしいに違いありません。考えてみてください。彼らはAIの専門家、プロのAI研究者です。これが文字通り彼らの仕事です。彼らは問題を解決することと、他の誰かがすでに解決した論文を見つけることの違いを知っているべきです。

それは基本的な研究の101のようなものです。何かを主張する前に、常に他の誰かがすでにそれを発見していないかチェックします。それは文献レビューと呼ばれ、これらの壮大な発表をする前に行われるべきなんです。第二に、彼らはこの発表を皆が見られるTwitterで公開しました。

そして彼らは静かに論文を発表して査読中に訂正されるのではありませんでした。彼らは直接ソーシャルメディアに行って祝い始めたんです。第三に、彼らはこれを採用発表として使いました。「皆さん、私たちの新入社員がどれだけ賢いか見てください。AIを使って不可能な数学問題を解決しました」と。そして結局、彼は論文を検索するためにそれを使っただけだったことが判明しました。これは全く同じ自慢ではありません。

第四に、主要な競合のCEOがそれについて公に彼らを非難しました。それは痛いに違いありません。デミス・ハサビスは実際にはあまりツイートしません。だから彼がツイートして、それがあなたの会社をダンクするためだとき、それがどれほど厳しいか考えなければなりません。そして第五に、これが決定打ですが、彼らはリストを維持している人にチェックすらしませんでした。

トーマス・ブルームはそこにいます。彼は連絡可能です。彼の連絡先情報はウェブサイトにあります。彼らは「ねえ、これらの問題の解決策を見つけました。確認してもらえますか?」というメールを送ることができました。しかし、彼らはただ早まって、Twitterに直行したと思います。

AI業界の誇大広告の問題

ズームアウトする必要があります。なぜなら、これが今AI世界での大きな問題だからです。これは今起こっている大規模な誇大広告サイクルがあるんです。AI企業は皆、お互いを常に誇大宣伝しようとしています。OpenAIが何かをリリースし、次にGoogleが何かをリリースし、次にAnthropicが何かをリリースし、彼らは皆、自分たちのAIが最も賢く、最も有能で、最も画期的であることを示そうとしています。

そしてそのレースで、時々人々は先走ります。彼らは印象的な結果を見て、最も正確な解釈ではなく、最もエキサイティングな解釈にすぐに飛びつきます。GPT-5に数学問題を与えて、それがトレーニングデータを検索して解決策がある論文を見つけたら、それはそれなりに印象的です。

AIが優れた情報検索能力を持っていることを示しています。あなたが何を求めているかを理解し、関連する学術論文を見つけることができます。研究者にとってそれは本当に価値があり、データベースを検索する何時間も何日も節約できます。しかし、既存の解決策を見つけるのが得意なのと、以前は未解決だった問題を解決できるのとの間には大きな違いがあります。

一つは有用なツールです。もう一つは革命的なブレークスルーです。さて、GPT-5が明らかにうまくできることについては、適切な評価をする必要があります。それは文献検索です。そしてそれは無視できないものです。考えてみてください。世界には何百万もの学術論文があります。あなたが数学者で問題に取り組んでいる場合、誰かがすでにそれを解決していないかどうかをどうやって知るのですか?データベースを調べ、要約を読み、参考文献をチェックし、引用を見なければなりません。これはかなり時間がかかります。

そして、もしAIがそれを効率的にできるなら、ただ「ねえ、誰かこの問題を解決しましたか?」と尋ねることができて、それが何百万もの論文を検索して「はい、これに対処する3つの論文があります」と返してくれるなら、それは有用です。それは研究者にとって本当の生産性向上です。そしてトーマスもこれを認めています。

彼はそれがウェブサイトへの価値ある追加だったと言いました。それは彼が知らなかった論文を見つけるのを助け、彼のデータベースを更新しました。しかし繰り返しますが、それは問題を解決するのと同じではありません。それは教科書の裏にある宿題の答えを見つけるようなものです。役に立ちますが、宿題をすること自体とは同じではありません。

そして、マークが問題827について、エルデシュの論文に元々誤りが含まれていることを発見したと主張したことを覚えていますか。これは少し誤解を招きます。なぜなら、GPT-5はマルティネスとラルダン・ペンサドによる論文を見つけて、それが何かを明確にしたり訂正したりしたからです。しかし、GPT-5がこの誤りを検証するために数学をしたわけではありません。他の人間がすでに気づいて修正していた論文を見つけただけです。

これは、有名な小説のタイポを発見したと主張するようなものですが、実際には誰かがすでにそのタイポを指摘していたフォーラムの投稿を見つけただけです。あなたはそれを発見しなかった、それについての議論を見つけただけです。では、なぜ人々はこのような間違いを犯すのでしょうか?理由の一つは確証バイアスだと思います。

新しいAIツールで作業していて、それが革命的であることを望んでいる場合、その結果を最も好意的な光で解釈することになります。そして、それが問題を解決する論文を生み出しているのを見て、「すごい、これらの問題を解決した」と思うわけです。それらの解決策が新しいものかどうかをより深く掘り下げることなく。そしてもちろん、今AI世界には進歩を示すプレッシャーがあります。投資家は結果を見たいし、競合他社は新しいものを発表しているし、みんな自分たちの技術が最高であることを証明しようとしています。それは発表を完全に検証する前に急ぐことにつながる可能性があります。

そしてもちろん最後のポイントは、ここには本当の誤解があるということです。数学は非常に難しく、エルデシュ問題のデータベースは複雑です。トーマスがそれを維持する方法、オープンは必ずしも人類によって未解決を意味するわけではありません。それは単に「私はまだ解決策を知りません」を意味するだけです。

そしてそれは微妙な区別です。そして、ウェブサイトがどのように機能するかに精通していない場合、それを誤解するかもしれません。しかしそれでも、もちろん専門の研究者として、彼らはもっと慎重であるべきだったかもしれません。まあ、もちろん、これがすべて明らかになった後、驚くべきことにツイートはまだ残っています。私が見る限り、公式な訂正や謝罪は発表されていません。

そして数学コミュニティとAIコミュニティはこれを大いに楽しんでいます。人々はそれを共有し、議論しています。そして、大手テック企業が主張をして、彼らが使用していたデータベースを運営する人によってすぐにファクトチェックされるときを考えると、かなり面白いです。

そして私が言わなければならないのは、トーマスはそれをかなり優雅に扱ったということです。彼は怒りの暴言をしませんでした。彼は冷静に何が起こったかを説明し、ツールがそれをすることに有用であることを認め、先に進みました。しかしハサビスの「これは恥ずかしい」というツイート。それは多くの注目を集めました。人々はそれをスクリーンショットし、引用ツイートしています。そしてこれは実際にテック業界における稀な瞬間の一つで、CEOが最も簡潔な方法で競合他社を直接ダンクします。

学ぶべき教訓

つまり、この点を指摘する必要があります。大きなAIの発表を見るとき、実際にもう少し懐疑的である必要があります。これは皮肉になる必要があるという意味ではなく、懐疑的であるという意味です。次のような質問をする必要があります。AIは正確に何をしたのか?これは実際に新しいことなのか?それとも既存の情報を見つけているのか?人間の専門家はこれについて何と言うだろうか?第二に、印象的なことと革命的なことの間には違いがあります。

GPT-5が文献検索が得意なのは印象的です。実際にオープンな問題を解決したら革命的でしょう。誇大広告に二つを混同させないでください。そして第三に、ドメインの専門家は確かに重要です。トーマス・ブルームはエルデシュ問題を熟知しています。これはデータベースを維持している人です。だから、彼が何が起こっているかを教えてくれるとき、あなたに何かを売ろうとしているテック企業よりも彼の言うことを聞くべきです。

そして第四に、査読は理由があって存在します。もしマークとセバスチャンがこれを論文として数学ジャーナルに提出していたら、査読者はすぐにこれを捉えていたでしょう。そして彼らは「待って、これらは新しい解決策ではありません。これらは既存の解決策への引用です」と言っていたでしょう。そして、それが私たちが査読システムを持っている理由です。公の恥になる前に間違いを捉えるためです。

さて、それを言った上で、これにはまだ本当の可能性があります。AIは数学に正当な貢献をしてきました。例えば、Google DeepMind、「これは恥ずかしい」と言った人デミス・ハサビスが運営する会社は、数学者が新しい予想やパターンを発見するのを助ける仕事をしてきました。そして彼らは数学者が証明できる潜在的な定理を提案できるツールを作成しました。

そして自動定理証明に関する研究もあります。AIシステムが実際に数学的証明を構築できるというものです。それは本当の意味のある仕事です。そして文献検索はもちろん価値があります。AIが研究者が関連する論文を素早く見つけるのを助けることができれば、それは実際の研究に費やせる時間を節約します。

ここでの鍵は、AIが何をしているかについて正直であり、全く過大に売り込まないことです。さて、あなたは「オーケー、私は数学者ではありません。これについて本当に気にする必要はないのでは?」と思っているかもしれません。しかし皆さん、覚えておいてください。これは今AI誇大広告に関するより大きな問題です。企業はAIができることについて大胆な主張をし続けるでしょう。そして一般の人々は何が本物で何が誇張されているかを理解することになっています。

AIはコードを書けますか?はい、しかしどれくらいうまく?プログラマーを置き換えることができますか?それは別の議論の余地があることです。AIは芸術を作れますか?はい、できます。それとも既存の芸術をリミックスしているだけですか?つまり、AIには混乱を招くことがたくさんありますが、懐疑的であり続けることが重要です。

そしてこのエルデシュ問題は完璧な例です。OpenAIの研究者はGPT-5が未解決の数学問題を解決したと主張しました。すごそうに聞こえます。しかし現実ははるかに平凡でした。あまりネガティブになりたくはありませんが、

コメント

タイトルとURLをコピーしました