ORION は完全な失望 – 実際に何が間違ってしまったのか?

AIに仕事を奪われたい
この記事は約17分で読めます。

9,773 文字

https://www.youtube.com/watch?v=ZujiHAfLW4Q

ORIONはAI界の新しいおもちゃですが、その喧伝に惑わされてはいけません。この話には表面上見えるより深い内容があります。OpenAIはORIONで大きな障害に直面し、計画全体を急いで見直さなければならなくなりました。GPTのアップグレードはもはや以前のようなペースでは進まなくなっています。そもそもこのORIONとは一体何なのか、なぜこれほど騒がれているのか、そしてなぜOpenAIはその開発でこれほど苦戦しているのか、詳しく見ていきましょう。
OpenAI ORIONの紹介
GPT-3、そしてGPT-4のリリースによって、OpenAIはAIと自然言語処理(NLP)分野のリーダーとしての地位を確立しました。GPT-4以降、私たちはGPT-4.0や01モデルも手にしましたが、誰もが待ち望んでいるのは次世代フロンティアモデルのGPT-5です。ただし、このGPT-5は実現しないかもしれません。というのも、代わりにORIONと呼ばれることになるという噂があるからです。この新しいORIONモデルはGPT-4の100倍もの能力を持つ可能性があると言われています。つまり、OpenAIは以前のモデルの能力を全く新しい高みへと引き上げようとしているのです。
ORIONで期待できる新機能について説明しましょう。まず明らかなのは性能の向上です。報告によると、ORIONはこれまでにない高度なアーキテクチャーと学習技術を活用するとのことで、テキストの理解と生成の精度が従来のモデルよりも向上するとされています。これは、より高度な理解力とより文脈に即した応答が得られることを意味します。
さらに、ORIONはより広範な応用範囲を持つと報告されています。新しいORIONモデルでは、より優れた会話能力だけでなく、医療、金融、教育、エンターテインメントなど、さまざまな産業分野での幅広い応用が可能になります。もしこれが実現すれば、AIは単なる会話の相手ではなく、医師、金融アドバイザー、教師など、さらに多くの役割を果たすことができるようになります。
最後に重要なのは、ORIONはマルチモーダル機能が向上すると考えられていることです。つまり、テキスト、画像、音声、さらには動画の入力が可能になるかもしれません。これが実現すれば、AIとのやり取りはこれまで以上に有用なものとなるでしょう。
発売への期待
これほど素晴らしい機能を聞けば、このモデルがいつ発売されるのか気になるでしょう。あなただけではありません。コミュニティは9月から推測を重ねています。すべては、OpenAIのCEOであるサム・アルトマンのツイートから始まりました。サム・アルトマンのツイートはどれも暗号めいたメッセージを含んでいることで知られています。人々はその意味を考え始め、あるユーザーがChatGPT-01モデルに尋ねたところ、隠されたメッセージは「ORION」だったことが判明しました。
それ以来、冬の星座にちなんで12月にリリースされるのではないかと考える人も出てきました。しかし、サム・アルトマンは10月のツイートでこれはフェイクニュースだと否定しました。現在、一部の人々は来年初めにリリースされるのではないかと推測していますが、OpenAIチームが直面しているボトルネックを考えると、大幅な遅延が予想されるため、あまり期待しない方が良いかもしれません。
期待外れのアップデート
OpenAI ORIONは初期の従業員テストを経ましたが、その結果はチームの期待を下回るものでした。ORIONについて、OpenAIは大きな野心を持っていました。ChatGPTがGPT-3からGPT-4へと大きく進化したように、同程度の性能向上を目指していたのです。しかし、初期のテストと使用を終えた後、一部のOpenAI従業員は、ORIONが期待に応えていないことを明らかにしました。
確かに、ORIONは学習の20%を完了した時点でGPT-4レベルの性能を達成したという初期テストの結果もあります。これは一見印象的に聞こえるかもしれませんが、重要な点は、AIトレーニングの初期段階が最も劇的な改善を生み出すということです。残りの80%のトレーニングが大きな進歩を生み出し、GPT-4を大幅に上回る可能性を示すものではありません。
実際、OpenAIの従業員によると、GPT-4からORIONへの改善は、GPT-3からGPT-4への改善ほど大きくないとのことです。品質面でも、GPT-4からORIONへの飛躍は控えめに見ても中程度にとどまっています。さらに悪いことに、OpenAIの研究者たちは、ORIONが特定のタスクにおいてGPT-4より優れているわけでも、より信頼できるわけでもないと考えています。
ORIONはコーディングの面で前身より優れているわけではなく、言語タスクでのみ確実な改善が見られたことが明らかになっています。これは業界に疑問を投げかけました。AIのリーダー企業が新モデルをリリースしたのに、20ヶ月以上前に導入されたモデルと比べて顕著な改善が見られないというのは、かなり不安な状況です。
加えて、ORIONはOpenAIの運用面でも課題を投げかけています。データセンターでの実行だけでなく、メンテナンスにも従来のモデルよりもはるかに多くのリソースが必要になると予想されているのです。
しかし、なぜOpenAIは同じような性能向上を達成するのに苦戦しているのでしょうか?具体的な問題は何なのでしょうか?そして、これは大規模言語モデル(LLM)が停滞に向かっていることを意味するのでしょうか?
AIのスケーリング法則
AIに関する根本的な原則があります。それは、業界のリーダーたちが固く信じていた(あるいは信じていた)スケーリング法則です。ChatGPTが2年前にリリースされて以来、AI企業は、単に学習データとコンピューティングパワーを追加することで、AIモデルを常にスケールアップしてより賢く、より有能にできるという意見を持ち続けてきました。
しかし、ORIONでOpenAIが直面している苦戦を見ると、この考えは深刻な課題に直面しています。この原則は限界に達しつつあり、その原因は単純です。それは、利用可能なデータの問題です。
今年初め、研究によって2028年までにAI企業は公開データを使い果たし、その後トレーニングデータの在庫が陳腐化する可能性があることが明らかになりました。この研究以外にも、著名なAI科学者たちが「より大きいほど良い」という哲学、つまりスケーリング法則の限界について声を上げ始めています。
AI法、安全なスーパーインテリジェンス、そしてOpenAIの共同創設者であるイリヤ・スツケーバーは、言語パターンと構造を理解するために使用されるデータが枯渇したため、事前学習のスケールアップからの結果は頭打ちになったと述べています。
彼はさらに、スケーリングの時代は終わり、今や私たちは再び驚きと発見の時代に戻ったと言及しました。誤解しないでください。スツケーバーはスケールアップのプロセスによって生成AIで大きな飛躍を達成したことで知られており、それがGPT-4につながったのです。しかし今、彼の言葉は真実味を帯びてきています。
OpenAIがORIONのAIを訓練するために利用できるデータに関して壁にぶつかっているのです。LLMが事前リリースのトレーニングで使用できる高品質のテキストやその他のデータの供給は継続的に減少しており、これにより新しいLLMがコーディングの問題を含む複雑な問題を解決する能力を向上させることが難しくなっています。
これは、なぜORIONがGPT-4よりもコーディングで大きく改善されていないかを説明しています。この時点で、LLMはデータを大量に使用してしまい、良質なトレーニングデータを見つけることがこれまで以上に困難になっています。つまり、進歩は大幅に遅くなり、2022年当時と比べて同じような飛躍を達成することがはるかに困難になっているのです。
その他の技術的制限
しかし、公開データの枯渇は、OpenAIや他のAI企業がGPT-4より優れたモデルの開発で直面している技術的制限の唯一の問題ではありません。仮に魔法のように大量のトレーニングデータが見つかったとしても、このトレーニングはコンピューティングリソースの面ではるかに集中的になります。
つまり、ORIONやさらなるAIモデルの開発と運用は、これまで以上に高額になるということです。もちろん、最終的にその費用を負担するのはユーザーですが、これらの先進的なモデルは開発自体が財務的に実現不可能だと考えられています。
これらのトレーニング実行には数千万ドルの費用がかかる可能性があります。何百ものチップを同時に稼働させる必要があるからです。より多くのチップは、より複雑なシステムを意味し、より複雑なシステムは、ハードウェアに起因する故障の可能性が高くなることを意味します。
しかも、この広範なハードウェアをすべて使用しても、研究者たちはトレーニング実行が終わるまでモデルの性能を知ることができません。それには数ヶ月かかる可能性があります。最大でも中程度の結果を得るためにそれだけの時間とパワーを使うことを想像してみてください。
さらに、環境への影響も考えてみてください。気候変動への懸念がこれほど高まっている時期に、これらのトレーニング実行中に、より大きなデータセンターが電力網から電力を吸い取り、心配の種となることを想像してみてください。このような集中的なコンピューティングパワーをAIモデルが使用するのに最適な時期ではないかもしれません。
これらの課題を考えると、ORIONは期待に応えられない運命にあるのでしょうか?それとも、これはOpenAIがさらに革新的なAIモデルを探求する道のりの小さな障害に過ぎないのでしょうか?この質問に答えるために、OpenAIがこの状況をどのように修正しようとしているのか話してみましょう。
OpenAIの新戦略
この状況に対処するため、OpenAIは明らかに新しい戦略を考え出さなければなりませんでした。まず、デュアルトラック開発戦略を考案しました。これは、モデル開発を2つの別個のタスクに分割するように、アプローチを再構築したということです。
現在、彼らは2つの異なるモデル、OシリーズとORIONモデルを持っています。Oシリーズは推論能力に焦点を当て、より高い計算強度で動作します。これは複雑な問題解決タスクに理想的です。一方で、ORIONモデルと並行してGPTシリーズを継続して開発しており、こちらは一般的な言語処理とコミュニケーションタスクに重点を置いています。
これは、両モデルが1つの巨大なモデルの場合よりも少ない計算能力で、それぞれが得意とする分野でより優れた性能を発揮できることを意味します。しかし、これはデータ不足の状況にどのように対処するのでしょうか?
それに対して、OpenAIは合成データ生成と呼ばれるものを探求しています。これは、実世界のデータを使用する代わりに、人工的に生成されたデータを使用する計画を意味します。しかし、これはすべての問題を解決するわけではありません。この解決策には新たな複雑さが伴います。特にモデルの品質と信頼性に関してです。
AIが時々間違いを犯すことは既に知られています。そのため、AIモデルが元々AI生成されたコンテンツで大量にトレーニングされ始めると、微妙なAIの不完全さを増幅させるフィードバックループにつながり、検出と修正が increasingly 困難になる間違いを生み出す可能性があります。
このため、研究者たちは、合成データへの過度な依存はAIモデルのパフォーマンスを時間とともに低下させる可能性があると明らかにしています。しかし、OpenAIチームは高品質と問題のある可能性がある合成データを区別するための新しいフィルタリングメカニズムと検証技術を開発しており、これによってデータ品質を維持しようとしています。
さらにOpenAIは、人間が生成したコンテンツとAIが生成したコンテンツを組み合わせるハイブリッドトレーニングアプローチも探求しており、これにはリスクを最小限に抑えながら利点を最大化する可能性があります。
実際、OpenAIは既に01モデルでこれを開始しており、テストタイムコンピュートと呼ばれる技術を使用しています。これは、AIモデルが使用中にパフォーマンスを向上させる技術です。つまり、モデルは即座に回答を選択して進むのではなく、リアルタイムで複数の可能性を生成して評価し、それらすべてを考慮して最適な道筋を選択するのです。
これにより、モデルは複雑な数学やコーディングの問題により多くの処理能力を割り当てることができます。OpenAIの研究者によると、01モデルでもこの技術により、モデルを10万倍スケールアップし、10万倍長くトレーニングした場合と同じパフォーマンス向上が得られたことが明らかになっています。しかも、追加のコンピューティングパワーを必要とせずにです。これは本当に印象的です。
Anthropic、XAI、Google DeepMindなど他の主要AIラボの研究者たちも、この技術の独自バージョンの開発に取り組み始めています。しかし、既に01モデルでリリースし、改良に取り組んでいるOpenAIほど進んでいる企業はありません。
だからこそ、OpenAIの最高製品責任者であるケビン・ワイルは「人々が追いつく頃には、私たちはさらに3歩先を行こうとしているでしょう」と述べたのです。それに異論を唱えることはできませんよね。OpenAIは常にAIゲームで3歩先を行っているのです。
AI業界への影響
もちろん、AIの戦略が大きく転換するにつれて、これまでNVIDIAのAIチップが支配してきたAIハードウェアの競争環境も完全に変わる可能性があります。この新しい転換により、SequoiaからHorowitzまでの投資家たちは、高額な投資への影響を検討し始めています。
企業は、巨大な事前トレーニングクラスターの世界から、クラウドベースのサーバーを必要とする推論クラウドへと移行していることに気付き始めています。これまでNVIDIAのAIチップに競争相手はありませんでしたが、推論市場に近づくにつれ、NVIDIAはこれまで以上の競争に直面するかもしれません。
この新しいアプローチは、Microsoft AzureやAWSなどのクラウドインフラストラクチャプロバイダーへの需要を開拓します。これらは常にAI市場では比較的小規模なプレイヤーでしたが、今や彼らにとっても新しいAIの時代が始まるかもしれません。NVIDIAチップの単独ゲームではなくなるのです。
しかし、NVIDIAは既に一歩先を行っており、事前トレーニングよりも推論に適したチップの開発に取り組んでいます。実際、先月CEOのジェンスン・フアンは、最新のAIチップBlackwellが推論の時代になった今、他のチップよりもはるかに優れた性能を発揮していることについて言及しました。
ちなみに、NVIDIAの最新のAIブレークスルーは既に2025年まで完売していることをご存知でしょうか?次回の動画では、NVIDIAのイノベーションがなぜ飛ぶように売れているのかについて深く掘り下げていきます。
OpenAIへの影響
しかし、ORIONの影響は他の企業だけでなく、OpenAI自身にも及びます。ご存知の通り、OpenAIは現在大きな転換期にあります。最近、ThriveCaptial、Microsoft、SoftBank、NVIDIAなど、多くの企業から66億ドルの資金を調達しました。Appleも当初は投資を検討しましたが、最終的に見送りました。
ただし、この資金調達契約には、OpenAIが完全な営利企業に移行しない場合、投資家が資金を引き上げることができるという条項が含まれています。この影響により、CTOのミラ・モラディや最高研究責任者のボブ・マクルーを含む主要人物が会社を去ることを発表するなど、大きな内部対立が生じています。
OpenAIの目標は常に研究主導で、公共の利益のためにAIを利用可能にすることでしたが、今やその目標はより商業的な方向へと変化しているのかもしれません。しかし、もしこれが事実だとすれば、ORIONの立ち上げは彼らにとってこれ以上ないタイミングでした。
一つには、Microsoftが現在クラウドプロバイダーを必要としているOpenAIに投資していることは、彼らにとって良い兆候です。Microsoftとのコラボレーションにより、Azureクラウドとの統合が可能になり、新しいORIONモデルを強化する可能性があります。
そして二つ目に、もちろんこのモデルが潜在能力を発揮できれば、その大規模な応用可能性を考えると、OpenAIの商業的地位は大きく成長する可能性があります。この資金調達のタイミングは素晴らしいですよね。
企業としてのOpenAIにとってはこれほど有益に聞こえますが、クライアントにとっては同じことは言えません。OpenAIが完全な営利組織への移行を完了すれば、明らかに価格設定とアクセシビリティに大きな影響を与えることになります。つまり、小規模な組織はORIONの採用が制限される可能性があります。古いモデルは恐らく同じ価格モデルを維持しますが、ORIONが利益重視であれば、はるかに高い価格モデルを期待できます。
潜在的な応用
ORIONの潜在的な応用範囲は、現在市場にある他のどのLLMよりも広大です。これらの戦略により、新しいモデルは人間の思考と創造性を持つことが期待されています。これは、GPTが単なるAIツールではなく、あなたを理解し、人間のように応答するパーソナルアシスタントになることを意味します。
企業はORIONを使用して意思決定と生産性を最適化し、製品開発を推進することさえできるかもしれません。看護師、インターン、プロジェクトマネージャー、ORIONは彼らのタスクをすべて実行する可能性があり、さらに多くのことができます。このように、医療や金融を含む多くの産業を変革する可能性があります。
患者のデータと履歴をグローバルな医学研究データとともにリアルタイムで分析し、希少疾患を診断するAI搭載のORIONを想像してみてください。それがどれほど素晴らしいことか想像してみてください。
一方、金融分野では、ORIONは市場動向の予測ツールとしても機能する可能性があります。市場動向を分析し、過去とリアルタイムのデータフィードに基づいて下降傾向について警告を生成し、ユーザーがより効果的に投資できるよう支援することができます。かなり素晴らしいですよね。
倫理的および安全性に関する考慮事項
しかし、もちろんスパイダーマンが言うように、「大いなる力には大いなる責任が伴う」のです。大いなる力には大いなる責任が伴うことを忘れないでください。そしてもちろん、OpenAIが製品を改良するにつれて、誤用のリスクも高まります。
このモデルは非常に高度な機能を持つと予想されており、もし間違った人物の手に渡れば、有害な目的に使用される可能性があります。AIが進歩するにつれて、これはコミュニティ全体の懸念事項となっています。
そのため、この時期にAI企業が透明性のある実践に取り組み、安全性と倫理を優先することが極めて重要です。このため、OpenAIと他のいくつかのAI企業は、システムがプライバシーの権利を侵害しないことを確実にするために、倫理委員会とパートナーシップを組むよう求められています。
OpenAIはこれを倫理基準を維持するための一歩として受け入れました。これは、AI業界がイノベーションだけでなく、責任あるイノベーションに焦点を当てることを確実にするという点で素晴らしいことです。
倫理委員会とのパートナーシップの他に、OpenAIは独自にも、より厳格なモデルアクセス制御を含むさまざまな実践を通じて、モデルの安全性を確保するための措置を講じています。
AIについての数千もの世界的な議論が行われている今日、その規制も一般的な話題となっています。AIテクノロジーがユーザーのプライバシー、データセキュリティ、そして全体的な倫理基準を優先することへの懸念が高まっています。
このため、OpenAIチームは、最も有用な製品を作るだけでなく、それが安全で確実なものであることを確認するという課題を抱えています。リリース日が遅れ続けるのも無理はありません。
しかし、それだけではありません。倫理的な影響について話すなら、合成データ生成も倫理的なリスクをもたらします。既に述べたように、合成データはAIのエラーやハルシネーションを増幅させるフィードバックループにつながる可能性があります。
企業としてのOpenAIには、ユーザーに誤ったデータを提供しないようにする倫理的責任があります。そのため、合成データ生成は依然としてチームによるレビュー中です。技術的にも倫理的にもこれをどのように完璧にしようとするのか、見守っていきましょう。
ORIONに対する一般の反応
OpenAI内でこれらすべてのことが起こっている間、ORIONに関して一般のコミュニティでもさまざまな動きがありました。ORIONの導入はもちろんAI世界の進歩を象徴するものですが、一般の意見は2つの理由で非常に分かれています。
一つ目は、最初に大きく誇張されすぎていたという事実です。彼らは前身のGPT-4の100倍優れていると言っていましたが、実際には以前のバージョンと比べて飛躍的な進歩はそれほど印象的ではないことが明らかになりました。
二つ目は、すべてのOpenAIモデルと同様に、これも発売が遅れ続けているという事実です。この時点でコミュニティは、これが本当に新しい優れたモデルなのか、それともGPT-4の単なる拡張版(いわばGPT-4.5)なのかを疑問に思っています。
この時点で、OpenAIが新しいモデルを誇張し続けた後に遅延させることは、コミュニティが会社とサム・アルトマンをどのように認識するかを完全に変えてしまいました。あるユーザーが、会社のCEOには信頼性がないと言うほど状況が悪化しているのです。
さらに悪いことに、OpenAIはORIONを最初に大企業にリリースすることを発表しました。これはもちろん、Redditのこのユーザーのように、コミュニティで眉をひそめる結果となりました。ORIONの最初のテスト結果も人々を落胆させ、一部の人々は単にスケーリングによってAIの新しいブレークスルーを達成することは不可能だと確信するようになりました。これは、推論が新しい時代であることを考えると真実かもしれません。
しかし、すべての否定的な反応にもかかわらず、OpenAIが新しい戦略でORIONモデルにわずかな改善でも加えることができれば、AI開発と改良において大きな一歩を踏み出したことになるという事実は変わりません。
あなたはどちら側ですか?ORIONに期待していますか、それとも誇張と遅延に失望していますか?コメントで議論しましょう。
結局のところ、あなたはどう思いますか?ORIONは実際にその喧伝に応えられるのでしょうか?それともGPT-4からの性能向上はそれほど印象的ではないのでしょうか?コメントで議論してみましょう。
私の意見では、いずれにせよORIONの立ち上げはLLM世界での次の大きな出来事となるでしょう。新しいアップデートの準備はできていますか?チャンネル登録と通知ベルをクリックして、今後のAIアップデートを見逃さないようにしてください。次回もお楽しみに。

コメント

タイトルとURLをコピーしました