Baidu の ERNIE 4.5 が GPT-4.5 を上回る性能を発揮—しかも格段に低いコストで!

AGIに仕事を奪われたい
この記事は約11分で読めます。

6,217 文字

Baidu's ERNIE 4.5 Just Outperformed GPT-4.5 — For a Fraction of the Cost!
Baidu has just launched ERNIE 4.5, and the results are jaw-dropping. In performance tests across reasoning, language und...

OpenAI は AI の最新進歩についていくのに本当に苦戦しています。実際、中国の新モデル「ERNIE 4.5」が OpenAI の最強モデル「GPT-4.5」を、はるかに低いコストで打ち負かしたのです。見出しはどこでも見かけるようになりました。「ERNIE 4.5 が主要タスクで GPT-4.5 を上回る」「Baidu の価格設定が市場を驚かせる」「中国がグローバル AI 競争で加速」などです。
では、実際何が起きているのでしょうか?詳しく見ていきましょう。このビデオでは、ERNIE 4.5 が GPT-4.5 とどう比較されるのか、どこで勝り、どこで遅れをとっているのか、そしてなぜそのコストが AI の構築、使用、価格設定の方法にグローバルな変化をもたらす可能性があるのかを掘り下げていきます。ERNIE 4.5 を試してみたい方は、下の説明欄の最初のリンクをチェックしてください。
グローバル AI レースに予想外の展開が起きました。何年もの間、OpenAI の GPT モデルが AI の話題を独占してきました。GPT-3.5 は 2022 年に登場し、GPT-4 が 2023 年に続き、最近では GPT-4.5(現在 Chat GPT Plus で提供されているトップクラスのモデル)が推論、創造性、コーディングの基準を引き上げました。しかし OpenAI は性能面でベンチマークを設定してきましたが、決して安価ではありませんでした。
エンタープライズ API の使用、最先端の GPT モデルへのアクセス、プレミアムサブスクリプションにより、最先端の AI は強力ですが高価になっています。今、中国の大手テック企業で ERNIE モデルシリーズの開発元である Baidu が、その優位性に公然と挑戦しています。2025 年 3 月 16 日、Baidu は最新バージョンの ERNIE 4.5 をリリースしました。
このアナウンスは、推論能力に焦点を当てた別のモデル「ERNIE X1」と共に行われました。しかし、注目はすぐに ERNIE 4.5 に移りました。その理由は、複数の AI ベンチマークでの驚くべき性能と、さらに重要なのは、そのあまりに低いコストです。
ERNIE 4.5 が GPT-4.5 に勝った理由
最も重要なのは性能です。Baidu の内部評価によると、ERNIE 4.5 は複数の標準ベンチマークで GPT-4.5 に匹敵するか上回っています。例えば、MMLU(Massive Multitask Language Understanding)では、様々な科目にわたる一般知識と推論を評価するテストで、ERNIE 4.5 は 87.3% のスコアを達成し、GPT-4.5 の報告された 86.8% をわずかに上回りました。
同じテストの中国版である CMMLU では、ERNIE は特に優れた結果を示し、85.2% のスコアを達成し、バイリンガルまたは多言語コンテキストでの強固な基盤を反映しています。GSM8K のような数学問題解決タスクでは、ERNIE は 89.6% のスコアを獲得し、GPT-4.5 の 88% を上回ったと報告されています。
コード生成やプログラミングタスクに関しては、GPT-4.5 がまだ優位を保っています。人間の評価のようなベンチマークでは、プロンプトから機能的なコードを書く能力をテストしますが、GPT-4.5 がまだリードしており、OpenAI のモデルがソフトウェア開発により最適化されていることを示唆しています。ERNIE 4.5 は常識的推論やオープンドメインの質問応答でもわずかに性能が低く、より広範な英語データセットでの GPT-4.5 の微調整が有利に働いているようです。しかし、全体的な差は小さく、ほとんどのタスクで ERNIE は今や競争力を持っています。
マルチモーダルの優位性
ERNIE 4.5 の最も注目すべきアップグレードの一つは、そのマルチモーダル能力です。GPT-4.5 は Chat GPT の最新バージョンで画像とテキスト入力をサポートしていますが、ERNIE 4.5 はテキスト、画像、音声、ビデオの処理と生成ができるように訓練されており、ネイティブにフルスペクトルのマルチモーダルサポートを提供しています。
Baidu のデモと技術説明によると、ERNIE 4.5 はビデオクリップを理解し、要約し、その内容に関する質問に答え、さらに単一のプロンプトウィンドウから新しいビデオや画像出力を生成することができます。このモデルは画像を細部まで描写し、物体や場面を認識し、要求に応じて関連するコンテントを生成できます。
これは従来のマルチモーダルサポートを超えています。言語だけでなく、より幅広いタスクをこなせる実世界の AI エージェントへの Baidu の取り組みを反映しています。ビデオチュートリアルを見て教えることができるバーチャルアシスタントや、画面録画を理解して視覚的な指示を出せる AI コパイロットを想像してみてください。
OpenAI は Whisper による音声と GPT-4 Vision による視覚などの限定的なビデオ理解機能を展開していますが、ERNIE 4.5 はこれらのモードにわたってより深く統合されているように見えます。ただし、第三者のベンチマークによる完全な独立検証は、この記事の執筆時点ではまだ限られています。
驚くべきコスト差
さて、AI エコシステム全体が警戒している部分、価格設定です。Baidu はエンタープライズ AI クラウドスイートである Qianfan プラットフォームを通じて、ERNIE 4.5 の公式価格体系を発表しました。コストは入力トークン 100 万につき 55 セント、出力トークン 100 万につき 2.20 ドルです。
対照的に、API 経由で使用される OpenAI の GPT-4.5(モデル ID:GPT4-0125-preview)は、2025 年 3 月時点の OpenAI の公式価格に基づいて、入力トークン 100 万につき 75 ドル、出力トークン 100 万につき 150 ドルの価格設定になっています。これにより、ほとんどのエンタープライズおよび開発者のユースケースでは、ERNIE 4.5 は GPT-4.5 より約 30〜70 倍安価になります。
消費者側でも価格差は同様に顕著です。Baidu は個人に対して ERNIEbot へのアクセスを無料で提供していますが、OpenAI の GPT-4.5 は Chat GPT Plus で月額 20 ドル、より高い使用量枠と優先アクセスを提供する Chat GPT Pro で月額 200 ドルでアクセスできます。
これらの数字は理論上のものではありません。すでに Baidu の商用およびデベロッパーサービス全体で実施されています。Baidu によると、この積極的な価格戦略は、特に予算の厳しい地域や部門で、大規模言語モデルの採用を加速させるための意図的な動きだとのことです。
AI の未来に向けた Baidu の戦略
Baidu が ERNIE 4.5 をリリースしたとき、それは単に優れたモデルを提供するだけではありませんでした。それは CEO のロビン・リーによるより大きな戦略の一部であり、迅速な繰り返し、マルチモーダルの優位性、超低価格を優先するものでした。
今年 2 月の世界政府サミットで、ロビン・リーは AI が大規模に有用であるためには安価である必要があると明確にしました。モデルがどれほど強力でも、推論コストが大幅に下がらない限り、企業は広く展開できないと指摘しました。彼は「今日、大規模言語モデルの推論コストは基本的に 12 ヶ月で 90% 以上削減できる」と述べています。
ロビン・リーはまた、ERNIE モデルがモデルアーキテクチャからデータ処理、デプロイメントシステムまで完全に社内で開発されていることを強調しました。これは Baidu が最近のアップデートで強調している、フルスタック AI 能力のモデルです。開発パイプラインのすべての層(ソフトウェア、トレーニングインフラストラクチャ、システムレベルの最適化)を制御することで、Baidu はコストを削減し、デプロイメント効率を向上させ、反復を加速させることができます。この統合されたアプローチは、ERNIE 4.5 の低価格モデルと迅速なアップグレードサイクルを可能にする上で重要な役割を果たしています。
一方、AI モデル自体は中国語と英語の両方のデータセットを使って訓練されており、検索拡張生成、エージェントベースのタスク完了、マルチモーダルグラウンディングが向上しています。これが ERNIE の価値提案が変わるところです。これは単なるチャットボットやテキストモデルではなく、API ファースト、ビジネス向けの汎用 AI システムとして機能することを意図しており、それに応じた価格設定になっています。
明確にしておくと、このビデオは Baidu と AI Uncovered の間のスポンサー付きコラボレーションです。スポンサー付きではありますが、このツールがどのように機能するかについて偏りのない分析を提供するよう心がけています。私たちの焦点は、Baidu の ERNIE 4.5 がどのように動作するか、そしてそれがあなたのニーズに合っているかどうかを理解するのに役立つ、正確な研究ベースの洞察を提供することです。
なぜこれが中国を超えて重要なのか
ERNIE 4.5 は中国製のモデルですが、その影響は一国に限定されません。AI は今やグローバルインフラストラクチャであり、価格設定、性能、モデル設計の変化はエコシステム全体に影響します。ERNIE 4.5 がいくつかの重要なベンチマークで GPT-4.5 に匹敵したり、上回ったりしていることは、本当の疑問を提起します。
より多くの企業、政府、あるいはスタートアップが、より安価で高性能な代替品に移行し始めたらどうなるでしょうか?これは OpenAI、Google Gemini、Claude の価格モデルにとって何を意味するのでしょうか?
これまで、西側では OpenAI が価格のペースを設定してきました。しかし、Baidu の最新の動きは、価格対性能比が採用の主要な推進力となる LLM の商品化を加速させる可能性があります。
これはまた、Mistral、Deepseek、Meta の LLAMA など、大手テクノロジー企業の外部で高品質モデルを提供することを目的としたオープンソース LLM プロジェクトにも影響を与えます。Baidu が OpenAI が API を通じて GPT アクセスを提供するのと同様に、Qianfan というモデル・アズ・ア・サービス(MaaS)プラットフォームを通じて ERNIE へのAPIアクセスを提供していることで、これらの取り組みには緊急性が加わります。
ERNIE 4.5 にはまだできないこと
ERNIE 4.5 は多くの分野で高い能力を示していますが、限界がないわけではありません。ERNIE は英語と中国語の両方で強力ですが、中国外の独立した第三者のベンチマークはまだ限られています。Baidu のパフォーマンスデータのほとんどは社内テストから来ており、有用ではあるものの、全体像を把握するにはより多くのグローバルなピアレビュー検証が必要です。
また、ERNIE へのアクセスは西側市場では依然として限られています。中国の開発者はすでに Qianfan プラットフォームを使用できますが、グローバルクラウドプロバイダー全体での API 展開はまだ完全に実現していません。これにより、少なくとも現時点では、国際的な開発者や企業の採用が制限されています。
それでも、Baidu が多言語、マルチモーダル、エージェント対応の AI モデルを迅速なリリーススケジュールで発表しているという事実は、競合他社が注意深く見守っていることです。
OpenAI の現在の市場での立場と対応
では、OpenAI はどのように対応しているのでしょうか?現時点では、OpenAI は ERNIE 4.5 について公式にコメントしていませんが、最近の動きは同社が変化する状況を認識していることを示唆しています。2024 年末、OpenAI は GPT-4 よりも高速でコスト効率の高いバリアント「GPT-4 Turbo」を発表し、現在は Chat GPT Plus のデフォルトになっています。
GPT-4 Turbo は 128K トークンのコンテキストウィンドウと遅延の削減を提供しています。しかし、これらの改善があっても、コストは Baidu の提供するものよりもはるかに高いままです。
一方、OpenAI は Chat GPT のチーム版とエンタープライズ版に取り組んでおり、より広範なエンタープライズ採用に向けた動きを示唆しています。しかし、特に大規模なモデルを展開しようとするスタートアップや小規模企業にとって、手頃な価格は依然として懸念事項です。
また、他の中国企業も急速に動いていることも注目に値します。Tencent、Alibaba、Zhipu AI はすべて独自の基盤モデルを発表しています。Baidu は現在ベンチマークレースをリードしていますが、一社だけではありません。より広い観点では、AI レースはもはや性能だけの問題ではありません。ドルあたりの性能の問題です。そして今、Baidu はそのメトリックをリードしています。
レースの行方
では、これはどういう状況をもたらすのでしょうか?ERNIE 4.5 の発表は、AI における成長しつつある変化に拍車をかけます。閉鎖的で超高価なモデルから、より速く、より安く、多言語で、マルチモーダルなシステムへの移行です。あなたが開発者であれ、ビジネスリーダーであれ、AI 研究者であれ、この変化は重要です。
グローバル競争は加速しています。知性のコストは下がり、モデルはこれまで以上にエージェント的、感覚的、そして手頃な価格になりつつあります。ERNIE 4.5 は、Baidu の内部研究の優先事項を反映した、独自の能力、アーキテクチャデザイン、パフォーマンス戦略を持って登場します。
AI の領域は急速に進化しており、新しいリリースと改善が毎月のように発生していますが、継続的な競争がグローバルエコシステム全体でイノベーションとアクセシビリティの両方を形作り続けています。
ERNIE 4.5 を試してみる準備ができたら、説明欄の最初のリンクをチェックしてください。また、詳細については、固定されたコメントもお忘れなく。
ここまで見ていただいた方は、下のコメント欄でご意見をお聞かせください。より興味深いトピックについては、今画面に表示されているおすすめビデオをご覧ください。ご視聴ありがとうございました。

コメント

タイトルとURLをコピーしました