
4,593 文字

バイドゥがちょうど2つの新しいAIモデル、ERNIE 4.5とERNIE X1をリリースし、予定より早くERNIEボットプラットフォームで無料提供を開始しました。本当に無料なのです。このバイドゥの動きは、OpenAI、Google、DeepSeek、Tencentといった大手に公然と挑戦し、高度なAIツールを大手企業だけでなく誰もが使えるようにすることで、テック業界全体を騒然とさせています。
バイドゥはAI分野では新参者ではありません。2023年に中国で最初に生成AIプラットフォームを展開した大手企業の一つでしたが、ChatGPTのように爆発的に普及することはありませんでした。競争は激しく、ByteDanceは多くのユーザーの注目を集めた独自のAIチャットボットを持ち、スタートアップのDeepSeekは米国ベースの最高モデルと同等の推論モデルを、はるかに低いコストで提供できると主張し、業界全体を揺るがしました。これらの確立された巨人たちに「私たちはあなたたちと同じことができて、しかも安く」と言うことを想像してみてください。それはまさに至る所でアラームを鳴らすことになりました。
では、これらの新しいバイドゥモデルについて話しましょう。まず最初はERNIE 4.5です。バイドゥはこれを最新の基盤モデルと呼んでいます。つまり、大量のデータで訓練されているため、様々なタスクに対応できるということです。マルチモーダルと呼ばれるもので、テキストだけでなく、画像、おそらく音声、おそらく動画など、あらゆるものを扱えます。言語能力、論理的生成力、記憶力が向上していると言われています。さらに高いEQを持っていると主張しており、私たちがオンラインで投げかける風刺漫画やミームなどをすべて理解できるそうです。
バイドゥは、ERNIE 4.5がDoc VQAなどのタスクでどれだけうまく機能するかを強調しています。Doc VQAとは複雑な文書を理解することに関するもので、90以上のスコアを獲得したとのことです。これは契約書や研究報告書などのテキストを扱う人にとっては大きな意味を持ちます。バイドゥはERNIE 4.5の全体的なマルチモーダル性能をGPT-4oと比較して、「77.77% VQA」という非常に正確な数字を引用しています。要するに、画像、テキスト、またはその両方を扱う研究者や開発者であれば、ERNIE 4.5のような有名な競合製品を上回る可能性のあるモデルの見通しに興奮するでしょう。
次に、ERNIE X1を見てみましょう。バイドゥはこれを推論重視または深い思考モデルと呼んでいます。DeepSeekのR1モデルに匹敵し、コストは半分だと自慢しています。特に、ERNIE X1がCM MLU(中国語の知識をテストするベンチマーク)や中国語のシンプルQA、そしてMath 500と呼ばれるものでうまく機能することを強調しています。X1はそのMathテストでGPT-4.5さえも上回ったとされています。これについて考えてみてください。数学タスクでGPT-4.5を凌駕することは、数学と論理能力がそこそこのAIアシスタントと真に強力なAIの違いとなる世界では大きな意味を持ちます。
すでにバイドゥの無料AIモデルに大きな価値を見出す人もいます。例えば、インドネシアの研究者シリは、衛星画像や科学データの分析に苦労していましたが、ERNIE 4.5が無料になったことで、ようやくジャカルタでの作業を管理することができるようになりました。開発者のアーティは宿題支援ツールを構築したかったのですが、必要な強力なAIツールを買う余裕がありませんでした。しかしERNIE X1が無料でリリースされたことで可能になりました。バイドゥはこの動きを「AIの民主化」と呼び、これまでこれらのツールを買えなかった開発者や研究者のために門戸を開いています。
しかし、高度なAIの開発がこれほど高価なら、なぜ彼らはすべてを無料にしているのでしょうか?基本的に、これはAI世界で巨大なユーザーベースを獲得できる大胆な戦略です。人々があなたのモデルを使い始めると、膨大な実世界データが得られます。より多くのデータはより良い改善を意味し、それによってモデルはエンタープライズ契約、より高度な研究、あるいはライセンス提携にとってより魅力的になります。AIが無料でもバイドゥのクラウド上に構築されているか、バイドゥ検索に統合されている場合、間接的な収益を生み出す可能性があります。
彼らはまた、6月30日からいくつかのERNIEモデルをオープンソース化することも言及しており、これはDeepSeekのオープンソース化の例に倣っています。つまり、より多くの開発者やユーザーを取り込むための軍拡競争のようなものです。Tencentは2月にDeepSeekよりも速く応答すると主張するモデルをリリースし、DeepSeekの技術の一部をそのアプリに統合しました。Alibabaは中国でのAppleデバイス向けAIでAppleと提携し、今後3年間でAIに約3800億元(約52億ドル)を投資することを約束しました。AlibabaはQuerという名前のオープンソースの推論モデルを搭載した新しいバージョンのAIアシスタントもリリースしました。ByteDance(TikTokの親会社)もDouという人気を集めたチャットボットで生成AI分野に参入しています。
基本的に、皆が注目、ユーザー獲得、そして最も低コストでこれらの強力なサービスを提供できるかを競っています。それも企業だけではありません。中国政府もAIにリソースを投入しており、北京、上海、広東、珠江などの地方政府がAI産業のハブを構築しています。上海はオープンで協力的なイノベーション構造について語り、オープンソース開発とデータ共有の拡大を目指しています。一方、広東は新しいAIとロボティクスの政策を展開し、プロジェクトごとに最大800万元の補助金を提供しています。I Researchのアナリストたちは、中国のAI部門は2028年までに8110億元の価値を持つ可能性があると述べています。これは驚異的な成長であり、バイドゥとそのライバルたちによるこれらの大きな動きの舞台を整えるものです。
この話のもう一つの側面は、バイドゥ自身が以前にDeepSeek R1推論モデルを自社の検索エンジンに統合していたことです。彼らはDeepSeekの強さを明らかに認識していますが、バイドゥの視点からすれば、消費者向けチャットボットからエンタープライズソリューションまで、大規模AIのための頼りになるプラットフォームになりたいと考えています。彼らはERNIE X1をツールを自律的に使用する初めての深い思考モデルだと主張するなど、グローバルAIレースで際立ちたいと考えています。
また、コスト面の優位性を強調していることも注目に値します。例えば、ERNIE 4.5はGPT-4.5の価格のわずか1%かもしれないと言及しています。さらに、ERNIE 4.5の実際の入力と出力のコストは、入力が1000トークンあたり0.4元、出力が1000トークンあたり0.16元と低くなる可能性があります。このような価格設定は小規模なスタートアップや個人にとってゲームチェンジャーになりえます。
もちろん、大きな疑問はバイドゥがこのペースを維持できるかどうかです。高度なAIモデルのトレーニングとメンテナンスは高価です。モデルを無料にすることは宣伝とユーザー獲得には素晴らしいですが、会社はクラウドサーバー、研究、データセンターなど、トップレベルのAI開発に必要なすべてのコストをカバーする必要があります。2024年には彼らのクラウド収入が26%増加するという適度な財務成長がありましたが、非GAAP純収入が6%減少したこともあり、これらのAIモデルを無料で提供し続ける場合の課題を示唆しています。
それでも初期の結果に人々は興奮しています。バイドゥによると、ERNIEボットが無料になると発表した直後、何百万ものユーザーが殺到したとのことです。開発者たちはERNIE 4.5のマルチモーダル能力をテストし始め、患者の医療履歴と組み合わせてX線を分析したり、財務分析のためにチャートを解釈したりするように連携させています。バイドゥがサーバーを維持し、改善を続けることができれば、その可能性は計り知れません。
一部の人々は2025年3月16日を、少なくとも中国でのAI開発の軌道を変えた日と呼んでいます。なぜなら、その日に主要企業が高度なAIには高額を支払わなければならないという標準に公然と挑戦したからです。
西側企業がどう対応するかという観点もあります。DeepSeekのコスト効率の良いモデル提供の成功は、すでに新しいリリースの波を引き起こしています。OpenAIは噂のGPT-5リリースを加速させるか、より競争力のある価格設定を考え出す必要があるかもしれません。バイドゥはまた、ERNIE X1が特に論理と推論において中国語タスクで強力な優位性を持っていると主張しており、それによって地域的な優位性を得る可能性があります。
中国市場では、ByteDanceとTencentはバイドゥに注目を独占させることはないでしょう。Tencentは今年初めにHuaNyuan Turbo Sを導入し、以前の2倍の速さでテキストを生成できると述べています。ByteDanceの消費者採用率はDouを発売したときに急上昇しました。一方、Alibabaは中国でのiPhone向けAIソリューション開発のためにAppleと提携し、AIのための資金を確保しました。
人々は現在のAI業界全体が巨大な進化の中にあることに気づいています。過去には高度なAIは十分な資金を持つ研究所や大企業の遊び場でしたが、バイドゥとDeepSeekが無料または低コストのモデルを推進することで、突然インドネシアの研究者やジャカルタの開発者のような人々が活躍するようになりました。遠隔地の教師はこのようなモデルを使って、より良い授業を作り始めるかもしれません。地元の病院はX線を読むためにそれを活用するかもしれません。つまり、これは単なるハイプではなく、日常への影響なのです。
もちろん、健全な懐疑論もあります。一部の業界関係者は、バイドゥが最終的にプレミアムティアを導入するかどうか疑問に思っています。基本的な使用は無料のままかもしれませんが、高度な機能、より高いトークン制限、または特殊なツールキットはお金がかかるかもしれません。特に、特定のウェブサービスがどのように運営されているかを見ると、このようなフリーミアムアプローチは非常に一般的です。
しかし、今のところバイドゥは明らかに「すべての人のためのAI」という物語に傾倒しており、これは政府やビジネスと強く共鳴しています。特にデジタル化と自動化に熱心な中小企業が多い国ではなおさらです。
以上が全体の話です。あなたはどう思いますか?コメントで教えてください。ご視聴ありがとうございました。次回お会いしましょう。


コメント