OpenAI、オープンウェイトへの移行で全員を驚かせる!

AGIに仕事を奪われたい
この記事は約8分で読めます。

4,152 文字

OpenAI Going OPEN WEIGHTS Shocks Everyone!
🔥 Secure your free spot before it’s gone → has announced a major shift by releasing an open-weights AI model, allowing d...

AIの世界で大きな動きがありました。実際には、4月1日に同時期にいくつかの大きな出来事がありました。4月1日はただのエイプリルフールではなく、AI業界全体の現実を見つめ直す日となりました。OpenAIが戦略の驚くべき転換を図り、Metaが映画級の会話するキャラクターを生成する驚異的な新ツールをリリース、そして中国のトッププレイヤーであるAlibabaとDeepSeekが覇権を争っています。
それでは、すべてを順を追って説明していきましょう。
まずはOpenAIについてです。彼らをしばらく追ってきた人なら、彼らがこれまでかなり閉鎖的だったことをご存知でしょう。彼らの名前は文字通り「オープン」を意味していますが、長年にわたって彼らのモデルはそれとは程遠いものでした。彼らの主張は常に安全性に関するもので、悪意ある行為者が干渉できないよう専有技術として管理するというものでした。AIがほとんどの人にとってまだ謎のブラックボックスだった頃は、確かにそれは理にかなっていました。
しかし今、状況は急速に変化しています。4月1日、OpenAIはついにより開かれた生成モデルの開発に取り組んでいると発表しました。特に透明性と制御を必要とする開発者たちがずっと求めていたものに近いものです。CEOのSam Altmanも、この考えは社内で長い間浮上していたが、優先順位を下げ続けていたことを認めています。しかし今や、それは優先事項となりました。理由は単純に競争です。
DeepSeekやMetaのLlamaのようなオープンソースモデルが爆発的な人気を博しています。Metaはついに、彼らのLlamaモデルが10億回以上ダウンロードされたと発表しました。これは驚異的です。開発者や政府さえも、カスタマイズでき、実際に理解できるツールにより傾いています。プレッシャーがかかり、OpenAIは座して最善を願うだけではいられないことを理解しています。
ただし、OpenAIは完全にオープンソース化するわけではありません。彼らは「オープンウェイト」モデルと呼ばれるアプローチを取っています。これは一種の中間地点です。ソースコードや完全なトレーニングデータは得られませんが、モデルの重み(ウェイト)にはアクセスできるようになります。これらはAIを機能させる訓練済みのパラメータです。これにより、開発者は一からモデル全体を再トレーニングすることなく、自分のユースケースに合わせてモデルを微調整し適応させることができます。
多くの企業にとって、これは大きな勝利です。統合がより簡単になり、はるかに安価になります。そして、これが真のオープンソースとどう違うのかと疑問に思うなら、オープンソースはすべてを提供します。トレーニング方法、データ、コードなどすべてです。オープンウェイトは最終製品だけです。
つまり、以前よりも透明性は高まりましたが、OpenAIはまだ多くを秘密にしています。彼らがトレーニングデータと内部プロセスを厳重に守ってきたことを考えると、これは本当に驚くことではありません。この新しい方向性を打ち出した今でも、彼らが王国の鍵をそのまま渡すとは期待しないでください。
ここで重要なのは、この動きは開発者と仲良くするためだけではなく、非常に戦略的だということです。Elon Muskは長い間OpenAIを批判し、彼らが当初のミッションから外れていると言ってきました。彼は彼らが商業的になりすぎていると言いましたが、間違っていないかもしれません。なぜなら、このオープン性に関する話の一方で、OpenAIは巨額の資金調達ラウンドも締めくくろうとしているからです。
約400億ドルという数字は、スタートアップをウォール街の大物のように見せる金額です。このラウンドは日本のソフトバンクが主導しており、成功すればスタートアップとしては過去最大となるでしょう。投資家への魅力を高めるため、OpenAIはいくつかの本格的な技術力も披露しています。
彼らの新しいGPT-4oのバージョンには、ネイティブの画像生成機能があります。プロンプトを与えたり、画像をアップロードしたりすると、それを強化したり、まったく新しいものを生成したりします。もはやDallEのような外部モデルに頼る必要はなく、すべてが組み込まれています。Altmanはライブストリームでこれを披露しましたが、あまりにも人気があったため、サーバーがGPUの負荷で文字通り過熱し始めたそうです。これは比喩ではなく、ハードウェアが熱くなりすぎるという実際の問題が発生したのです。
この新しいモデルの最も素晴らしい部分の一つは、画像の扱い方です。10〜20の異なるオブジェクトを持つビジュアルを生成でき、以前よりもはるかに正確に画像内にテキストを印刷できます。これはかつて大きな問題でした。Hacker Newsのユーザーたちは、以前のバージョンが読みやすいテキストのレンダリングにおいていかに劣っていたかを指摘していましたが、今はずっと良くなっています。非ラテン文字に関しては完璧ではありませんが、明らかに一歩前進しています。
これらすべての画像にはC2PAタグが付きます。つまり、それらがAIによって作られたものであることがわかります。これは現在、成長している標準であり、正直なところ、この時点ではおそらく必要なものです。コンテンツセーフガードも導入されていますが、OpenAIはルールに従う限り、公人の画像を許可するようになりました。
OpenAIがこのように少し緩和している一方で、Metaは全く新しいレベルに到達しています。彼らは「Mocha」を発表しました。これは飲み物ではなく、Movie CHAracterの略で、テキストと音声だけから全身で会話するキャラクターを生成できる最新モデルです。基本的なアバターではなく、全身の動き、表情、ジェスチャー、さらには映画的なカメラアングルまで作成します。AIによって完全に駆動される自分専用のアニメーションキャラクターを持つようなものです。
実際、これは私たちが取り組んでいることを紹介するのにぴったりのタイミングです。AIアバターの始め方、作り方、使い方、さらには収入源にする方法についての完全に無料のコースを立ち上げています。完全に無料ですが、アクセスは限られています。興味があれば、説明欄のリンクをクリックして、メールアドレスを入力してください。コースがライブになったときに最初に案内します。また、動画を見逃してもAIの最新情報を入手できるよう、今後週刊AIニュースレターにもアクセスできます。
Mochaに戻りましょう。このモデルはウォータールー大学との共同研究で構築され、参照画像、骨格、キーフレームなしで動作します。スクリプトと音声を入力するだけで、720p、24fpsで最大5.3秒の短いアニメーションクリップが得られます。複数のキャラクター間の完全な会話を生成することもできます。これは文字通り、ターンベースの対話、キャラクタータグなど、それができる最初のモデルです。
内部的には、Mochaはディフュージョントランスフォーマーアーキテクチャに基づいています。これは現在最先端のものです。Wav2Vec 2からの音声埋め込みとクロスアテンションによるテキスト調整を使用して、すべてを同期させます。また、このモデルを評価するためだけにMetaが構築した「Mocha Bench」というカスタムベンチマークもあります。テストでは、リップシンクの精度、顔のリアリズム、そして全体的な自然な動きにおいて、SadtalkerやHallow 3などの既存ツールを上回りました。
つまり、MetaはMochaとLlamaの成功の間で遊んでいるわけではなく、オープンで表現力豊かなAIのリーダーになることに全力を注いでいます。
そして中国も見てみましょう。そこのAIシーンはこれまでになく過熱しています。DeepSeekは今年初めにV3モデルを発表し、西側はその影響を感じました。V3が非常に破壊的だったのは、ほとんどの西側モデルよりもはるかに安価に開発でき、パフォーマンスを犠牲にしなかったからです。これは多くの人々、特に中国の大企業であるAlibabaのような企業を揺るがしました。
現在、Alibabaは反撃を準備しています。ブルームバーグによると、彼らは次世代のフラッグシップモデルであるQwen 3を今月中に発表する準備をしているとのことです。タイミングはまだ少し不明確ですが、内部情報によれば、いつでも発表される可能性があるとのことです。数か月前に旧正月の初日にQwen 2.5 Maxをリリースしたことを考えると、これは理にかなっています。これは中国の大きな祝日で、通常人々は家族と休暇を取っています。その日に主要なモデルをリリースするということは、競争がいかに激しくなっているかを示しています。便宜上のことではなく、彼らが諦めていないことを示すためだったのです。
DeepSeekの影響力は過小評価できません。彼らもまた、R1の後継モデルのリリースを加速させています。彼らの目標は5月までにそれを発表することです。V3のようなものであれば、再び世界的なAIレースのパワーバランスを変える可能性があります。
現在の状況はこうです。OpenAIは安全性とオープン性の間のラインを歩こうとしており、このオープンウェイト戦略を展開しながら400億ドルの資金調達を追求しています。Metaは表現力豊かなAIに全力を注いでおり、デジタル映画製作を完全に変える可能性のあるMochaのようなツールを作っています。そして中国、彼らは全く減速していません。DeepSeekがペースを設定し、Alibabaが追いつこうと奮闘する中、グローバルなAIの戦場はさらに混雑してきています。
コメント欄でこれらすべてについてのあなたの考えを聞かせてください。そしてまだ登録していない方は、今がいいタイミングです。視聴いただきありがとうございます。次回の動画でお会いしましょう。

コメント

タイトルとURLをコピーしました