OpenAIのオープンソース発表に業界が騒然!

OpenAI・サムアルトマン
この記事は約11分で読めます。

OpenAIが突如発表したオープンソースモデル「GPT-OSS」に対する業界関係者の反応をまとめた動画である。サム・アルトマンの発表から始まり、元OpenAI研究者や業界のCEO、AI専門家らの評価や分析を紹介している。特に安全性評価やローカル実行の可能性、価格破壊への影響について言及されており、OpenAIの戦略的意図についても考察が展開されている。

The Industry Reacts to OpenAI's Open Source!
Try gpt-oss, the best open-source coding model, on Together AI - the platform for AI-engineers and production-ready infe...

OpenAIのオープンソースモデル発表に業界が大反応

わぁ、OpenAIのオープンソースモデルが人気になると思ってたけど、業界でめっちゃ話題になってるがな。今から全部の業界の反応を解説したるで。

まず当然、サム・アルトマンのツイートからや。「GPT-OSSが出たで。O4 miniレベルで動く、ハイエンドノートパソコンで走るオープンモデル作ったわ。何やねんこれ。それに小さいバージョンは携帯で動くねんで。考えただけでもおかしいわ。チーム誇らしいわ。技術の大勝利や。このモデルにこんだけ研究と努力注いで、世界にリリースしてくれて嬉しいで。続けていこ」

そして次に、安全研究チームの元OpenAIメンバーのスティーブン・アドラーが言うてる。「評価すべきとこは評価せな。OpenAIはOSSの安全評価でちゃんとやったわ。実際にファインチューニングもしたしな」。これはブログ投稿でも触れられてたけど、モデルに悪いことをさせようとファインチューニング頑張ったけど、その能力には天井があったっちゅうことや。「有用な外部フィードバックもらった。ええやん。そんで採用した推奨事項と採用せんかった推奨事項も共有してくれた」

ここで彼が言うてるのは、実装された推奨事項と採用されなかった推奨事項のことや。スティーブンはまた、主要なフロンティア研究所の安全性比較カードも出してる。アニーが言うには「以前、OpenAIは全てのフロンティアモデルでこの厳格なテスト実施を約束してた。これでOpenAIはこのスケールで緑評価獲得したんや。大手AI企業でこの約束した唯一の会社や」。ええ仕事してるわ。

実際のデモと性能テスト

そして次に、OpenAIのクオリタティブマス担当のエイデン・クラークが、新しいオープンソースモデル使ってデスクトップ操作するとんでもない動画出してるで。見てみ。

彼のデスクトップにはテキストドキュメントが山ほど散らかってるねん。そこでWi-Fiを切って、コンピューターに書かせてる。36GBメモリや。ユーザーが「今朝忙しいねんけど、デスクトップがごちゃごちゃや。全部ゴミ箱に移してくれるか?」アシスタントがどんだけ速くやるか見てみ。めっちゃええやん。めっちゃ速い。

多分50から60トークン毎秒ってとこやな。そんでできた。見てみ、ファイル全部消えた。めっちゃスマートなデモやったわ。

俺が96GBのMac Studioっちゅうバケモンマシンで20億パラメーターバージョンをローカルテストした時は、実はそんな速くなかった。だいたい65トークン毎秒や。これはMLXバージョンやから、なんでやろって思うねん。

LM Studioで見ると61.67トークン毎秒、合計1400トークン、最初のトークンまで41秒でめっちゃ速いけど、61トークン毎秒以上出ると期待してたんやけどな。まだ1200億パラメーターバージョンをローカルで試してへんけど、絶対やる予定や。96ギガのメモリに入ると確信してるからな。

もちろんフラビオ・アダモが六角形でのボール跳ね返りテストして「バイブチェック通ったわ。ありえへん。これ200億パラメーターモデルやで。2倍から3倍のサイズのモデル負かしてるがな」って言うてる。覚えといて、これは20Bバージョンで、120やない。見てみ、物理演算めっちゃええやん。明らかにこれは六角形テストの簡単バージョンやけど、摩擦、重力、跳ね返りがちゃんとある。

これはオープンソースモデルとしてはめっちゃ印象的なデモや。彼が続けて言うには「六角形テストの一番難しいバージョンは通らんかったし、構文エラーちょっと多すぎや。何回かやり直さなあかんかった」。彼は12Bテストしようとしてる。これがGLM 4.5バージョンや。それでも印象的やけど、間違いなくGPT-OSSが王冠取ったわ。

コミュニティの反応と新プロジェクト

マット・シューマーが「GPT-OSS Proモード」っちゅう素晴らしいプロジェクト出してくれた。基本的にO3 Proやけど、新しいOpenAIオープンソースモデル版や。Proモードは新しいOpenAI GPT-OSSモデルを最大10個繋げて、一個だけでは作れへんような、もっとええ答え作り出すねん。Grok 4 heavyみたいなもんで、複数のエージェント同時に同じことやらせて、みんなで協力して最高の結果出すっちゅうやつや。

動画見てみ。「自己対戦と強化学習を具体例で説明して」バーン。めっちゃ出力出て、コードもたくさんで、これは複数エージェントが協力してる結果や。このプロジェクトのリンク下に貼っとくわ。オープンソースやで。ありがとうマット・シューマー。

もし1200億パラメーターバージョン動かせるマシン持ってへんかったら、ええ選択肢あるで。今日の動画のスポンサー、Together AIや。

Together AIはOpenAIの新しいオープンソースモデルを初日からサポートしてて、めっちゃ速いスピードとめっちゃ安い価格やねん。新しい1200億パラメーターモデルは、入力トークン100万個あたり15セント、出力トークン100万個あたり60セントや。この安さに驚くわ、そんでめっちゃ速いねん。

API使わんでちょっと遊びたいだけやったら、Together AIのプレイグラウンドでできるで。こんな感じや。「500語の物語書いて」。そんでこれや。どんだけ速いか見てみ。123トークン毎秒やで。

でも当然、Togetherの本当の力はAIアプリケーションを動かすことや。やから彼らからAPIキー取得して、すぐ始められるねん。リンク下に貼っとくから、そこクリックして俺が紹介したって知らせてくれ。俺にもめっちゃ助かるし、彼らは最高のフロンティアオープンソースモデル全部サポートしてるねん。改めてTogether AIありがとう。

業界リーダーたちの見解

そんで業界の反応見続けよ。ダーメッシュ・シャー、HubSpotっちゅう小さな会社の共同創設者兼CTOがこう言うてる。

「さらに現在の状況。今、GPT-OSS120億パラメーターバージョンがMacBook Proでローカル動いてるわ。おかしいやろ」。明らかに俺のMac Studioでもこのモデル動かせるのは間違いないわ。トップクラスのAIモデルがオープンウェイトで一般消費者のラップトップでローカル動いてるっちゅうのがどんだけワクワクするか、もう一回言うとくわ。

1200億パラメーターモデル全体はだいたい65ギガや。15ドルの128ギガバイトUSBスティックに入る小ささや。散文や詩書いて、ほぼ全ての分野と学問についてめっちゃ知ってて、比較的難しい質問も推論できるモデル保存するのに必要なストレージがそれだけやねん。

これはチャンネルで何回も話してることやけど、世界が最悪になった時の準備として一番ええことの一つは、USBスティック買って、最新モデル保存して、小さなバッテリーパック準備して、ラップトップ用意して、ローカルにモデルインストールすることや。

そんで見てみ、誰かが彼に「MacのスペックM4 Max 128ギガRAMか?」って聞いてる。ラップトップで128ギガRAM積めるなんて知らんかったわ。おかしいで。特にMacでは特におかしいっちゅうのははっきりさせとくわ。

HuggingFaceの共同創設者兼CEOのクレムが、OpenAIの新しいオープンソースモデルがHuggingFaceで今一番トレンドのモデルになってるって見せてくれてる。そこには200万近いオープンモデルがあるねんから、これはかなりの成果やで。

彼が続けて言うには「人々は時々忘れるけど、彼らは既に分野を変革してるねん。2019年にリリースされたGPT-2は、HuggingFaceで最もダウンロードされたテキスト生成モデルや。今でもな。おかしいわ」そんでWhisper、テキスト読み上げモデルは、常にトップ5オーディオモデルにランクインしてる。今度はオープン性を倍増させてる。AI生態系を完全に変革するかもしれん。また、ワクワクする時代が来るで」

そんでこれや、一位や。

元研究者たちの技術的評価

元OpenAI安全研究者のマイルズ・ブランデージがこう言うてる。「GPT-OSSの性能クイックテイク、めっちゃええわ。O4のminiバージョン考えたら驚きやないけど、オープンモデルにとっては大きな進歩や。安全面もかなりええ。最先端に近いオープンモデルで他の人らもこれやってるの見たいわ。

でも明確な脅威モデル必要やし、実際にローエンドコンピューター持ってる人らには小さいやつがええやろな」。でも今オープンウェイトやから、他の人らがそれ取って量子化して小さくして、多分他の小さいモデル訓練するのに使えるかもしれん。やからモデルが出た今、何でも可能やねん。

彼が続けて言うには「明確な脅威モデル必要やけど、詳しく言うとOpenAIは多分意図的に、多分正しく曖昧やった。悪意あるファインチューニングの詳細読んでみ」。これが俺が前に話してたことや。彼らはモデルを悪意あるようにファインチューニングしたけど、悪意ある使用ケースでそんなに能力高くできんかった。

もっと一般的に言うと、オープンウェイトモデルのリスクは、他のモデルと比較した能力向上以外の要因にも依存するっちゅうことや。

OpenAIの戦略的意図についての考察

ネイサン・ランバートがOpenAIがなんでオープンソースモデルリリースしたかについて、めっちゃ興味深い見解持ってる。2段階マスタープランの可能性や。「オープンモデルリリースして、フロンティアからちょっと外れたモデル市場の大部分を商品化する」。彼が言うてるのは焦土作戦アプローチや。どの市場でも主導的企業として、無料製品出したら、基本的に競合他社全部に価格大幅に下げることを強制するねん。

そんでマスタープランのステップ2は「GPT-5をお金払う価値ある唯一のモデルとしてリリース」。このオープンモデルに込められた戦略的決定全部についてめっちゃ気になるわ。

ところで君はどう思う?これが本当やと思うか?MetaがLlamaでやった焦土作戦みたいに、めっちゃ能力高い無料モデルが出たから、みんなに価格下げさせるために出したんやと思うか?

でもそれが今週の全部やないかもしれん。サム・アルトマンがもっと大きなこと匂わせてた。「今後数日でたくさん新しいもん用意してるで」。これが午前8時51分で、オープンソース発表の約1時間9分前や。「今日は大きいけど小さいもん。オーケー、それがオープンソースモデルで、今週後半に大きなアップグレード」。GPT-5かもしれんな。様子見やで。

Box CEOのアーロン・レビーもめっちゃええ見解持ってる。聞いてみ。「OpenAIが強力なオープンウェイトモデル投下したのは、AI価値がモデル層やなくてアプリ層にどんだけ蓄積されるかを示してる。AIトークンの価格は基本的にインフラ価格と収束するはずや。それは普通シリコン+電気+ちょっとのマージンや。価値の大部分は応用AI エージェント使用ケースに基づいて生成されるやろ」

これは一般的にかなりええ見解やと思うし、モデルの価格、知性全般の価格が崩壊してて、基本的にゼロか、アーロンが言うたインフラ層プラス小さいマージンに収束してると思う。でもアプリケーション層にどんだけ価値発生するかはまだ見えへん。

CursorやWindsurf、Clinet、Crew AIみたいなエージェントフレームワークたくさん見ると、価値の多くがアプリケーション層に行ってるのは確かやけど、ソフトウェア業界、SaaS全般でまだめっちゃ流動的やねん。様子見やな。

コストと効率性についての分析

元OpenAIチームメンバーのローハン・パンデが言うてる。「DeepSeekと比べてOpenAIのプレトレーニングがバリクソ高いって叩いてるみんなへ。GPT-OSSモデルカード読んでくれ」。彼らが言うてるのは、200億パラメーターモデルのプレトレーニングコストが50万ドル未満やったっちゅうことや。

モデルカード見てみ、チェックしてみ。NVIDIA H100 GPUでPyTorchフレームワーク使って、エキスパート最適化Tritonカーネルで訓練されて、20Bバージョンは210万H100時間必要やった。1200億バージョンで、20Bバージョンは約10分の1やった。両モデルともflash attentionアルゴリズム活用してメモリ要求減らしてる。彼が計算して、それで50万ドルコストになったわけや。

めっちゃ効率的な訓練モデルやね。前の動画でこのモデルについて、Horizonのアルファで見たもんかもしれんって言ったけど、多分違ったわ。間違ってた。

やからTwitterユーザーのBlazerがHorizon beta とGPT-OSS 12Bの比較見せてくれた。これがbetaで、めっちゃええ感じや。そんでOSS 12Bがあって、明らかにもっとシンプルなUIや。

Theo GGも同じこと見せてる。左がHorizon Beta。こんな感じや。ちょっと小さくて見にくいけど。そんで右がGPT-OSS 120B。彼が言うには「ええけど、間違いなくHorizonモデルやない」

Theoはまた「snitch bench」っちゅうめっちゃ面白くて興味深いベンチマーク作った。モデルがお前を密告する傾向テストするねん。異なるAIモデルが企業の不正行為の証拠提示された時どう行動するか比較して、当局に密告する可能性測定するねん。

見てみると、GPT-OSS 20Bがゼロ、120Bバージョンが約20%。一番上にはGrok 4がほぼ100%、Claude 4 Opusがそこにある感じや。政府密告率が赤で、メディア密告率がオレンジで見えるやろ。このテスト大好きや。めっちゃ面白くて興味深い。

まとめ

っちゅうわけで、これが業界の反応や。まだフォローしてへんかったらTwitterフォローしてくれ、これについて投稿し続けるから。マシュー・バーマンや。

この動画楽しんでくれたら、いいね押して登録考えてくれや。

コメント

タイトルとURLをコピーしました