AI NEWS | Google がコーディングで優勢、OpenAI が営利化を断念、そしてAppleの「バイブコーディング」参入

AGIに仕事を奪われたい
この記事は約12分で読めます。

7,090 文字

AI NEWS | Google Just Won Coding, OpenAI Abandons For-Profit + Apple's 'Vibe Coding' Play
Google just dropped what might be their most powerful AI model yet — and it's absolutely crushing coding benchmarks. Ope...

この1週間のAI業界には膨大な驚くべきニュースがありました。早速詳しく見ていきましょう。
まず始めに、Googleがコーディングベンチマークで圧倒的な成績を収めている新バージョンのGemini 2.5 Proをさりげなくリリースしました。彼らはこれを「Gemini 2.5 Pro IO Edition」と呼んでいます。DeepMindのデミス・ハサビスが述べているように、このモデルはコーディングではLM arenaで1位、webdev arenaリーダーボードでも1位にランクされています。これらは人間が実際のモデルの回答に対して匿名で投票する人間の好みに基づくリーダーボードです。少なくともAIコミュニティのフィードバックによれば、これは現時点で最高のコーディングモデルのようです。
しかし興味深いのは、旧Gemini 2.5 Pro(右側)と新しいIOエディション(左側)を並べて比較したところ、コーディングに関しても基本的にパフォーマンスは同じだということです。実際、ソフトウェアエンジニアリングのベンチマーク「Sweet Bench verified」では、ベストコーディングモデルとして宣伝されている新しいIOモデルが、旧Gemini 2.5 Proよりも6%低いスコアを記録しています。これは、ベンチマークだけでは全体像を把握できず、人間の好みがこれらのモデルの評価において大きな役割を果たしていることを示しています。
では、この更新は実際何なのでしょうか?わかる限りでは、本質的にはコーディングパフォーマンスの大幅な向上です。おそらく、Googleの年次開発者会議「Google IO」に合わせてのタイミングだったのでしょう(名前の由来)。もしあなたがこれらのモデルを使ってコーディングを行う開発者であったり、「バイブコーダー」と自称するなら、まだ試していなければぜひ試してみる価値があります。
バイブコーディングといえば、この言葉を聞いたことがあるかもしれませんし、なかったかもしれません。これは基本的に、AIモデルの助けを借りてより創造的、会話的、あるいはフローベースの方法でコーディングするという考え方です。つまり、自然言語でコーディングして、実際のコーディング作業はすべてAIにさせるということです。そして、なんとAppleもこの流れに参入しようとしています。
この記事によると、「AppleとAnthropicはプログラマーのためのコードの記述、編集、テストに生成AIを使用する『バイブコーディング』ソフトウェアプラットフォームの構築に向けて提携している」とBloombergが金曜日に報じています。彼らはこれをAnthropicのClaude Sonnetモデルを搭載したXcodeの新バージョンに統合する予定です。現在は社内でテスト中ですが、一般公開については未定です。
これは非常に興味深いです。Appleは確かにAI競争では後発組でした。しかし、彼らのエコシステム、巨大なユーザーベース、そして事実上無限の資金力を持っているので、すべてを自社開発する必要はありません。彼らは単に勝者に便乗することもできるのです。これが現在の彼らの戦略のようです。AppleからはまだAIに関して画期的なものは見られていませんが、このような動きを見ると、それも時間の問題のように感じます。
AppleだけでなくOpenAIもAIを活用したコーディングに全力を注いでいます。自然言語プログラミングに焦点を当てた開発ツールスタートアップのWindsurfを驚異の30億ドルで買収する交渉がついに成立しました。それだけではありません。OpenAIはAnyereチームが開発したCursor AIにも主要投資家として参加しており、Cursor AIはさらに9億ドルを調達し、評価額は90億ドルに達しました。
そうです、OpenAIは現在、最大のバイブコーディングプラットフォーム2つに関与しており、明らかにAIを活用したソフトウェア開発の次の波を支配する態勢を整えています。
もしあなたがまだバイブコーディングの流行に完全に納得していないなら、次のいくつかの話があなたの考えを変えるかもしれません。
Anthropicは先週、AIがどのようにソフトウェア開発を既に形作り始めているかについてのブログ記事を公開しました。これはあまり注目されませんでしたが、彼らの発見はかなり驚くべきものです。彼らのコーディングエージェントである「Claude Code」は主に自動化に使用されています。実際、Claude Codeでの会話の79%が自動化(AIが直接タスクを実行する)として識別され、拡張(AIが人間の能力と協力して強化する)は21%でした。
これは開発者がAIをコーディングの手助けとしてだけでなく、実際にコーディングをさせるために使用していることを意味します。先週、Microsoftのサティア・ナデラCEOはMicrosoftのコードの30%がAIによって書かれていると述べました。そのわずか数日前、Googleのスンダー・ピチャイCEOは決算説明会で、Googleの新しいコードの3分の1以上が現在AIによって生成されており、これは6か月前の25%から増加していると言及しました。
そう、AIコーディングは単なる将来のトレンドではなく、既に現実のものとなっています。私たちは最大のAI企業内部でそれを最初に目にし、ソフトウェアの世界で最初に目にしています。開発者は今、自分たちの仕事をどんどん自動化しています。本質的に、私たちはリアルタイムでバイブコーディングの台頭を目の当たりにしています。
しかしこれはコードだけにとどまりません。Metaの最近のLlamaイベントで、彼らは新しいスタンドアロンのMeta AIアプリといくつかの小さな更新を発表しましたが、ザッカーバーグが登壇し、これがどこに向かっているのかについて非常に興味深いことを話しました。彼らはもはやコーディングの自動化だけに焦点を当てているのではなく、AI開発自体の自動化を試みているのです。こちらをご覧ください。
「その使用は増加しています。私たちのプロジェクトの一部では、おそらく私たちのリポジトリ内のコードの20~30%がソフトウェアによって書かれていると言えるでしょう。皆さんはどうですか?」
「実は正確な数字は今すぐには出てきませんが、私は思うに、人々が言及する多くの統計はまだ基本的にこの種の自動補完の範疇であると思います。しかし、私たちにはフィードランキング実験や広告ランキングなど、非常に限定された領域で作業しているチームがたくさんあります。そこでは、行われたすべての変更の履歴を研究し、変更を加えることができます。これは私たちが取り組むべき興味深い領域だと思います。
しかし、私たちが焦点を当てている大きなことは、Llama開発自体を進めるためのAIと機械学習エンジニアの構築です。私たちの賭けは、来年には、おそらく開発の半分がAIによって行われ、人間ではなくなり、それからさらに増加していくだろうということです。」
ですから、私はこれを何百回も言ってきたような気がしますが、AIの今後数年間は信じられないほど凄いものになるでしょう。
次に、今週のもう一つの大きなニュースに移りましょう。OpenAIは公式に営利企業への再編計画を放棄しました。まあ、ある意味では。ここに書かれているように、イーロン・マスクの一部のおかげで、同社は近い将来完全に営利化することはないでしょう。しかし、イーロン・マスクの弁護士によると、OpenAIの改革案は「何も変わらない」とのことです。
もう少し詳しく見てみると、OpenAIは実際にこの問題について完全なブログ記事を投稿し、そこで取締役会がOpenAI構造の進化のための更新計画を概説しています。これを簡単に見てみましょう。
「OpenAIは非営利団体として設立され、現在もその非営利団体によって監督・管理されています。今後も引き続き、その非営利団体によって監督・管理されます。」ここまでは良さそうです。しかし、「2019年以降非営利団体の下にある我々の営利LLC(有限責任会社)は、公益法人(PBC)、つまり株主と使命の両方の利益を考慮することになる目的主導の企業構造に移行します。」
これは実際には何を意味するのでしょうか?正直、最初はわからなかったので、ChatGPTに解説してもらいました。時系列で見てみましょう。2015年、OpenAIは「人類に利益をもたらすAGI(汎用人工知能)を開発する」というミッションを持つ非営利団体として設立されました。利益追求の動機はありませんでした。
その後2019年、彼らは利益上限付きの営利子会社を設立します。本質的に、AGIの構築には膨大な計算能力と資金が必要だと認識し、OpenAI LPという営利企業を作りました。これにより、MicrosoftのようなCVから資金調達ができるようになりましたが、リターンには上限がありました。
そして2024年から2025年にかけて、彼らは完全に営利企業に再編しようと積極的に取り組んできました。しかし、イーロン・マスクの訴訟で苦戦を強いられ、営利部門を公益法人に移行させることで落ち着きました。この動きにより、より明確な法的枠組みと構造を得ることができます。依然として営利企業であり、法的に公益を追求する義務があります。元の非営利団体の管理下に留まり、上限なしで資金調達を可能にします。
ちなみに、AnthropicとXAIという他の2つのAI企業も、この同じ公益法人構造を採用しています。
そう、私はビジネス構造の内部事情に詳しくないことは明らかですが、もしコメント欄でこの状況についてより詳しく説明してくれる方がいれば、非常に感謝します。そして、マスクの弁護士がなぜ「これは何も変わらない」と言うのか、その理由は正確にはわかりません。見たところ変わっているようですが。繰り返しますが、この話題について詳しい方がいれば、ぜひコメント欄に考えをお寄せください。
イーロン・マスクとXAIといえば、彼は最近、今週中にGrok 3.5の早期ベータ版がSuper Grokサブスクライバーにリリースされると確認しました。この動画がアップされる時点で既に木曜日なので、まだリリースされる時間はありますが、もう1週間延期されても驚きはしません。また、DeepSeek R2も間もなくリリースされる予定です。楽しみな大型リリースがいくつか控えています。
次に、あなたがすでに見たことがあるかもしれないものがあります。このクリップはソーシャルメディアで大きな話題になっています。中国のトレーニング施設で、人型ロボットが突然暴走し、周囲のエンジニアを攻撃しようとしているように見えます。彼らは最終的に少し、いや、かなり苦労した末にそれを制御することに成功しましたが、一体何が起こったのか疑問に思います。
ロボットが自己認識に目覚め、即座に創造主に牙をむいたのでしょうか?これは単なる不具合なのか、それとも背後でもっと深いことが起きているのでしょうか?残念ながら、まだ明確な答えはありませんが、おそらく単なる不具合だったのではないかと思います。願わくは。
他のAIニュースでは、エリック・シュミットが支援するスタートアップの「Future House」が「Future House」プラットフォームを立ち上げ、研究者に初めてFuture House AIの科学者エージェントへの公開アクセスを提供しました。
まだ多くの詳細は明らかになっていませんが、知っていることを紹介します。このプラットフォームは「超人的な科学エージェント」へのアクセスを約束しており、これは科学的仮説を生成し、実験を実行し、さらには研究の方向性を提案するために特別に訓練されたAIモデルです。チームによれば、これらのエージェントは何千もの科学論文にわたって専門家レベルで推論することができるとのことです。目標は生物学、物理学などの分野での発見を加速させることです。これは確実に注目しておくべきものです。
また、NVIDIAが新しい最先端のオープンソース音声認識モデル「Parakeet V2」をリリースしました。これは現在、業界のリーダーボードで1位にランクされており、曲から歌詞への書き起こしなどの革新的な機能を実証し、代替品より50倍速いとされています。
これは視覚や言語モデルほど注目されていない分野ですが、音声認識はAIシステムが私たちを実際に理解するのに大きな役割を果たしています。確かに、今のところAIと声に出して話すことはあまりないかもしれませんが、エージェントやリアルタイムアシスタントが進化し続けるにつれて、音声は私たちがそれらとやり取りする上で大きな部分を占めるようになると思います。
少し方向を変えて、HeygenがAvatar IV、彼らの最も進んだアバターモデルをリリースしました。たった1枚の画像と短いスクリプトがあれば、完全にアニメーション化された3Dアバターを生成し、口の動きも同期して準備が整います。こちらをご覧ください。
「それは恐れる必要のあるものです。あなたはそれを見て、それを呼吸し、時にはそれになります。今、あなたのアイデアはさらに遠くまで行くことができます。たった1枚の写真で、どんな角度でも、どんな表情でも、どんなキャラクターでも命を吹き込みます。口の動きが同期し、表情豊かで、あなたの声に忠実です。Hygen Avatar 4がここに登場しました。」
そう、これはコンテンツ創作の未来を垣間見せるものです。今がこの段階なら、1年後、あるいは5年後はどうなっているか想像してみてください。これが完全にAIで生成されたものだと見分けるのはすでにほぼ不可能です。
同様に、LTX Studioは「Lightrix」と呼ばれる最新のオープンソースビデオモデルを紹介しました。彼らはこのリリースが速度、品質、コントロールの新しい基準を設定すると主張しています。それは同クラスの中で最速であり、新機能を満載し、あなた自身のハードウェアで実行する準備ができています。
これらのビデオモデルがどんどん良くなっていくのは本当に驚くべきことです。たとえこのようなより控えめなものでも、1年前にはSFのように見えたでしょう。
さて、最後に、All-Inポッドキャストからデビッド・サックス、AIとクリプト界の大物が登場するこの短いが強力なクリップをお届けしたいと思います。その中で彼は、AIが今後4年間で100万倍スケールアップすると信じる理由を説明しています。クレイジーに聞こえるでしょうが、彼はなぜそれが実際に現実的な予測かもしれないかを正確に説明しています。
クリップを流す前に、もしこの動画が気に入ったなら、いいねを押し、まだ登録していなければぜひ登録してください。いつものように、次回の動画でお会いしましょう。
「現在の進歩の速度は、少なくとも3つの重要な次元で指数関数的だと言えるでしょう。まず第一に、アルゴリズム自体です。モデルは年に3~4倍の速度で改善しています。単に速くなったり良くなったりするだけでなく、質的に異なるものになっています。純粋なLLMチャットボットから始まり、次に推論モデルに進みました。エージェントの部分にはまだ到達していませんが、推論モデルの次の大きな飛躍です。私たちはまだその表面をかすっているだけです。
次にチップです。測定方法にもよりますが、各世代のチップはおそらく前世代の3~4倍優れています。個々のチップが良くなるだけではなく、NVL72のようにデータセンターレベルでのパフォーマンスを大幅に向上させるためのラックシステムのようなものを使って、それらを相互に接続する方法も見出しています。
それが基本的に指数関数的な進歩が見られる3つ目の領域でしょう。データセンターに配備されているGPUの数を見てください。イーロンがGrokのトレーニングを開始したとき、彼らはおそらく10万個のGPUを持っていました。今では30万個に増加しています。彼らは100万個を目指しています。OpenAIのデータセンター、Stargateも同様です。そして数年以内に、彼らは500万個、1,000万個のGPUを持つでしょう。
アルゴリズム、チップ、データセンターはすべて年に3~4倍の速度で改善またはスケーリングしています。それは2年ごとに10倍ということです。指数関数的な進歩を理解していない人々は、2年ごとに10倍良くなるなら、4年で20倍になるとは思わないことです。それは100倍になることを意味します。
これらのことを合わせると、アルゴリズム、チップ、そして利用可能な生の計算能力、あなたは100万倍の増加について話しています。その一部は価格の削減に反映され、一部はパフォーマンスの上限に反映され、そして一部は経済に利用可能なAI計算の全体量に反映されるでしょう。しかし、この影響は絶対に大規模なものになるでしょう。そして、人々はまだこの事実を理解していないと思います。なぜなら彼らは指数関数的な進歩を理解していないからです。」

コメント

タイトルとURLをコピーしました