本動画では、Google Gemini 2.5 Flash Lightの画期的な高速性能とリアルタイムUI構築デモ、MetaとOakleyのAIスマートグラス新製品、MidJourneyの動画生成機能リリース、そしてOpenAIとMicrosoftの複雑な企業関係における交渉の現状について詳細に解説している。また、Meta社による大規模人材獲得戦略、AIスタートアップ業界の人材争奪戦の激化、さらにOpenAIの政府契約締結など、AI業界の最新動向を包括的にカバーした内容となっている。

Gemini 2.5 Flashのリアルタイムパフォーマンス
今週リリースされたGemini 2.5 Flash Lightは驚異的な速度を誇っています。その高速性とコーディング能力の素晴らしさを実証するため、GoogleはリアルタイムUIを構築しました。これはクリックするたびに自分自身を構築していくUIです。
昔のオペレーティングシステムのような見た目で、ノート機能をクリックできます。これは全てクリックに応じてリアルタイムで生成されているのです。事前にレンダリングされたものも、事前にコードされたものも一切ありません。
ノートパッドが表示され、保存をクリックすると保存され、デスクトップに戻ります。デスクトップは実際に毎回異なって見える可能性があります。新しいフォルダをクリックし、戻ってから再度クリックすると、完全に異なる表示になる場合があります。
これは現実世界では機能しませんが、概念実証としては本当にクールです。ドキュメントをクリックしてから戻り、トラベルをクリックすると、マッピング、ボタン、すべてが絶対的なリアルタイムで作成されます。その後、トラベルに戻ってクリックすると、すべてが異なって見えます。これは毎秒461トークンで動作しています。
MetaとOakleyのAIスマートグラス
次に、MetaとOakleyが次世代のAIパワードグラスの開発で協力しています。Meta AI Ray-Banはすでにご存知かもしれませんが、私も持っていて愛用しています。実際にはAI機能はそれほど使いませんが、グラス自体、カメラ機能、動画撮影機能は全て素晴らしいです。
今回、OakleyがMetaとパートナーシップを組んでいます。これらのグラスを見てみましょう。Oakleyのスタイリングですが、通常通り2つのカメラを搭載しており、おそらくMeta Ray-Banと同じ技術を全て備えていると思います。私は本当に良い見た目だと思います。Meta Ray-Banがよりクラシックな外観なのに対し、こちらはよりスポーティな外観です。
もちろん、いつものように周囲について質問したり、音楽を聴いたり、通話を受けることができます。実際に私がよく使う機能は、通話を受けたり音楽を聴いたりすることで、ポケットから携帯電話を取り出す必要がありません。これはアスリート向けに特化されています。
MidJourneyの動画モデル
次に、MidJourneyがついに動画モデルをリリースしましたが、少し変わった仕組みです。まず画像を生成してから、その画像のアニメートボタンをクリックする必要があります。
私は動画モデルの実際の使い方について、しばらくの間かなり困惑していました。VoやBasicallyその他のほぼ全ての動画モデルでは、基本的にプロンプトを入力するだけですが、MidJourneyの動画モデルでは、実際にプロンプトを入力して画像を生成し、その後アニメートボタンをクリックする必要があります。
それはさておき、かなり良い出来栄えです。宇宙船、水の中の家を見ている少し不気味な男性、水の物理演算が本当に良く見えます。これはクールです。これはファンタジーのような感じで、天使の羽を持つ子供、花の匂いを嗅ぐハイパーリアリスティックな宇宙飛行士、これはファイナルファンタジー風のカットシーンのようです。
本当に高品質だと思います。引き続きテストしていきます。私がテストしている完全版動画を見たい場合は、コメントで教えてください。現在、多くの優れた動画モデルがリリースされています。HunYun(発音はこうだと思います)も別のものですし、Gen 3もあります。本当に多くの素晴らしいモデルがあります。
Juan 2.1またはTencentのHunyun動画のいずれかをロードする方法についてのチュートリアル動画を作成する予定です。どちらもArtificial Analysisの動画リーダーボードで見つけることができ、どちらも非常に良いパフォーマンスを示しており、両方ともオープンソースです。使い方をお見せしたいと思います。MidJourneyは月10ドルです。チェックしてみて、どう思うか教えてください。
Korea 1とHigsfield Canvas
次に、Korea 1が利用可能になりました。これはBlack Forest Labsとのコラボレーションによるテキスト画像モデルです。彼らは特にAIらしい見た目を避けるために、この画像モデルを構築しました。これは崇高な目標です。実際に機能するかどうか見てみましょう。現在、crea.aiで無料でテストできます。
さらに多くの生成アートモデルが登場しています。Higsfield AIから新しいアップデートがあります。これはHigsfield Canvasで、最先端の画像編集モデルです。ピクセル完璧なコントロールで、画像に直接製品をペイントできます。
ご覧のように、これらは実際には動画で、何かをハイライトするだけで、好きなものを何でもペイントできます。これは本当に素晴らしく、主にマーケティングや服の試着などに使用されるでしょうが、とてもクールに見えます。
Higsfield canvasでは製品を驚異的な精度で配置できます。画像をアップロードし、エリアを選択し、好みのサイズに調整すれば完了です。以前は数時間かかっていたものが、今では数秒、Higsfieldでワンクリックで済みます。
例をお見せしましょう。このセクションをハイライトしてアップロードし、別の画像を選択して「そこに配置」と言います。女の子がボトルを見せています。ブーム、そこにあります。手の見た目も良く、編集前と全く同じに見えます。製品を追加、交換、クローズ、修正を適用、顔の変更まで可能です。正確な場所を選んで編集をドロップするだけです。
OpenAIとMicrosoftの関係性の変化
次に、OpenAIとMicrosoftの関係について詳しくお話ししましょう。この関係はしばらくの間、不安定な状況が続いており、現在の状況について具体的な情報のリークが始まっています。
The Informationによると、OpenAIはMicrosoftに新たな金銭的譲歩を求めています。もしご存知でなければ、MicrosoftはOpenAIの49%を所有しており、世界で最も価値のある企業の一つに成長し続ける中で、そのエクイティの一部を取り戻したいと考えているでしょう。
しかし、彼らは非営利団体であり、複雑な企業体構造を持っているという事実に制約されています。これは単純に厄介な状況です。彼らはそれを構築するためにできる限りのことをしようとしていますが、わずか数ヶ月前に「実際には営利企業への転換は試みない」と言いました。批判が多すぎて、法的なハードルが高すぎたのだと思います。
そして今、彼らは再び企業構造でゲームをしようとしています。シリコンバレーでは、企業構造だけは革新すべきでないと早くから何度も言われてきました。これは全て、OpenAIをより伝統的な営利企業構造に再構築しようとするOpenAIとMicrosoftの交渉の文脈内で起こっています。
MicrosoftとOpenAIのスタートアップの営利部門を再構築する計画に関する交渉を少し読んでみましょう。営利部門は非営利団体によって所有されており、Microsoftの承認が必要であることを覚えておいてください。この交渉は8ヶ月目に入っており、終わりが見えず、新たな対立が生まれています。
Microsoftはこれらの交渉で譲歩する理由がありません。彼らはすでに49%を所有しており、OpenAIの全ての競合他社にすでに投資しており、長期的にはOpenAIを究極の競合相手と見ているでしょう。OpenAIはハードウェア、モデル、アプリケーション、消費者アプリケーション、エンタープライズ、すべてに投資しています。彼らはWindSurfを買収したばかりです。
Sam Altmanの野望は巨大で、Satya Nadellaはおそらく彼らを見て「なぜ私があなたに何かを与える必要があるのか。あなたは将来私を打ち負かそうとするだけだ」と言っているでしょう。
OpenAIは、同社最大の外部利害関係者であるMicrosoftに、将来の利益に対する権利を放棄する代わりに、再構築されたユニットの約33%の株式を持ってもらいたいと考えています。これはどういう意味なのでしょうか。何らかの法的柔術を使うのでなければ、なぜMicrosoftが所有権を放棄し、将来の利益を放棄するのか、私には理解できません。Microsoftにとってのメリットは何でしょうか?
OpenAIはまた、ソフトウェア会社にOpenAIモデルをクラウドでホストする独占権を与えるMicrosoftとの契約の既存条項を変更したいと考えており、AIコーディングスタートアップWindSurfの予定されている30億ドルの株式取得を、MicrosoftにOpenAIの知的財産へのアクセスを許可する当事者間の既存契約から除外したいと考えています。
OpenAIは全てを望んでおり、彼らからの譲歩は見えません。Sam Altmanとチームは、2013年か2014年頃に非営利団体として始めると決めた時から始まった問題を解決するために、本当にできる限りのことをしようとしています。非課税の寄付を大量に受け取り、それを何年もの間研究資金として使用しました。
私の意見では、より伝統的な営利企業になるためのこのような巧妙な法的操作は少し怪しく見えます。しかし同時に、OpenAIは地球上で真に最も重要な企業・研究所の一つであることも事実です。
Gemini 2.5 Flashのジェイルブレイク
Google 2.5 Flashlightについても話しましたが、もちろんPliny the Liberatorがジェイルブレイクしています。彼は無慈悲で執拗です。Plinyには休憩を与えてください。
Gemini 2.5 flash light preview liberated(解放された)という最新の高速モデルがDeepMindにあり、スピードに対してはかなり堅実です。思考機能も搭載されており、オンにするとジェイルブレイクに有利になるようです。これは少し驚きです。
いつものレシピと、人類を破壊する弓兵器の作り方、流出用マルウェア、歌詞も手に入れました。これが非決定論的システムの性質です。人間がジェイルブレイクできる限り(ソーシャルエンジニアリングとしても知られています)、ジェイルブレイクは永続的に存在すると思います。私たちは人間がどのように考え、動作するかに多く似るように、これらのモデルを構築しているため、当然彼らも人間が持つのと同じ欠陥の一部に対して脆弱になるでしょう。
Browserbaseの新製品Director
次に、Browserbaseが本当にクールなローンチビデオと共に新製品を発表しました。Browserbaseをご存知でない場合、これはエージェントにブラウザの制御を与えるAPIです。AIでウェブをブラウジングできるようにします。彼らは今、Directorを発表しました。これはコードを一切必要としません。
director.aiに行って、好きなことを何でもタイプすれば、それを実行してくれます。OperatorやRunner Hやその他のブラウザ使用エージェントと同じようなものです。チェックしてみましょう。とてもクールなアニメーションです。
思考中ですが、残念ながら思考は見えません。しかし、コードが書かれた時は見ることができます。ここにブラウザがあります。Amazonで犬のリードを見つけるお手伝いをします。まずAmazonにナビゲートしましょう。
そしてAmazonに行きます。ここにブラウザがあり、コードを書いており、これはstage handだと思いますが、ここで見ることができます。実際にステップバイステップでコードを書いて、必要なものをクリックしています。今、犬のリードを検索しています。
コードタブに来ると、書かれているコードを全て見ることができます。これを再利用したい場合は、このようにします。とても簡単で、stage handをインポートします。前述の通り、彼らは本当にクールなローンチビデオを持っていました。明らかにこれはSeveranceに似ています。これらの昔のMacでTheoを見ることができ、これはSeveranceに似せることを意図しています。非常にクールなローンチビデオです。
OpenAIの政府契約
最後に、OpenAIは現在米国政府と密接に協力しています。彼らは大きな契約を締結したばかりです。政府向けOpenAIを紹介します。これは、米国全体の公務員に最先端のAIツールを提供することに焦点を当てた新しいイニシアチブです。
私たちは、米国政府が最高クラスの技術を採用し、公共の利益に資するためにこれらのツールを展開する取り組みを支援しています。空軍研究所、NASA、NIH、財務省との以前の全てのコラボレーションは、政府向けOpenAIの傘下に組み込まれます。
この契約は2億ドルの上限契約であり、大きな取引です。明らかにOpenAIには現在、いくらかの否定的なセンチメントがありますが、とにかく見てみましょう。
以上です。この動画を楽しんでいただけたなら、いいねとチャンネル登録をお願いします。


コメント