AI最新情報:Chrome版Claude、Nano Banana、Metaの人材流出問題、AppleのGemini利用、その他盛りだくさん!

AIニュース
この記事は約16分で読めます。

この動画は最新のAI業界のニュースとトレンドを包括的に解説したものである。AnthropicのClaude for Chrome拡張機能の発表から、GoogleのGemini 2.5 Flash Imageの優れた性能、MetaのAI部門での人材流出、AppleのSiri改良に向けたGoogleとの協議、NvidiaのJetronによる推論速度向上技術まで、AI分野の最新動向を幅広くカバーしている。また、MicrosoftのVibe Voiceによる音声合成技術やKiwiのフライト検索MCP、さらにはAIインフラ投資が経済全体に与える影響についても触れ、技術的進歩から経済的インパクトまでAI業界の現在の状況を多角的に分析している。

AI News: Claude for Chrome, Nano Banana, Meta Poaching Gone Wrong, Apple Using Gemini, and more!
Give Recraft a try, it’s free to start at Humanities Last Prompt Engineering Guide (free) 👇🏼

AnthropicがClaude for Chromeをリリース

今回の動画のスポンサーはRecraftや。詳しくは後で説明するで。

AnthropicがClaude for Chromeをリリースしたんやけど、Perplexity Cometよりもずっと直接的なアプローチを取ってるんや。Chrome拡張機能を使うだけでClaude for Chromeをインストールできるんやで。現在は研究プレビューとして公開されてて、実際にアクセス権を取得してテストしてるところや。

チャンネル登録しといてくれたら、レビュー動画を出すときに一番最初に知らせるで。Cloud4 Chromeを使えば、ClaudeがブラウザのChromeを操作してくれるんや。見てみいや、右上の小さなボタンをクリックすると拡張機能が開くんや。Perplexity Cometと非常によく似た感じやな。やりたいことを入力すると、実際にブラウザを操作してくれるんや。ここにZillowがあって、ドキュメントもあるし、Door Dashもある。Salesforceのエントリーも注文できるんや。

つまり、エージェントがどんどん人間のブラウジング体験をコントロールするようになっていくってことやな。でも、いかにもAnthropicらしく、非常にゆっくりとロールアウトしてるんや。先ほど言ったように、まずは研究プレビューからやっているのは、AIエージェントが本来すべきでないことをしてしまう危険性だけでなく、インターネット上の悪意のある行為者がそれを悪用する可能性があるからや。

すべてのモデルはジェイルブレイクされる可能性があり、AIエージェントにブラウズしてもらいたいウェブサイトを変更するだけで、人々はそれを悪用できるんや。ここに書いてあるように、ブラウザの使用にはいくつかの安全性の課題があり、最も注目すべきはプロンプトインジェクションやと。ClaudeのMaxプランを利用している場合は、今すぐウェイティングリストに登録できるで。下にリンクを貼っとくわ。

NvidiaのNeatron Nano 9B V2とその他の小型モデル

最近小型モデルがめちゃくちゃ増えてるみたいやな。NvidiaがNeatron Nano 9B V2をリリースしたんや。Artificial Analysisによると、これは90億パラメータの小型推論モデルで、Artificial Analysis Intelligence Indexで43点を記録し、100億パラメータ未満のモデルとしては過去最高のスコアなんやで。

これはNvidia自身が初めて事前訓練したモデルで、ハイブリッドMambaトランスフォーマーアーキテクチャを採用してるんや。純粋なトランスフォーマーではないってことやな。このハイブリッド技術については実際聞いたことなかったけど、めちゃくちゃクールそうやな。過去のMambaは俺にとってはあんまりうまくいかなかったけど、今回は違うことを願ってるで。

主な特徴として、128kトークンのコンテキストウィンドウを持ち、/nouink設定で推論と非推論をサポートしてるんや。Nvidia Open Model Licenseの下でリリースされてる。どこに位置するかを見てみると、43点でSolar Proのすぐ下、GPT5 minimalのすぐ下で、Quen 30B、Llama for Maverick(すまん、Llama)、Magestral Smallの上にあるんや。繰り返しになるけど、これは最高性能を目指したモデルではなくて、ほとんどのコンシューマーグレードのコンピューターで実行できる小型モデルなんやで。

GoogleのGemini 2.5 Flash Imageの驚異的性能

もし昨日完全にオフラインだったら、Twitterに投稿されたバナナをすべて見逃したやろな。Nano Banana。Googleがリリースしたこの驚異的な画像編集モデルや。これはGemini 2.5 Flash Imageで、信じられないくらいよく動くんや。LM Arenaのスコアを見てみいや。

下部にすべてのトップモデルが表示されてて、ほぼすべてのカテゴリで、特に全体的なパフォーマンスにおいて、Gemini 2.5 Flash Imageは他より断然優秀なんや。昨日テスト動画を出した自分の個人的なテスト体験からも、これは本当に信じられないほど素晴らしいで。まだチェックしてない人は、AI StudioとGeminiで試してみることができるで。

ちなみに、画像モデルで遊ぶことから大きな価値を得てる人は、今日の動画のスポンサーであるRecraftをチェックしてみてくれ。実際にプロダクション対応のアセットを提供するAIデザインツールをお探しか?RecraftはただのPGではなく、本物のSVGを生成するんや。つまり、クリーンなレイヤーとスケーラブルな品質を持つ完全に編集可能なベクターグラフィックスってことやな。もう手動トレースやピクセル化の問題はないで。

Recraftはモデルコンテキストプロトコル(MCP)とシームレスに統合され、CursorやClaudeのようなエージェントと直接接続できるんや。つまり、会話インターフェースを通じてデザインを簡単に生成・改良でき、ロゴ、マーケティング素材、製品マークアップなど何を作ろうが関係なく、正確なクリエイティブコントロールを維持できるってことや。Recraftはすべてを処理し、プロフェッショナルが必要とする一貫性でプロダクション対応ファイルを提供してくれるで。

今すぐ無料で試してみてくれ。下の説明欄にリンクがあるで。Recraftに改めて感謝や。それでは動画に戻るで。

MetaのSuper Intelligence Labsの人材流出

次に、Meta Super Intelligence Labsがすでに主要スタッフを失ってるようやな。Business Insiderによると、Meta AIのスタッフの一部が新しい汎用知能部門を退職してるんやて。これらの退職は、MetaがOpenAIやGoogleと競争するための取り組みに続くものや。

Metaは、退職者の多くは長年のAI従業員で、ある程度の人材流出は正常やと述べてる。俺が読んだところによると、入社したばかりの人が2ヶ月後にOpenAIに戻るために退職したって話もあるんやけど、実際には何も確認されてないようやけど、人材争奪戦が続いて激化してるのを見るのは興味深いな。

CEOのマーク・ザッカーバーグがMeta Super Intelligence Labsという全く新しい部門を発表してから2ヶ月も経たないうちに、研究者、エンジニア、シニア製品リーダーを含む少なくとも8人の従業員が会社を去ったんや。

チームに大量の新しい人材が流入するときは、これは必然的に起こることやな。AI CEOのAlexander Wangの下で大規模な組織再編が起こったばかりのときは、摩擦が生じるのは避けられないことや。全員が満足するわけではないし、何人かは去っていくやろな。

Metaで12年間働いて今週の初めにAnthropicに移ったBert Mayorがいる。この人はPyTorchの開発を手伝った人物で、PyTorchはAIとMLワークロードを支援する非常に人気のあるオープンソースライブラリなんや。Tony Louuも8年以上勤務した後、LinkedInで退職を発表したんや。彼はPyTorch GPUシステムで働いていて、他にも何人かが退職したんやで。フロンティアAIラボからのこれらさまざまな移籍について、引き続きアップデートしていくわ。

Nouse ResearchのHermes 4モデル

次に、Nouse Researchが使用できるオープンウェイト・オープンソースモデルをリリースしたんや。これもまた別のハイブリッド推論モデルやで。これを見てみいや。NASA Researchが最新のハイブリッド推論モデルラインであるHermes 4を発表したんや。Hermes 4は、テスト時計算能力を拡張したユーザー調整モデルの遺産の上に構築されてるんや。

これらのモデルをクリエイティブで興味深いものにすることに特別な注意が払われ、検閲に阻まれることなく、もしそれが好みなら、これは素晴らしいモデルやで。オープンウェイトモデルとして最先端レベルの数学、コーディング、推論パフォーマンスを維持しながら、中立的に調整されてるんや。

今すぐchat.nressearch.comで試すことができるで。これは実際に他と違って見える初のチャットインターフェースやな。これを見てみいや。これは本当に興味深く見えるな。昔のインターネットの雰囲気もあるけど、何か新しいことを試す人は好きやで。

彼らは技術レポート全文もリリースしてて、下にリンクを貼っとくわ。70億パラメータ版と4050億パラメータ版の2つのサイズがあり、推論版と非推論版もあるんや。Refusal Benchで回答した質問の割合を見ると、市場の文字通り他のすべてのモデルよりもはるかに高いんや。つまり、検閲されてないってことやな。

Grock Codeの登場

次に、Grock Codeが登場したんや。少なくとも小規模版がな。基本的にXAIやGrockからのアナウンスはほとんどなかったけど、Windsurf、Cursor、その他のエージェンティック・コーディング・プラットフォームなんかに現れ始めたんや。

ここにあるで。Grock codeがCursorで利用可能になったんや。100万入力あたり20セント、100万出力あたり1.5ドルや。非常に高速で非常に安いんや。俺のチームが行った初期テストでは、Claudeモデルファミリーほど良くはないけど、速度と価格を考えると、かなり魅力的やで。もちろん、今後どんどん良くなっていくやろうな。

現在もっとテストを行ってるところで、完全なテスト動画をまとめるかもしれん。下のコメントで見たいかどうか教えてくれや。

SpaceXの海上着陸成功

宇宙とロケットのニュースで、SpaceXがまたやってくれたで。海の真ん中の小さなプラットフォームに信じられないようなロケットを着陸させたんや。これが未来やで。これはSFの頂点やな。しかも、実際の映像も撮れたんや。

着陸してるのが見えるやろ。倒れてしまうけど、確実に着陸したんや。あらゆる点で成功だったと言ってたで。見てて非常にクールやった。SpaceXチームおめでとう。信じられないことやで。

AppleのAI企業買収計画とGemini利用

次に、多くの人がなぜAppleは他のAI企業を買収しないのかと聞いてるけど、どうやら話し合いはしてるけど、まだ実行に移してないようやな。何千億ドルもの現金がただ寝かせてあるんや。狂ったような株式買い戻しをしてるけど、なぜAI企業を買収しないんやろ。なぜ買収をしないんやろ。

これまでに行った最大の買収はBeats by Dreadのヘッドホンで、これは狂ってるで。AI分野であまりにも遅れをとってるようで、単純に別のAI企業を買収することもできるはずやのに。

Reutersによると、Apple幹部はPerplexityの買収について内部協議を行ったんやて。協議は初期段階で、オファーにつながらない可能性があるんや。これを最初に報じたBloomberg Newsがこのスクープを得たのは狂ってるで、まだそんなに早い段階やのに。誰かが確実にリークしたな。

もちろん、Perplexityは「Perplexityに関する現在または将来のM&A協議については一切知らない」と述べてる。Appleはすぐに応答しなかったけど、報告されてるんや。彼らは毎日どんどん遅れをとってるから、早くそういう動きをしてほしいもんやな。

そしてここに、なぜそうなのかの例があるで。またReutersによると、AppleはリニューアルされたSiriを動かすためにGoogleのGemini AIの利用について協議中なんやて。Bloomberg Newsが報じてるんやけど、実際にこのAIブーム全体でSiriは悪化したと思うし、今度はGoogleに助けを求めるかもしれんな。

でも、これは初めてのことではないで。GoogleはiPhoneの検索を長い間動かしてきて、基本的にAppleにデフォルト検索エンジンになるためにお金を払ってるんや。だから、これも別の例かもしれんな。

Appleは最近、来年リデザインされたSiriを動かすためのカスタムAIモデルを開発するためにAlphabetのGoogleにアプローチしたんや。なぜ来年やねん?Elon MuskとXAIチームがGrockを市場に出して一流のAIプロバイダーになるまでの動きの速さを見ると、Appleがどれほど遅れているかを考えるのは狂気やで。

Appleは社内SiriモデルにこだわるかExternal partnerに切り替えるかを決定するまでまだ数週間で、まだ選択してないんや。Anthropicかもしれないという噂もあったし、他の企業かもしれないという噂もあった。Mistralとそのモデルとチームを買収するかもしれないという噂もあったな。でも最終的には、何かしらの行動を起こす必要があるで。

KiwiのMCPフライト検索サーバー

次に、実際にかなり過小評価されると思うんやけど、Kiwi.comがフライト検索MCPサーバーをリリースしたんや。フライトを予約したいとき、フライト予約は価格比較だけでなく、マルチホップなんかをする場合は非常に複雑になるんや。従来のフライト検索が提供するインターフェースを使うのは本当に面倒に感じるんやで。

だから今、エージェントを設定してKiwiでフライトを検索するんや。単一のツール検索フライトを公開し、往復または片道フライト、出発地目的地、旅行日程、日付の柔軟性、乗客の人数とタイプ、キャビンクラスなど、フライトを予約するために必要なすべての情報を取得できるんや。

これは本当に今後起こることのヒントやと思うで。エージェントがインターネットに普及し、人間とインターネット上の情報の間の相互作用レイヤーになるにつれて、ますます多くの企業がMCPサーバーを公開するようになるやろな。本当に人間とインターネットは分離し続けて、俺のエージェントが俺に代わってウェブで物事をするようになると信じてるで。

だから、その方向への素晴らしいステップやな。Kiwiよくやった。チェックしてみてくれ。

NvidiaのJetron技術で推論速度を50倍向上

次に、Nvidiaが素晴らしいオープンソース論文を発表し続けてるんや。これはLLM推論を50倍以上高速化するものやで。TwitterのJackson Atkinsがこれがどのように機能するかの素晴らしい要約をまとめてくれたんや。

これはポストニューラルアーキテクチャ検索という技術で、事前訓練されたモデルを改造するための革新的なプロセスなんや。知識を凍結するんや。つまり、Quen 2.5のようなモデルを取って、そのコアMLPレイヤーをロックダウンし、その知性を保持するんや。それから外科的な置換を行って、これらの遅いレイヤーを置き換えるんや。

それからスループット用に最適化するんや。検索は複雑な推論に必要な正確な位置にいくつかのキーフル注意レイヤーを保持し、H100 GPU上での速度に最適化されたハイブリッドモデルを作成するんや。

結果がこれや。Jet Neatronが毎秒2800以上のトークンで、トップクラスのモデル性能と47倍小さなKVキャッシュを実現してるんや。これこそ俺たちが必要なものやで。

DeepSeekが落ちたときのことを覚えてるやろ。みんな「うわー、DeepSeekはもっと効率的でもっと低コストを達成できた。Nvidiaの株を全部売るべきや」と思ったんやけど、当時Nvidiaはそれを信じてなかったし、今市場はそれがばかげてることを理解してるんや。

実際に起こることは、物事がより効率的で安くなるにつれて、俺たちはもっと使うようになるってことや。だからNvidiaはこのような論文を発表して、信じられないほどの効率を達成する方法を示すことに何の問題もないんや。明らかに投資アドバイスではないけどな。

論文はこれや。「ポストニューラルアーキテクチャ検索による効率的言語モデルJetron」。詳しくチェックしたい人のために下の説明欄にリンクを貼っとくわ。内容を詳しく説明した動画をほしい人は、下のコメントで教えてくれや。

GoogleのAIによる天気予報の成功

AIへの深い投資から生まれるポジティブな結果について続けてみようか。Ars Technicaによると、GoogleのAIモデルが今年最強の大西洋嵐の予報を見事に的中させたんやで。AI天気モデルがこのパフォーマンス改善を続けるなら、激しい天気を予測するゴールドスタンダードになるかもしれんな。

なぜこれが良いことなのか?人々に襲来する激しい嵐や竜巻、その他彼らがいる場所に影響するかもしれないあらゆることについて事前に知らせることができるからやで。これを見てみいや。内部テストでは、俺たちのモデルのサイクロン経路と強度の予測は、現在の物理学ベースの手法と同じくらい正確で、しばしばそれ以上に正確やと示されてる。

これはDeep MindのAlphaFoldプロジェクトと非常に似た感じやな。基本的に、潜在的なタンパク質とその折り畳み方をすべて手動で推測しようとする代わりに、フォールディングプロジェクトでは予測モデルを使って異なるタンパク質を予測したんや。はるかに効率的なだけでなく、より正確でもあるんやで。

そして、ここでもまさに同じことが起こってるようやな。DeepMindチームからのもう一つのクールなプロジェクトや。おめでとう。

CodecCLAの新機能アップデート

次に、Codec CLAが大量の新しいアップデートを受けたんや。これを見てみいや。Codecについて知らない人のために説明すると、これはOpenAIのコマンドラインインターフェース・コーディング・エージェントなんや。

まず、Codec CLIアップデート0.24で画像入力が追加され、他の多くの改善と一緒に試すことができるんや。ウェブ検索メッセージ、コピー&ペーストとドラッグ&ドロップ画像、トランスクリプトモード、簡素化されたコマンド承認、より良い出力差分、その他も追加されたで。Brew install codecsで使用でき、たくさんのアップデートがあるで。チェックしてみてくれ。

AIインフラ投資が経済全体を支える

次に、ニューヨーク・タイムズによると、AIインフラ支出が経済全体を支えてるんやて。技術企業が新しいデータセンターに注ぎ込んでる何兆ドルもの資金が、少なくとも今のところ、経済成長に現れ始めてるんや。

記事は、AIインフラ支出がもちろんNvidiaのような企業に利益をもたらしてるという明白なことを指摘することから始まってるんや。でも今、それが経済全体を支えている兆候が見え始めてるんやで。

企業は2025年だけで世界的にAIインフラに3750億ドルを費やし、来年は5000億に上ると予測されてるんや。これは興味深いグラフィックやな。ここは従来のオフィスへの支出で、ここはデータセンターへの支出や。だから、これらのオフィスがすべて近いうちにデータセンターに変換されるかもしれんな。

そしてこれを聞いてくれ。このブームは電気技師、エンジニア、重機オペレーターにとっても良いものとなってるんや。だから、このAIブームから恩恵を受けてるのはホワイトカラー労働者だけじゃないんやで。ブルーカラー労働者もこれから大きな恩恵を受けてて、今電気技師になるのは実際に非常に魅力的なキャリアパスなんや。まだ構築する必要があるインフラがめちゃくちゃ多いからな。

だから、AI経済の中で何が起こってるか、そしてAIインフラ投資のレンズを通して見た広い経済について理解しようとしてる人には素晴らしい記事やで。下にリンクを貼っとくわ。

MicrosoftのVibe Voice音声合成技術

次に、MicrosoftがVibe Voiceをリリースしたんや。フロンティア・オープンソース・テキスト読み上げモデルや。これを聞いてみてくれ。

「また同じことをしたなんて信じられない。2時間待ったのよ。2時間も。電話1本もテキスト1つもなし。一人でそこに座ってるのがどれだけ恥ずかしかったか分かる?」

「分かってる。ごめん。」

素晴らしいな。本当に優秀やで。これはもちろんOpenAIによる高度音声モードと同レベルで、それはクローズドソースやけど、これは絶対に信じられないものやで。トーン、リズム、すべてがカスタマイズ可能で、聞いた通りコンテキスト対応やんか。

ウェイト、研究論文、ソフトウェア、すべてをリリースしたんやで。Microsoftよくやった。ベンチマークを見てみいや。ここに人間の好みがあって、Viveoice 7Bと1.5Bや。これらは非常に小さなモデルやけど、7B版はGemini 2.5 Pro Preview TTS、11 Labs V3、Pigs Audio、Sesame AI Labsを上回ってるんや。Sesameが最高やと多くの人が言ってるから驚きやな。これは本当に優秀に聞こえるで。

試してみたい人のために、下にリンクを貼っとくわ。知っておくべき機能がもうちょっとあるで。単一の音声生成で最大90分まで対応できるんや。これは本質的に単一生成でフルポッドキャストってことやな。だから、2つの生成をクリップして繋げれば、本質的に無限の音声が得られるんやで。

4スピーカー対話シナリオをサポートしてるんや。慣れ親しんだ2つだけでなく、最大4つまでや。そして多言語対応で、まともな中国語性能も含んでるんやで。試してみて、どう思うか教えてくれや。もしかしたらチュートリアルを作るかもしれん。下のコメントで欲しいかどうか教えてくれ。

この動画をスポンサーしてくれたRecraftに改めて感謝や。下にリンクを貼っとくで。チェックしてみてくれ。このチャンネルの素晴らしいパートナーになってくれたんや。俺が送ったと伝えてくれや。

この動画を楽しんでもらったら、いいねとチャンネル登録をよろしく頼むで。

コメント

タイトルとURLをコピーしました