AIニュース:DeepSeekのAIエージェント、CEOがAI「危機」論を煽る、OpenAIの経済ソリューション

AIニュース
この記事は約9分で読めます。

本動画では最新のAI業界動向を速報形式で紹介している。主要トピックとしてDeepSeekが2025年にAIエージェントをリリース予定であることや、AIモデルがポーカーボット開発で競い合う新たなベンチマーク「Husky Holde Bench」の結果発表、SalesforceのCEOによるAI導入に伴う4,000人規模のレイオフ発言とそれに対するOpenAIの経済機会拡大ソリューション、さらにイリヤ・サツケヴァーのユニークなグッズ展開まで、幅広いAI関連ニュースを網羅的に解説している。

AI NEWS: Deepseek's AI Agent, CEO Stokes AI 'Crisis' Narrative, OpenAI Economic Solutions
The latest AI News. Learn about LLMs, Gen AI and get ready for the rollout of AGI. Wes Roth covers the latest happenings...

AIニュース速報:DeepSeekの新展開とAI業界の最新動向

ここでは重要なAIの発表をいくつか、速報形式で取り上げていこうと思う。まず第一に、DeepSeekを覚えているだろうか?彼らは少し静かにしていたが、ついにこの間ずっと何を企んでいたかが分かった。どうやら今年、OpenAIと競合するAIエージェントをリリースする予定のようだ。

他のニュースでは、News ResearchがHusky Holde Benchをリリースした。これはスクリプト化されたボットがテキサスホールデムポーカーをプレイするベンチマークだが、ここが面白いところだ。それらのボットは大規模言語モデルによって書かれている。まさにプロット・ツイストだ。なぜそうなのかはすぐに説明しよう。

また、SalesforceのCEOマーク・ベニオフが、AIのおかげで人手が必要なくなるため4,000人のレイオフを行うと発言している。information.comによると、彼の発言は少しばかりAI危機論を煽ったようだ。しかし恐れることはない。OpenAIがソリューションを用意している。OpenAIによる「AIによる経済機会の拡大」だ。また、これもある。これについてはすぐに触れよう。

DeepSeekの沈黙の理由と新たな展開

DeepSeekについて多くのニュースを聞いていたかもしれないが、彼らは少し潜伏していた。噂では、DeepSeekはHuaweiチップでの訓練に困難があったため、モデルの一つを遅らせたということだった。

Financial Timesによると、「DeepSeek次期AIモデル、中国チップ使用試行により遅延」とある。これは8月14日の記事だ。どうやら彼らはNvidiaに切り替え、Huaweiチップは推論と将来のプロジェクトのために予備として保持しているようだが、中国のチップはまだそこまで到達していないようだ。

Nvidiaとはまだ競争力がなく、これがプロジェクトを遅らせた。Bloombergによると、Deep Seekは最小限の指示で人に代わって多段階の行動を実行するように設計されたAIモデルを構築しているという。このシステムはまた、以前の行動から学習し、向上することを意図している。

これは少し曖昧だ。過去の行動からの学習とは記憶を意味するのだろうか?これは強化学習を一般人向けに表現した方法なのか、それともはるかに高度な何かなのだろうか?まだ分からない。

最初の部分は非常に明確だ。チャットボットのようなものではなく、多段階機能、長期タスクを実行できるAIエージェントのような新しいAIモデルが登場し、OpenAIや西側の最先端AI研究所との競争力を高めるということだ。これは今年2025年に見ることができるだろう。

AIがポーカーをプレイからボットを作るへの転換

一方、他のニュースでは、それほど昔のことではないが、現在OpenAIにいるNoam Brownのような最も優秀な研究者たちが、人間をポーカーで打ち負かすAIを構築していた。

こちらがNoamのプロフィールだ。彼はPluribusを共同創設し、人間対機械の競争で最高レベルの人間ポーカープロフェッショナルを打ち負かした。つまり、人々は人間をポーカーで打ち負かすAIを作っていたのだ。この記事の見出しは2019年のもので、時系列を把握してもらうためだ。

そして今、5、6年後、状況は完全に逆転している。今では、AIモデル、大規模言語モデルがポーカーをプレイするボットをどれだけうまく構築できるかを測定するベンチマークがある。

これは最近Hermes 4をリリースしたNoose Researchによるもので、Husky Holde Benchと呼ばれている。LLMがポーカーボットを開発し競争する。これはコード生成を超えて、競争的なポーカーボット開発を通じて戦略的思考と創造的問題解決をテストするベンチマークだ。

各モデルからのボットは、可能なすべての対戦相手の組み合わせに対して6人テーブルで競争し、テーブルあたり10,000ドルから始めて1,000ハンドをプレイする。ランキングは累積賞金によって決定される。

現在、Claudeが最上位に位置している。Claude Sonnet 4は3,600ドルデルタマネー。つまり3,672ドル稼いだということだ。10,000ドルから始めて3,672ドル増加させたので、開始時より36%増加したことになる。

次にClaude Opus 4.1が3,100ドル。Gemini 2.5 Proが3,100ドル弱。Grok 4が937ドル。GPT-5 Highが396ドル。Gemini 2.5 Flashが111ドル。Hermes 4の50億パラメータ版、つまりNews Researchの最新モデルが-1,200ドル。

そして有名なオープンソースモデルを含む残りのモデルは全てマイナスだ。様々なClaudeモデルが最上位かその近くにいることに驚きはないが、GrokとGPT-5 Highがこれほど劣った結果になったことは驚きだ。

これは独自の動画に値すると思う。なぜこれらの2つのモデル間にこれほど大きな違いがあるのかを詳しく分析してみたい。Grok 4は他のチャレンジでもかなり良い結果を出している。

Grok 4はコーディングモデルではなかったが、私たちが見ているベンチマークはますます興味深くなっている。なぜなら、これらのモデルが様々なテスト問題にどれだけ良く答えるかを見るだけではなくなったからだ。

ますます、単に質問に答えるだけでなく、戦略的思考を必要とする長期タスクで互いに競争させるようになっている。

これにはコーディングも含まれ、ポーカーをプレイするボットを書き上げることも含まれている。これは本当に素晴らしいベンチマークだ。そして再び、これらの大規模言語モデルがとてもとても優秀になっているために我々が持てるようになった新しくて刺激的で斬新なベンチマークに加わる、さらなる驚異的なベンチマークだ。

言葉が出ない。

SalesforceのCEOとAI危機論の議論

SalesforceのCEOマルコ・ベニオフが、information.comによると、意図せずにAI危機論を煽った。

彼はかなり長い間その太鼓を叩き続けている。彼の立場に対する批評家たちは、彼がみんなにAIエージェントのアイデアを売り込もうとしていると言っているため、彼は自分の利益のために発言している可能性があると理解することが重要だ。だから、話半分に聞いておいた方がいいかもしれない。

しかし、AIが引き継ぐにつれて仕事がますます減っていく可能性があると言っているまた別の人物がここにいる。

繰り返すが、全員が同じ見解を持っているわけではないが、OpenAIがソリューションを持っているかもしれない。

OpenAIの経済機会拡大への取り組み

こちらが彼らの最近のブログ投稿だ。「AIによる経済機会の拡大」。最近の採用の一人であるアプリケーションCEOのFidji Simoによるものだ。彼らが最初に受ける質問の一つから始まっている。「AIは私の仕事にとって何を意味するのか?私の会社にどのような影響を与えるのか?」

答えは、AIは破壊的になるということだ。

仕事は異なって見えるようになる。企業は適応しなければならず、シフト勤務者からCEOまで、私たち全員が新しい方法で働くことを学ばなければならない。

OpenAIの目標は、破壊を排除することはできないが、より多くの人々がAIにより精通するのを助けることができるというものだ。ここで要点に進もう。

彼らが言っているのは、AI精通者を雇いたい企業にとって、適切な人材を見つけることは当たり外れかもしれないということだ。OpenAI求人プラットフォーム。これが一つ。二番目はOpenAI認定だ。

基本的に、私が理解している限りでは、これはAIの仕事のためのオンライン認定の一部かもしれない。今年の初めに、彼らは無料のオンライン学習プラットフォームであるOpenAI Academyを立ち上げた。

アイデアは従業員をアップスキルし、その後、現在AI精通者となったアップスキルされた従業員の雇用を雇用主が行うのを助けることだ。明らかにこの多くは実際の実行、どれだけうまく実行するかに本当に依存するだろう。

これは素晴らしいことになる可能性もあれば、あまり影響がない何かになる可能性もある。しかし、これについてどう思うか教えてほしい。

OpenAIは最も使用されているAIモデルのいくつかを提供している。彼らは人々がアップスキルし、AIを学ぶための無料認定を提供するようだ。OpenAI Academy、これはAIを学ぶための無料学習プラットフォームだ。

AIの使い方を誰が教えているのか?それはAIだ。だから我々は明らかにAIを教えるためにAIを使う。

誰でもChatGPTのスタディモードで認定の準備をし、アプリを離れることなく認定を受けることができる。

つまり、彼らは人々にAIの使い方を教えている。そしてこの上に、これらの認定されたAI精通従業員を雇いたい企業を結びつけるのに役立つ、ある種のOpenAI求人プラットフォームがあるようだ。

しかし、これについてどう思うか教えてほしい。OpenAIがこれを担当すべきだと思うか?仕事のいくつかが置き換えられる中で人々をアップスキルし、彼らがAIを使って新しい仕事を見つけられるようにする素晴らしい仕事を誰かがやるだろうか?教えてほしい。

これがどのようにうまくいくか知りたくてたまらない。明らかに、成功するか失敗するかは実行にかかっている。人々がこのことについてどう思うか知りたくてたまらない。

イリヤ・サツケヴァーの意外な展開

他のニュースでは、イリヤ・サツケヴァーがツイートした。彼はあまりツイートしないが、するときはこのイリヤグッズについてだ。そして明らかに、これがイリヤグッズだ。

今日一つ買うことができる。世界中に発送。世界中に発送される。イリヤ・サツケヴァーへのサポートを示すために、私が見たものは何だったか?彼がこれを見た。

どこで買えるか疑問に思っているなら、画像の右下を見てほしい。そこの小さなシンボルは、これがGoogleのImageFX Nanaによって生成された可能性が非常に高いことを意味している。

誰かが帽子の写真、イリヤの頭の写真を撮り、ImageFX Nanaに入れて、結合と言ったのだ。しかしイリヤはそれを気に入っており、「これまで見た中で革命的な breakthrough だ」と言っている。

私の質問は、彼がツイートを始めるのを想像できるかということだ。彼がX上で人々を trolling するのを想像できるか?我々は可能な限り最も面白いタイムラインの一つに住んでいる。

少なくとも彼らの誰かが人工超知能を構築するまでは、その時点では、まあ、誰も知らない。

ここまで見てくれた方、本当にありがとう。私の名前はWes Rothで、次の動画でお会いしよう。

コメント

タイトルとURLをコピーしました