新型DeepSeek 3.2が驚きの性能でオープンAIをリード、Runway Gen 4.5がリリース、Kling O1が動画編集機能を搭載

DeepSeekが3.2バージョンをリリースし、オープンソースAIモデルとして注目を集めている。同時期にKling AIとRunwayも動画生成モデルの新バージョンを発表し、AIによる動画生成と編集技術が実用レベルに達しつつある段階に入った。Kling O1は画像要素の詳細な指定や動画編集機能を搭載し、Runway Gen 4.5は複雑なシーンの生成と物理演算の精度向上を実現している。DeepSeek 3.2はGPT-4oやGemini 3 Proと比較可能な性能を示し、特にエージェント機能とコード生成において優れた結果を出している。無料でオープンソースという特徴から、中国のAI技術がオープンソース分野でリーダーシップを取りつつあることを示す事例となっている。

NOVO DeepSeek 3.2 SURPREENDE e Lidera iA Aberta, RunWay Gen 4.5 Liberado e Kling O1 Edita Vídeos

Aprenda Inteligência Artificial! ▸ Aprenda Agentes iA: ▸ Seja MEMBRO:

DeepSeek 3.2とKling O1、Runway Gen 4.5の登場
Kling AIの新しい動画生成モデル
動画編集機能の革新
Runway Gen 4.5の性能向上
DeepSeek V3.2の衝撃的なリリース
DeepSeek 3.2の実力テスト

DeepSeek 3.2とKling O1、Runway Gen 4.5の登場

皆さん、ニュースが次々と届いています。DeepSeekがバージョン3.2をリリースして、みんなを追い越して、いつか起こるだろうと誰もが期待していた中国の逆転劇をやってのけると約束しています。またKling AIとRunwayのリリースもありました。この2つは動画生成モデルです。

そして皆さん、これらのツールはどんどん良くなってきています。何が起こっているのか見てみましょう。一緒に来てください。さあ行きましょう、皆さん。いつもいいねを押してくれた皆さん、チャンネル登録してくれた皆さんに感謝しています。このAIチャンネルをスポンサーしてくれているチャンネルメンバー全員に特別な感謝を送ります。

メンバーの方々には、インテリジェントエージェントに関する限定動画へのアクセス権があることを常に覚えておいてください。そこではWhatsApp統合、MCP、PDF、ドキュメント、スプレッドシートの読み取りなどを備えたエージェントの作り方を教えています。また、早期公開動画へのアクセスもあります。もし会社にインテリジェントエージェントを導入してカスタマーサービスやプロセスの自動化、あるいは作り方がわからないAI製品を検討しているなら、Maximiza IAに連絡してください。説明欄にリンクがあります。彼らがあなたのためにこの小さなプロジェクトを実現してくれるので、あなたは見ているだけでいいのです。

Kling AIの新しい動画生成モデル

さて皆さん、今日の話題に入りましょう。Kling AIが動画生成のための新しいAIモデルのリリースを行っています。そして皆さん、見てください。私たちは今、私の頭の中に3つのバーがあるような瞬間に到着しています。

その1つ目のバーは、画像や動画の生成が面白おかしいけれど、ソーシャルメディアへの投稿にしか使えない時です。それから2つ目のレベルがあって、それは使い始めると便利になってくるけれど、まだ少し苦労するので、本当に価値があるかどうかわからない時です。そして3つ目のバーがあって、それは使えばそのまま進んでいける時です。

2025年の終わりに私たちが見ているのは、AIがふざけた用途にしか使えないレベル1から抜け出して、すべての要件を満たした通常の生活のフローの一部になっているレベル2に入っているということです。

では、ここで何が起こっているか注目してください。例えばKlingでは、このO1モデルをリリースしています。これはすでに利用可能で、50%割引のプロモーションもあり、ブラックフライデーもあり、このツールについて想像できるすべてがあります。そこをクリックすると、通常の動画生成ができます。モデルを選択できますが、この場合はプロフェッショナルなビデオ1になっています。2秒から10秒まで、希望する長さを選択できます。

いくつかの参照画像を渡すことができ、ここで3秒から10秒を選択できます。会員の方の場合は、標準にするか、プロフェッショナルにするか、VIPにするかを選択でき、フォーマットが横向き、正方形、縦向きのいずれかを選択し、欲しい出力の数を選択します。ここまでは普通のことですよね。

でも、彼らは何をするのでしょうか。メガネ、ネックレス、特定の服、特定のブーツ、水玉のスカート、そして小さな犬を連れた女の子の写真をアップロードします。そしてここで要素をマークし始めます。要素1、画像1、画像2、画像3、画像5、画像4、画像6です。そしてここに置いている説明を見てください。

要素1を取って、画像1からメガネを置き、画像2からネックレスを置き、画像3から服を置き、画像4からスカートを置き、画像5から靴下を置き、一方でキャラクターは画像6から犬を抱いています。この画像の説明の質の高さがわかりましたか。

そして生成をクリックすると、この女の子の写真とこれらすべてのアクセサリーで、これらすべてに基づいた画像をここに作成します。メガネを置き、服を置き、ネックレスを置き、膝の上に小さな犬、スカートを置き、どんどん進んでいきます、皆さん。

同じように、ここでも瓶を取って要素として置き、この中に夢の青い液体があり、瓶が黒い石の上に置かれ、神秘的で深みのある質感のある雰囲気だと言います。そしてここで瓶の4つの画像に展開し、ここで4つの異なる生成を行います。太陽がある石を含めて。そしてここにこれら他の4つも、とてもきちんとした、とても美しい方法で。

動画編集機能の革新

そして今、人々が最も気に入って最も興奮している部分、それが動画編集です。見てください、動画編集ですよ、皆さん。画像を送信して次のように言います。「画像1の雪を動画1に置いてください」。すると少し雪がある動画がありますが、あまり多くはありません。むしろ芝生が多いのですが、そこで何をするかというと、動画に雪を追加し、それからさらに物を追加し続けます。猫を置き、飲み物を置き、たくさんのものを。

すると猫が現れ、飲み物、アイスクリーム、たくさんのものが出てきます。彼は単純に編集し続け、すべてのものが消えるまで置いたり取ったりします。すべてのオブジェクトを入れ替えるだけで、画像と動画は同じままです。見てください、そこの女の子の髪の色を変えています。同じ動画の異なる角度の生成を依頼しています。

つまり、ただそう言えば、たくさんの角度を作り出してくれます。背景を変えたり、カメラの角度を変えたり、動画生成をしている時に変更するのが好きなこれらすべての小さな編集が、今では超高速の極端なバージョンになっていて、プロンプト経由で直接動画を編集できるようになっています。

これについて皆さんはどう思いますか。そしてテストするために、私は自分の写真で素早く要素の生成を行いました。この要素をプロンプトに追加して、インディ・ジョーンズのシーンを作れるか見てみましょう。そして会員ではないので、6秒までしかできません。

インディ・ジョーンズが巨大な石から逃げるシーンがどうなるか見てみましょう。48クレジットです。私は166持っています。このツールがポルトガル語を理解するか見るためにポルトガル語で入力しました。インディ・ジョーンズ映画の生成がどうなったか見てみましょう。注目してくださいね。プロンプトを入力しました。見てください。

要素、転がる石を置きました。私はそこでジャンプしました。きちんとジャンプしましたが、そこで少し変なことをしました。キャラクターはあまり私に似ていませんでした。動画を生成する時、少し感覚を失いますよね。顔を観察すると、少し歪んでいますが、石は正確です。ここでもっと近づいた時に、もっと似てくるか見てみましょう。

まあ、無理やり友好的に言えば、これは私に似ていると言えますが、似ていません。かなり歪んでいますが、少なくともアイデアは良いですよね。つまり、こう言いましょう。たくさんの参照写真でよく構成された良い要素を作成し、整列させれば、あるキャラクターで動画を作り、好きな方法で生成するのは速くなります。

ここで興味深いことの1つは、リップシンクもできることです。AIで作った音楽を入れて編集できます。とてもシンプルで、編集をクリックすると動画を維持し、ここで続けて編集し、さらに物を追加していけます。このO1モデルについてどう思うかコメントしてください。

どうやら本当に非常に良いレベルに進化しているようです。そしてほぼ同時に、Runway MLも画像生成モデルのGen 4.5をリリースしました。これも銀河系史上最高のモデルだと言っていて、皆さんが見ることができる素晴らしい画像があります。ですから皆さん、この画像生成の件、今は複雑な画像、シンプルな画像、象、シンク内の小鳥、素晴らしいものの数々が今ますます複雑になっていて、動画を生成するのがますます簡単になっています。

Runway Gen 4.5の性能向上

ですから準備してください。このツールは進歩し続けるだけで、ますます良くなるすべての要素が揃っています。これらの動画は今や驚異的な品質になっていて、すでに良かったものがさらに良くなっています。そして彼らの分析では、Runway Gen 4.5はVO3やKling 2.5よりも良いとされていますが、彼らはKlingoが前のニュースで発表されたばかりだということを知りません。

彼らはこのモデルが複雑なシーンを作ると言っていることがたくさんあります。なぜなら、例えば要素がたくさんあると、小さな電車、小鳥、汚れた食器、これらすべてのことです。シーンが複雑であればあるほど、作るのが難しくなります。

ソファ、テレビ、何もない場所を航行している小さなボート、上昇して家の中に入っていきます。これはすべて多くの情報です。プロンプトが超複雑になりますよね。庭のホースから水が出て、錆びた金属のバケツを満たしています。バケツのすぐ下には、完璧な状態で折られた白い紙のボートがあり、小さな黄色い花が付いています。

ボートは小さな川を下って家に入り、壊れたテレビの前で旅を終えます。つまり、物事が多すぎる、情報が多すぎる、そしてプロンプトへの忠実度が驚異的です。彼らはここでもコメントしています。詳細な構成が素晴らしく機能していると。ホッキョクグマが透明な氷のブロックの中に丸まっていて、小さな銀色のトレーラーにしっかりと固定されています。

カメラは目の高さでロープに引かれるトレーラーを追い、それから右に移動してトレーラーを引くヤギを明らかにします。すると氷の中のクマが見えて、突然ヤギが現れ、すべてがプロンプトで話された通りの順序で、これらの詳細が見事であることを示しています。

彼らは物理的精度も向上したとコメントしています。現実的な物理法則と、もっともらしい衝突です。サボテンが風船を抱きしめて、物理法則がすべて意味を成すように風船を破裂させます。これは非常にクレイジーですよね。そして彼らはキャラクターがより表情豊かになったともコメントしています。

つまりこの場合、演出において、より芸術的なもので、微妙な感情、自然なジェスチャー、現実的な顔の詳細を示しています。彼らはモデルがすでにリリースされているが、今後数日で利用可能になるとコメントしています。そして私が動画を生成しに来た時、4.5で生成をクリックすると、ここで情報が表示されます。新しいモデルが来ているが、まだリリースされていないという情報です。

ですからこの動画の録画時点では、まだリリースされていませんが、すぐに登場するはずです。そしてもしあなたがチャンネルの古参なら、この小さな動画を覚えているはずですよね。ずっと昔に生成した時のものです。もしかしたらこの映画を続けるかもしれません。なぜならこの映画は良かったからです。

DeepSeek V3.2の衝撃的なリリース

そしてDeepSeekは、少し静かで沈黙していた会社でしたが、今新しいモデルをリリースしました。彼らはここで震えさせています。DeepSeek V3.2とDeepSeek V3.2という新しいモデルで、これはエージェント向けに作られた推論モデルです。

そして彼らは、このバージョン3.2がすでにWebアプリケーションとAPIで利用可能だとコメントしています。しかしここの3.2、つまり推論モデルは今のところAPIのみです。APIというのは、プログラマー、開発者の場合、AI製品を作っている時にプログラミングを通じてモデルを呼び出し、質問や対話を行う時です。

ここでは、明るい青と点線の青がDeepSeek SpecialeとDeepSeek 3.2 F thinkingです。そしてどうやらここでは、ほぼすべてのテストで非常に良い結果を出しているようです。もちろんこれは前の動画で質問したことですが、彼らはGPT-4oと比較を続けていますが、GPT-4o1はすでにリリースされています。Claude 4.5 SonnetにはすでにOpusがありますが、少なくともここではGemini 3 Proと比較されていて、どうやら彼らはGeminiにも勝っているようです。

彼らはここで興味深い詳細をコメントしています。このツールはエージェント用に使用され、ツール使用のベンチマークで優れたスコアを出していて、Claude SonnetやGPT-4o、Geminiと同じレベルにあります。

そして望むなら、彼らのコードはオープンで、Hugging Faceで利用可能で、ダウンロードしてインストールできます。もちろんスーパーコンピューターが必要です。これらのモデルは大きいですからね。でもここにヒントがあります。無料でオープンなモデルです。

ここで非常に興味深いコメントがいくつかありました。例えば、Alex Prompterはこうコメントしました。「DeepSeekは考えられないことをやってのけた」。彼らはDeepSeek 3.2をリリースし、これは静かに最先端のオープンソースモデルの意味そのものを再定義しています。なぜなら、皆さんが知らないかもしれませんが、中国はオープンソースモデルをリードしています。彼らは本当に皆に自分たちのモデルを使わせています。

そして彼はコメントしています。パラメーターを調整したり、GPUを追加したりする代わりに、彼らはLLMが考え、訓練する方法を再設計しました。そして結果はオープンモデルにとって信じられないように見えます。つまり、皆さん、わかりましたよね。彼らは無料のAIに品質を入れています。これは非常に重要な節目です。

DeepSeek 3.2の実力テスト

そして皆さん、ご存知のように、私は一般的に中国のモデルにはあまり興奮しないのですが、疑念を晴らすために、DeepSeekに入りました。特別版ではありませんが、thinkingバージョンがあります。思考を有効にして、車のゲームの生成を行いました。

テストしなかったとは言わせないためですが、驚いたことに、ゲームは素晴らしかったです。このオープニング画面を見てください。指示がとてもきちんとしていて、ここをクリックしてゲームを開始できます。そしてこのゲームがどうなったか見てください。とても良かったので、コードをダウンロードしてフルスクリーンにすることにしました。このツールがどう機能しているか見たかったからです。

見てください、皆さん、車のゲームで気づかなければならないことがいくつかあります。木々を通り抜けています、山々を通り抜けています、大丈夫ですよね。シーンの真ん中にある小さな電車がドリフトしています。電車も通り抜けています。でも上に機能している煙突という栓があります。もしここで機関士に当たると爆発して、うまくいきません。

でも、DeepSeekの中国モデルで私が気に入っていることがいくつかあります。例えば、他のモデルが通常は持ち込まない何か新しいものを常に持ってきます。例えば、ここの地面の草のテクスチャーは、他のモデルが入れないものだと気づくもので、モデルが他のAIが訓練されているデータとは異なるデータで訓練されているという感覚を与えます。

ここを見てください。ゲームオーバーになりました。プレイヤーが勝ちました。もう一度プレイ、小さなメニューがすべてきちんと機能しています。コード生成中にたった1つの小さなエラーが出ただけでした。修正する時は超高速でした。そしてこの車の品質を見てください。車輪がきちんとしていて、上部があり、影があり、雲があり、山があります。

正直なところ、彼らが批評で言っていることに同意しなければなりません。本当に優れたモデルです。特にこのモデルが無料で、オープンで、誰でもダウンロードできると考えると。だからDeepSeekはおめでとうです。私は驚きました。超速テストをして、気に入らず、何も機能せず、何も驚かせてくれないだろうと期待していました。

でもとんでもない、大間違いでした。さらに見てください、このきれいなスピードメーターを。針がきちんと機能しています。針が上がって、車を止めると、針がきちんと下がります。プレイヤー対AIの進行状況のスコアボードも、とてもきれいに起こっています。ですから、これについてどう思うか、このツールにも驚いたかどうか、下にコメントしてください。

そしてこのような動画を見続けるためにチャンネルをサポートしたいなら、メンバーになってください。メンバーはインテリジェントエージェントの限定動画と早期公開動画にアクセスできます。それではいいねを押してください。ありがとう。