私の終焉、新たな№1オープンソースAI、トップ画像モデル、新GPT機能、新ディープフェイクAI

AIニュース
この記事は約41分で読めます。

今週のAI界は目覚ましい進歩を見せた。Tencentが発表したX Omniはオープンソースの画像生成モデルで、GPT-4oレベルのテキスト描画能力を持つ。同社のHunyuan World 1.0は単一画像やテキストプロンプトから3D環境を生成できる革新的なツールである。中国のZ AIが開発したGLM-4.5は、プロプライエタリモデルに匹敵する性能を持つオープンソースの思考型モデルとして注目を集めている。一方、GoogleのDeepMindはAlpha Earthファウンデーションズを発表し、地球全体の高解像度デジタルツインを実現した。OpenAIは無料ユーザー向けに学習支援機能を追加し、Googleは深い思考能力を持つGemini 2.5 Deep Thinkを発表した。さらに、Ideogramの新機能Character は単一の写真から高精度なディープフェイクを生成可能とし、ヒューマノイドロボットの分野でも実用的な進歩が見られた。

The end of me, new #1 open-source AI, top image model, new GPT features, new deepfake AI
INSANE AI NEWS: GLM 4.5, AlphaEarth, Hunyuan World, FLUX Krea dev, X-Omni, NotebookLM Video Overviews #ai #ainews #aitoo...

革新的なオープンソースAIモデルの登場

AIは決して眠らへんし、今週は本当にとんでもない週やったわ。新しいトップクラスのオープンソースモデルが出たんやけど、これがGrok 4やGemini 2.5 Proみたいな最高のプロプライエタリモデルと同じくらい優秀なんや。

テキストを画像にしっかり描ける、GPT-4oの画像モデルみたいに設計された新しいオープンソース画像生成器も出てきた。TencentがリリースしたオープンソースのAIは、テキストプロンプトや画像だけでインタラクティブな3D世界を作れるねん。

参照画像1枚だけで超正確なディープフェイクを作れる新しいディープフェイク生成器もある。ChatGPTには学習に役立つ新しい無料機能が追加されたし、これらの写真みたいに超リアルな写真を作れる新しいオープンソース画像生成器もある。実際に本物みたいに見えるし、あの完璧で磨かれた感じがないんや。

このAIは俺の仕事を破壊してしまうやろうな。アップロードした記事や文書から完全な解説動画を作れるねん。DeepMindは地球の超詳細なモデルをリリースしたし、他にもいっぱいある。さあ、すぐに見ていこうや。

Tencent X Omniの革新性

まず最初に、Tencent HunyenがX Omniをリリースした。これは実際かなりでかいことやねん。オープンソースのGPTレベル画像生成器みたいなもんなんや。言い換えれば、自然言語をはるかによく理解して、特にテキストを含む画像をもっと正確に生成できるねん。

これはGPT-4oの画像生成器とまったく同じ自動回帰型の画像生成器や。だから、Stable DiffusionやFluxみたいな従来の拡散モデルとは違うねん。ここにいくつかのサンプル生成がある。このポスターを見てもらったら分かるように、テキストも非常に正確にレンダリングできてる。

これもそうや。誤字はあるけど、オープンソースの画像生成器としてはまだまだ良い出来やな。テキストはFluxみたいな従来の拡散モデルよりもはるかに良い。

別の例がここにある。テキストが完璧やのに注目してや。そして、このようにさまざまなタイプの画像を生成できることにも注目や。テキスト付きの追加例もある。これらの例のテキストのほとんどが実際に正しいのが見て取れるやろ。

GPT-4o以外の他のモデルでは非常に難しいことなんや、特に画像にたくさんのテキストがある場合はな。だから、これは本当に印象的やねん。それから中国語のテキストもこんな風にできる。

これらの文字のほとんどが実際に正しいねん。良いところは、ページの上の方にスクロールしたら、これをオンラインで試せる無料のHugging Faceスペースをリリースしてくれてることや。だから、これをクリックしてみよう。

2つのスペースから選べるねん。これは英語のテキストレンダリングをサポートしてる。これは中国語をサポートしてる。だから、これをクリックしてみよう。使い方は結構シンプルや。ここにテキストプロンプトを入力するねん。

それから、ここに高度な設定もあるけど、俺は普通デフォルトのままにしてる。だから、このプロンプトを試してみよう。Edward Robertsonに宛てたプロフェッショナルなトーンの正式な手紙で、以下のテキストを左揃えで配置。その下に、この日付も左揃えで配置。そして、手紙の本文にこのテキストも全部追加して。

これは生成に時間がかかることに注意やな。具体的には、少なくともここでは182秒って表示されてる。だから、これが終わるまで待とうや。よし、これが結果や。テキストのほとんどは正しい。ここにいくつか間違いがあるな、これはセミコロンじゃなくてコンマのはずや。

句読点に問題があるみたいやな。ここにピリオドがあるべきやし、ここにコンマがあるべきや。でも、エラー率はStable DiffusionやFlux、HyDreamみたいな他のオープンソースモデルよりもはるかに低いねん。特にこれだけのテキスト量やと、他のは全部幻覚を起こして大量の単語を間違えるからな。

でも、これは実際に本当に良い。良いところは、このHugging Faceスペースに加えて、モデルとコードも既にリリースしてくれてることや。だから、このボタンをクリックしたら、GitHubページに移動する。少し下にスクロールしたら、コンピューターにダウンロードして実行する方法の説明が全部載ってる。

さらに、これはApache 2ライセンスの下にあることに注目やな。これは制限が非常に少ない。商用利用も含めて、基本的に何にでも使えるねん。ここではVRAMの要件は明記されてへんな。でも、このHugging Faceのページをクリックしたら、モデルのサイズが約20GBやということが分かる。

だから、これを実行するには24GB以上のVRAMが必要かもしれへん。とにかく、さらに詳しく読んだり、オンラインで試したりしたい人は、メインページのリンクを下の説明欄に載せとくわ。

Hunyuan World 1.0の3D世界生成

次に、TencentがHunyuan World 1.0をリリースした。これは、パノラマ画像や没入感のある探索可能な3D環境を作成できる無料でオープンソースのAIで、実際にインタラクションできるねん。

ここが彼らのショーケースリールや。見ての通り、テキストプロンプトだけで3D世界を生成できるし、参照として使用する画像をアップロードすることもできる。そして実際にこの3Dシーンを歩き回って探索できるねん。

ここでは、これみたいな物理シミュレーションを追加したり、コントローラーで制御できるオブジェクトをシーンに追加したり、コントローラーで制御できるキャラクターをシーンに追加したりといった、もう少し多くの機能を見せてる。

でも、今のところ、これらの機能はまだ俺らのほとんどが使えへんのやな。できるのは3D環境の生成だけや。良いところは、これをオンラインで試せることや。だから、ここをクリックしたら、パノラマ画像とインタラクティブな3D世界の両方を実際に生成できるオンラインプラットフォームに移動する。

例えば、ここでこの参照画像をアップロードして、生成をクリックしたら、このシーンから完全なパノラマ画像を生成するねん。どんだけクレイジーやと思う?この木の1枚の画像だけからこれをやってのけたんや。でも、残りのシーンがどんな風になるかを推測して生成できるねん。

だから、マウスを端から端までドラッグしたら、こんな感じに見える。すべてが超シャープで詳細やのに注目やな。これは間違いなく俺が今まで見た中で最高解像度のパノラマ画像生成器や。これが一つの例やな。

別の例がここにある。この画像をアップロードしたら、これが結果や。元の画像からこのデジタルアートスタイルも保持してることに注目やな。どんだけクールやと思う?これも超詳細で高解像度のパノラマ画像や。

よし、ここに別のトリッキーなやつがある。この水彩の中国画をアップロードしたら、元の画像はここにあるけど、元の画像を基にしてシーンの残りを生成できるねん。

すべてがどんだけ詳細で美しくて一貫してるか見てや。これは本当に印象的やな。ここに画像をアップロードすることに加えて、このオプションを選択してテキストプロンプトを入力することもできる。

例えば、空に浮かぶ島みたいなのを試してみよう。そして生成をクリックしよう。このオンラインプラットフォームでは結構速いことに注目やな。パノラマ画像を生成するのに1分もかからへん。

よし、これが結果や。見てや!確かに空に浮かぶ島がある。シーンを回転させたら、ちなみにこれはインドネシアの火山に奇妙に似てるな、何のことか分かるやろ。でも、そう、これもテキストプロンプトだけで生成できる超詳細な3Dシーンやねん。

ここの上で、パノラマ画像を生成するだけでなく、これをクリックしてインタラクティブな3D世界を生成することもできる。例えば、ここでマウスをこんな風に動かせる。でも、WASDキーを使って移動することもできるねん。

でも、どれだけ移動できるかは実際にはかなり制限されてることに注目やな。前に歩きすぎると、フレームが紫や青でハイライトされて、基本的に境界に達したことを示すねん。だから、これ以上は進めへん。そして、シーンの後ろはこんな感じになってる。これが一つの例やな。

この画像をアップロードした場合の別の例がここにある。それから生成された3D世界がこれや。また、非常に詳細で高解像度のシーンやな。動き回ってみよう。とてもクールやな。

だから、これはビデオゲームやアニメーション、その他何でも用の3D環境を作成するのに使える、非常に有用なオープンソースAIやねん。別の例がここにある。また、WASDキーを押してこれとインタラクションできる。

とても良い。オンラインで試すことに加えて、良いところは既にHuggingFaceで全モデルをリリースしてくれてることや。でも、一部のユーザーは24GBのVRAMでも動作しないと報告してる。だから、これを動作させるには32GBの5090みたいなのが必要やねん。

将来的にはもっと量子化されたバージョンも利用できるようになると思う。でも、今十分な計算能力があるなら、このGitHubリポジトリの下の方に、コンピューターにローカルでダウンロードして実行する方法の説明が全部載ってる。さらに詳しく読みたければ、メインページのリンクを下の説明欄に載せとくわ。

Alpha Earth Foundationsの地球デジタルツイン

他のニュースで、Google DeepMindがAlpha Earth Foundationsをリリースした。これは基本的にAIを使って地球の大量の空間データを一つの統一モデルに圧縮するねん。そして、これによって雲の覆い、気候、土地利用などのすべてを超高解像度で見ることができる。これは地球の最も詳細なモデルや。

動作原理はこうやねん。従来、俺らには大量の空間データがあるけど、これらは全部別々の層になってる。例えば、アマゾンの森林被覆だけの1つの層マップがあったり、アメリカの都市部全部の別の層マップがあったりする。でも、この空間データは全部別々やねん。

Alpha Earth Foundationがやることは、基本的に全てのマップデータを一つの統一モデルに統合することや。そして、これは驚異的な解像度やねん。つまり、地球のこのモデルを取って、特定の場所にズームインして、極めて精密で詳細に見ることができるねん。

ここで彼らが述べてるように、これは仮想衛星のように機能するAIやねん。基本的に大量の空間情報を地球の一つの統一されたデジタル表現に圧縮できるねん。デジタルツインみたいに考えてもらったらええ。そして、これは森林伐採や都市拡大、水資源、気候変動などのたくさんのことをマッピングするのに役立つ可能性がある。

これらはペタバイト級のデータや。そして、これを10×10メートルという驚異的な解像度に圧縮してる。これは従来の方法よりもはるかに詳細やねん。大量のデータを処理するにも関わらず、実際には非常に効率的に圧縮できてる。

ここでは他のAIシステムと比較して16倍少ないストレージスペースしか必要としないと書いてある。そして、地球のこのデジタルツインによって、たくさんのことができるようになる。

農業、都市拡大、森林伐採のような地球規模の変化を極めて高い精度で追跡できる。さらに、彼らはAlpha Earth Foundationsが他のモデルよりも24%低いエラー率を持つことも発見した。だから、データサイズの面でより効率的やだけでなく、より正確でもあるねん。

素晴らしいことに、彼らは既にGoogle Earth Engineで年次埋め込み、基本的に年間データサマリーのコレクションをリリースしてる。だから、科学者で地理空間データを扱う必要があるなら、ここでGoogle Earth Engineの使用にサインアップできる。

とにかく、人類と地球のためにまた別の非常に有用なアプリケーションを作ったGoogle DeepMindに敬意を表するわ。この会社は人類のためにこんなに多くの価値を創造してきた。彼らはAlphaFoldやAlpha Genomeを作った。医療分析用のAIであるMed Gemmaも作った。サイクロンの予測に役立つWeather Labも作った。イルカのコミュニケーションを解読するのに役立つDolphin Gemmaも作った。

そして今、地球の最も正確で最高解像度の再構築であるAlpha Earth Foundationsをリリースした。俺らのためにこんなに多くの価値を創造してくれたGoogle DeepMindに敬意を表するわ。とにかく、さらに詳しく読みたければ、メインページのリンクを下の説明欄に載せとくわ。

ChatGPTの学習支援機能

次に、OpenAIが超有用な機能をリリースした。これは無料ユーザーでも利用できるねん。このツールのドロップダウンで、この新しい「Study and Learn」ボタンがあることに気づいてへんかったら見てや。だから、これをクリックしてみよう。

これは基本的にガイド付き家庭教師のように機能する。直接答えを与えるのではなく、段階的に何かを学ぶのを手助けするように設計されてる。そして、これは参加と批判的思考、そして自己反省を奨励するねん。

例を試してみよう。細胞呼吸について教えてって書いて、スタディモードをオンにして、生成をクリックしよう。答えを直接与える代わりに、実際に俺にいくつか質問をしてくる。なんで俺をMapleって呼ぶのか分からんな。

4o advanced voiceが出た時にその音声がMapleって呼ばれてたからやと思う。だから俺がそう呼んだんや。なんでか俺の名前がMapleであるべきやって登録されてるのか分からんけどな。とにかく、ここで最初に「これについて既にどれくらい知ってる?」って聞いてくる。だから、これについてはまだ何も知らないって答えるわ。

よし、これが次の答えや。超シンプルに始めよう。基本的な方程式がここにある。まだ覚える必要はないよ。そして、そこで一旦止まって質問をしてくる。なんで細胞にエネルギーが必要やと思う?細胞はそれを何に使うと思う?

だから、実際に俺に参加させて、これについて批判的に考えさせてるねん。だから、答えよう。機能するためにエネルギーが必要やな。物を動かしたり、老廃物を取り除いたりするのに必要かもしれへん。

そして、これがその反応や。次に、細胞呼吸の3つの段階を教えてくれる。そして、別のフォローアップ質問をしてくる。細胞のどの部分が最もATPを作る責任があると思う?細胞質かミトコンドリアか?そして、延々と続いていく。

これは一つの例やけど、この学習機能がどれだけ有用かが分かるやろ。実際にどんなトピックや言語でも学習して理解するのに役立つねん。なぜなら、実際に段階的に一時停止して、各ステップで考えさせる質問をしてくるからや。実際にもっとよく学習できるねん。だから絶対に試してみてや。

これは無料プランの人も含めて、全てのChatGPTユーザーが利用できるねん。

Hera Videoの動画生成技術

俺のチャンネルを追ってる人は、俺が最高のビデオ生成器を見つけることに夢中やってるのを知ってるやろ。最近、このビデオのスポンサーであるHera Videoを試してみたんやけど、これは本当に印象的やった。

これはテキストプロンプトだけからプロフェッショナルなモーショングラフィックアニメーションを作成できる唯一のAIや。Vio SoraやRunwayみたいな他のビデオ生成器では、これを正確にやることはできへん。

例えば、このデータでアニメーション棒グラフを作ってもらおう。これが結果や。俺のプロンプトの数字とテキストに正確に従ってる。

別の例がここにある。アメリカの地図を作って、ズームインしてカリフォルニア州をハイライトしてもらおう。これが結果や。これは本当に印象的やな。アメリカの本格的な地図を生成して、カリフォルニアにズームインして、カリフォルニアの輪郭を描いてる。

これを試してみよう。iPhoneでの天気アプリのインターフェースを紹介して。どんだけ美しいか見てや。これを使って、どんなアプリやウェブサイトでも製品ビデオやコマーシャルを簡単に作れるねん。

実際に俺が指定した全テキストに従えるかどうか見てみよう。だから、このテキスト全部でアニメーションスライドを作ってもらおう。今回はアスペクト比を縦にしてみる。これは本当に印象的やな。

これを美しく見せてくれる。最後に、以下のメッセージでInstagramチャットを試してみよう。これが結果や。とても良い。これには内蔵エディターがあることに注目やな。だから、実際にビデオの任意のコンポーネントを選択して編集できる。背景色を変更したり、テキストを変更したり、コンポーネントのサイズを変更したりできる。

さらに、さらに編集するためのフォローアッププロンプトを追加することもできる。従来、これらのアニメーションを作るには大量の時間がかかったけど、Heraを使えば超速くて簡単やねん。高度なデザインスキルや高価なソフトウェアは必要ない。

大量のプロンプトでテストしたけど、全部うまくいった。下の説明欄のリンクから今日Heraを試してみてや。

GLM-4.5の登場と性能評価

過去2週間、中国企業からの大量のオープンソースモデルが出てきて、トップクラスのプロプライエタリなクローズドソースモデルの一部を打ち負かすものまで出てきた。これにはQwen Q2とAlibabaのQwen 3が含まれる。

今週、中国企業からの別のオープンソースモデルがあって、これはZ AIによるGLM-4.5と呼ばれてる。これも最先端やねん。実際に2つのバリエーションをリリースしてる。GLM-4.5とGLM-4.5 Airや。

完全版のGLM-4.5は総パラメータ3350億個、アクティブパラメータ320億個や。一方、このAirは基本的に軽量版で、パラメータ1060億個、アクティブパラメータ120億個やねん。

両方とも思考モードをオンにしてより長く考えさせたり、より複雑な推論タスクを処理させたり、シンプルなタスクのためにオフにしてより速く答えさせたりできるハイブリッド思考モデルやねん。

GLM-4.5のベンチマークスコアをチェックしてや。絶対に驚異的やねん。エージェント推論とコーディング能力を評価する12のベンチマークで、GLM-4.5はClaude 4 OpusやO4 Mini、Gemini 2.5 Proを上回ってることが分かる。

無料でダウンロードして使える可能性があるオープンソースモデルにしては本当にクレイジーやな。Grok 4とOpenAIの03にだけわずかに遅れをとってる。

エージェント性能を見ると、GLM-4.5はここにあって、リリースされたばかりのGrok 4さえも上回ってることに注目やな。そして、Qwen 3とQwen Q2は遥か下にある。

比較のための他のベンチマークスコアもここにある。だから、GLM-4.5の完全版であるこの青いバーから全体的に見ると、Gemini 2.5 ProやClaude、OpenAIの03や04みたいなトップクラスのプロプライエタリモデルの一部と同じかそれ以上の性能やねん。

ツール呼び出しも得意やねん。これは基本的に、特定のタスクを解決するために自律的に他のツールを使用するエージェント能力をテストしてる。だから、これはPythonコーダーかもしれへんし、ウェブ検索ツールかもしれへん。PowerPointクリエーターなどかもしれへん。

でも、ここで見て分かるように、GLM-4.5は他のモデルと比較して最も高い成功率を持ってる。だから、これが彼らのデモの一部やねん。すぐに俺の個人的なデモもお見せするわ。

これを開いてみよう。でも警告やけど、オンラインプラットフォームにはダークモードがないから、最大限の不快感で目をさらす準備をしてや。とにかく、これを開いてみよう。

ここで、単一のHTMLファイルでFlappy Birdゲームを書いてってプロンプトしたら、これが結果や。だから、「ゲーム開始」を押してみよう。スペースを押してbird をflapさせるわ。

よし。各障害物を通り過ぎる度に、ポイントを獲得する。ここでクラッシュしてみよう。そうしたら、ゲームオーバーになる。とても良い。一つのプロンプトでゼロショットでこれを実現できるのは超印象的やな。

スライドとプレゼンテーションの作成も得意やねん。だから、ここでこの人の昨日のツール・ド・フランスでの実績を紹介するPowerPointプレゼンテーションを作ってもらったら、これが結果や。

ウェブ検索も有効にできて、すぐに見せるわ。だから、実際にウェブをスクレイピングして、このような関連画像を見つけることができる。ここで実際にウェブを検索して、今年のツール・ド・フランスに関する最新情報を見つけてるのが見える。

その後、これが結果や。だから、関連画像付きの非常に美しくデザインされたプレゼンテーションで、情報も正確や。とても良い。そして再び、これを一つのプロンプトからやってのけた。さらにプロンプトする必要がなかった。超印象的やな。

古典的なポケモン図鑑の例がここにある。だから、プロンプトが「最初の50匹のポケモンをフィーチャーしたインタラクティブなポケモン図鑑を作って、アニメーションとタイプも含めて」やったら、これが結果や。

タイプでフィルタリングすることもできる。だから、電気タイプでフィルタリングしたら、これが結果や。炎タイプを試してみよう。これが結果や。そして、それぞれをクリックしたら、能力や身長、体重を含む全ての統計を実際に教えてくれる。これはGemini 2.5 ProやGrok 4よりもはるかに詳細やな。超印象的や。

良いところは、彼らのオンラインプラットフォームで無料で試せることやねん。だから、Z.AIや。下の説明欄にリンクを載せとくわ。残念ながら、ダークモードがないねん。だから、目にはしんどいけど、ほんまに素早く、ここが全設定や。ChatGPTやQwen Chatと結構似てるねん。

上の方で、4.5と4.5エラーを含む、これら全ての異なるモデルから選択できる。もちろん、最もパフォーマンスの高い4.5を選ぶわ。そして、ツールの下で、プロンプトに必要やったらウェブ検索を選択して、ウェブを検索して最新情報を取得してもらうことができる。

それから、ここで文書もアップロードできる。最初のプロンプトでは、ウェブ検索をオフにするわ。そして、コーディング能力をテストしてみよう。

プレイヤーが小惑星フィールドを通って宇宙船を操縦し、破片を避けて、エイリアンの侵略者にレーザーを発射するスペースシューターゲームを作ってもらおう。全てを一つのHTMLファイルに入れて。生成を押してみよう。

よし、これが結果や。だから、矢印キーかWASDで移動できて、スペースで発射できる。スタートを押してみよう。

よし、確かに完全に機能するスペースインベーダーゲームがある。うわあ、これは本当に難しいな。見ての通り、エイリアンを撃ったら爆発する。そして、俺が攻撃されたら、右上のシールドが下がる。とても良い。

実際にここで負けてみよう。だから、エイリアンに当たってみよう。完璧や。シールドがゼロになったら、ゲームオーバーや。

これが最終スコアや。だから、一つのプロンプトから、パーティクル爆発みたいな実際に結構良いアニメーション付きの完全に機能するスペースインベーダーゲームを作ってくれた。さらに、宇宙船と敵は実際に、基本的に基本図形だけを与えるGemini 2.5やGrokや03と比較して、まともに見える。これには本当に感動したわ。

よし、次や。暗号通貨ポートフォリオダッシュボードを作って、アニメーション線で価格変動を表示し、リスク評価とトレードシミュレーターも含めて。全てを単一のHTMLファイルに入れて。生成を押してみよう。

これが結果や。とても良い。価格は完璧やないことに注目やけど、ウェブ検索をオンにしてへんから、実際に最新の価格データを取得してるわけやない。これはどんな風に見えるべきかのシミュレーションに過ぎへん。

これらのカードがリアルタイムで更新をシミュレートしてるのが見える。そして、ここが価格トレンドや。実際に俺の時計と同期してる。だから、確かに今6時24分やねん。これは超印象的や。

ここにリスク評価がある。トレードシミュレーターまで提供してくれる。だから、ビットコインを試してみよう。それから、200ドル買ってみよう。

購入をクリックしたら、ここに良いポップアップがある。さらに、ここに取引を表示してくれる。そして再び、左にあるように、一つのプロンプトを入力しただけや。これにフォローアッププロンプトを追加する必要がなかった。

もちろん、これをさらに良くして、もっと機能を追加することもできる。でも、見ての通り、一つのプロンプトから、ゼロショットで、既に大量の機能的な能力を持つ素晴らしいダッシュボードを作ってくれた。

これを試してみよう。アップロードされた画像から色を抽出し、ハーモニーを提案し、デザインプロジェクト用のスキームをエクスポートするカラーパレット生成器を作って。これが何を提供してくれるか見てみよう。

よし、これが結果や。再び、これは一つのプロンプトからやねん。画像をアップロードしてみよう。

だから、この画像をアップロードするわ。見ての通り、この画像から自動的に色を抽出してくれる。そして、ハーモニーを選択できる。だから、モノクロマティックが何かを見てみよう。とても良い。そして、これがアナロガス。これがコンプリメンタリー。これがトライアディック。そして、参考のための他のハーモニーもここにある。とてもクール。

それから、パレットを全てのこれらの異なるフォーマットにエクスポートすることもできる。さらに、ヘックスコードもコピーできる。ちなみに、これらのカラーカード全てにも関連するヘックスコードがある。全てが完璧に動作する。

再び、一つのプロンプトでこの全てを生成できるのは超印象的やな。一方、そこにある最先端モデルの一部でさえ、通常、エラーなしで完全に機能する何かを実際に作る前に、2、3回プロンプトする必要がある。

よし、次に、Three.jsシーンを作ってもらおう。これは3Dアニメーションを作るのに使われるライブラリや。そして、コア崩壊から拡張する残骸まで、衝撃波ビジュアル付きの超新星爆発をシミュレートしてもらおう。それが何を提供してくれるか見てみよう。

よし、これが結果や。だから、今これはこのコア崩壊をやってる。うわあ、この超新星拡張があって、今は拡張する残骸の段階にある。とても興味深い。アニメーション速度を上げたり、カメラ距離を下げたり上げたりもできる。これを再び再開してみよう。

だから、今は安定してる。コア崩壊をやって、それから超新星爆発をやってる。とても良い。

最後に、思考と推論と分析能力もテストしたいねん。だから、ここに厄介な医学的質問がある。先天性心疾患を持つ新生児のために、手術選択肢を研究し、長期予後を示唆し、モニタリング段階、遺伝カウンセリングを基本的に包括的な健康レポートにまとめて。

生成を押してみよう。これが結果や。だから、ここで手術選択肢、長期予後、主要リスクを含む、先天性心疾患の一般的なタイプ全ての本当に詳細な表を提供してくれる。

それから、ここで患者の年齢に応じたモニタリング段階と生涯にわたる監視を提供してくれる。ここに遺伝カウンセリング云々がある。そして、ここに関連する参考文献付きの生存率チャートと結論がある。

良いところは、オンラインで無料で使うことに加えて、既に全てをリリースしてくれてることやねん。これは完全に無料でオープンソースや。だから、Hugging Faceをクリックしたら、4.5と4.5エラーモデルの両方をリリースしてくれてる。さらに、わずかに圧縮されたFP8バージョンもある。

そして、このGitHubリポジトリをクリックしたら、コンピューターにローカルでダウンロードして実行する方法の説明が全て含まれてる。リンクは全部ここにある。

だから、興味があるなら、さらに読むために下の説明欄にこのメインページのリンクを載せとくわ。

Google Notebook LMのビデオ概要機能

次に、このAIは俺の終焉を示すねん。だから、GoogleがNotebook LMと呼ばれるプラットフォームにあるビデオ概要と呼ばれる新機能をリリースした。

Notebook LMを聞いたことがないなら、これはノートブックと呼ばれるものを基本的に作成できる超強力なプラットフォームで、講義ノートや文書、研究レポートのPDFなどの任意の情報源をアップロードできる。

あるいは、Google Driveのファイルから選択することもできるし、ウェブサイトやYouTubeビデオにリンクすることもできる。あるいは、記事のテキストをここに貼り付けることもできる。

これは基本的に情報を処理して、学習ガイドみたいなものを作ってくれる。だから、例えば、ウェブサイトを入力して、URLをここに貼り付けるわ。ちなみに、複数のURLをここに貼り付けることができることに注目やな。

だから、基本的にGoogleのEarth Engineについて説明するこのページを貼り付けるわ。そして、挿入を押してみよう。その後、情報を処理して、ここのチャットインターフェースでこの記事について質問できることに注目やな。

でも、これに加えて、オーディオ概要をクリックすることもできて、アップロードしたソースについて話す2人のホストでポッドキャストを生成してくれる。だから、オーディオリスナーなら、これは超役立つ。でも、とにかく、この機能は数か月前にリリースされた。だから、それは古いニュースやな。

今週リリースしたのは、ビデオ概要と呼ばれる新機能や。これは基本的に、アップロードした情報源を説明するオーディオ付きの解説ビデオを作ってくれる。だから、ビデオ概要をクリックした後、実際に結構速く読み込まれる。そして、これが俺が得た解説ビデオや。これを再生してみるわ。

「こんにちは、お帰りなさい。もし地球全体を検索できたらどうでしょう?言葉や写真を検索するという話ではありません。数十年にわたる地球表面への実際の物理的変化を検索するという意味です。今日は、それを可能にするツールを掘り下げます。Google Earth Engineと呼ばれています。

本当にこのスケールの感覚を得るために、この数字を見てください。80プラスペタバイトのデータ。それが何を意味するのでしょうか?1ペタバイトは1000テラバイトです。数百万のHD映画を保存するのに十分です。だから、その80倍以上の量を想像してください。全て私たちの惑星に焦点を当てています。そして、ここがクレイジーな部分です。全てが即座に分析の準備ができています。

そう、その数字はほとんど理解不可能です。だから、分解してみましょう。この巨大なものは実際に何でしょうか?

オーケー、公式定義がここにあります。これには2つの本当に重要な部分があることに注目してほしいです。まず、マルチペタバイトカタログがあります。それは、私たちが話していた衛星画像の巨大なライブラリです。でも、そして、これも同じくらい重要ですが、惑星規模の分析能力があります。

見てください、これは単なる大きなフォトアルバムではありません。そのフォトアルバムに本当に、本当に大きな質問をさせるツールボックスです。

だから、そんなに多くのデータを処理し始めるにはどうすればいいのでしょうか?つまり、絶対的に信じられないほどの計算能力が必要です。そして、そこでGoogleのクラウドインフラストラクチャが活躍します。文字通りあなたのラップトップを溶かすことなく、惑星全体を検索することを可能にする、フードの下の巨大なエンジンと考えてください。

オーケー、それが何かは分かりましたよね?この巨大なデータライブラリと超強力な分析エンジンの組み合わせです。でも、実際にはどのように動作するのでしょうか?その生データから実際の答えに、どのようにしてたどり着くのでしょうか?

そのハートでは、実際にはかなりシンプルですが、信じられないほど強力な公式に要約されます。衛星画像、この巨大なライブラリを取ります。そして、アルゴリズム、特定の質問、見つけようとしているトレンドを追加します。そして、この2つを一緒にすると、現実世界のアプリケーションが得られます。変化する惑星についての答えが得られます。

だから、誰がこのようなものを使えるのか疑問に思うかもしれません。実際、プラットフォームは科学界に本当に深いルーツを持っています。非商用の作業をしている学者や研究者にとってはまだ完全に無料です。でも、そして、これは大きなことですが、商用利用のためにも開かれました。つまり、企業も自分のプロジェクトのために、この惑星データ全てを活用できるのです。」

これがこのビデオの最初の数分やった。でも、見ての通り、俺は本当にヤバいねん。この機能があれば、もうAIニュースビデオを見る必要がない。なぜなら、AIニュース記事へのリンクをいくつか貼り付けて、このAIに通して、ビデオ概要を押すだけで、基本的に俺がYouTubeで作ってるものを生成してくれるからや。

でも、とにかく、視覚的でオーディオ学習者なら、これは本当に有用なツールになり得る。講義ノートをここにアップロードして、解説ビデオを生成できて、いつでも見ることができる。そして、これは実際にこれを非常によく説明するように調整されてる。そして、このプラットフォームは完全に無料で使えるのが素晴らしい。

とにかく、これを試してみたければ、下の説明欄にNotebook LMのリンクを載せとくわ。ここにこのビデオ概要ボタンが自動的に見えるはずや。

Alibaba Qwen 3 30Bの新モデル

他のニュースで、AlibabaのQwenが別の最先端モデルをリリースした。だから、先週彼らは既にQwen 3 235Bをリリースして、推論モデルと非推論モデルの両方をリリースした。

特に印象的なのは、この推論モデルに関して、これが今使える最高のオープンソース思考モデルやということや。ここの上にある全てのものは、全てプロプライエタリでクローズドソースや。でも、これに関しては、十分な計算能力があれば、ローカルで実行できる。好きなように微調整して調整できる。だから、これを実際にリリースしたAlibabaに敬意を表するわ。

今週、彼らはQwen 3 30Bと呼ばれる小さなバリエーションをリリースした。そして、これも専門家の混合モデルや。だから、問題を解決するために一緒に働くAIエージェントのチームのように考えてもらったらええ。そして、これは300億パラメータを持ってる。だから、この2350億パラメータモデルよりもはるかに小さい。だから、性能は劣る。

でも、小さいサイズのおかげで、開発者は簡単にこれをローカルでダウンロードして実行して、いじったり微調整したりできる。これは大部分のコンシューマーグレードGPUで簡単に実行できる。

そして、これをクローズドモデルであるGemini 2.5 Flashと比較したら、サイズは分からんけど、これはGemini 2.5の小さなバリエーションみたいなもんや。

これらのベンチマークのほとんどで、赤いバーであるQwen 3が実際にGemini 2.5 Flashと同等やということが分かる。そして、競争的数学に関しては特に印象的やねん。

このオンラインインターフェースを使って、Qwen 3 30Bを無料で試すことができる。

だから、前のニュースビデオでこのインターフェースについては説明したから、ここでは繰り返さへん。でも、ここのドロップダウンからQwen 3 30Bを選択できる。そして、ChatGPTのようにこれを使うことができる。

このオンラインインターフェースに加えて、このHugging Faceページで、少し下にスクロールしたら、コンピューターにローカルでダウンロードして実行する方法の説明が全て含まれてる。

だから、さらに詳しく読みたければ、特に開発者でこのモデルをローカルでいじりたければ、さらに読むために下の説明欄にこのページのリンクを載せとくわ。

Gemini 2.5 Deep Thinkの深い思考能力

他のニュースで、GoogleがGemini 2.5 Deep Thinkをリリースした。名前が示すように、これはGeminiがさらに長く深く考えることを可能にして、科学や競争的数学問題みたいな本当に複雑な推論タスクに取り組むのに特に効果的やねん。

実際、これの完全版が今年の国際数学オリンピックで金メダルを獲得したもののようやな。そう、世界で最も優秀で賢い人々が、このイベントで本当に難しい数学問題のセットを解くために競争するオリンピックがあるねん。これらは世界で最も困難な数学問題の一部や。

そして、通常、各問題は大量の思考と大量の時間を解決に要する。今、これは正確にこのオリンピックで金メダルを獲得したモデルやないねん。彼らが言うには、リリースしてるDeep Think機能はそのモデルのバリエーションやと。

そして、具体的には、彼らが並列思考技術と呼ぶものを使用してる。これは基本的にGeminiが一度に多くのアイデアを生成して、同時にそれらを検討することを可能にする。これはGrok 4 Heavyみたいなもんやな。

だから、一つのAIが作業をするのではなく、それぞれがアイデアを考えることができ、また一緒に作業して、時間をかけて異なるアイデアを修正して組み合わせて、最良の答えに到達できるAIエージェントの軍隊のように考えてもらったらええ。

そして、彼らは新しい強化学習技術でこれを設計した。もちろん、Geminiはクローズドソースやから、この技術の詳細な技術的詳細は実際には分からへん。

でも、とにかく、Deep Thinkがどれだけ驚異的に良いかを示す例がここにある。美しい庭園での桜を含む木々と一緒に、ピゴータの創造的で精巧で詳細なボクセルアートシーンを作ってもらったら。

Gemini 2.5 Flashは結構基本的やのに注目やな。実際にはピゴータのようには見えへんし、木も実際には木のようには見えへん。そして、Gemini 2.5 Proは少し良い。でも、この建物はまだ実際にはピゴータのようには見えへん。

でも、Deep Thinkにこれをやってもらったら、ここで見て分かるように、はるかに良く見える。そして、参考のためのベンチマークスコアもここにある。

本当に曖昧で専門的な科学的主題に関するAIの知識をテストする人類の最後の試験に関して、Deep Think付きのGeminiが10%以上でGemini 2.5 Proを大幅に上回ってることが分かる。03やGrokのような他の競合他社も上回ってる。

そして、コード生成に関しても、これは競合他社よりも良い。競争的数学も同様や。見ての通り、この線は銅メダルを示してる。そして、Gemini Deep Thinkはその印を大幅に上回った。

別の競争的数学ベンチマークがここにある。見ての通り、Gemini 2.5は99.2%を獲得した。でも、これは実際にはりんごとりんごの比較やないことに注目やな。なぜなら、彼らはDeep Thinkを競合他社の通常のベースモデルと比較してるだけやからや。だから、もちろん、それらは悪い性能になるやろ。

競合他社モデルにもより長い思考を追加したら、例えば、03にはhighバージョンがあって、Grok 4にはheavyバージョンがある。そうしたら、それらも良い性能を発揮すると予想される。だから、これは実際には有効な比較やないねん。

でも、とにかく、このDeep Think機能は基本的に俺らが壁にぶつかってないことを示してくれる。思考時間を延長して、複数のモデルに並列で思考させることで、既存のモデルをさらに知的で性能の良いものにすることは間違いなくできるねん。

残念ながら、このDeep Think機能は、GoogleのAI Ultraと呼ばれる最も高価なプランに加入してる場合にのみ利用可能やねん。そして、通常、これは月250ドルかかる。

医学のような分野で本当に極めて深い研究をする必要があるなら、このDeep Think機能はまだ価値があると思う。でも、俺らの残りにとっては、日常的なタスクにはそんなクレイジーなモデルは多分必要ないやろな。

とにかく、さらに詳しく読みたければ、下の説明欄にこの発表ページのリンクを載せとくわ。

Flux One Createの自然な画像生成

次に、Fluxと呼ばれる最高のオープンソース画像モデルの一つを手がける会社であるBlack Forest Labsが、新しいオープンソースのバリエーションをリリースした。今回は、Crea AIとのコラボレーションでFlux One Createと呼ばれてる。

このモデルは、プラスチックっぽくて彩度が高すぎる傾向があるAI生成画像の本当によくある問題を修正することを目的としてる。代わりに、このモデルは実際にリアルに見える、より自然で高品質なビジュアルを作成するように微調整されてる。

彼らはこれを意見のあるテキスト・ツー・イメージモデルと呼んでる。なぜなら、プロンプトに正確に従うだけでなく、彼らが心地よく驚くような結果と呼ぶものを与えるために、いくつかの芸術的バラエティを追加するからや。

ベンチマークスコアを見ると、この新しいFlux 1 Createは、Flux 1devという以前のオープンソースバージョンよりも良い性能を発揮してる。素晴らしいことに、これは既にコンピューターに無料でオフラインでダウンロードして実行できるようになってる。

でも、一つ注意すべきことは、Black Forest Labsに関しては、結構制限的なライセンスを持ってることやねん。だから、商用目的にはあまり使えへん。でも、自分で使うだけで、オフラインで生成してるなら、実際には問題ないねん。

Flux One Createを使う方法はいくつかある。一つはオンラインで使うことで、Koreaで使える。下の説明欄にこのページのリンクを載せとくから、ここにプロンプトを入力して、生成をクリックするだけや。

このプロンプトを入力してみよう。「ナイトクラブで踊る赤いドレスの女性。ハードフラッシュ、アマチュア低品質写真」。生成を押して、何が出るか見てみよう。

クールなことに、画像を生成する際の拡散プロセスを実際に見ることができる。そして、これが最終結果や。これがはるかにリアルやということが分かる。以前に慣れ親しんでたAI生成画像よりも磨かれてなくて完璧やない。これは実際にナイトクラブでランダムに撮られたアマチュア写真のように見える。

手と指にはまだいくつかエラーがあることに注目やけど、ほとんどの場合、Fluxは結構良い指を生成する傾向がある。このページを使って画像を生成する場合、1024×1024の画像しか出力されへんことに注目やな。

異なるアスペクト比を生成したければ、これを使える別の場所がここにある。これはBlack Forest Labs自身による無料のHugging Faceスペースや。ここがプロンプトを入力する場所や。

でも、これらの高度な設定を展開したら、ここで幅と高さを調整できる。だから、例えば、幅を768に調整してみよう。そして、ガイダンスはAIにプロンプトをどれだけ文字通りに従ってほしいかみたいなもんや。

だから、高い値にしたら、プロンプトを本当に文字通りに従って、指定した全てを生成してくれる。一方、低い値にしたら、画像にもっと創造性とバラエティを追加することを許可してくれる。デフォルトの4.5に戻しとこう。

そして、推論ステップ数は最終画像を出力する前に、どれだけの反復を通してほしいかみたいなもんや。だから、一般的に、ステップ数が多いほど、品質は高くなるけど、ある時点で収穫逓減になる。

そして、低いステップ数に設定したら、生成は速くなるけど、品質がいくらか犠牲になる。再び、俺はデフォルトの28のままにしとく。そして、プロンプトはこれを試してみよう。

「金髪に脱色した髪と首のタトゥーを持つ男性DJが、煙っぽい薄暗いクラブでミキシングボードの後ろに立ってる」。実行をクリックしよう。

クールなことに、画像を生成する際の拡散プロセスを見ることができる。だから、ノイズから始まって、ステップごとにそのノイズの一部を取り除いて、最終的にこれが得られる。見ての通り、これも非常にリアルに見える。

従来のAI生成画像のように磨かれたり完璧やったりしない。別の例を試してみよう。「女性がスーパーの通路を走ってる。モーションブラー、アマチュア写真、不規則な角度」って書くわ。実行をクリックしよう。

よし、拡散プロセスが見える。これが最終結果や。見ての通り、これも女性がスーパーの通路を走ってて、モーションブラーもある。

これは結構普通のリアルな写真に見える。つまり、これを見たら、AI生成やとは疑わへんやろな。

オンラインでこれら2つのプラットフォームを使うことに加えて、もちろん、これは既にオープンソースやねん。だから、オフラインで無制限にダウンロードして実行できる。彼らは既にHugging Faceでモデルをリリースしてる。

だから、下の方に、ComfyUIやdiffusersでこれをダウンロードして実行する方法の説明が全て含まれてる。とにかく、さらに詳しく読みたければ、下の説明欄にこのメインリリースページのリンクを載せとくわ。

ヒューマノイドロボットの洗濯作業

ヒューマノイドロボットのニュースで、ついに洗濯ができるロボットが登場した。だから、Figure AIがFigure 02ロボットが洗濯をしてる新しいデモをリリースした。そして、これはロボットの脳みたいなHelixモデルによって動作してる。

でも、正直に言うと、最も簡単な部分しかやってへん。洗濯機に服を投げ入れるだけやねん。服は結構軽くて掴みやすい。さらに、バスケットは結構大きくて、開口部を外すのは難しくない。だから、ヒューマノイドロボットにとってもこのタスクをするのは間違いなく難しくない。

さらに、それが彼らが見せた唯一の部分やねん。だから、インターフェースを読んで適切なボタンを押して実際に洗濯機を動かすこともできるかは分からへん。

それでも、これは良いスタートやな。俺を含む多くの人が、洗濯をしたり、皿を洗ったり、ゴミを出したり、子供の世話をしたりするのを手伝ってくれるヒューマノイドロボットがほしいと思ってるのは確かや。これについてどう思うか、下のコメントで教えてや。

他のヒューマノイドロボットのニュースで、数週間前に、LIMX CL3と呼ばれる新しいダンシングロボットを特集した。今週、会社LIMX DynamicsはLIMX Ollieと呼ばれる別のロボットモデルをリリースした。

これは身長1.65メートルで31自由度を持つフルサイズのヒューマノイドロボットで、結構柔軟やねん。そして、確かに、これはたくさんの異なることができる。

もちろん、このように非常に自然に歩き回ることができる。ジムでワークアウトもできて、歩きながら結構まともな重量を持ち上げることができるようやな。

それから、公園でこのようにカンフーもできる。悪くないな。そして、ここではこの工場にナビゲートしてる。

見ての通り、自律的にターゲットオブジェクトを検出して、それを拾って、このカートに落とすことができる。だから、このロボットは物流や倉庫でのタスクの自動化に潜在的に非常に有用やと思う。

そして、ここではこれらの小さなオブジェクトを拾って、適切に自律的に分類することもできるのが見える。これをゴミ箱に投げる方法さえ知ってる。

この分類タスクはFigure 02の洗濯デモよりも実際にはるかに印象的やと思うわ。なぜなら、これらのアイテムははるかに小さいからや。さらに、実際にこれらのアイテムを分類する必要がある。さらに、コンパートメントも小さい。だから、実際にこのタスクを実行するのははるかに困難やねん。

そして最後に、ここで見て分かるように、ダンスもある程度試みることができる。俺が言わなあかんのは、結構可愛いねん。でも、とにかく、それがLIMX Ollieと呼ばれるこの新しいヒューマノイドロボットによる最新のデモや。

Ideogram Characterの高精度ディープフェイク

次に、俺のお気に入りの画像生成器の一つであるIdeogramが新しくて非常に印象的な機能をリリースした。Ideogram Characterと呼ばれてて、これによって1枚の写真をアップロードするだけで基本的に誰でものディープフェイクを作ることができる。

そして、これは俺が今まで見た中で最もリアルで最高品質のディープフェイクツールの一つやねん。

以前は、ディープフェイクを作るためには、LoRAや基本的に人の複数の画像での微調整を訓練する必要があった。理想的には異なる角度でな。さらに、各画像の適切なテキスト説明も必要やった。

もちろん、これには大量の時間と労力がかかるし、複数の写真が必要やねん。1枚の画像をアップロードするだけでディープフェイクを作る他の方法もある。例えば、Instant IDと呼ばれるツールを使うことができて、これは実際に結構良い。

だから、例えば、1枚の参照画像だけでこのようなディープフェイクを作ることができる。別の例がここにある。別のツールはPulidと呼ばれてる。そして、これも1枚の参照画像だけを必要とする。

でも、これらのツールでは、時々当たりはずれがある。だから、例えば、1枚の画像だけをアップロードした場合、その特定の角度でのその人の顔のデータしかないから、異なる角度での人の写真を生成するのは本当に難しい。AIが他の視点からその人がどのように見えるかを実際に推測するのは本当に難しいねん。

でも、この新しいIdeogram Character機能がここまで優れてる理由がここにある。1枚の写真だけから、誰でもが何でもやってる任意の角度で超正確なディープフェイクを実際に作ってくれるねん。

例がここにある。この参照画像をアップロードしたら、異なる環境で異なることをしてる彼のこれらの写真を生成できる。そして、これらの写真は全てこの元の男に実際に似てる。

別の例がここにある。女性のこの画像をアップロードしたら、超ぼやけてることに注目やけど、それでも彼女の顔を捉えることができて、異なることをしてる彼女の異なる写真を生成できる。

これらは彼らのショーケース例の一部に過ぎへん。実際に自分たちでテストしてみよう。だから、Ideogram Characterを試すをクリックしてみよう。最初のステップは誰かの画像をアップロードすることや。だから、もちろん、ウィル・スミスをアップロードするわ。

そして、ここで画像の残りの部分から自動的に実際に彼の顔をマスクしてることが分かる。だから、これをクリックしたら、自動的にこのマスクを適用したのが見える。でも、このマスクを変更することもできる。

だから、彼にもっと髪を追加したいとか、髪を除去したいとか、彼に異なるヘアスタイルを生成したいなら、これもマスクアウトするやろ。でも、とにかく、デフォルトのままにしとく。

そして、プロンプトでは、「彼はジェダイのローブを着てライトセーバーを持ってる」って書こう。アスペクト比は、これら全てから選択できる。16対9のままにしとく。

モデルは、turbo、default、qualityから選択できる。もちろん、qualityは多くのクレジットがかかる。だから、turboのままにしとこう。

それから、realisticかfictionからも選択できる。realisticを選択しよう。そして、ここでこれら全ての異なるテンプレートからも選択できる。でも、既にプロンプトを追加してて、彼にジェダイのローブを着せてライトセーバーを持たせたいだけやから、それが本当に必要なこと全てやねん。このテンプレート機能を使う必要は本当にない。だから、生成をクリックしよう。

よし、これが最初の画像や。確かに、彼はジェダイのローブを着てライトセーバーを持ってる。そして、これはまさにウィル・スミスに見える。とても良い。そして、これが2枚目の画像や。再び、これはジェダイのローブを着てライトセーバーを持つウィル・スミスや。彼は5本の指を持ってて、顔はまさにウィル・スミスに見える。

よし、次に、女性のこの写真をアップロードするわ。そして再び、ここで自動的に彼女の顔と髪にマスクを適用してるのが見える。これは既に結構良い。だから、デフォルトで行こう。

そして、プロンプトでは、「彼女は黒いビキニを着て、背景の巨大な爆発から逃げてる。モーションブラー、ハイアクション」って書くわ。生成を押してみよう。

よし、これが最初の画像や。彼女は確かに背景の巨大な爆発から逃げてる。黒いビキニを着てる。そして、これはアップロードした元の写真に似てる。そして、これが写真2枚目や。再び、彼女は俺の参照キャラクターにそっくりに見える。だから、これは本当に良い。

今度は正面図ではなく、サイドビューを試してみよう。「彼女は街を見下ろす屋上で黒いドレスを着てて、夕日やねん」。今回は、アスペクト比も縦に設定してみよう。そして、生成を押してみよう。

よし、これが画像1や。これはサイドビューで、それでも元の写真に似てる。そして、これが2枚目の写真や。再び、これはこの参照キャラクターの結構まともなサイドビューやねん。

Ideogramは有料でクローズドソースやけど、これはそこにあるトップクラスの画像生成器の一つで、無料でサインアップできて、いくらかのスロークレジットがもらえるから、Ideogram Characterを使った写真生成をすぐに無料で始めることができる。

とにかく、興味があるなら、さらに詳しく読むために下の説明欄にこのリリースページのリンクを載せとくわ。

今週のAIニュースまとめ

これで今週のAIのハイライト全てをまとめたわ。これら全てについてどう思うか、コメントで教えてや。どのニュースがお気に入りやった?そして、どのツールを試してみるのを最も楽しみにしてる?

いつものように、俺は皆さんと共有するトップAIニュースとツールを探し続けるわ。だから、このビデオを楽しんだなら、いいね、シェア、チャンネル登録を忘れんといてや。そして、もっとコンテンツのために調整しといてや。

また、毎週AI界では本当にたくさんのことが起こってる。俺のYouTubeチャンネルでは全てをカバーすることはできへん。だから、AIで起こってることを本当に最新の状態に保つために、俺の無料週刊ニュースレターを購読することを確実にしてや。

そのリンクは下の説明欄にあるわ。見てくれてありがとう、次回でまた会おうや。

コメント

タイトルとURLをコピーしました