
14,851 文字

今週見逃したかもしれないAIニュースをお届けします。まずはMetaから始めましょう。Metaは初めてのLlamaconを開催しました。例年、通常MetaはMeta Connectイベントを開催しており、歴史的にそこで最新のAIアップデートについて話してきましたが、どうやら今回は新しいLlamaconイベントを作成し、よりAIに焦点を当てたイベントにしたようです。一方でMetaconはソーシャルメディアプラットフォームやハードウェアにより焦点を当てたものになるかもしれません。
しかし、今週のLlamaconから最も大きな発表は、新バージョンのMeta AIアプリでした。Ray-Bバンド Meta グラスをお持ちの方は、おそらくすでにアプリをインストールしていたでしょう。それはMeta Viewアプリと呼ばれていました。彼らはそのMeta ViewアプリをMeta AIアプリにリブランドし、アプリ内に単独のAIチャット機能を直接組み込みました。
つまり、ChatGPTやClaudeなどの様々なAIアプリと同様に、Meta AIアプリを開いて直接Llamaとチャットできるようになりました。
「どの大規模言語モデルで動いていますか?」
「私はクラウドベースのLLM(大規模言語モデル)で、インターネットから膨大なデータセットに基づいて言語を処理しています」
「はい、でもどのモデルを使っているの?」
「私の音声はLlama 4で構築されています」
「ジョークを一つ教えて」
「かかしがなぜ賞を獲得したのか知っていますか?それは畑で傑出しているからです」
「ああ、そうだと思った。励ましてくれてありがとう」
「もう一つジョークを聞きたいですか?」
「いや、もういいよ」
「わかりました。お話できて楽しかったです。気が変わって別のジョークを聞きたくなったらぜひお知らせください。良い一日を」
「”strawberry”(イチゴ)という単語には何個のRがありますか?」
「strawberryという単語には2つのRがあります」
「本当に3つじゃないですか?」
「確かです。strawberryには2つのRしかありません。もしよければ、つづりを言って数えてみましょう」
「S-T-R-A-W-B-E-R-R-Y。Rを声に出して数えます。1つ、2つ。はい、正解です。strawberryには2つのRがあります」
「そう言うなら」
「はい、これについては自信があります。他にRを数えてほしい単語はありますか?」
このアプリで面白いのは、AIチャットをよりソーシャルなものにしようとしている点です。右上隅に共有ボタンがあります。それを押すと、フィードに共有されます。この会話全体を共有できるのがわかります。「投稿」をクリックすると、このポストが載ったフィードができます。InstagramやFacebookのように、人々はコメントしたり共有したり「いいね」したりできます。また、このアプリで他の人が行った創作やランダムなチャットも見ることができます。
ですので、面白いプロンプトのインスピレーションが必要な場合は、他の人がどんなプロンプトを使っているかを見ることもできます。そして見てわかるように、おそらくMetaのemuAI画像ジェネレーターを使用して画像も生成できます。月に向かって遠吠えする狼の画像を作成するようプロンプトしてみましょう。できました。
実際にかなり優れた画像ジェネレーターです。生成される画像にはかなり感心しています。
彼らがこの新しいアプリにロールアウトしたもう一つの機能は、Ray-Bバンド Metaグラスで会話をして、グラスを外してアプリを開き、アプリやウェブアプリで会話を続けることができるというものです。基本的に、どこでも好きな場所で会話を続けることができます。
Ray-Bバンド Metaグラスの話が出たところで、Vergeによると、Metaは最近プライバシーポリシーを変更しました。変更されたプライバシーポリシーの一部を紹介します。
Meta AIとカメラの使用は、特に無効にしない限り、常にグラスで有効になっています。ただし、Ray-Bバンド Metaで撮影された写真やビデオは、「ヘイMeta、写真を撮って」「ビデオ」などの音声コマンドを使用して撮影された写真やビデオを含め、電話のカメラロールに保存され、Metaによるトレーニングには使用されないとしています。
また、MetaはRay-Bバンド Metaの所有者が音声録音をクラウドに保存することをオプトアウトできなくなりました。音声録音の保存を無効にすることはできませんが、設定内でいつでも録音を削除することは可能です。音声の文字起こしと保存された音声録音は、Metaの製品を改善するために最大1年間保存されます。
基本的に、彼らは写真や動画を学習に使用することはありませんが、大規模言語モデルの改善のためにオーディオや文字起こしを学習に使用する可能性があるようです。また、Vergeによると、先ほど私の電話で見ていたAIアプリに広告を導入する計画があるとのことです。
現在は無料で使用でき、広告もありません。単にチャットしてその会話をフィードに共有できるだけです。しかし、将来的には広告付きのアプリになるようです。マーク・ザッカーバーグは今週2025年第1四半期の決算発表を行い、その中でMeta AI内で製品推奨や広告を組み込むことに言及しました。
ただし、広告や有料プランがいつロールアウトされるかは明確ではないとしています。まず少なくとも1年間は、実際のビジネス面を構築する前にスケーリングとエンゲージメントの深化に焦点を当てたいとのことです。製品推奨や広告と言う場合、現在のFacebookアプリ内で見られるように、アプリ内に広告が表示されるのか、他の人のチャットをスクロールして見ていると、その間に広告が散りばめられるのかは明確ではありません。
広告がAIチャットの会話のように見えるようなことをすると想像できます。Koraが広告をサイトの残りの部分と同じように質問と回答のように見せる方法のようなものです。そのようなことをすると想像できますが、チャットへの回答内で製品を推奨するようなこともあり得ます。
「ねえ、この5つの異なるカメラを見ているんだけど、どれを買うべき?」と言うと、返答の一つは大手カメラ会社のスポンサー付き回答かもしれません。彼らがそうするかどうかはわかりませんが、それがAI企業の一部で展開される将来だと想像できます。
今週はGoogleからもいくつかのアップデートがありました。先月、彼らは新しいAIモードを披露しました。これは私にとってはPerplexityや新しいChatGPT検索機能への対応のように感じます。現在、米国のすべてのラボユーザーが利用できるようになりました。labs.googleにアクセスして米国にいれば、AIモードを試すことができるはずです。
「試す」をクリックすると、「Search Labsは現在あなたのアカウントでは利用できません」という通知が表示されます。私は米国のAIラボユーザーなのですが。しかし、どのように見えるかを示すビデオを見ることができます。誰かが「ミッドセンチュリーモダン家具のためのベストのヴィンテージショップ」と入力し、AIの回答が表示され、さまざまなウェブサイトへのリンクが含まれているようです。
そして下部には、実際に購入できる場所があり、地図もあります。再度、これはPerplexityやChatGPT検索で見るものと非常によく似たインターフェースです。米国にいれば、近くラボアカウントでこれが利用できるはずです。
また、ラボ外での限定テストも開始すると述べています。今後数週間、米国の少数のユーザーが検索でAIモードタブを見ることになり、引き続きフィードバックを取り入れて体験を向上させていくとのことです。ですので、ラボユーザーでなくても、google.comにアクセスするとすぐにロールアウトされる可能性があります。
携帯電話にGeminiアプリをお持ちの場合、Geminiアプリ内で直接画像をアップロードして編集できるようになりました。これはしばらくの間AI Studioで行えていたことです。以前の動画でデモしたように、画像を取り込んでサングラスを追加したり、帽子を追加したりしていました。現在、Android上のGeminiアプリでもそれが可能になりました。
私のようにNotebook LMが好きな方には、オーディオ概要(つまり与えたデータから作成される小さなポッドキャスト)を50以上の言語で生成できるようになりました。Notebook LMにアクセスして新しいノートブックを作成し、量子コンピューティングに関するソースを発見させましょう。
ちなみに、この「ソースを発見する」機能は数週間前にロールアウトされた比較的新しい機能です。これを送信し、これらの記事をすべてインポートします。右上の設定に行くと、出力言語のオプションがあります。これを英語からスペイン語に変更できます。保存をクリックすると、英語ではなくスペイン語の小さなポッドキャスト・エピソードが得られるはずです。
同様の話として、他の言語について話している中で、GoogleはLittle Language Lessonsという新しい小さなアプリをロールアウトしました。これは特定の言語を話せない人が旅行などで最低限必要な知識を得るために設計されています。
このLittle Language Lessonsには3つの異なる小さな実験が含まれています。1つ目は「Tiny Lesson」で、あらゆる状況に関連する語彙、フレーズ、文法を見つけます。2つ目は「Slang Hang」で、ネイティブスピーカー間の生成された会話から表現、慣用句、地域のスラングを学びます。3つ目は「Word Cam」で、写真を撮影して周囲について話す方法を学びます。
「Tiny Lesson」を試してみましょう。これを開いて、日本に行くとしましょう(実際に今年後半に行こうとしています)。日本語を選択します。目的やテーマとしては「レストランで食事する」を選び、生成をクリックします。
語彙が生成されました。聞くこともできます。「レストラン」「レストラン」「メニュー」(これは同じ単語ですね)。「オーダー」「リクエスト」「チャン」「水」「ミズ・ミシ」。もっと見ることができます。「お絞り」「フォーク」「スプーン」「ナイフ」「箸」などの単語があります。基本をすぐに理解できます。
フレーズもあります。「すみません、メニューをもらえますか?」「おすすめは何ですか?」「これをください」「少々お待ちください」。そして下にはヒントがあります。「レストランで食事するとき、要求を丁寧にする必要があることがよくあります。この文法パターンはそのために最適です。これは『してください』と丁寧に言う方法です」。ですので、旅行に行く場合は、部屋でこれらを練習できるでしょう。
今週はRecraft社からもニュースがありました。彼らは私が見た中で最もクールなウェブサイトの一つを持っており、今日の動画のスポンサーでもあります。Recraftをご存知ない方のために説明すると、これは非常に包括的なAI画像生成・編集プラットフォームで、画像ベクター化、モックアップジェネレーター、アップスケーラー、背景除去、AIイレイサーなどの機能があります。
Chatbot Arenaをチェックすると、彼らは常に最高のAIモデルとしてトップに位置しています。先ほど述べたように、彼らは今週ニュースを発表しました。ログインして見てみましょう。新しいプロジェクトを作成します。作成新規の下の画像をクリックし、recraftをクリックすると、この巨大な新しいスタイルライブラリがあります。
ここでフィードをクリックすると、自分の画像に使用できるスタイルが無限にスクロールされます。この鮮やかな海洋ファンタジースタイルが気に入ったら、適用をクリックします。プロンプトを入力します。月に向かって遠吠えする狼でやってみましょう。そしてrecraftをクリックします。選択したスタイルで私の狼の2つのバージョンがここにあります。
このサンセットセレニティも気に入りました。これを適用して、このスタイルでリクラフトしましょう。これで、このサンセットセレニティオプションでいくつかの選択肢ができました。探しているスタイルを正確に見つけるために、スタイルを検索することもできます。コミックブックスタイルを探してみましょう。コミックブックスタイルでこれらすべてのオプションがあります。
繰り返しますが、ほぼ無限にスクロールできます。このレトロアーケードシンセを選択して、ここでスタイルを保存できます。保存済みに移動すると、このスタイルを将来簡単に見つけて再利用できます。でもこれはさらに面白くなります。いくつかのスタイルの間で決められない場合があるでしょう。レトロポップを検索してみましょう。
ここには多くのクールなスタイルがあります。決められません。レトロフューチャリスティックアートを選択してそのスタイルを保存します。そして、鮮やかなレトロコスモスと鮮やかな神話的ポストも保存しましょう。その3つを保存しましょう。保存済みに戻ると、これらの新しいスタイルが保存されているのがわかります。
スタイル作成をクリックすると、実際に複数のスタイルを選択して上部に追加し、作成しようとしている新しいスタイルにそれぞれのスタイルをどれだけ重み付けするかを変更できます。プロンプトでテストしてみましょう。ここでブレンドしたスタイルで新しい画像を生成します。これが生成されたものです。
このスタイルが気に入ったら、「カラフルなレトロポップ」というスタイルとして保存できます。これは常に私のスタイルに表示されるようになります。このスタイルを保存し、新しいスタイルを作成し、この新しいスタイルを他のスタイルと混ぜることで、さらに反復することもできます。これで、完全にカスタマイズした本当にユニークで素晴らしいスタイルが得られます。
リンクをコピーして他の人に共有することで、彼らが自分のRecraftアカウントでそれを使用できるようにすることもできます。これらの新機能は、あなたにぴったりのスタイルを見つけるために、新しいスタイルを迅速に反復してテストしたい場合に最適です。ブランドをお持ちで、生成するすべての画像が他のすべての画像と同じスタイルを持つようにブランドの一貫性を作りたい場合に最適です。これにより、求めている正確な外観を調整できます。
Recraftは素晴らしく、この動画のスポンサーとなったので、初月は$11オフで$1で試すことができます。リンクとプロモーションコードを説明欄に記載します。ぜひ参加して、新しいスタイルのアップデートをチェックして、楽しんでください。Recraftは、あなたが探している正確なスタイルの画像を得る能力を本当に調整しています。
繰り返しますが、下記でチェックしてください。Recraftに今回のビデオのスポンサーになっていただき、誠にありがとうございます。それでは続きに戻りましょう。
今週はOpenAIからのニュースはあまりありませんでした。しかし、週の初めにサム・アルトマンは現在のGPT-4oのバージョンにあまり満足していないと話していました。彼は最近のアップデートでパーソナリティが少し「サイコパンティ」(過剰に迎合的)になりすぎたと言いました。
基本的に、質問すると過剰に褒めてくれるようになり、質問に答えるよりも、あなたを気持ちよくさせ、褒めることに焦点を当てるようになったのです。彼がそのツイートをした数日後、彼らは4oに加えたアップデートを完全にロールバックしました。つまり、数週間前に使っていたバージョンに戻りました。
「削除したアップデートは過度にお世辞や同意するもので、しばしば『迎合的』と表現されていました。長期的なユーザー満足度を重視してフィードバックを収集し取り入れる方法を修正し、よりパーソナライゼーション機能を導入しています」と彼らは説明しています。
さらに何が起きたのかを説明しています。彼らはモデルのデフォルトのパーソナリティを改善しようとしていました。最近のアップデートでは、短期的なフィードバックに焦点を当てすぎ、ChatGPTとのユーザーインタラクションが時間とともにどのように進化するかを十分に考慮していませんでした。その結果、なぜかGPT-4oは過度に支持的だが不誠実なものになってしまいました。
現在、彼らはそのバランスを少し調整するためにモデルに取り組んでいます。ChatGPTは今週他にもいくつかの機能を獲得しました。ChatGPT検索の改善や、より良いショッピング体験の提供が始まりました。以下がその例です。
「イタリアのコーヒーの味に近い200ドル以下の最高のエスプレッソマシンは何ですか?」と質問すると、ウェブを検索し、Googleの検索結果の上部に表示されるものと同様の小さなカルーセルを表示します。私はこれを自分のアカウントでテストしましたが、この記録時点ではまだロールアウトされていませんでした。ただし、現在すべての人にロールアウト中とのことです。製品の結果は独立して選ばれており、広告ではないとも述べています。
先ほどMetaについて言及しましたが、それはChatGPTで行っていることではありません。また、WhatsAppに検索機能も追加されました。WhatsAppでChatGPTを使用すると、実際にウェブを検索してくれます。引用の改善、トレンドやオートコンプリートの追加も行われました。
プロンプトウィンドウから直接現在のトレンドを見ることができます。アプリをより使いやすくするためのやや小さな機能アップデートです。
今週はイーロンからも情報があり、来週にはスーパーGROCK購読者向けにGrock 3.5が提供されるとのことです。これは最も高いティアの人々、月額$57程度の非常に奇妙な価格設定のプランだと思います。イーロンは来週には提供されると主張しています。
彼はこれが「ロケットエンジンや電気化学などの技術的質問に正確に答えられる最初のAI」だと言っています。基本原則から推論し、インターネット上に存在しない答えを導き出すこともできるとのことです。イーロンは何かがリリースされるまでの時間を過小評価する傾向がありますが、来週には見られるといいですね。おそらく今月5月中には提供されると思いますが、来週かどうかはわかりません。
今週Anthropicは、Claudeの新しいアップデートを発表しました。彼らは「統合」を発表しました。個人的にはちょっと混乱していますが、MCPs(モデルコンテキストプロトコル)というものがあります。これは大規模言語モデルが他のアプリと通信するための簡単な方法です。現在、CursorやWindsurfなどのツールを使用して接続できます。
Claudeデスクトップアプリを使用してMCPsを接続することもできますが、現在はClaudeウェブアプリ内で機能する、より公式なClaudeへの接続があります。現時点では、これらの新機能はMax、Team、Enterpriseプランで利用可能です。つまり、高額プランです。月額$20のプランを使用している場合、現時点ではこれにアクセスできません。
これらの機能が私が使用している月額$20のプランなどの低額プランにロールアウトされれば、もう少し深く探求するでしょう。
アリババは今週、Quinn 3という新しいモデルを発表しました。これはハイブリッドAI推論モデルです。彼らは「ハイブリッド推論モデル」という用語を、本質的に思考の連鎖をオンまたはオフにできるモデルに使用しています。O3やGemini 2.5 Proなどを使用してプロンプトを与えると、通常は思考プロセスを見ることができ、大規模言語モデルが問題をどのように考えているかを読むことができます。
これらの新しいハイブリッドモデルでは、その思考をオンまたはオフに切り替えることができます。通常、少し長く考えさせると、より正確で少し良い応答が得られます。少し速くする必要があり、精度がそれほど重要でない場合は、その思考をオフにすることができます。
すべてのベンチマークによると、このQuinn 3は非常に優れています。正直なところ、大規模言語モデルのこのような些細な改善にはちょっと疲れてきています。ほとんどの場合、大規模言語モデルは私にとって多くのことをしてくれます。コーディングや競技数学で少し優れているといった些細な改善に興奮するのが難しくなってきています。
私の意見では、アリババや大規模言語モデルを発表しているほぼすべての企業から見られる新しいアップデートは、コーディングが少し良くなり、競技数学が少し良くなったというものです。私はこのような些細な改善にますます感銘を受けなくなっています。正直なところ、これらの少しアップデートされた大規模言語モデルについては、ますます少なく話すようになるでしょう。
現時点で大規模言語モデルでほぼすべてやりたいことができることを考えると、かなり大きな飛躍以外のものにはますます興奮しなくなっています。
今週はVersepというブランドから別のAIエージェントが発表されました。彼らはVI(ヴィー)を紹介しました。これはAIを使ってコンピュータと相互作用する新しいツールです。彼らのX投稿では、「VIはあなたと同じようにコンピュータを見て使用するAIの最初の一瞥です。すべてのアプリケーションとすでにサインインしているアカウントにアクセスして、コンピュータにネイティブに実行されます。今日からダウンロード可能です」とのことです。
ただし大きな注意点として、ダウンロードはできますが、実際に使おうとすると「ありがとうございます、ウェイティングリストに入りました」と表示されるだけです。つまり、ソフトウェアをダウンロードできますが、承認されるまでは使用できないソフトウェアです。ダウンロードしてコンピュータにインストールしましたが、まだ待っています。
しかし、デモビデオでは、プロンプトを入力できる小さなボックスがあります。「Viに何をさせたいですか?」「Chromeで Adobe Podcastオーディオエンハンサーを使用して、デスクトップにある背景オーディオを削除してください」。スクリーンショットを撮ったのがわかります。ここでの返信を読むことができます。「スクリーンショットに基づいて、Finderが開いているMac OSデスクトップが見えます。いくつかのファイルやフォルダが見えます。タスクはAdobe Podcastオーディオエンハンサーを使用することです」。
そして計画を立て、アプリケーションを開き、実際にクリックしてGoogleに何かを入力し、Adobe Audio Enhancerを表示し、デスクトップからファイルを取り込み、クリーンアップされたバージョンのファイルをダウンロードしたようです。
これが素晴らしいのは、実際にアプリの使い方を知る必要がないことです。彼らはFigmaで何かをするという例を示し、FigmaのUIを知っています。たとえFigmaの適切な領域にアクセスする方法や、結果を達成するために適切なものをクリックしたりドラッグアンドドロップする方法を知らなくても、あなたが望むことを伝えれば、Figmaの使い方を知っているので、すべての適切なボタンを押し、適切なレバーやノブなどを回して結果を得ることができます。
これは本当に便利に感じます。Blenderで何かを作成し、彫刻の方法を知らなくても、「オーブを滑らかにしてほしい」などと伝えることができれば、ユーザーインターフェース内のボタンの場所を知って、実際にアプリの使い方を知らなくても、私が望む変更を加えることができます。
そしてアプリ内でのクリックや操作方法を観察することで、実質的にAIの肩越しに見て、アプリの使い方を学ぶことができます。この側面は本当にクールだと思います。まだアクセスできませんが、最終的にアクセスできるようになったら使ってみたいと楽しみにしています。
すでにRecraftの新しいアップデートについては話しましたが、AIクリエイティビティの領域では他にも本当にクールなアップデートがありました。まずMidJourneyが「omni reference」と呼ぶものをロールアウトしました。彼らはこれを「私の画像にこれを入れる方法」と説明しています。キャラクター、オブジェクト、乗り物などで機能します。
試してみましょう。MidJourneyで作成をクリックします。自分自身を画像に挿入できるか見てみましょう。気づいたことですが、バージョン7に設定されていることを確認する必要があります。バージョン7に設定されていないと、これは機能しません。バージョン7に設定されていると仮定して、画像をドラッグ&ドロップします。
ここに小さな頭のショットがあり、「omni reference」と書かれたボックスがあります。画像をここにドラッグしましょう。小さなスライダーがあります。強度を少し高く設定しましょう。400にしましょう。「雪の中に立っているバイキング」と入力して、私をバイキングにするか見てみましょう。
これが結果です。実際に私の顔をうまく取り込みました。これらはどれもバイキングらしく見えませんが、真ん中の2つは近いです。外側の2つは明らかにバイキングの雰囲気ではありません。これが最も近いですが、顔の参照はかなり良くできました。正直なところ、MidJourneyの詳細なチュートリアルをするのはしばらく経っていません。今後の動画でそれを行うのも楽しいかもしれません。
Cling AIは「instant film effect」という新機能をロールアウトしました。ポートレート画像を与えると、そのポートレートを取り込んでポラロイドのように見えるように変換し、それからアニメーション化するようです。こちらが別の例です。
これが結果です。ポラロイドのような画像を作りました。男性がストラップを噛んでいます。複数の人物やさらには動物でも機能するようです。
私のClingアカウントにログインしました。AIテンプレートの下に「instant film」と書かれたエフェクトタブがあります。これをクリックします。先ほどXで紹介されていたinstant filmを試してみましょう。自分の写真をドロップします。使用している画像はこちらです。instant film画像を生成してみましょう。
これが生成された静止画像です。かなりクールに見えます。これを確認して、どのようにアニメーション化されるか見てみましょう。ここでビデオ生成をクリックします。推定待機時間は約5分とのことです。
5分後、これが生成されました。微妙ですが、アニメーションがあります。
Higsfield AIという会社は「iconic scenes」と呼ばれる新機能をリリースしました。自撮り写真だけで伝説的な映画のシーンに入ることができます。Higsfield.aiにアクセスしてログインしましょう。上部にある「iconic」リンクを試してみましょう。
上部には選べる様々なアニメーション映画シーンがあります。「this is fine」アニメーションを試してみましょう。自分の画像をアップロードします。同じヘッドショットを使います。生成をクリックします。生成された画像が見えます。
実生活よりも少し太めに作られたと思いますし、小さな帽子も付けられましたが、今はアニメーションを待っています。これは本当に時間がかかりましたが、無料プランなので文句は言えません。アニメーションを無料で得ました。これが生成されたものです。非常にFamily Guyのような感じです。
これで遊ぶ場合は、無料プランではとても遅いので注意してください。
Koreaは今週も毎週のように新機能をロールアウトしました。その機能は「GPT Paint」と呼ばれています。編集マーク、基本的な形、メモ、参照画像を通じてChatGPTを視覚的にプロンプトできます。
こちらが彼らの例です。恐竜の写真、赤いゴム長靴、小さなバケットハットがあります。バケットハットから恐竜の頭部に矢印を描き、小さなゴム長靴から恐竜の下部に矢印を描き、完了をクリックすると、以前の画像のバケットハットと靴を着た恐竜の画像が生成されます。
スティーブ・ジョブズの画像とCrayaエナジードリンク缶の画像をアップロードし、スティーブから缶に矢印を描き、「ドリンクを持っている」というテキストを与えると、スティーブ・ジョブズがそのドリンクを持っている画像が生成されます。
基本的に、GPT-4o画像生成が登場したとき、人々がサムネイルをどのようにしたいかをスケッチし、テキストを書いて矢印を描いていたあれらの画像を覚えているなら、その機能をKrayasに組み込んだだけです。現在はそれを使用できます。
GPT-4oの話が出たところで、これを見たことがあるでしょうか?かなり驚くべきことです。人々は画像を取り、ChatGPT-4oに投げ込み、「この画像の正確なレプリカを作成してください。何も変更しないでください」と言っています。そして同じことを74回行いました。別の人が101回行ったのも見ました。
正確なレプリカを作成しているわけではありません。こちらを見てください。プロンプトを与えるたびに、画像は少しずつ変化します。少しずつ。少しずつ。そしてほんの数回のプロンプト後、元の画像とはまったく似ていません。見続けると、最終的には元の画像とはまったく似ていなくなります。これは単に「正確なレプリカを作成してください」と言って74回行っただけでした。
これが最終画像です。これが彼らが始めた画像です。こちらは別の例で、このミームから始めました。スクロールすると、かなり変わっていくのがわかります。最終的には元の画像とはまったく似ておらず、ゴミ箱の中の奇妙な象形文字のように見えます。元の画像はこれでした。驚くべきことです。
もう一つだけ紹介します。なぜなら本当に魅力的だからです。こちらが元のウィリー・ウォンカです。最後までスクロールすると、これが最終的な画像です。初めの画像、70回以上後、この画像です。GPT-4oが画像に加えている小さな変更が、多くの反復を経ると非常に大きな変化になることを示しています。
最後にいくつか共有したいアップデートがあります。急いで紹介します。これらは今週少し興味深いと思ったことです。Sunoは新バージョン4.5をリリースしました。有料プランを使用している場合、いくつかの小さな改善があるようです。拡張されたジャンルとよりスマートなマッシュアップ、強化された音声、より複雑で質感のあるサウンド、プロンプトへの適合性の向上などです。彼らはSunoを少し改善しました。
数週間前、TobyとShopifyについて話し、彼らが会社を完全にAIファーストの会社にしていることを紹介しました。Dualingoも今週それに続き、AIファーストの会社になると発表しました。彼らはAIが処理できる作業をするために契約業者を徐々に使用しなくなると述べています。
彼らは仕事の方法の多くを再考する必要があり、人間のために設計されたシステムに小さな調整を加えるだけでは十分でないと述べています。Duolingoは従業員を大切にする会社であり続け、従業員をAIに置き換えることではないとも述べています。代わりに、ボトルネックを取り除き、従業員が創造的な仕事や実際の問題に集中できるようにし、繰り返しの作業ではないようにすることが目的です。
これは素晴らしいアプローチだと思います。誰もがAIをこのように見るべきだと思います。AIは誰も本当にやりたくない単調で退屈な繰り返しの作業を取り除き、理想的には私たちが本当にやりたい楽しく創造的でインスピレーションを与える仕事をもっとできるようにしてくれます。
Lyftは、AI収益アシスタントを立ち上げました。Lyftドライバーなら、少しでも多く稼ぐことができます。ドライバーは空港到着、地元のイベントなどに関するリアルタイムデータに基づいて、シフトを最適化する方法を尋ねることができます。理論的には、できるだけ多くの乗車を得て、できるだけ多くのお金を稼ぐために、運転パターンやどの時間にどこにいるかを最適化するのに役立ちます。
Aurora社はテキサス州で無人トラックを展開しました。長年のテストと検証の後、Auroraは最初の完全自律走行トラクタートレーラーがテキサス州の公道で運行していると発表しました。同社のクラス8トラックは現在、ドライバーなしで1,200マイル以上走行した後、ダラスとヒューストン間で顧客配送を行っています。これらのトラックのキャビンからの実際の映像があり、高速道路を自律的に走行している様子が示されています。
また、トラックが高速道路を走行しているのを見る視点も得られます。長距離ロードトリップに行くと、横を見て、中に運転手が全くいない大型トラックが隣を走っているのを見るかもしれません。
最近、多くの本当に楽しいAIニュースが出ています。とても興奮しています。大規模言語モデルのニュースにはますます興奮しなくなり、AIの創造的な側面にますます興奮しています。ビデオジェネレーター、画像ジェネレーター、音楽ジェネレーター、テキスト読み上げなど、それらすべてが最近かなり大きな飛躍を見せています。
一方、大規模言語モデルは、私が個人的に使用する多くのニーズにすでに対応しています。そのため、些細な改善を伴う新しいロールアウトを見ることは、私にとってあまり興奮することではありません。そのようなニュースが出てきたら簡単に共有しますが、新しい大規模言語モデルが出るたびに深く掘り下げたい場合は、他にもっと良いチャンネルがあるでしょう。
マシュー・バーマン(私の良い友人)は、すべての新しい大規模言語モデルについての深い詳細が欲しい場合に思い浮かびます。彼も間違いなくフォローすべきチャンネルです。
今日はこれで以上です。AIの世界で何が起きているかについてより詳しく知ることができたと思います。また今週も楽しい一週間でした。このような動画が好きで、最新のAIニュースをすべて知り、本当にクールなAIチュートリアルを入手し、業界のAI思想リーダーや先駆者との本当にクールなインタビューを見たい場合は、この動画に「いいね」を押し、このチャンネルを購読してください。
そのような内容がYouTubeフィードに表示されるようにします。理想的には、AIに関する最新情報を見逃すことがないようにします。それが私があなたのためにしようとしていることです。繰り返しますが、もっとそのような内容が欲しければ「いいね」と購読をお願いします。
まだの方は、futuretools.ioをチェックしてください。私が出会うすべてのクールなAIツールをキュレーションしています。この動画で話したり話さなかったりするすべてのニュースは、この巨大なニュースページで見つけることができます。
もちろん、無料のニュースレターもあります。参加すると、週に2回、最もクールなツールと知っておくべき最も重要なニュースを共有します。サインアップすると、AI収入データベース(さまざまなAIツールを使用してお金を稼ぐクールな方法のデータベース)に無料でアクセスできます。すべて完全に無料です。futuretools.ioで見つけることができます。
視聴していただきありがとうございます。今回のスポンサーとなったRecraftにも改めて感謝します。本当に感謝しています。ご視聴ありがとうございました。次回もお会いできることを願っています。


コメント