終わりました… ChatGPTがAIレースに勝利しました!

AGIに仕事を奪われたい
この記事は約12分で読めます。

6,845 文字

C'EST TERMINÉ ... ChatGPT a Remporté la Course à l'IA !
Apprenez l'IA sous toutes ses formes et rejoignez la communauté VISION IA ! la ...

OpenAIとChatGPT-4がまさに大規模なアップデートを受け、状況が完全に変わりました。このアップデートは画像生成で全ての競合を打ち負かしただけでなく、推論なしの市場で最高のコーダーとしての地位を確立しました。これは私が言っているのではなく、独立したベンチマークが証明しています。ご覧ください、Artificial Analysisの専門家たちは、このChatGPT-4のアップデートが驚異的だと断言しています。
今日はこのことについて、そしてさらに多くのことについて見ていきます。OpenAIとChatGPTの主要なアップデートの概要をお伝えします。
始める前に、動画を視聴中に気に入っていただけたら、チャンネル登録といいねをお願いします。また、ニュースレターを作成したことをお知らせします。このビデオの説明欄にリンクがありますので、興味があれば登録してください。平日に最高のテクノロジーニュースをメールでお送りします。特に時間がない方や、ニュースにできるだけ早くアクセスしたい方向けです。
それでは動画を始めましょう。ご覧ください、Artificial Analysisは次のように述べています:「今日のChatGPT-4のアップデートは本当に重要です。推論なしでClaude 3.7 SonnetとGemini 2.0 Flashを上回り、当社のインテリジェンス指標では現在、推論なしのコーディングにおけるリーダーモデルとなっています。」
そしてこれがインテリジェンス指標です、彼らのスケールで2024年11月の41から50に上昇し、最近リリースされたDeepSeek V3モデルのすぐ後ろにつけています。そのモデルについては明日公開予定の動画を準備しているところです。
正直に言って、これは完全に狂っています。なぜOpenAIがChatGPT-4oのような古いモデルにこれほど多くの時間と労力を費やすのか疑問に思うかもしれません。実は、非常に明確な理由があります。
数ヶ月前に中国のモデルDeepSeek Eronがリリースされ、AI生成のコストを破壊し、AI計算コストを安くしたことを思い出してください。DeepSeek Eronの現象がみんなが計算能力への支出を減らし始めることを意味すると思ったなら、ジェボンズのパラドックスについての専門家の意見を本当に聞くべきでした。
最近の動画でも話したことがありますが、物事が安くなると、私たちはさらに多くを求めるようになります。そしてそれがまさにAI分野で起きていることです。アルトマンの発言を見てください。彼らは最新モデル(4.5)を改良、向上させるために、十分なGPU、十分なチップを確保することさえできていないのです。
小さなスタートアップの話ではありません。これはMicrosoftとパートナーシップを組む数十億ドル規模の企業OpenAIで、数十億ドルもの資金を調達しています。しかし、AI計算用の十分なチップや十分なグラフィックカードを確保できないのです。これは見ていて非常に驚くべきことです。
しかし、これらはすべての改善ではないことに注意してください。このアップデートのOpenAIのノートを読みましょう:「GPT-4は、特に複数の要求を含む詳細な指示に従うことが向上し、複雑な技術的コーディング問題に取り組む能力を改善し、直感と創造性を向上させ、絵文字の使用が少なくなりました」(ここでGPT-4を使っている人へのウィンクがあります。時々理由なく絵文字が送られてくることをご存知でしょう)。
「GPT-4の更新版は、すべての有料ユーザーに今すぐ利用可能です。無料ユーザーは今後数週間以内に利用できるようになります。」
そして今ポイントとなるのは、彼らはすでにGPT-4.0の画像生成能力に制限を設ける必要があることです。なぜなら、その需要は彼らの予想を大きく上回ったからです。ここ数日でChatGPTが非常に遅くなっていることに気づいているかもしれません。時には遅すぎて使えないほどです。個人的には、これを改善する必要があると思います。私のお気に入りのモデルに求める要素の一つはスピードだからです。
このChatGPTの新しいアップデートをすでに少し試してみましたが、確かにモデルはより良くなっています。詳細については後で触れますが、この動画で本当に話したいのは、彼らが行った別の大きなアップデート、画像ジェネレーターのレベルでのアップデートです。
見逃すことはできないと思いますが、ChatGPTは画像を生成する能力を大幅に向上させる主要なアップデートを受け、今や驚くべき画像を生成できるようになりました。後で例を見て試してみますが、まず彼らの公式発表を見てみましょう。
私はよくこのAI画像生成を「Photoshopキラー」と呼びますが、これは一部の人に気に入られていません。確かにPhotoshopを完全に置き換えるにはまだ準備ができていませんが、考え方としては、この方向に進み続け、単に話しかけるだけで画像を編集できるようになれば、大多数の人にとって、画像編集に使うツールは専門的なソフトウェアではなく、このようなチャットボットになるでしょう。
私たちは画像と動画の生成の転換点にいます。世界中のビジュアルアーティストはこれを見て、自分の作品にどう活用できるか考えるべきです。私の意見では、このフィールドにいるなら、業界に追い越されないよう、一緒に進化することが重要です。
正直に言って、これは全く新しい世代のアーティストやクリエイターに力を与え、これまで不可能だと思われていたことをこれほど短時間で作れるようにするでしょう。
彼らのブログ投稿を見て、何を提供しているか見てみましょう。彼らは例を示しています。これは彼らが書いたシーンを描写するプロンプトです。ベイブリッジを見下ろす部屋のグリーンホワイトボードの電話で撮った広角写真を求めています。視野には大きなOpenAIロゴのTシャツを着た女性が書いている様子が映っており、自然でやや乱雑な筆跡で、カメラマンの反射も見えます。
結果をご覧ください、これは絶対に素晴らしいものです。彼らが求めた通り、ベイブリッジを見下ろす部屋のグリーンホワイトボードを映したスマートフォンで撮影されたように見える広角画像です。これは少し変わったアプローチで、外の景色がホワイトボードに反射して見えていますが、明らかにスマートフォンで撮られたものです。効果はそこにあります。
また、Tシャツ上のOpenAIロゴを完璧に再現し、女性がボードに書いている様子を表現しています。このテキストを見てください、印象的です。
小さな注意点として、彼らは下部でこれが8回の生成の中で最も良い結果だと述べています。つまり、彼らは同じことを8回依頼し、これが彼らが選んだ最高のものだったのです。確かに最初の試みではないですが、それほど多くもありません。
実際、画像上のテキスト生成はAIにとって常に難しいことでした。最近できるようになりましたが、ここで見られるような精度ではありませんでした。これは本当にゲームチェンジャーです。だからこそ最近みんながこれについて話しているのです。
すべてが素晴らしく見えます。もちろん、細かい点を突き詰めたいなら、この領域やあの領域が少し変形していたり奇妙だったりするかもしれません。しかし、この成果は18/20くらいの評価に値すると言えるでしょう。
そして、私がよく言うように、これは私たちが見る最も悪いバージョンになるでしょう。次の例を見てください。
「看板を読んでいる20代の二人の魔女」というプロンプトがあります。もう少し長いプロンプトですが、すべては読みません。アメリカの一部の地域でよく見られる、通りの清掃スケジュールや駐車許可などについての50種類の異なる情報がある看板を見たことがないかもしれませんが、あちこちに看板があり何も理解できないというのはアメリカの一部ではかなり一般的です。これが彼らが再現しようとしたものです。
この例では、実際の通りの看板のように見えるように、看板をパラフレーズして編集するよう依頼しています。結果をご覧ください。「魔女の箒駐車禁止」や「魔法の絨毯積載区域」などと読むことができます。これまでの画像生成ツールでは全くできなかったことで、非常に印象的な演出です。
次に、多段階の生成があり、これはとても興味深いです。まず猫を作成し、次にシャーロック・ホームズの帽子と単眼鏡を付けます。興味深いのは、実際に彼らがOpenAIの従業員の猫の写真をアップロードし、ここで演出しようとしたことです。
AIによって再現された猫を見て、いくつかの指示を与え、そしてもちろん、このキャラクターを4Kゲームエンジンでビデオゲームキャラクターに変換します。結果を見てください、かなり印象的です。
すべてのプロンプトを完全に読み上げるわけではありませんが、このモデルに非常に具体的な指示を与え、それらを完璧に実行していることを理解する必要があります。また、これはベストオブワンなので、最初の生成でこの結果を得たことにも注目してください。かなり良いですよね。
今では風景や画像の比率も変更できます。より多くの詳細を追加し、少しズームアウトし、蒸気パンクマンハッタンを背景に三人称視点に切り替えることができます。何でも想像でき、それは完璧に実現します。AI画像生成分野は今日大きな飛躍を遂げました。
もしこれがあなたの猫で、これらの画像を見たら、「あ、これは私の猫がこの画像に映っている」と思うかもしれません。そしてそれが大きな新機能です。後で自分自身をAIで表現してみて、どうなるか試してみます。
もう一つの技術的な例を見てみましょう。「16のオブジェクトを含む4×4列のグリッドを持つ画像」という指示です。これはAIにとって非常に難しいプロンプトで、彼らが試みたテストの一種です。結果はかなり良いです。cursiveのOpenAI、青いキリン、虹色の稲妻などが見られます。
次の例は驚異的です。よく見てください。まず三角形の自転車のコンセプトスケッチを作成するよう依頼しています。ここで注目すべきは、彼らが実際の自転車の古い特許から実際のスケッチや図面をアップロードしたことです。次に「特許2025 OpenAI」など、この発明を特許登録するようなテキストを下に書くよう依頼しています。
実際に古いスケッチのような結果が得られ、発明されたかのように見えます。そして素晴らしい部分は次の部分で、ニューヨーク市のこの発明を示すよう依頼し、その結果が非常に印象的です。
これは製品の演出方法を完全に変えるでしょう。マーケティング分野にいるなら、これがすべてを変えることを知っておいてください。もうすぐ、販売している商品や宣伝している商品を撮影し、ChatGPTに送信して「これをこのように演出して」と依頼すれば、すでにそれを行ってくれます。後で例をもう少し示します。
彼らは多くの例を提供してきましたが、見てわかるように、これは鈍化していません。使用例に移る前に、次の考えを共有したいと思います。
時々、「AIはブームに過ぎないと思いますか?」「これらすべての支出は価値を生み出さないのでは?」と質問されます。私の答えは簡単です。間違わないでください。確かに私は非常に偏っていますが、これらすべてのAIツールから個人的に引き出している価値の量は膨大です。
私の友人は毎日これらのツールを使用しています。私の家族も毎日これらのツールを使用しています。私がフォローしている何千人もの学生は毎日これらのツールを使用しています。そしてそれは本当の価値を生み出しています。重要なポイントは、今日でさえ、AIが膨大な価値を生み出していることです。だから、これは一時的なブームではありません。
実は、問題は単に教育の問題です。人々は今日のAIで何ができるのかを単に知らないのです。そしてそれが私が解決しようとしている問題です。私はみんながこれらのAIツールの使い方と最大限に活用する方法を理解してほしいのです。それが私のミッションであり、YouTubeのこれらのすべての動画で私がやろうとしていることです。
そして言われたように、もし望むなら、本当に到来している未来であるAIのマスターの仕方を教えます。既に何千人もの学習者の働き方を変えてきた、包括的でありながらアクセスしやすいオンライントレーニングを作成しました。
私が受けているフィードバックは驚くべきものです。毎日貴重な時間を節約し、自分では作れないと思っていたコンテンツを作成し、これらのツールでビジネスを革新している人たちがいます。例は数え切れないほどあります。そして意図的にこのトレーニングを手頃な価格にしました。なぜなら私の優先事項は、この知識を民主化することだからです。
私たちのコミュニティは毎日成長しています。このチャンスを逃さないでください。AIの革命は待ってくれません。これらのツールをマスターすればするほど、あなたの優位性は大きくなります。興味があり、さらに進みたい場合は、動画の下のピン留めされたコメントにリンクがあります。
動画がちょっと長くなってきたので、早く終わらせましょう。そのために、いくつかの使用例をテストしてみたいと思います。
小さな注意点として、もし私の生徒なら、トレーニングの大幅な更新を計画していることを知っておいてください。たくさんの新しいことをカバーし、この新しいツールの深い掘り下げも提供される予定です。詳細については後ほど説明しますが、ここでは最初の概要を紹介します。
最初の例は、現在ソーシャルメディアで見かける新しいトレンドです。画像をジブリスタイルの画像に変換するものです。みんなが知っているあのアニメです。
この例では、私の週間ニュース動画の一つから画像を取り、ChatGPTにかけてみます。単純に画像を貼り付け、「ジブリスタイルの画像を作って」と書きます。GPT-4.5ではまだできないので、GPT-4oを選択していることを確認してください。プロンプトをもっと詳細にすることもできますが、ここでは簡単にやってみます。
結果をお見せして、最近ソーシャルメディアで見かけたこの変換がどのようなものかを確認してみましょう。結果はなかなかいいですね。何度か試すのをためらわないでください。通常、1回目か2回目でかなり良い結果が得られます。
子供がいる場合や家族を感動させたい場合、ChatGPTのサブスクリプションがあれば、これを試してみることをお勧めします。写真を撮り、「見てみて、これから何をするか」と言って見せれば、間違いなく感動するでしょう。
では、別の例を見てみましょう。YouTubeで最も良いサムネイルの一つを使い、同じことをします。画像を貼り付けて、単に「同じようにしてください」と言います。結果はなかなか良いですね。テキストが保持され、漫画のようになっています。
さらに進んで楽しんでみましょう。今度はこの画像をどこかに表示するよう依頼します。例えば、「ニューヨークの看板にこの画像を表示して」と書きました。かなり素晴らしいですね。
いくつかの小さな例を紹介しましたが、動画が長くなりすぎないようにします。繰り返しますが、私の生徒であれば、大きなアップデートが来ることを知っておいてください。
今日は、言語ベースモデル(GPT-4o)と新しい画像ジェネレーターの両方についての、ChatGPTの主要なアップデートの概要を紹介しました。大きなものが来ていると思います。おそらくソーシャルメディアのあちこちで見たと思います。2、3日前にリリースされ、今日その動画を作っています。
皆さんにお勧めしたいのは、単純にそれを試してみることです。ChatGPTのサブスクリプションがあれば、試してみてください。感動すると思います。
動画を楽しんでいただけたなら、いいねを押すか、まだの方はチャンネル登録をお願いします。これは私をサポートし、チャンネルの成長を助けます。テクノロジーニュースを見逃したくない場合は、動画の説明にニュースレターへのリンクがあることを思い出してください。また、動画の下のピン留めされたコメントにトレーニングへのリンクがあることも思い出してください。
AIの使い方を学ぶなら今がチャンスです。チャンスを逃さないでください。よく言いますが、私たちは新しい現代産業革命の中にいるのです。だから、列車に乗り遅れないでください。
今日はこれで終わりです。ここまで動画を見てくれてありがとう。また明日の次の動画でお会いしましょう。

コメント

タイトルとURLをコピーしました