AIニュース – OpenAIのアダルトモード、GPT-5計画、DeepSeek、Grok-3の月曜リリース、PerplexityのDeep Researchなど

AGIに仕事を奪われたい
この記事は約18分で読めます。

10,660 文字

AI 뉴스 - 오픈AI 성인용, GPT-5 계획, 딥야스, Grok-3 월요일 출시, 퍼플렉시티 Deep Research 등
매주 최신 AI 뉴스를 전달드립니다AI 비트코인 투자 자동화 무료 강의 보러가기(업비트): 비트코인 투자 자동화 무료 강의 보러가기(빗썸): 오프라인 3기:...

OpenAIがついにグロウンアップモード(アダルトモード)を準備しているというニュースが出ています。以前にも一度紹介しましたが、OpenAIが次に何を作るかについての意見を募集した際に、唯一のダウン票マークが付いていたグロウンアップモードがありました。アダルトモードを強調していた経緯がありましたが、具体的な内容が出てきました。
一般的な制限を徐々に緩和しているようです。これは今後避けられない市場になりそうです。というのも、これで収益を上げている事例が多く報告されているからです。Character AIのリターンもそうですし、制限のないチャットでも収益が出ているので、おそらくOpenAIもこの分野に進出するのではないでしょうか。
これはオープンソースでも検証されています。Hugging Faceは、オープンソースのAIモデルを共有して試せるプラットフォームですが、人気ランキング3位に入ったAIモデルがあります。まさにDeepというモデルです。3位まで上がったことで、このようなフィルターが解除されたものへの需要が見て取れますね。いずれにしても、この分野の市場は更に拡大しそうです。
次にOpenAIのアップデート計画が発表されました。サム・アルトマンがGPT-5についての情報を伝え、o3をGPT-5と統合すると発表しました。さらに驚くべきことに、無料ユーザーも無制限チャットが可能になるとのことです。
GPT-4.5およびGPT-5に関するOpenAIのロードマップが紹介されています。これまでのOpenAIモデルは非常に散発的に登場してきました。3.5から4に行き、5モデルに突然移行し、GPT-4.5に戻ったりと、モデルが多様すぎて、モデル構造をよく知らない人々にとっては「どのモデルを使えばいいのか」という混乱がありました。
そこで、これらを統合することになりました。一般的に非常に広範な作業に有用なシステムを作り、oシリーズやGPTシリーズなどを区別して複雑にするのではなく、GPT-5として統合し、それを使えば自動的に望む通りに使えるような構造を作ろうとしているのです。
ただし、API側では別途使用できるように公開するとのことです。開発者にとっては詳細なモデルが必要な場合もあるでしょうから、そのような対応をしているようです。一般的なChatGPTを使用する際は、統合して一度に使えるようにする方針です。
また、無料層でもGPT-5の無制限チャットアクセスが提供されるということですが、これはo3だけでなく、様々なモデルが統合され、その中で比較的低い知能を継続的に使用できるようにするということでしょう。Plus購読すればより高い知能でGPT-5を実行でき、Pro購読ではさらに高度な知能レベルでGPT-5を実行できる、というように、GPT-5という名の下で構成されるということです。
内部的には「Orion」というコードネームで、これをGPT-4.5バージョンとして最後にリリースするとのことです。そしてGPT-5からは命名を統合して進めていくとのことです。
次に、ChatGPT 4oモデルがアップデートされ、かなり改善されたとのことです。チェスをさせてみたり、プロンプトを試してみたりしていますが、確かに良くなっています。重力に従って自然に流れるように出力されています。
OpenAI o1/o3ミニにイメージファイルのアップロード機能が追加されました。従来は推論モデルに画像などを載せることができませんでしたが、今ではPDFなどもそのままアップロードできるようになりました。
試しに使ってみると、大学入試の数学の問題1番の解答を書いてくれますね。このように問題をうまく解いて正解を出してくれるのが分かります。つまり、UIイメージを実装したり、論文や数学の問題などをファイルで添付しても読み取ることができるようになったということです。
次に、ケビン・ウェイル(OpenAIのCPO)が残したアップデート情報についてです。アプリインテグレーションの一部として「Sign in with OpenAI」が導入されます。これは、Googleログインのように、OpenAIで統合してログインできる機能です。
これが持つ影響は大きく、単なるログインで終わらず、OpenAIの購読者であればそのまま利用できる可能性があります。例えば、アプリインテグレーションでChatGPTを購読している人なら、自動的に有料プランとして使用できるということです。
他のアプリやサービスにも適用されれば、AIサービスを作っても、ユーザーに課金させることができるでしょう。他のサービスでどのように動作してほしいかという意見も募集されています。
例えば、「自前のOpenAIキーを持ち込む機能」というような意見がありました。私が作った運勢を占うChatbotのようなAIサービスを運営する際、現在はAI機能の API費用を私が全て負担し、購読料や広告収入などで収益を上げる構造になっています。しかし、もしこれが現実化してAPIキーを自動的に利用できるようになれば、完全無料でサービスを提供し、追加の広告収入などだけで収益を上げることも可能になるでしょう。
まだ意見を募集している段階なので、実際に適用されるかどうかは分かりませんが、適用されれば非常に大きなニュースになるでしょう。
次に、OpenAI o3が国際情報オリンピアード(International Olympiad of Informatics)で600点満点中394点を獲得し、金メダルを獲得しました。世界で18番目に高い得点だとのことです。IOIのサイトを見ると、OpenAI o3が18位という実力を示しています。
次に、Anthropicがビジュアル推論統合の次世代モデルをリリースするとのことです。OpenAIとほぼ同じ方向性で、一度に使えるモデルを使えば自動的に全てをこなすような構造になるでしょう。現在も新しい情報が出てきています。Anthropicがウェブアプリのビルドを新たにデプロイし、「Sherlock」と「Kallyra」というコードネームのものをデプロイして、統合された推論モデルが間もなくリリースされるのではないかと予想されます。
統合モデルも登場しますが、推論の強度も設定できるようです。Low、Medium、Highというように、o3モデルも3種類でリリースしましたが、それと同じように適用されるようです。
次に、イーロン・マスクのGrok-3が月曜日の夜8時(韓国時間火曜日午前0時)に発表されるとのことです。期待できそうですが、「地球上で最も賢いAI」という発言を残しています。これはつまり、o3を超えるということですが、Grok-3は確かにColossus AGOと呼ばれるNVIDIA GPU 10万個で訓練されたモデルなので、実際にパフォーマンスが良い可能性があります。
そしてGrokのウェブサイトが韓国でも使用できるように別途公開されました。おそらくここにGrok-3が追加されるでしょう。有料プランでなくても画像生成が可能だとのことです。
試してみると、「イーロン・マスクと犬が一緒に散歩している」という画像を生成できます。イーロン・マスクは確かによく再現されています。「ミッキーマウスがドナルド・トランプと遊んでいる場面を描いて」と入力すると、すぐに生成されます。全く制約がないようですね。画像生成時に非常に便利そうです。フィルターが全くないので、望むものを自由に生成できそうです。
いずれにしても、このようにGrok-3の動向を注目して見ていくと良さそうです。
次に、Perplexityがdeep researchをリリースしました。試してみましょう。Perplexity esでdeep researchを選択すると、OpenAIを使うようにdeep researchができます。「JoCodingのYouTubeについて調査して」と入力すると、OpenAIやdeep researchのように調査してくれます。非常に詳しく調査し、ビットコイン構築講座も調査して、JoCasoを作ったことまで調査し、非常に具体的によく調査して回答してくれるのが分かります。
しかも無料ユーザーでも使用できます。非購読者の場合、1日最大5クエリ、Pro購読者は1日最大500クエリが提供されるとのことです。もちろん性能的にはOpenAIの方が良いという声もありますが、このような機能を無料でも非購読者が使用できます。
性能を見てみると、「人類最後の試験」というものがありますね。最近よく見かけますが、PerplexityはOpenAIに近い性能を示しています。21.1%の正確度と、かなりの性能を示していることが分かります。そのため、コストパフォーマンスを重視してdeep researchを使いたい方は、Perplexityを利用してみることができるでしょう。
さらに、PerplexityがCelebrateと協業しました。Celebrateと言えば、推論を非常に高速に行う企業ですが、PerplexityとYangが協業して、SoraのAPI使用時に1200トークン/秒が出るとのことです。非常に高速に結果を出してくれるので、かなり便利でしょう。
次に、DeepSeekがプライバシー問題で論争になっていましたが、方針を変更しました。キーボードパターンの収集を除外するとのことです。ただし、残りは同じです。キーボードパターンの収集を止めただけで、内容などが全て中国サーバーに送られるのは変わりありません。それでも、パターン収集は非常に物議を醸したため除外されました。
そして、AlibabaからAnimate Anyone 2が発表されました。以前のニュースでも時々紹介しましたが、踊らせるAIですね。さらに高度化されました。ジョーカーの写真を1枚入れただけで、この男性が踊るように作ることができます。バスケットボールをしているシーンに写真を1枚入れると、この人がバスケットボールをしているように自然に表現されます。
アニメーションキャラクターを入れても、このように上手くできます。非常に自然ですね。このような、刀を持っているものでも非常に自然に表現されます。このように服を着ているものや、動きなども非常に自然です。人間だけでなく、猫を入れてもよく反映されますね。
現時点では直ぐに使用できるわけではないようです。プロジェクトページだけが公開されている状況です。そのため、これがオープンソースで公開されるかどうかは分かりません。Animate Anyone 1の時も、オープンソースで公開すると言って、まだ公開していないと思います。2年前に発表して、まだ公開していません。そのため、おそらく公開されないのではないでしょうか。
また、ByteDanceがSora Plus(Sora+)というモデルを公開しましたが、クオリティが非常に高いです。人物や製品の動きなどが非常に自然ですね。このようにSoraの利点は、広告映像に活用するのに非常に適していることです。
このような製品の動きや、フェイクインフルエンサーの動きが非常に自然です。食べる様子も非常に自然に表現されます。確実に進歩していますね。TikTokのデータが多いため、インフルエンサーたちが製品広告をするようなものを多く学習したのでしょう。このように上手く表現できるのではないでしょうか。
もう少し具体的に見てみると、Soraには2種類あります。通常のSoraはテキストからビデオを作成するもので、このようにAI映像を作成してくれますが、より特別に作られたのがSora Plusです。ビデオ広告のための基礎モデルで、人物と製品を含む広告シナリオを作成する際に最適化されているとのことです。AIを使用した広告制作時に非常に有用に活用できるでしょう。
製品画像をビデオクリップにすることもできます。このような製品画像があれば、それを映像化できるということです。宣伝する際に非常に良さそうですね。また、このような製品とインフルエンサーの相互作用も非常に自然に表現されます。化粧品などを持っている様子が統合され、靴もこのように履いているように作れ、ホームショッピングのようにこのように作ることもできます。
ただし残念ながら、現時点ではオープンソースでは公開されていないようです。しかし、リクワイアメントを見ると、オープンソースで公開される可能性もありそうです。これが公開されれば非常に有用に使えそうです。
ただ、少し問題になりそうだと感じたのは、韓国の俳優の顔がそのまま出てきてしまうことです。テキストからビデオを作れるということですが、この方は非常に有名な方のようで、確認してみると高チョンミソン俳優さんがほぼそのまま出てくるようです。このように出してしまって大丈夫なのかという懸念があります。
次に、Adobeが新しい映像生成AIを公開しました。Fireflyが使用できるようになりました。Image to Video、Text to Videoなどができ、モーショングラフィックスなども作れます。Adobeが強調しているのは、著作権の問題なく商業的に使用可能だということです。独自に著作権を確保したものをベースに訓練させて作ったとのことです。そのため、これを使用する際にはかなり自由に使用できるでしょう。1080p解像度の映像を1秒あたり24フレームで制作することができ、クオリティもかなり良好です。
次に、Googleがテキストプロンプトなしで画像生成できるツール「Wisc」を韓国でリリースしました。以前にも一度紹介しましたが、これは米国でしか使用できませんでしたが、今では韓国でも誰でも使えるようになりました。
試しに使ってみると、私の写真を入れてスタイルをチョコレートにすると、スタイルと被写体などを反映して、このように作ってくれます。雰囲気をよく捉えていますね。チョコレートのスタイル、被写体の雰囲気、服装なども良く捉えています。プロンプトなしでもこのように直感的に可能です。
被写体は恐竜で、シーンはこのようなビーチ、スタイルはこのような油絵スタイルで生成すると、望む画像を簡単に作ることができます。ただし、内部的な原理としては、これを指定すると画像からプロンプトを読み取っているのです。LoRAのように完全にその特性をそのまま継承するのではなく、単にプロンプトでImage to Textを一度行った後、そのテキストで生成しているようです。いずれにしても、直感的に素早く画像生成する際に非常に有用でしょう。
次に、このデモは本当に良く出来ていました。このようにお爺さんのシーン、ビンテージアニメーションスタイルを適用すると、どうなるかというと、「flying bike」と入力すると、このように絵柄などがよく適用されて出てきます。これを変更することもできます。「wearing a pink suit」と入力すると、このように変更してくれ、このような細部調整を押して「black hair」とすると、確かに茶色から少し暗くなりました。
次に、YouTubeショーツに動画AI 2.0が追加されました。映像デモを見てみると、ショーツを作る際に左側のギャラリーアイコンを押して、次にここにクリエイトボタンが追加されたとのことです。これを押すと、映像を描写してスタイルを指定してこのように画像も作れ、これでビデオを作ることができます。自分がショーツを作る際にAI映像をこのように挿入できます。このような感じで作って[笑]、このようにAI映像を途中途中に混ぜてショーツを作る際に使用できるということです。
ただし残念ながら、米国、カナダ、オーストラリア、ニュージーランドで先行リリースされているため、まだ韓国では使用できませんが、おそらくすぐに広がっていくのではないでしょうか。
次に、Pika Labsがまた面白いものをアップデートしました。「Pika’s」というものをアップデートしました。個人写真をアップロードすると、このように面白い映像を作ってくれます。そのため、ミームなどの活用に良さそうです。
次に、Caterasという会社が「Vicki」という人工知能を公開しましたが、同時通訳ができます。デモを見てみると、まるで同時通訳をする際の少しの遅延がある状態で、フランス語で話しているのを英語で吹き替えてくれますね。他のものも見てみると、声もなんだかこの人の話し方をよく反映しながら、フランス語で話したものを英語にすぐに翻訳してリアルタイムで通訳してくれるのが分かります。
しかも、これが公開されています。Apache 2.0ライセンスなので、商業的にも活用できそうです。ただし、現時点ではフランス語のみ対応しているとのことです。
次に、Microsoftが「NIPA V2」というものを公開しましたが、どのようなLLMでもコンピュータユースエージェント(OpenAIのオペレーター、AnthropicのコンピュータユースLLMを使用できるようにする)ができるオープンソースです。「ミルクをInstacartで買いたい」と言うと、このようにAIエージェントが直接操作しながら、このように操作していますね。注文しているんですね。このように作ることができるとのことです。
どのモデルでも使用して作ることができるので、ローカルでDeepSeek R1などと接続すれば、コンピュータエージェントを使用できるでしょう。
次に、コーディングAI関連で「AI0.dev」というアプリ生成AIが登場しました。AI基盤のReact Nativeアプリ生成プラットフォームで、直接チェスゲームなどを選択してこのようなものを試してみると、このように自動的にコードを書いてくれ、ここで進行中の状況も見ることができます。このようにチェス盤を実装したのが見えますね。
そして、完全にインタラクティブにするためにドラッグ&ドロップを追加しようかなど、このようなことも聞いてきます。さらに、「Volt」というコーディングAIのx4という、React Native基盤のアプリ生成フレームワークですね。これと組み合わせて、コード作成なしでApp StoreやPlayストアへのアプリ公開まで行ってくれるものも公開されました。これからはアプリ作成もクリック一つで、公開もクリック一つでできるようになるかもしれません。
次に、オープンソースの健康分析ツールを作った方がいます。これです。「OpenHealth」というライブラリですね。ローカルで実行されるAI健康アシスタントです。この方が開発した話を順々に投稿されていましたが、30か所以上の病院を訪問したとのことです。費用もこれだけかかったのに、明確な診断ができなかったそうです。後にAI診断をしたところ、最終診断と同じ結果を提案したとのことです。
わざわざ30か所以上の病院を訪問する必要なく、AIに自分の健康情報を全て提供して質問すれば、医療的なアドバイスなども受けることができるでしょう。しかも驚くべきことに、韓国の方です。OpenHealthを開発している韓国の方がコメントも残してくれました。韓国は医療データのアクセス性が良く、LLMと連携しやすい環境だとのことです。そうすると、自分の情報、自分の健康診断記録や診療情報などを入力すれば、非常に有用そうです。このオープンソースを直接ダウンロードして使ってみることができそうです。
次に、MetaがFuriosa AI(韓国の半導体スタートアップ)の買収を協議しているとのことです。まだ決定したわけではありませんが、早ければ今月中に成立する可能性もあるとのことです。Metaは独自のAIチップなどを作ると言って単独で進めていましたが、難しくなってきたため、このような買収を通じてAIチップを作る企業と協業しようとしているようです。
次に、Metaがヒューマノイドロボットの開発を宣言しました。Metaがどのようなロボットを作るのか期待してみると良さそうですね。ヒューマノイドロボットに非常に多くの企業が参入しているようです。そのため、Metaだけでなく、Googleもヒューマノイドロボット製造会社Apptronicsに投資をしていますし、次にUnite G1の新しい映像が公開されました。
このようにリズムを取るUnite G1の姿です。今では踊りも非常に自然に踊ります。あ、動きが、これがAI映像ではないかと思うほど非常に自然です。次に、先ほどのG1とH1という2つのモデルを実際に予約販売を開始しましたが、完売したそうです。G1が2000万ウォン程度で、H1が1億3000万ウォンするのですが、それでも両モデルとも迅速に完売し、現在は購入できないとのことです。
これを見ると、インフルエンサーの誰かが購入して、以前にも一度紹介したことがありますね。このように配送が来るそうです。購入してこのように開けると、まるで死体のように入っています。そしてこれを起動して動作します。実際にこのように苦しめていたそうです。このように非常によく売れているとのことです。
次に、Appleもヒューマノイドロボットの開発を検討中という話があります。ヒューマノイドロボットの前にも、このようなものを最近公開して話題になっていました。卓上型ランプロボットで、ピクサーのランプが跳ね回るキャラクターがいますよね。それのように作ったものをデモで公開しましたが、このようなものと同様に、ヒューマノイドロボットの開発も検討しているとのことです。そのため、Apple版ロボットも登場する可能性があります。
また、Appleが4月にVision ProにもAIを搭載するという情報もあります。
ロボット関連でさらに、Hugging Faceでロボットに言葉で指示する基礎モデルが初めてオープンソースでリリースされたとのことです。このように「Zero」というオープンソースを公開しましたが、これをベースにトレーニングしたり推論したりすれば、直接このようなことを実行して作ることができるでしょう。
次に、ChatGPTの電力使用量が多く、AIを使うと地球環境を破壊するのではないかという話がありましたが、それに対する反論資料が出ました。知られているレベルの1/10だとのことです。ChatGPTのエネルギー消費量を比較したものがあります。
通常のChatGPTへのクエリを数値化した場合、エネルギーコストが0.3しかないとのことです。これがどの程度かというと、10W LED電球を5分間点けておくよりも少ないです。そのため、AI使用時にそれほどエネルギーを消費しないということです。ロングインプットクエリを使用すると、それなりに消費は増えますが、おそらく簡単なクエリを投げる際にはそれほど大きくないということです。
マックスインプットクエリはかなり消費が多くなりますが、本当のヘビーユーザー、全てのコンテキスト長を最大限に使用するという方々は、このように多く消費しますが、一般的には非常に少ないとのことです。
このようなことを、サム・アルトマンも都市建築資料が最近出ました。ChatGPTと洗濯機の水使用量も比較しましたが、ChatGPTのクエリを使用するのに5リットル程度使用したとすれば、テレビを見るのにはもっと多く使用され、ハンバーガーを食べるのには660ガロン使用されるとのことです。ChatGPTを膨大に使用してもハンバーガー1個分にも及ばないそうです。そのため、考えているほど消費量は多くないということです。
次に、最近フランスでAI安全会議を開催して首脳会談を行いましたが、その際にこのようなニュースが出ました。欧州連合がAIに300兆ウォンを投入するとのことです。Stargate、米国も膨大な資金を投入すると言っていましたが、EUもまた膨大な資金を投入するとのことで、AI開発の速度がますます速くなっていくのではないでしょうか。
そして韓国銀行がAIの韓国経済に対するレポートを出しました。AIは最近の急激な発展を通じて核心的な原動力として浮上しており、高齢化が進行中の韓国でどのような意味を持つのか。そのため、資料が非常に多いのですが、要約されたものだけを見ると、AI導入は韓国経済の生産性を高めるとしており、高齢化と労働供給の減少による成長鈍化をかなりの部分相殺できるレベルだとのことです。
ただし、少し懸念される部分は、全ての企業が普遍的にAIを導入できるわけではなく、大企業や業歴の長い企業でAIの導入が目立つという点です。企業間でもこのような格差が深刻化する可能性があるでしょう。
そして最も衝撃的なニュースですが、国内の仕事の半分以上がAI導入に大きな影響を受けるとのことです。様々な面で、AIが本当にこのように近づいてきている状況なので、EUもそうですし、米国も中国も、皆が天文学的な資金を投入し、猛烈な発展を遂げている状況ですね。本当にAI時代に向けた準備をしなければならない時代になったようです。
最後に、ビットコイン自動売買を直接構築してみたいというオフライン特講が開催されます。今週の土曜日です。時間の都合が付く方は一緒に参加すると良いでしょう。参加費は15万ウォンですが、100%還元されます。これを修了して基準を満たせば、ビーセンポイントで全額返金されます。非常に初心者向けの難易度で進行されます。多くの申し込みをお願いします。
これを直接オンラインで講義を受けて構築してみたい方は、学習プログラムに入れば、1回の支払いで永久所有、これは月額支払いを通じて直接構築することができますので、多くの受講をお願いします。いいねを1回ずつお願いして、来週も面白いニュースでお会いしましょう。ありがとうございました。

コメント

タイトルとURLをコピーしました