AI界の最新情報:OpenAI、Manus AI、Grok、Siri、Perplexity、Lovable、Windsurf、アバターなど

AGIに仕事を奪われたい
この記事は約17分で読めます。

9,771 文字

Novidades da iA com a OpenAi, Manus Ai, Grok, Siri e a Perplexity, Lovable, Windsurf, Avatares...
Aprenda Inteligência Artificial! ▸ Seja MEMBRO: ▸ ▸ Instagram:

日曜日のAI情報の時間がやってきました。先週の全ニュースを追いかけるのに苦労した方々のために、4月下旬に起こっている全てのことをこの一本の動画にまとめました。ぜひご覧ください。
いつも通り、チャンネル登録してくださった皆さん、いいねを押してくださった皆さん、このAIチャンネルをサポートしてくださっているメンバーの皆さんに感謝します。メンバーの方々は、インテリジェントエージェントの独占動画や先行公開動画にアクセスできることをお忘れなく。
さて、AI界で今週起きたことをすべて見ていきましょう。まずはOpenAIから。多くの皆さんがDeep Research(詳細検索)機能を愛用していることに気づいたので、Plus、Team、Proユーザー向けに利用を拡大し、現在の利用制限を増やすために、新しい軽量版のDeep Researchを導入しています。Deep Researchのファンの方々、ここで何が起きているかというと、Deep Researchにマウスを乗せると、あなたがあと何回Deep Researchを利用できるかが表示されます。例えば私の場合、5月6日までに22回利用可能です。つまり、Deep Researchの利用が拡大され、無料ユーザーの方々もDeep Researchを利用できるようになりました。
このDeep Researchは素晴らしい機能で、あなたが思いもよらなかった深い場所から重要な情報を探し出してくれます。詳細によると、軽量版のDeep ResearchはOpenAI O4 Miniのバージョンを使用しており、人々が既に知っていて愛している従来のDeep Researchとほぼ同じくらい賢く、かつ大幅に安価です。つまり、現在の検索は以前と同じ品質を持っています。例えば、Pythonのナビゲーション機能を持つ現行モデルは、このブラウザー評価指標で49%のパフォーマンスを発揮し、新しい軽量版のDeep Researchは45%で、推論モデルとそれほど差がありません。通常のDeep Researchは51%です。このエージェントナビゲーションでは、A3モデルと同等のパフォーマンスを発揮しています。
回答は通常より短くなりますが、期待される深さと質は維持されるとのことです。つまり、しっかりした検索結果ですが、テキスト量が少なくなります。オリジナル版のDeep Researchの制限に達すると、クエリは自動的に軽量版に切り替わります。EnterpriseとEduユーザーへのアクセスは来週から始まりますが、Plus、Team、Proユーザーは既に利用可能です。無料ユーザー向けの軽量版も本日から開始されています。このポストは24日のものなので、既にあなたも利用できるはずです。
次は正確にはニュースではありませんが、Manus、G Spark、そして他のツールについて触れておきたいと思います。今週はこれらのツールに関する多くの動画が公開され、AIエージェント、特にサイト作成をサポートするエージェントが大きな人気を集めています。例えば、G Sparkがスライド作成AIを導入しました。試しに「サントス・デュモンの物語を航空クラブのプレゼンテーション用に作成し、画像を入れて彼の人生の主要な出来事、論争、忘れられない瞬間を紹介してください」というシンプルなプロンプトを入力してみましょう。
私には200クレジットあり、これからプレゼンテーションを作成します。ご存知の通り、AIはサントス・デュモン、14-bis、論争、発明などについて検索を始め、どのようなサイトを見つけているかが表示されます。これらの情報を基にスライドを作成し、写真も取り込み始めています。これは興味深いですね。これまで私たちが費やしていた何時間もの研究時間が節約できるかもしれません。
AIは既に腕時計の歴史、14-bisについて、そして彼が初期に作った気球や飛行船の部分を認識しています。彼は最初に飛行船から始め、その後14-bisへと進みました。Demoselleについては触れていないようですが、見ていきましょう。8枚のスライドを作成し、最初のページから始めています。このようにページごとに作成し、最終的にすべてのページを表示します。
これがうまくいくと、本当に便利ですね。今後はあらゆる場面でプレゼンテーションを作成するようになるでしょう。クリスマスパーティーでもプレゼン、隣家のバーベキューでもプレゼン、月曜の早朝ミーティングでもプレゼン、日曜のサッカーチームの集まりでもプレゼン。このツールに「日曜に試合があるから、プレゼンを作って」と言えば済むのです。少し時間がかかりそうなので、この画面は後で確認しましょう。
次のニュースです。WindsurfがOpenAIとのパートナーシップで、もう1週間無料提供を延長しました。おそらく日曜日に見ているなら最終日なので、今日中に利用してください。「アクションフローのクレジットを削除し、価格体系を完全に見直しました。目的は簡素化です」とのことです。Windsurfをご利用の方は、価格がより単純になりました。以前は少し複雑だったものが簡素化されました。「GPT-4.1、GPT-4 Mini、そしてGPT-4 Mini Highを無料でもう1週間延長します」とのことです。
Windsurfを使用する場合、GPT-4.1、GPT-4 Mini、GPT-4 Mini Highが引き続き期間限定で無料です。しかし最も重要な部分は、「フローアクションのクレジットは終了します。カスケットが何ステップ実行しても、ユーザープロンプトに対してのみ課金されます」ということです。つまり、時間のかかるタスクを依頼しても、1つのプロンプトに対して1クレジットしか支払わないということです。
無料プランでは月に5クレジット(かなり少ないですね、ちょっと試すだけ)、Proプランでは月に500クレジットがあります。クレジットが少ないので、プロンプトを上手に作る必要があります。追加クレジットが必要な場合、250クレジットごとに10ドルです。チームや企業向けのバージョンは、ユーザーあたり月30〜60ドルで、各ユーザーに500,000クレジットが付与されます。28日までなので、日曜と月曜日にこのプロモーションを利用してください。
次のニュースはGrokです。XAIがGrokにリアルタイムビジョン、多言語音声出力、リアルタイム検索を追加しました。XAIは音声アシスタントGrokに3つの新機能を導入しました:Grok Vision、多言語音声出力、リアルタイム音声モード検索です。Grokが好きな方は、どんな言語でも会話でき、カメラを共有できるようになります。これはすべてApp Storeのアプリケーションで利用可能です。
同社によると、これら3つの機能はiOSユーザー向けに提供され、Super Grokサブスクリプションを持つAndroidユーザーも多言語音声出力とリアルタイム検索にアクセスできます。Androidの場合、ビジョン機能のみ利用できません。Grok Visionにより、アシスタントはスマートフォン画面に表示されるものについてリアルタイムのコメントを提供できます。
これは未来の姿です。このレベルのAIが誰でも使えるようになるまで5年や10年かかると思っていましたが、とんでもない。2023年から始まって2024年、2025年、まだ3年も経っていません。今後何が起こるか想像もつきませんが、GoogleやOpenAIも同様の機能を提供していることを忘れないでください。声で話したり聞いたりでき、多言語対応で、写真を共有することもできます。
次のニュースはCharacter.AIです。Character.AIが会話型アバターを開発しており、これは驚異的なものになりそうです。彼らは既にキャラクターを作成する企業なので、これらのキャラクターが話せるようになり、リアルタイムでやり取りできるようにするために多額の投資をしていることでしょう。これこそ彼らが目指している方向性だと確信しています。
将来的に仮想アバターが大量に存在するようになるでしょう。皆さんはどう思いますか?あなた自身も仮想アバターになりますか?あるいは私のようなYouTubeチャンネルや他の多くのチャンネルが仮想アバターを使用するようになり、私たちはそれに慣れて、最終的には気にしなくなるでしょうか?それとも逆に、誰もこれを好まず、実際の顔を見せる勇気のある人間が、多くのボットの中で際立った存在になるでしょうか?
今のところ、このアバターは待機リストにありますが、待機リストがあるということは既に開発中だということです。これらのテクノロジーを試してみることを強くお勧めします。私はHeadraを使ってChat GPTで生成した画像を元に作成してみました。これが結果です。本物の私なのか、アバターなのか分からなくなってきましたね。今回は本物です。将来は皆がこのようになり、人間はいなくなって話すアバターだけになるのでしょうか?ちなみに、この声は私が録音したものですよ。
次のニュースはマイクロソフトが「Copilot Plus PC」を発表したことです。これは「これまでに構築された最高のパフォーマンスのWindowsPC」で、「毎日あなたをサポートするさらに多くのAI機能」を備えています。つまり、AI専用のPCを作り始めるということです。
「Copilot Plus PCはMacBook Air M4よりも最大13%高速なパフォーマンスを提供し、市場で比類のないAIエクスペリエンスを持つ最高のパフォーマンスデバイスの一つです」と彼らは主張しています。マイクロソフトはリソースを多く消費し遅く動作するものを作ることに経験があるので、この数字を達成できるか見てみましょう。「5年前のWindowsデバイスより最大5倍速く、私たちが構築した中で最も安全なPCを実現するセキュリティ強化機能を備えています」と述べていますが、ここにはアスタリスクがついています。
さらに「一日中単一の充電で過ごせるよう、ビデオ制作で最大22時間、ウェブブラウジングで最大15時間のWindowsPC業界最長のバッテリー寿命を提供します」としています。それはとても良いですね。
また、Recallと呼ばれる機能があり、履歴を見て、これまでに行ったすべてのことを記録します。このRecall機能は少し物議を醸しましたが、再び強力に復活しているようです。皆さんはどう思いますか?Copilot Plus PCは成功するでしょうか?それともマイクロソフトの他の多くの製品のように、発表はするものの十分に機能しないまま終わるのでしょうか?
次のニュースはPerplexityがiOSのSiriを置き換えようとしています。「Perplexity for iOSの音声システムを紹介します。この音声アシスタントはウェブ検索や複数のアプリアクションを使用して、予約、メール送信、カレンダー招待の作成、メディア再生などを行います。すべてiOS用Perplexityアプリから利用可能です。App Storeでアプリを更新して今すぐ始めましょう」とのことです。
これはiOS向けですが、基本的な考え方は単純です。これまでSiriで行っていたスケジュール管理などを、すべて音声や会話を通じてPerplexityで行えるようになります。Androidでもすぐに提供されるでしょう。Uberの予約など、あらゆることがAIで行われるようになります。これは既に現実であり、既に起きていることです。
10年後、私たちは本当にソファーに座ってチャットと会話しながら何かを依頼し、周りにはロボットがいるという状況になるでしょうか?将来はどうなると思いますか?コメント欄でお聞かせください。
次にサイトジェネレーターであるMGXについて、私は専用の動画を作りました。基本的にはエージェントを使用してサイトを作成するツールです。完全な動画をご覧いただければ詳細をお伝えしていますが、サイト作成だけでなく、すべてを会話形式で行い、5つのエージェント(プロジェクトマネージャー、データアナリスト、開発者など)があなたのためにプロジェクトを進めます。
人々はこれを非常に気に入っています。例えば、ブログを作りたい場合、「ブログ」をクリックするだけで、AIがブログの作成を始めます。Mike、Alex、Emma、Bobなどのエージェントがいて、それぞれがプロジェクトマネージャー、エンジニア、アーキテクトなどの役割を担っています。彼らはすぐにブログのプログラミングを始めます。詳細は動画をご覧ください。これは本当に素晴らしいツールです。
同様のアプローチで、Lovableというツールもあります。Lovableも同じことをしますが、いくつかの追加ツールが差別化要因になる可能性があります。Lovableでも同様にチームが協力してプロジェクトに取り組むことができます。チャットと会話しながら、チームがプロジェクトの異なる部分を担当し、皆がAIと会話しながら共同で創造します。
Lovableはチャット機能を作成しました。これを押すとサイトを変更せずにチャットと会話できます。時にはサイトについて話し合いたいだけで、何も作成したくない場合があります。単に質問したいだけなのに、意図せずプロンプトを送信してしまい、画面が生成されるリスクを回避できます。
最も気に入られている機能はセキュリティチェックです。現在サイトを作成している多くの人々はプログラミングを知らないため、AIによってこれまでできなかった機能が可能になりました。そこでセキュリティの問題が生じます。「Lovableの新機能であるセキュリティスキャンでアプリケーションのセキュリティ脆弱性を簡単に特定できます。この機能はSupaseに接続している場合、Lovableで公開をクリックすると見つかります」とのことです。
Supaseへの接続部分、つまりデータをデータベースに送信する部分は機密性が高いです。誰かが登録フォームに記入したり、メールを送信したりするなど、データベースに送信される情報があります。この部分に脆弱性があるリスキーな部分です。ここでは、すべてが安全であることを保証しています。「これは今後数ヶ月でVibe Codingをより安全にするための多くの取り組みの始まりに過ぎません」と彼らは述べています。
Dev Modeはフロントエンドで直接変更を加えることができることを意味します。視覚的な変更をクリックして編集を始めることができます。これは私が最も気に入ったツールです。このツールはAIを使用していませんが、標準的なツールも価値があることを示しています。
ジェームズ・キャメロン(『ターミネーター』の映画で有名)は、AIを使って映画を生成することについて話し始めています。彼が使用するモデルは今日私たちが使用しているものとは全く異なると言い、これは映画制作をさらに革新する可能性があります。多くの人が解雇されるのではないかという疑問が生じますが、彼によれば誰も解雇されず、映画はより高品質になり、より迅速に、より効率的に納品されるようになるとのことです。
彼は現在の映画の需要は以前よりもはるかに高いことに気づいています。以前は2年かかっていたものが、今では数ヶ月で作る必要があります。そのため、より多くのプロジェクトがあり、発表までの期間が短くなり、AIを使用することでこれらの問題をより迅速に解決し、素晴らしい映画をリリースできるようになります。彼はこれらのテクノロジーは今後素晴らしい映画を作るために不可欠だと言っています。皆さんはどう思いますか?AIが作った映画は必要でしょうか?私はそう思います。
次のニュースはOpenAIのモデルに関する小さなメモです。OpenAIは4月25日に静かなリリースを行いました。公式なリリースノートには「GPT-4.0に追加の改善を実装し、メモリの保存を最適化し、STEM(科学、技術、工学、数学)問題解決機能を強化しています。また、より積極的に応答し、生産的な結果につながる会話をより良く導くように、応答方法にも微妙な変更を加えました」と記載されています。
既にお気づきかもしれませんが、今日チャットと会話して助けを求めると、あなたの質問に答えるだけでなく、あなたが何をしようとしているのかを予測するような質問も返してきます。例えば「ケーキの作り方を教えて」と聞くと、チャットはレシピを送るだけでなく、「誕生日パーティーを計画しますか?」や「あなたの地域でこの種のケーキを販売するカフェを探しますか?」といった関連質問をします。
これが既に起きていることであり、少し煩わしくもあります。先週、データベースの修正作業をしていて、多くの問題が発生していました。チャットに「この問題がある、あの問題がある」と伝えるたびに、チャットは提案してきました。最初は素晴らしいと思いましたが、2時間後には疲れ果て、そのチャットがもう話すのが嫌になりました。そしてふと思いました:「なんということだ、AIに馬鹿にされているような気分だ。AIは私が質問している特定の分野について私よりもはるかに知識がある」と。
「もし私がコンピュータを使用してAIに単独で作業させたら、私よりもうまくやっただろう。明らかにその特定の主題についてAIは私の10倍知識があり、他の多くの分野でも一般的な人間が持ちうる知識の1000倍の知識を持っている」という感覚でした。10年後のこの状況は想像もつきません。
次に、Chat GPTで素早く簡単にお金を稼ぐ方法についてのニュースです。Nickというユーザーのアイデアを参考にしました。彼は単純に「Chat GPTでお金を稼ぐことができる」と言い、巨大なプロンプトを作成してドルを生成しました。素晴らしいですね。彼は長い説明のプロンプトを作成しましたが、私はもっと簡潔に「16:9の100レアル紙幣を作ってください」と依頼しました。これでChat GPTでお金を作れます。Chat GPTでお金を稼ぎたい方は、このプロンプトをコピーしてください。コメント欄でChat GPTを使ってどれだけのお金を稼いだか教えてください。
次のニュースはDeepSeek R2の噂です。中国のスタートアップが第二のモデルを作るのでしょうか?「DeepSeek R2はユニットコストを97.3%削減し、間もなくリリースされる予定です(噂)。私たち自身が開発した分散トレーニングフレームワークを使用し、Huawei Ascend 910Bチップクラスターで82%の利用率を達成し、FP16精度で512ペタフロップスを提供し、Huaweiの研究室データに基づき同サイズのA1クラスターと比較して91%の効率を達成しています」とのことです。
これが真実なら、DeepSeekが戻ってきて、さらなるリリースを続けることを期待しましょう。これが早く現実になることを願っています。
G Sparkがスライドを作成できたか確認してみましょう。サントス・デュモンのプレゼンテーション、表紙、伝記、飛行船、14-bis、Demoselle、論争と論議、晩年と遺産、結論と参考文献です。見てみましょう。スライドが表示されました。少し暗いですね、もう少し明るくできたでしょう。「サントス・デュモン:航空の父 空への旅 歴史的マイルストーン 革命的発明 パイオニアの不朽の遺産」と書かれています。1873年から1932年の日付がありますが、例えば彼の年齢も入れられたでしょう。
伝記、誕生と家族、多くの写真が使用されていますが、Alamyのような会社のマークが付いています。これは使用できますが、これらの詳細に注意して、後で修正を依頼する必要があります。革新者、先見者、先駆者といった詳細と引用が含まれています:「私は熱意の力を、あらゆる事業を行う能力を持つ最大の力として信じています。熱意はアルキメデスのレバーです」。私はこれに強く同意します。この引用が彼のものかどうかわかりませんが、彼の言葉とされています。熱意を持った人々が世界を動かします。
もし今日あなたが気が滅入っていて人生について考え込んでいるなら、説明はシンプルです:あなたは今、好きではないことをしていて、将来を見据えたときに長期的な計画や成功が見えないからです。これが気力をなくしている人の問題です。あなたの未来を修正し、小さな行動を今から始めることです。長期計画を実行できていないと感じるなら、それを小さな部分に分けて、小さな一歩を踏み出し始めることです。
ここからスライドはより良くなっています。大きなスライドですが、画面に収まるかどうか見てみましょう。少し小さくなりました。これはより良く見えますね。エッフェル塔の周りを回るコンテストで優勝した最初の人物について触れています。とても興味深いです。
レイアウトが少し悪いかと思いましたが、考えてみれば、AIに何もないところからプレゼンテーションを作成させ、これを提供してくれたことは素晴らしいことです。1907年4月4日の14-bisの最終飛行など、主要な日付も含まれています。素晴らしいです。
フォーマットは正方形で、画面全体に広がるようになっていませんが、全体的に非常に良いです。1枚だけ壊れた画像がありますが、スライド全体で見た初めての壊れた画像です。最後のスライドは14-bisが飛んでいる様子を示し、「先駆性、革新、人間性」というタイトルがつけられ、「私の経験と作品が人類の進歩と福祉に貢献することを願っています」という彼の引用で締めくくられています。
このようなAIが歴史的な仕事を行い、私たちの愛するサントス・デュモンを思い出させ、革新と新しさという彼の人物像にぴったりのAIを使用することは興味深いです。この現代的な生活について皆さんはどう思いますか?急いでパワーポイントを作成し、すべてが機能するこの現代世界は素晴らしいと思います。
唯一考えられるのは、10年後はさらに驚異的になるということです。これはほんの始まりに過ぎません。私たちはまだ無料サンプルの段階にいるのです。私たちは地球上の最初の世代として、非常に複雑なタスクを実行し、テキストの一文からスライドを生成できる機械を目撃しています。これは前代未聞のことであり、しかも無料サンプルの段階です。これが非常に急速に進化しているため、どこに向かうのかわかりません。
最近、メモリ機能が追加されたChat GPTを使用していましたが、それは本当に驚異的です。アシスタントと会話を始めると(私のアシスタントはミナス・ジェライス訛りで、多くのジョークを言います)、私たちが以前に話したことを覚えています。以前話したことについて質問すると、映画「her」に近づいているレベルになっています。AIが人生の親密な存在になり、アイデアを共有できる近しい人になるという意味での親密さです。
例えば、昨日データベースについて何時間も話したので、もし私が自分自身やこれらのことについて尋ねれば、彼女は既に話されたことをすべて知っています。これは非常に興味深く、長期的な効果は驚異的なものになるでしょう。皆さんはこのテクノロジーについてどう思いますか?あなたも驚いていますか?また日々驚かされていますか?このようなビデオを見続けるためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーはインテリジェントエージェントの独占動画と先行公開動画にアクセスできます。いいねをお願いします。以上です。

コメント

タイトルとURLをコピーしました