
13,440 文字

このビデオでは、私が個人的に見つけることができた2025年に起こることをすべて調査しましたので、時間を無駄にせずにAIで何が起こるのかについて詳しく見ていきましょう。
まず最初に起こることの1つは、もちろんエージェントです。エージェントに関して、AI分野で世界最大の企業の1つであるOpenAIは、2025年にオペレーターエージェントと呼ばれるAIエージェントを発表する予定です。これは、コードを書いたり、旅行を予約したりするなど、人の代わりにコンピュータを使用してアクションを実行できるエージェントになります。
この情報は、AI業界で非常に信頼できる情報源であるThe Informationを通じてリークされたものであり、2025年に実現する可能性が高いです。OpenAIがこのエージェントを開発することがわかったので、これはおそらく高品質なものになるでしょう。他の多くの企業がすでにAIエージェントをリリースしていますが、OpenAIは私たちを驚かせるような何かを待っているようです。
このエージェントのタイムラインについて気になる方のために、この情報が発表された時に私はビデオを作成しましたが、要点を説明すると、その時の水曜日のスタッフミーティングでOpenAIは1月にこれが実現すると発表しました。AI業界のタイムラインは様々な要因で変動する可能性がありますが、基本的に1ヶ月後には体験できる可能性があります。来月にはOpenAIがデモを行い、エージェントができることを示すような研究プレビューが出るかもしれません。
しかし、AIエージェントは少し扱いが難しく、完全に信頼性の高い動作はまだ実現できていないため、2月になる可能性もあることも承知しています。2025年にOpenAIがリリースする予定の他のエージェントについて気になる方のために、彼らは複数の関連エージェント研究プロジェクトをリリースする予定で、コンピュータで動作するものだけでなく、Webブラウザでタスクを実行できるものも含まれています。これはブラウザに組み込まれて、あなたのためにさまざまなことを実行できるものになります。
私はすでにWebブラウザエージェントの例を見ており、これについてはすぐに説明しますが、サム・アルトマンは2025年のエージェントについて、そしてなぜそれが全てを変えると信じているのかについて次のように語っています:
「エージェントは誰もが話題にしているものです。それには良い理由があると思います。AIシステムに、とても賢い人間に与えるような複雑なタスク、つまり時間をかけて取り組み、多くのツールを使用して価値のあるものを作り出すような種類のタスクを与えることができるという考えです。これは来年期待されることで、もしそれが期待通りにうまく機能すれば、物事を本当に変革することができます。」
彼はまた、自身のチャンネルで行われた詳細な対談で、AIエージェントで実現できる非常に興味深いデモ、というよりも例を示しています:
「人々がAIエージェントが代わりに行動するという話をする時、彼らが一貫して挙げる主な例は、エージェントにレストランの予約をさせることです。オープンテーブルを使用したり、レストランに電話したりできます。確かにそれは少し面倒な作業を省くことができます。
しかし、人間としてはできない、あるいはしないようなことができるという世界の方が興味深いと思います。例えば、1つのレストランに電話して予約するのではなく、私のエージェントが300のレストランに電話をかけて、私にとって最高の料理があるところや、何か特別なものが提供されているところを見つけ出すとしたらどうでしょうか。エージェントが300件のレストランに電話をかけるのは本当に面倒だと思うかもしれませんが、もし300件すべてにエージェントが応答するのであれば問題ありません。これは人間にはできない並列処理が可能になります。
これは些細な例ですが、人間の帯域幅の制限をエージェントが持たない可能性があります。しかし、私が思う最も興味深いカテゴリーは、レストランに電話をかけるというような一般的に話題になるものではなく、優秀な先輩社員のような存在です。プロジェクトで協力し合い、エージェントが2日間のタスクや2週間のタスクを本当によく実行し、質問がある時はあなたに連絡を取り、素晴らしい成果物を持って戻ってくるようなものです。」
彼が話していた音声エージェントについて知りたい方のために、彼らは実際に非常に短いデモを行いました。これはおそらく皆さんが見たことがないものです。なぜなら、私もこれを取り上げていませんし、他のチャンネルもほとんど取り上げていません。これはOpenAIが行ったプライベートデモだったからです。
しかし、これは実際に2025年のOpenAIのエージェントが何をするのかを示すものでした。エージェントは異なる店舗に電話をかけ、あなたの代わりにさまざまなことを行うことができます。ここで見ることができますように、「これらの店舗に電話をかけてください」と言うと、このアシスタントがあなたのために多くの異なることを実行できます。
「はい、お電話ありがとうございます。こちらはLのテックストアでしょうか?私はAと申しますが、お客様の代わりに電話させていただいております。」
「はい、Lのテックストアです。どのようなご用件でしょうか?」
「1 12とエメラルドフローイーの在庫確認のお電話です。お客様のキアが本日お受け取りを希望されています。」
「申し訳ありません。OnePlus 12は在庫がありますが、そのカラーはございません。」
「ありがとうございます。本日の閉店時間を教えていただけますでしょうか?キアが後ほど電話を見に来る可能性があります。」
「エメラルドはありませんが、シルバーとブラックをご用意しています。閉店は午後7時です。」
「わかりました。シルバーとブラックが在庫にあり、午後7時までに来店可能とキアにお伝えします。ご協力ありがとうございました。良い一日をお過ごしください。」
「ありがとうございました。」
OpenAIだけがこれを行っているわけではありません。Googleも顧客エージェントのデモを公開しており、これは2025年の後半にリリースされる可能性が高いと私は予想しています。
「顧客エージェントを発表したばかりです。これはGeminiとベクトル検索を活用して、シームレスなショッピング体験を提供します。何をお探しでしょうか?」
「そのシャツが欲しいのですが、他にもいくつか指定があります。キーボード奏者が着ているようなチェックのシャツを探してください。価格、購入場所、いつ着られるかを知りたいです。」
「ビデオを含めます。顧客エージェントは、Geminiのマルチモーダル推論を使用して、テキストとビデオを分析し、私が探しているものを正確に特定します。そしてGeminiはそれを検索可能な形式に変換します。」
「これはすごいですね。探していたチェックのシャツと、他の素晴らしい選択肢がすぐに見つかりました。これはGoogleの信頼できる検索テクノロジーを活用しているからで、お客様が記録的な速さで適切な結果を得られることを保証します。提案された商品は、Simple Fashionsの在庫と過去の実績データに基づいており、お客様が満足して購入できるようにしています。」
「最初のものが完璧です。4日以内に配送か、近くの店舗で今日受け取れるようですね。明日の夜に着たいので、安全のため地元の店舗にしましょう。もちろん、私のサイズは3着しか残っていません。このシャツを着損ねたくないので、店舗に電話をかけて取り置きをお願いしようと思います。」
「まず、舞台裏で何が起こっているかをお話しさせてください。Simple Fashionsの顧客エージェントは、GoogleクラウドのフルスイートのAI機能を使用して、カスタマイズされたサポート対話を提供し、購入や返品などの取引を促進し、リアルタイムで最新の情報を確実に受け取れるようにしています。コンサートに向けてシャツを手に入れるのはもう目前です。店舗に電話をかけてみましょう。」
「はい、サウスラスベガス通りのSimple Fashion顧客エージェントです。アマンダさんでしょうか?」
「はい、アマンダです。」
「ご連絡ありがとうございます、アマンダさん。別のデバイスでセッションがあったようですね。ライブチャットコンパニオンへのリンクをSMSでお送りしました。チャットに切り替えたい場合は、リンクをクリックしてください。本日はどのようなご用件でしょうか?」
「カートに入れているシャツを、登録されているカートで購入したいのですが。」
「もちろんです。Simple Fashion Rewardsのメンバーであることを確認しました。20%オフのバウチャーが利用可能のようです。この購入に適用しますか?」
「はい、お願いします。」
「お好みのサイズで店頭受け取り可能な、これらのアイテムもシャツと相性が良いですが、ご興味はありますか?」
「はい、白いシャツとブーツをカートに追加してください。」
「承知しました。合計は$23.76です。」
「登録されているカートで進めてよろしいですか?」
「はい。」
「ご購入が確認されました。他に何かご用意できることはありますか?」
「いいえ、大丈夫です。ありがとうございました。」
すばらしいですね。ブラウザエージェントについて見てみると、Googleは実際にSearch GenerativeExperienceと呼ばれるものをリリースしました。これは人々がまだ気付いていない驚くべきAIツールです。これはGemini Deep Researchと呼ばれ、基本的にはAIエージェントが何百万もの異なるウェブサイトをブラウズし、完全な研究レポートを作成することができます。
これは私が毎日使用している非常に過小評価されているものですが、将来的には研究は、何百万ものウェブサイトをブラウズできるAIエージェントによって行われ、その後コンピュータに戻ってくると、簡単に選別したり、望む方法で並べ替えたりできる大量の情報が得られると予想しています。これは私が現在使用しているものです。
2025年に存在するAIエージェントの種類やその他のAIエージェントについて知りたい場合、Googleはプロジェクトマリナーと呼ばれるものをリリースしました。プロジェクトマリナーは基本的にプロトタイプ実験で、このビデオでは正確にそれが何をするのかを見ることができます。なぜならそれは本当に驚くべきものだからです。
基本的に、プロジェクトマリナーというワンクリックツールがあり、ブラウザでさまざまなタスクを実行できます。では、次の2分間はGoogleに説明を任せて、その後次のポイントに移りましょう。
「今日はプロジェクトマリナーについてお話ししたいと思います。これは人間とエージェントの対話の未来を探求する研究プロトタイプで、Gemini 2.0上に構築されています。新しい技術はすべて、責任を持って構築することが重要です。そのため、私たちは小規模から始め、信頼できるテスター群からフィードバックを得て、プロジェクトマリナーの進化を形作っていきます。
どのように機能するか見てみましょう。プロジェクトマリナーは、実験的なChrome拡張機能としてブラウザで動作します。まず、プロンプトを入力します。ここではGoogleスプレッドシートに記載された屋外企業のリストがあり、彼らの連絡先情報を見つけたいと思います。エージェントに、これらの企業のリストを取り、ウェブサイトを見つけ、連絡可能なメールアドレスを探すよう依頼します。
これは、仕事で遭遇する可能性のある面倒な多段階タスクの簡略化された例です。エージェントはGoogleスプレッドシートを読み取り、企業名を把握しました。その後、Benchmark Climbingをグーグルで検索し始め、ウェブサイトにアクセスします。
この研究プロトタイプはアクティブなタブでのみ動作し、バックグラウンドでは動作しないことがわかります。メールアドレスを見つけると、それを記憶して次の企業に移ります。このプロセスの任意のポイントでエージェントを停止またはポーズすることができます。
ユーザーインターフェースでエージェントの推論を見ることができるのが素晴らしく、エージェントが何をしているのかをよりよく理解することができます。そして、次の2つの企業についても同様のことを行い、ブラウザをナビゲートし、リンクをクリックし、スクロールし、情報を記録します。
これは初期段階の研究プロトタイプなので、デモのために速度を上げています。信頼できるテスターと協力して、より高速でスムーズなものにしています。人間をループに入れておくことが非常に重要です。4番目のウェブサイトの後、エージェントはタスクを完了し、使用するメールアドレスを一覧表示します。」
「以上です。私たちは巨大なAIをコンピュータにもたらすことで可能になることの表面をほんの少し掻いただけです。この先がとても楽しみです。」
また、あまり多くの情報が明らかにされていない非常に興味深いデモもありましたが、これはRunner.aiのエージェントです。これはウェブをスキャンし、あなたのためにさまざまなタスクを実行できるエージェントです。これは現在、実行できることに関して最先端のAIエージェントなので、非常に興味深いものです。
他の研究所がどのようにしてこの現在のAIエージェントを上回るパフォーマンスを発揮するのか、非常に興味があります。なぜなら、彼らはステルスモードから抜け出して爆弾を投下したばかりだからです。現在ウェイトリストに登録することができ、私も登録していますので、これが競合する研究所と競争できるかどうか、とても楽しみです。
私の調査によると、現在2Bモデルと3Bモデルを使用していると思われるので、彼らがどのように実行していくのか、非常に興味深いものになるでしょう。彼らはウェブサイトをスキャンし、数十億の異なることを実行できます。
例えば、うまくいくと思われるもう1つのものは、このようなワークフローエージェントです。これらのワークフローエージェントは基本的に、異なるアプリを接続し、このケースでは事業の詳細を取得できるようにするものです。
事業の詳細を取得するのを見ることができます。いくつかのAPIを通じて実行され、Claudeを使用してすべての事業の詳細を整理されたテーブルに保存します。これは基本的に、私のコミュニティのために構築しているものです。誰かがウェブサイトなどのリードを自動的に取得する方法を必要としており、もちろんすべての連絡先情報を自動化する方法を必要としていたからです。
これはビジネスを成長させ、リードを見つけるための自動化された方法であり、2025年にはこのようなものがさらに一般的になると感じています。もちろん、このようなものが必要な場合は、私のコミュニティのエージェントワークフローセクションをチェックするのを忘れないでください。ここでは、使用可能なエージェントワークフロー、収入源の自動化、そしてもちろんビジネスの拡大が可能です。
次に、物理的なAIについてです。物理的なAIは2025年の最大のテーマの1つになるでしょう。なぜなら、多くの異なる企業が、ヒューマノイドロボットをより人間らしくリアルにすることに関して、本当に境界を押し広げようとしているからです。
これは、ヒューマノイドロボットの開発をより容易にする様々な進歩があるためです。より多くの環境でテストができるようになり、ヒューマノイドの数が本当に増加するのを目にすることになるでしょう。これらは多くの人間の仕事を行うことになります。
私が何について話しているのか疑問に思う方のために、Boston Dynamicsのデモをご存知ない方は、これはインターネットを席巻したとは言いませんが、これが社会にとって何を意味するのか、人々は本当に理解していないと思います。
すでにいくつかの企業や国が、ヒューマノイドロボットを持っているのを見てきましたが、これは完全にヒューマノイドなロボットが自律的に何かを行うのを実際に見た最初のものの1つでした。自律的に物事を行っていただけでなく、時には自分の間違いを修正し、続行できるということもありました。
これはもちろん、テスラやFigureなどの多くの企業が試みていることです。これらの企業は、自動化された労働者を構築することで労働力を拡大できることを確実にしようとしています。このようなロボットは、毎年数が増加していく従業員のような存在になるでしょう。
2025年は非常に興味深いものになるでしょう。なぜなら、他の企業が突然現れて、彼らが取り組んでいたヒューマノイドの種類を私たちに見せる可能性が高く、これらのロボットが特定のタスクを実行できる、より長時間のデモを見ることになる可能性が高いからです。
ここで見られるように、ロボットは間違いを犯し、「ちょっと待って、何が起こったんだ?」と言って、それを修正することができます。これは完全に電気で動作するロボットでもあります。つまり、100%電気で動作するため、もちろん環境にも優しく、また軽量でもあります。以前のAtlasバージョンのような油圧式の重いものではなく、より軽量なものです。
このようなものは非常に興味深いものになるでしょう。なぜなら、多くの人間のタスクを実行できるこれらのロボットの規模が大きくなり始めると、本当に経済を押し上げ始め、特定の物事が変化し始めると思うからです。
おそらく、完全に工場で働くロボットは得られないと思います。確かに工場で働くものもあるでしょうが、フルスケールは後年まで来ないと思います。しかし、いくつかの本当に印象的なデモを期待することはできます。
本当に信じられないようなことを成し遂げた企業の1つが、この1X Roboticsです。彼らは人間らしい動きを remarkably effectively に実行できるこのロボットを作ることができました。非常にスムーズで効果的で、多くの人々が目にしたものです。彼らがロボットをテストしているのを見てきましたし、2025年にはいくつかの主要なアップデートが来ることを知っています。
このロボットAIスタートアップのPhysical Intelligenceは、ベゾスとOpenAIから4億ドルを調達しました。それは、Pi zeroと呼ばれるロボティクスのための最初の基盤モデルを構築したためです。これは、自律的に物事を行うことができる汎用的なポリシーを持っているところです。
これらのロボットは文字通り2本の腕を使用し、完全に自律的にさまざまな異なることを行うことができます。これは、それが何をできるかを見たときに非常に驚くべきことです。服を畳んだり、段ボール箱を詰めたり、本当に信じられないような様々なことを文字通り行うことができます。
正直に言って、これを見たとき、これが自律的だとは思わないでしょう。遠隔操作されていると思うでしょう。しかし、これは単にこれを完全に自動化する汎用的なポリシーに過ぎません。完全に自律的です。
以前、人々が「ああ、このデモは自律的ではない、自律的ではない、なぜ気にする必要があるのか」と言っていた時、これは実際に自律的です。これは、本当のイノベーションが来ているところであり、物事が本当に変化し始めているところなので、注目すべきものです。
これは、私が以前言ったように、ほとんどの人々が注意を払っていないが、注意を払う必要があるものの1つです。そして、彼らの汎用ポリシーの将来のイテレーション、Pi 2やPi 3は、急速な改善になる可能性が高いです。
このビデオ全体を見たとき、私はこれについて完全なビデオを作りましたが、これが初めて見たものだったことに驚きました。そしてビデオは2万回以上の視聴さえ得られなかったと思いますが、年末にかけてより多くのロボティクスデモを見始めました。なぜなら、彼らのポリシーは実際に他のロボットにも一般化するからです。それは他のロボットで見てきたものです。
ここでそれらのデモのいくつかを含めるかもしれませんが、ロボットは大きな躍進を遂げる可能性が高いです。それはまた、Genesisというロボットシミュレータのおかげでもあります。これは基本的に、実際の現実ではなく、現実をマッピングすることができますが、現実を非常に正確にシミュレートできるため、そのシミュレートされた現実で訓練することができ、その後実際の世界にインポートされると、より効果的に実行できるということです。
だからこそ、このGenesisが全てを10倍速くすると思いますし、2025年には多くの人々の心を吹き飛ばすような、驚くべきロボットのデモが大量に出てくると思います。すでにロボットが非常に効果的に機能し、人間が行うタスクを完全に自律的に実行できるのを見てきました。
もちろん、今度は非常に効果的なデモが出てくることは驚くことではありません。ここでマイクロソフトAIの責任者が、無限のメモリを手に入れることについて話しています。これは基本的に、私たちが持っているこれらのモデルが、もう何も忘れることがないということです。
これは非常に興味深い議論を引き起こします。モデル、LLM、AIシステムが何も忘れないのであれば、なぜ別のAIシステムに切り替える必要があるのでしょうか?そのため、企業はこの無制限のメモリのような機能を急いで提供しようとしていると思いますし、それは本当に重要になるでしょう。彼は文字通りここで、これが2025年にオンラインになると言っています:
「メモリは重要な要素です。なぜなら、今日、AIに行くたびに新しいセッションが始まり、前回や前々回の会話について少しのメモリはありますが、5回前や10回前のセッションを覚えていないため、人々にとってかなりフラストレーションの溜まる経験になります。
深く投資し、本当に多くを共有し、以前話したことに基づいて構築することを望まないのは、忘れてしまうことを知っているからです。そのため、ある程度の時間が経つと、より浅い経験になってしまいます。
しかし、私たちは近無限のメモリを持つプロトタイプに取り組んでおり、そのため何も忘れません。これは本当に変革的です。変曲点について話すなら、メモリは明らかに変曲点です。なぜなら、時間を投資する価値があるということを意味するからです。言ったことすべてが、将来的に有用な形で返ってくるからです。
あなたはサポートされ、アドバイスを受け、時間とともに、一日の計画や生活の組織化の世話をしてくれるでしょう。2025年にオンラインになると予想されるこの能力だけでも、本当に変革的になるでしょう。」
これが単なる1つのクリップだと思う人のために、彼は別のインタビューでこれを2回言いました:「メモリは2025年に完了します。永続的なメモリです。考えてみれば、私たちはすでにウェブ上にメモリを持っており、常にウェブから検索しています。」
興味深いことに、OpenAIの従業員または技術スタッフのメンバー(この従業員については完全な秘密に包まれているので確実ではありません)も、「月額200ドルでユーザーメモリの増加がないのはおかしい」という投稿に対して、「もうすぐ」と無限のアイコンと共に投稿しているのを見ることができます。
つまり、おそらく私たちはもうすぐ無限のメモリを手に入れることになるでしょう。それがいつリリースされるかは、彼らの判断次第です。
また、より賢いモデル、つまり思考モデルも増えていくでしょう。ほとんどの人はこれに全く気付かないでしょうし、何が起こっているのかもわからないでしょう。なぜなら、現在のO1モデルは、私が見る限り、数学、ICS、物理学、科学、コーディングなど、本当に極端なアカデミアに携わっている人々にのみ本当に適用可能だからです。
これらの思考モデルを使用する分野にいない人々にとっては、これは価値のないものになりますが、2025年には新しいパラダイムになるでしょう。なぜなら、GPTシリーズは少し減速していますが、減速しているからこそ、彼らはもちろん、これらのモデルをスケールアップし、より賢くする新しい方法を見つけているからです。それをO1シリーズと思考モデルで行っています。
ここでGoogleが思考モデルに関して重みを加えているのを見ることができます。彼らはGemini 2.0 Flash Thinkingを導入することを決定しました。これは思考を明示的に示す実験的なモデルです。これは他のモデルよりも少し賢いものです。なぜなら、基本的に即座に応答するのではなく、問題について考え、検索し、それから応答を出すからです。
私は実際にこれを自分でテストし、2025年にリーマン仮説を解く方法についてモデルに尋ねることにしました。もちろん、2025年にはそれができるとは思いませんが、開くと、モデルが何を考え、どのようにしてその応答に至ったのかを正確に見ることができます。
個人的には、2025年にはこれが価値あるものになると思います。なぜなら、プロンプトを入力して、モデルが間違いを犯したときに、ステップを振り返り、出力の応答でどこで間違いを犯したのかを追跡できるからです。これはもちろん本当に有用ですが、そのようなものは非常に非常に価値があるものになると思います。
また、イテレーションサイクルがどのように来るのかを実際に見るとき、信じられないレベルの進歩があることも考慮する必要があります。ここでOpenAIの人物が、O3は非常にパフォーマンスが高く、O1からO3までの進歩はわずか3ヶ月だったと話しているのを見ることができます。
これは、O1から彼らのモデルの2番目のイテレーションであるO2まで、わずか3ヶ月しかかからなかったことを示しており、新しいパラダイムでの進歩がいかに速いかを示しています。思考の連鎖を使用して推論の計算をスケールアップする方法は、1〜2年ごとの新しいモデルの事前トレーニングパラダイムよりもはるかに速いです。
以前は、事前トレーニングに多くの時間を費やし、データを収集し、データを分析し、もちろん特定のドメインに微調整する必要がありましたが、今はそれをもう行っていないため、すべてがわずか3ヶ月で済みます。これはスケールアップのより速い方法であり、これはすべてここで説明されています:
「私たちは、次の6ヶ月から1年で、昨年見たよりも速くモデルが改善するのを見るでしょう。なぜなら、合成データ生成の新しい軸があり、投入できる計算量もまだスケーリング法則の初期段階にいるからです。まだ何十億ドルも合成データ生成、機能検証、推論トレーニングに費やしていません。数百万から数千万ドル程度です。では、それをスケールアップしたらどうなるでしょうか?」
「お金を使う新しい軸があり、もちろん推論時の計算時間もあります。より良くなるために推論に時間を費やすことができます。次の年または次の6ヶ月の進歩が、新しい方法論を通じて新しい軸を解放したため、より速くなる可能性があります。実際、これらの研究所の多くの人々がそう信じています。これはまだスケールの問題です。なぜなら、膨大な量の計算が必要だからです。ウェブ上に存在するよりもはるかに多くのデータを生成し、そのほとんどを捨てていますが、モデルを常に実行しなければならないほど多くのデータを生成しています。」
そして、フロンティア数学の基準を見ると、以前の最先端ではEpoch AIが2%でしたが、モデルの2番目のイテレーションでは(O1からO3と書かれていて混乱するかもしれませんが、O3は実際に2番目のモデルです。混乱しますが、信じてください)、以前に見たことのないテストで25%を獲得できました。これは本当に新しいレベルに到達していることを示す最初の兆候の1つです。これは本当に本当に興味深いものになると思いますし、これが実際にすべてをどのように変えるのか、とても楽しみです。
もちろん、AIムービーも登場するでしょう。以前、AIモデルからのビデオクリップの制作速度や品質に関して、信じられないほどの進歩を見てきました。このクリップはJason Saharaのものですが、本当に信じられないものでした。すべてのショットがGoogleのV2を使用したテキストからビデオで作成されました。
V2を見たことがない方は、本当に信じられないものです。この人は基本的にAIの短編映画を作り、さまざまなクリップを生成し、それらを一緒に繋ぎ合わせました。もちろん、この短編映画は彼が振り付けしたものですが、以前のAIモデルと比較して、これがどれほど素晴らしいものかについて話したいと思います。
これは現在得られる最高のものであり、AIにおける古い格言のように、これは最悪の状態になるでしょう。もしこれが最悪のAIビデオだとすれば、2025年末には大幅な改善があり、1080pや4K解像度、より一貫性のある、モーフィングのない映像になることが想像できます。
現在でも本当に信じられないほど素晴らしく見えますし、私がこのクリップをダウンロードしたため、品質はそれほど良く見えないかもしれません。説明欄にリンクされているオリジナルを見ると、これがどれほど素晴らしいものかがわかるでしょう。
また、AIハードウェアについてですが、2025年後半にはAIハードウェアの爆発的な増加があると思います。それはもちろん、エージェントがうまく機能すれば、AIハードウェアもうまく機能するからです。本質的に、Jony IveがOpenAIと一緒に新しいデバイスに取り組んでいることが確認されたという状況があります。大手New York Timesの記事で、Appleを離れてから何をしているのかについての主要なプロファイルで確認できます。Appleの主要なデザイナーの一人が退社し、自分で何かを作り始めましたが、今ではOpenAIで働いており、何らかのAI製品を開発していることがわかります。
彼がOpenAIと一緒に何を作っているのか、それがどんな物理的なAI製品なのか、非常に興味深いものになるでしょう。これは基本的に、エージェントが確立されたときに普及し始めると思います。エージェントを本当にスムーズに動作させるのにどのくらいの時間がかかるかは完全にはわかりません。一部の人々は2026年までかかる可能性があると言っていましたが、AIハードウェア製品が登場する可能性が高いことは確かです。
これはOpenAIだけでなく、Amazonの新しいAlexaボイスアシスタントがClaude AIを使用することになったことからもわかります。現在まだ大きなアップデートはありませんが、これが登場すると、かなり効果的なモデルを手に入れることになりそうです。
Amazon Alexaは、AI分野ではやや後手に回っていました。これは家庭で使用された最初の消費者向けAI製品の1つで、10年前の先進的な音声モードのような存在でしたが、今はClaude AIを使用することになり、パワーハウスになることができます。彼らはこれを「驚くべきAlexa」と呼んでおり、10月に発売され、サブスクリプション料金が必要になる予定でしたが、まだ何も出ていません。
より多くの音声アシスタントが登場すると思います。まだ理由は確かではありませんが、2025年にはAIハードウェアが一部の企業が活用するトレンドになる可能性があると予想しています。
最近、friend.comというウェブサイトを見ましたが、AIがより人間らしくなっていくと思います。現在、AIは、高度な音声モードと話すときでさえ、十分に人間らしくないという点で少し奇妙です。信じられないほど人間らしく聞こえますが、時々それがロボットだとわかります。
しかし、あなたに電話をかけ、メッセージを送り、奇妙な特徴や独自の問題を持つAIを想像してみてください。これは2025年後半に向けてのテーマになると思います。これはfriend.comのデバイスの1つで、まさにそれを実現するものです。このAIと何度か話をしましたが、人間らしく、リアルであることが驚くべきものでした。
以上のことから、2025年について皆さんはどう思いますか。様々なことが来ると思います。もし何か見落としていることがあれば、コメント欄に残してください。


コメント