Googleのジェミニによるアンドロイドの拡張現実とChatGPT o3の驚異的な知性

AGIに仕事を奪われたい
この記事は約11分で読めます。

5,980 文字

Gemini da Google Com Realidade Aumentada no Android, ChatGPT o3 Surpreende com Super Inteligência
Aprenda Inteligência Artificial! ▸ Aprenda Agentes iA: ▸ Seja MEMBRO:

皆さん、私たちは人類史上最大の知性革命の真っただ中にいます。今日はアンドロイドに関してもうすぐ登場するジェミニの新機能についてお話しします。私がO3と対戦している際に見られた知性の微妙な部分についても見ていきましょう。
TikTokにも新機能があり、さらにMCPを使って人工知能と対戦できるゲームの小さな実験もお見せします。それでは一緒に見ていきましょう。
いつもいいねをくれる皆さん、チャンネル登録してくれる皆さん、そして特にこの人工知能チャンネルを支援してくれるメンバーの皆さんに感謝します。メンバーは人工知能エージェントに関する独占動画にアクセスでき、WhatsAppに知能エージェントを統合する方法を教える完全なプレイリストや先行公開動画も見ることができます。
さて、今年のIO Editionで行われたAndroid Showでの発表を見てみましょう。ご覧のように、ジェミニはすでにAndroidデバイスで利用可能です。画面の共有ができたり、アプリに物を見せてジェミニが認識して会話できたりする部分は、以前から言われていたことからあまり変わっていません。
この部分は比較的変わらず、同じままです。物体を見せたり、画面に何かを表示してジェミニに質問したりできます。これは変わっていません。もし前から気に入っていたなら、これからも気に入るでしょう。この部分は問題ありません。
注目すべき点は、これらのアプリケーションが時計やメガネ、マップなど他のものと統合されていることです。ここから本当に面白くなります。なぜなら、あなたと対話するデバイスと交流し始める時が来たからです。
例えば、自然言語で会話できる腕時計があります。ボタンを押して設定するだけの時計ではなく、本当にバットマンの時計のようになりました。会話だけでどんなことでもできます。携帯を持っていなくても、バットマンの時計で会話して予定を立てたり、いろいろなことを質問したりできるのです。
それは本当に多目的なもので、ジェミニがリアルタイムで対話してくれます。ポケットに手を入れて携帯を取り出し、画面のロックを解除するなどの手間なしに、人工知能にアクセスできます。ただ会話を続けるだけで、予定を立てたり、メッセージを理解したりすることができます。これはすごいことです。
もう一つの注目点はAndroid Autoです。これは本当にあなたの交通時間のパートナーです。運転中にメッセージが届いたり、誰かが会話を始めたり質問してきたりしても、マップ画面から離れる必要はありません。経路案内を正確に行いながら、アプリを切り替えたり戻ったりする心配なく、その人と対話できます。
また、運転中に会話したり、ポッドキャストを聴いたり、交通支援アプリから離れることなく、したいことができます。
さらに、テレビとジェミニの統合も注目です。Googleはすべてに統合するという野望を持っています。Netflixが人工知能との統合を行うと言っていましたが、ここではジェミニがテレビ全体と統合されています。Netflixだけでなく、すべてです。
そのため、映画の提案やテレビ内の他のさまざまなことの提案ができます。私たちは本当にジャービスの時代に入りつつあります。去年の終わりに、2025年はエージェントの年、ジャービスの年だと言っていました。ジャービスとはあなたが会話するだけですべての問題を解決してくれる超アシスタントのことです。
そして、これこそがAndroid XRが提供するもので、3Dメガネで素晴らしい拡張現実体験ができます。これは今日すでに存在するもので、コンピュータで使用でき、Googleはみんなが好きな統合を行っています。
これは最も素晴らしい機能の一つで、仮想モニターが3つあります。この技術は新しいものではありません。3Dがあれば、これにアクセスできます。しかし、ジェミニを使ってチャットで会話し、この3Dシステムと対話することで、本当にジャービスになります。
3つか4つの画面、実際には無限の画面、メガネの中に入れて見ることができる限り、すべて有効です。これが3Dメガネの最大の利点の一つだと思います。例えば、3つの異なることを表示するモニターが3つありますが、物理的にはモニターは一つもなく、メガネだけです。これは大きな利点です。
私は今日でもこれらのメガネはまだ高すぎて少し不便だと思いますが、次の数年で何が起こるか、このものがより流動的で使いやすくなるかもしれません。この先、状況は変わるでしょう。Googleの新機能についてどう思うか、時計やメガネを買いたくなったか、交通機能を使いたいかなどコメントしてください。
交通部分は近いうちに登場するはずです。まだ利用できませんが、来週の20日か21日のGoogle IOでは発表があるかもしれません。
次のニュースはTikTokに関するものです。10代の若者たちはAI Aliveを使えるようになります。基本的にアイデアはシンプルです。TikTokはInstagramのクローンのようなもので、そのInstagramクローンにはストーリーズがあります。
ストーリーズで画像を共有するとき、写真をアップロードするとAIボタンがあり、プロンプトを書くことができます。「この写真を生き生きとさせて」と言うと、猫が犬の顔に足を触れているだけだった写真が動き始め、アニメーションや相互作用が始まります。
それは単純で無害な変更ですが、私たちの若者たちがすでに加速した人工知能の世界に足を踏み入れ始めていることを示しています。2025年に生まれた子供たちは、質問をすればすべての答えを返してくれるアシスタントのない世界を理解できないでしょう。
2000年以降に生まれた人は自分が先進的だと思っていたかもしれませんが、今や私のように人工知能以前に生まれたおじさんグループの一部です。でも大丈夫です。年齢の概念はより早く変わり、人々はまだ若いのに年を取っていると感じています。なぜなら、今、世界で起こる変化の量は、実際には2週間しか経っていないのに300年経ったように感じるからです。
なんて狂った世界に生まれたんでしょうね。次のニュースはとても興味深いものです。私はここでジェミニを使って三目並べゲームを作っていました。クリックしてプレイするシンプルなゲームです。ゲームを完成させた後、「人工知能と対戦したい」と思いました。
そこで様々な人工知能と対戦し始めました。画面のプリントを人工知能に見せ、プレイできるかを質問しました。以前にも動画で示したように、より単純なモデルは三目並べがとても下手です。一般的に正しい動きをしますが、意味のある動きではありません。
良い動きではなく、先を考えることができません。あなたが勝つことを認識できず、次の手で負けることが明らかな場面で防御することもできません。例えば、これはOの番です。Oは四角にここに置かなければ負けます。
しかし人工知能は「9に置いてブロックする」と言います。そこで「問題はプロンプトだ」と思い、別のプロンプトを書きます。すると今度は「6に置いて、あなたが勝つのをブロックする必要がある」と言います。
あらゆる種類のプロンプトを試してみると、結局これが人工知能であり、どうしようもないことに気づきます。しかし、リフレクションモデルを使うと、正しい動きをし、あなたをブロックし、最終的には引き分けになることがあります。
しかし、私がO3と対戦していたとき、興味深いことが起こりました。私は画面のプリントを送って彼に動きを尋ねていました。彼はここで自分の動きをしていました。例えば、このケースでは「あなたはXで、あなたの番です。どこに置きますか?」と尋ねました。
いきなりゲームの途中から始まりました。これはウォーカーが2か8に置かなければ勝つチャンスがなく、3か9に置くと最大でも引き分けになることを意味します。勝ちたいなら2か8に置くのが合理的です。
しかしジェミニはそうしませんでした。彼は「2に置きます」と言いました。私は「おや、この人は考えている、良い動きをした」と思いました。そこで彼は2に置きました。
私は彼が勝つのを防ぐために8にクリックして自分の動きをしました。しかし今、彼は負ける危険があります。あまり賢くないモデルなら、例えば3に置いて私が勝つことになるでしょう。しかし彼が動いたとき、彼は言いました。
「いや、右下の9に置いて、あなたが列を完成させないようにします」と。もちろん、私は彼女のために置き、彼女は自分の動きをして引き分けになりました。彼女は「もう一試合プレイしますか?」と尋ねました。そしてここからが興味深い部分です。
私は再び始め、7に置き、彼女は5に置きました。私は古典的な動きをして3に置きました。なぜなら彼女の次の動きの後、1か9に置くことを想像していたからです。
彼女が私をブロックする唯一の方法は4、2、6、または8に置くことだと想像していました。しかし、人工知能はそうしませんでした。彼女は「1に置きます」と言いました。この時点で、彼女が負けることはわかりました。彼女が1に置き、私が9に置くと、彼女が6か8のどちらに置いても彼女は負けるからです。
もし彼女が6で私をブロックしたら、私が8に置くので彼女は負けます。もし彼女が8で私をブロックしたら、私が6に置くので彼女は負けます。しかし彼女は非常に興味深いコメントをしました。
「厄介なフォークが仕掛けられました。6と8の両方を一度にブロックすることはできません。だから列をブロックするために6にXを置きますが、あなたが下の列の8を完成させて勝つのは見えています。おめでとうございます、事前に」。
これはとても興味深いです。なぜなら、私は人工知能が自分の敗北を予測して先にお祝いを言うのを見たことがなかったからです。これは高度な思考のレベルです。
明らかに私の三目並べテストでは、これは今まで見た中で最高の思考の証明でした。なぜなら、これまでは人工知能が勝つか負けるかだけだったからです。今回は「負けた、次の動きで負けることがわかっているのでおめでとう」と示しました。
これは、彼女がここの1番の悪い動きをしなかっただけで、他のいずれかのマスに動かさなければ負けることを予測できたということです。これは本当にすごいことです。
次のニュースです。MCPを使ったこの小さな遊びを見てください。MCPについてはもっと動画を作る予定です。このトピックは素晴らしいです。
基本的に、もしあなたが知らないなら、MCPは多くのものと接続するのを助ける人工知能ツールです。例えば、Gmailと会話するMCPサーバーがあります。あなたはアシスタントに「誰々にメールを送って」と言えます。
その自然言語のメッセージはMCPに行き、それをプログラミングに変換し、会話だけであなたにメールを送ります。これはGitHub、Google Drive、Google Maps、Posts、Reds、Slack、SK Lite、Timeなど、リストが終わらないほど多くの非公式サーバーと接続できることを意味します。
Alibaba Cloud、AWS、AegerやMicrosoftとCloud Flir、そして本当に多くのものと接続できます。基本的に、これらのシステムと統合して会話するだけで、無限のことができます。できることについて動画を作ることも考えています。
さて、人工知能とゲームをするという話題にいたので、私が本当にやりたかったのは、MCPを使って直接、自動化された三目並べのアプリケーションを作ることでした。私がやったことで非常に興味深く、共有する価値があると思うのは、MCPのメッセージボードサーバーを作ったことです。
ジェミニでこれをすべて作り、「メッセージボードを作るためのサイトを生成して、メッセージを送って投稿して更新するためのアドレスをサーバーに作成して」と言いました。そしてMCPサーバーを作りました。興味深いことに、Pythonでここに小さなサーバーを作りました。
それは「投稿」と呼ばれる特定の機能を持っています。これはBob Newsと呼ばれるものに投稿し、投稿が成功したか失敗したかを返します。そこで私は「投稿したいサイトに送信して」と言います。これが基本的にこのものがやっていることです。
Pythonを実行してこのPythonを起動するためにサーバーの設定をします。無料の人工知能モデルがたくさんあるR codeに入ります。また、MCPと統合するCursorでもテストしました。基本的に今起こっていることは、ここでチャットと会話して「Bob Newsに投稿があります。言ってください」と言えることです。
「MCPについての動画を録画しています。いいねを押してください」と言うと、このリクエストが始まります。R Codeは投稿する必要があることを認識し、「MCPについての動画を録画しています、いいねを押してください」というフレーズを送信する必要があります。承認します。事前承認して送信するように設定することもできます。
承認したら、サイトに行き、「MCPについての動画を録画しています。いいねを押してください」と表示され、きれいに統合されます。MCPは無料で使用でき、Cloudやカーソルとも統合できます。
カーソルでも同じことができます。「いいねを押してカーソルをインストールしてください」とBob Newsにメッセージを送ります。このメッセージを送ると同じことが起こります。ツールを実行するかどうか尋ねられます。ここでツールを実行すると、「いいねを押してカーソルをインストールしてください」と表示されます。
なぜこれが興味深いのでしょうか?カーソルでもHook Codeでもトークンに支払っていないからです。無料アカウントを使用しているからです。これが重要なポイントです。Cloudでも使用でき、無料のままです。しかし重要なのは、これらのツールを使わずにAPIを使用すると、トークンにお金がかかることです。
非常に興味深いので、あなたの人工知能エージェントをウェブサイトや他のツールとパーソナライズされた対話をさせたい方にこのアイデアとヒントを共有したいと思いました。これがヒントです。このようなコンテンツを続けて見るためにチャンネルをサポートしたい場合は、メンバーになってください。メンバーは知能エージェントの独占動画と先行公開動画にアクセスできます。
いいねをお願いします。ありがとう。

コメント

タイトルとURLをコピーしました