AI Studioにおける対話型エージェントのバイブコーディング

Google・DeepMind・Alphabet
この記事は約6分で読めます。

Google AI Studioを使用してリアルタイムの対話型面接パートナーを構築する方法を実演解説する動画である。音声入力によって多言語対応の面接エージェントをバイブコーディングで作成し、実際に英語とドイツ語を交えた模擬面接のテストを行う様子を収録している。完成したアプリケーションをGoogle Cloud Runを通じてウェブ上に公開する手順や、構築したエージェントをコピーしてカスタマーサポートなど別の用途のアプリケーションへとリミックスし、応用していく流れも紹介されている。

Vibe code conversational agents in AI Studio
Learn how to build real-time conversational agents in Google AI Studio. Describe your app using natural language and you...

アプリケーションの構築

皆さん、こんにちは。私の名前はトールです。Gemini APIとGoogle AI Studioのチームで働いています。本日はご参加いただき、本当にありがとうございます。

今回は、リアルタイムの対話型面接パートナーを構築していきたいと思います。ここから、アプリケーションに組み込みたい機能を選ぶだけで大丈夫です。動画の理解や音声の文字起こし、音声の生成など、本当にたくさんの機能が用意されています。できることは山ほどありますよ。

今回のケースではリアルタイムの対話型エージェントを作りたいので、ここにある対話型音声アプリを作成するという項目を選択します。もちろん、キーボードで入力して説明することもできますが、直接声で指示を出すことも可能です。

ねえGemini、リアルタイムで面接の練習相手になってくれるアプリケーションを作りたいんだ。特に、多言語対応が求められる仕事の練習をしたいから、面接官には複数の異なる言語でテストしてもらいたいな。たとえば、英語とドイツ語とか、英語とスペイン語みたいに、異なる言語をまたいでテストするような感じだね。

さて、これでGeminiアプリは、私たちが作りたいものを基本的に理解してくれました。多言語に対応し、様々な言語をまたいでテストできる、リアルタイムの面接練習パートナーとして機能するアプリケーションですね。とても良さそうです。ここから始めましょう。

あとは構築をクリックするだけで、Gemini 3 Flashを使用したコーディングエージェントが動き出し、アプリケーションの最初のバージョンを構築してくれます。

面接パートナーとの対話テスト

はい、素晴らしいですね。これでアプリケーションの準備が整いました。マイクへのアクセスを許可する必要がありますね。ここを全画面表示にしてみましょう。職種は技術的なカスタマーサポートにしておきます。言語はとりあえず英語とドイツ語にします。これで面接の準備ができたので、さっそく始めてみましょう。

もしもし、聞こえますか。

こんにちは。はい、はっきりと聞こえていますよ。本日はご参加いただきありがとうございます。シニア・テクニカル・カスタマーサポート職の面接を楽しみにしていました。事前にお伝えしていた通り、面接中は英語とドイツ語を切り替えながら進行していきます。始める準備はよろしいですか。

ええ、素晴らしいですね。

素晴らしいです。極端に技術的な問題が迅速に解決された状況において…

ちょっと待ってください、ごめんなさい。今の部分を英語で繰り返してもらえますか。

もちろんです。重大な技術的問題が迅速に解決されず、極度に不満を感じている顧客に対して、あなたはどのように対応しますか。その状況をどうやって鎮静化させますか。

なるほど、良い質問ですね。回答は英語とドイツ語、どちらが良いですか。

この質問については英語で続けましょう。どうぞ答えてください。

わかりました、素晴らしいですね。さて、ご覧の通り、私は答えがわからないのでこの質問には回答しませんが。

ここでご覧いただいたように、私たちのアプリケーションは実際のやり取りのような、本物の面接官のような機能を実現できました。英語とドイツ語を自然に切り替えながら、ここで面接の準備をすることができましたね。本当に素晴らしいです。

アプリケーションの公開とリミックス

これでアプリの最初のバージョンが完成しました。当然、これを友人や家族と共有したいと思いますよね。そこで、外部の誰もがアクセスできるように公開設定にし、同僚や友人と共有できるリンクを取得して、彼らにも試してもらうことができます。

そして次のステップとして、このアプリケーションを公開してみましょう。これはつまり、Google Cloud上の本格的なアプリケーションとしてウェブに公開されるということです。Google Cloud Runと統合されているんですね。ですから、開始するをクリックするだけで大丈夫です。自分のGoogle Cloudプロジェクトを選択し、そこにデプロイすれば、アプリケーション専用のURLを取得できます。これで、ウェブ上の誰とでも共有できるようになります。

はい、完璧です。これで最初のアプリケーションを確保できました。初めてのリアルタイム対話型エージェントを構築できたわけです。もちろん、ここからさらに改良を続けていくことも可能です。しかし、これをコピーして分岐させ、別のアプリケーションへとリミックスすることもできるんです。

たとえば、私たちの多言語対応面接官のコピーを作成してみます。そして、この多言語対応面接官をリミックスしていくことができます。つまり、これを面接官ではなく、お客様が話すどんな言語でもサポートできるカスタマーサポートエージェントに作り変えることができるわけです。たとえば、PDFファイルなどの形式でアップロードした自社製品やアプリケーションの知識を活用して、お客様をサポートするように設定できます。

このようにして、リアルタイムの対話型多言語面接パートナーという元のアプリケーションから、ビジネスに関する知識をまとめたPDFドキュメントなどを読み込ませたカスタマーサポートエージェントへとリミックスできます。そして、そのアプリケーションを活用して改良を重ねたり、さらに別のアプリケーションへと派生させたりすることが可能です。

AI Studioでの無限の可能性

このように、Google AI Studioでは製品やアイデアを構築し、インスピレーションを自由に羽ばたかせることができます。ぜひ覚えておいてください。AI Studioでは、すぐにアプリケーションの構築を始めることができます。

インスピレーションを得るためにギャラリーを覗いてみるのもいいでしょう。そこには、すでに構築された素晴らしいアプリケーションの数々が並んでいます。現在では、Google AI Studio内でマルチプレイヤーゲームを構築することさえ可能です。Googleマップを統合することもできますし、できることは本当に山ほどあります。

また、V0を使った動画生成のような、ものすごくクールな事例もあります。美しいランディングページなんかも作れますよ。ですから、ぜひここに来てギャラリーをチェックし、インスピレーションを受けて、あなただけのエージェント型AIアプリケーションを作り始めてみてください。

ご視聴いただき、本当にありがとうございました。私はGoogle DeepMindチームでGemini APIとGoogle AI Studioを担当しているトールです。皆さんがコーディングの旅を私と一緒に始めてくれたことを、心から感謝しています。本当にありがとうございました。

コメント

タイトルとURLをコピーしました