
6,450 文字

みなさん、こんにちは。Google I/Oへようこそ。今日から双子座の季節が始まると聞きました。何が特別なのかよくわかりませんが、Googleではどの日も双子座(Gemini)の季節です。数週間前、Geminiはポケモン青を完了しました。バッジを獲得し、勝利への道を進み、四天王とチャンピオンを倒しました。これでAPI、ポケモン人工知能の実現に一歩近づきました。
こちらはGoogle Beamです。AIをベースにした新しいビデオコミュニケーションプラットフォームです。Beamは最先端の新しいビデオモデルを使用して、2Dビデオストリームをリアルな3D体験に変換します。
裏側では、6台のカメラが異なる角度からあなたを捉え、AIを使用してこれらのビデオストリームを融合させ、3Dライトフィールドディスプレイに表示します。HPとの協力により、最初のGoogle Beam端末が今年後半に先行ユーザー向けに提供される予定です。
また今日、リアルタイム音声翻訳をGoogle Meetに直接導入します。英語とスペイン語の翻訳が今すぐ契約者に提供され、他の言語も今後数週間で展開されます。そして、リアルタイム翻訳は今年後半に企業向けに提供される予定です。
また、研究プロトタイプのProject Marinerもあります。これはウェブと対話して様々なことができるエージェントです。あなたと2人のルームメイトがオースティンでアパートを探していると仮定しましょう。それぞれの予算は月1200ドルです。洗濯機と乾燥機、または少なくとも近くにコインランドリーが必要です。
エージェントモードを使用すると、Geminiアプリがバックグラウンドで作業を開始します。Ziloのようなサイトであなたの条件に合った物件を見つけ、必要に応じてProject Marinerを使って非常に具体的なフィルターを調整します。Geminiアプリの実験的なエージェントモードはまもなく契約者に提供される予定です。
私たちはパーソナルコンテキストと呼ばれるものでこれを実現しようとしています。あなたの許可を得て、Geminiモデルはプライベートで透明性の高い方法で、完全にあなたのコントロール下でGoogleアプリからの関連コンテキストを使用できます。Gmailでの例をお見せしましょう。AIベースのスマート返信機能をご存知かもしれませんね?この機能がどれほど人気があるか驚くべきことです。
では、これらの返信があなた自身のように聞こえたらどうでしょう。これがパーソナライズドスマート返信の背後にあるアイデアです。Gemini 2.5 Proは私たちが今までに設計した最もスマートなモデルであり、世界最高の基盤モデルです。ほんの数週間前、2.5 Proの更新版のプレビューをリリースし、すぐにテストして開発を開始できるようにしました。
今日、2.5 Flashの更新版をリリースすることを発表できることを嬉しく思います。新しいFlashはほぼすべての面で向上し、推論、コード、長いコンテキストの主要な基準で改善しています。
Flashは6月初旬に一般提供され、その後すぐにProも提供されることを嬉しく発表します。ただし、AI Studio、Vertex AI、Geminiアプリで今すぐプレビューを試すことができます。また、音声合成の新しいプレビューも導入しています。これには類を見ないマルチスピーカーのサポートが含まれています。
これはモデルがより表現力豊かに会話できることを意味します。私たちの話し方の非常に微妙なニュアンスを捉えることができます。24以上の言語で機能し、言語間を簡単に切り替えることもできます。この音声合成機能は今日からGemini APIで使用できます。
Gemini 2.5 Proはコーディングに驚くほど優れています。Google Studioで写真を共有し詳細を学ぶための簡単なウェブアプリをコーディングするよう2.5 Proに依頼しました。そして、このデモの直前に同じ指示で実行した別のタブに切り替えます。こちらがGeminiが生成したものです。ワオ!
2.5 Proはお気に入りのIDE上や、Android Studio、Firebase Studio、Gemini Code Assist、非同期コーディングエージェントのJulesなどのGoogle製品で利用できます。Julesは、これまで何時間もかかっていた大規模なコードベースの複雑なタスクに取り組むことができます。Julesは現在パブリックベータ版なので、jules.googleで誰でも登録できます。
今日、Deep Thinkと呼ばれる新しいモードを導入することで、2.5 Proをさらに向上させています。これはモデルのパフォーマンスを限界まで押し上げ、画期的な結果を提供します。Deep Thinkは、思考と推論に関する最先端の研究を活用しています。広く提供する前に、信頼できるテスターからフィードバックを得るためにGemini APIを通じて利用可能にする予定です。
Geminiはすでに最高のマルチモーダル基盤モデルですが、私たちは脳と同じように世界の側面をシミュレーションして新しい経験を計画し想像できる「世界モデル」と呼ばれるものになるよう拡張するために懸命に取り組んでいます。
最近、視覚障害のある人々がビデオを通じて人間の視覚通訳者とつながることで世界をナビゲートするのを助けるAeraという企業と提携しました。Astra技術を使用して、より多くの人々がこのタイプの支援にアクセスできるようにするプロトタイプを構築しました。
エンドツーエンドのAIベースの検索体験を望む人のために、まったく新しいAIモードを導入します。AIモードが本日からアメリカで全ユーザー向けに提供されることを共有できることを嬉しく思います。そして今週から、私たちの最もスマートなモデルシリーズであるGemini 2.5が検索に登場します。
AIモードでは、思いつく質問を何でも尋ねることができます。見ての通り、検索がすべての情報をまとめて回答を生成します。これには、他の方法では見つからなかったかもしれないコンテンツやクリエイターへのリンク、評価などの役立つ情報がある販売業者や企業へのリンクが含まれます。
まもなく、AIモードは過去の検索に基づくパーソナライズされた提案を使って、さらに役立つ回答を提供できるようになります。Gmailから始まる他のGoogleアプリに接続することもできます。これをパーソナルコンテキストと呼んでおり、AIモードがあなたを支援するためにあなたのコンテキストを使用するタイミングがわかります。
Deep Searchは、先ほど聞いた同じクエリ洗練技術を使用していますが、それを何倍にも増やします。あなたに代わって数十、数百もの検索を行い、わずか数分で完全に出典付きの専門家レベルのレポートを作成できます。ここでタスクが完了しました。情報に基づいた決定ができるように、役立つコンテキストを持つ優れたチケットオプションが得られます。
Project Astraのライブ機能をAIモードに統合することで、マルチモダリティの次の大きな一歩を踏み出しています。これをSearch Liveと呼んでいます。カメラを使って、検索はあなたが見ているものを見て、あなたが対話している間にリアルタイムで役立つ情報を提供できるようになりました。AIモードでは、Googleでのショッピングを支援する新しいレベルのインテリジェンスをもたらします。
夏用の新しいドレスをいくつか探しています。検索は素晴らしいオプションを提供してくれましたが、今、オンラインショッピングの典型的なジレンマに直面しています。これらのスタイルが自分にどう見えるのか全くわかりません。そこで、スタイルがあなたにどう見えるかのイメージがつかめるよう、仮想的に服を試着できる新機能を導入します。
ライブデモをお見せしましょう。この青いドレスが気に入りました。試着するためにこのボタンをクリックします。写真のアップロードを求められるので、ギャラリーに移動します。ここにはたくさんの写真があります。全身が見える明確な写真を選びます。これで始まります。
そのために、特に「あなた」向けに訓練された、カスタムの画像生成モデルを開発しました。そしてそれは機能します。私たちの新しいインテリジェント機能は、ショッピングの最高の部分とAIの最高の部分を、まさに検索内で組み合わせています。新しいビジュアルショッピングとスマートペイメント機能は今後数ヶ月で展開され、アメリカでは今日からLabsで仮想的な衣装の試着を始めることができます。
今日5つの新機能を発表します。まず、Gemini Liveについて話しましょう。会話の流暢さと自然さに人々は感銘を受けています。これは45以上の言語と150以上の国で機能し、Gemini Liveにはカメラとスクリーン共有も含まれるようになりました。どちらも素晴らしいです。
これらすべてが本日から、AndroidとiOSのGeminiアプリで無料で展開されます。今日から、Deep Searchでは独自のファイルをアップロードして検索エージェントをガイドできるようになります。これは最も要望の多かった機能の一つであり、まもなくGoogle DriveとGmailも検索できるようになります。ここでCanvasの出番です。
これはGeminiの共同創作のためのインタラクティブなスペースです。このレポートをワンタッチであらゆる種類の新しいものに変換できるようになります。ダイナミックなウェブページ、インフォグラフィック、役立つクイズ、あるいは45言語でパーソナライズされたポッドキャストまで。ChromeにGeminiを導入します。
これはウェブを閲覧するときにあなたを支援するAIアシスタントになり、あなたのコンピュータ上で利用できます。最も素晴らしいのは、自動的にあなたが閲覧しているページのコンテキストを理解できることです。質問があれば、回答が得られます。今日から、最高性能の画像生成モデルをGeminiアプリに統合します。
これはImagen 4と呼ばれ、大きな前進です。音楽フェスティバルのポスターを作りたいと想像してみましょう。ChromeのTレックス恐竜をヘッドライナーにしましょう。Imagen 4はテキストと綴りを正確に再現するだけでなく、フォントに恐竜の骨を使用したり、このような素晴らしいポスターに見えるようにフォントのスペース、サイズ、レイアウトを決定するなど、真の創造的な選択をします。
最先端の新モデルVO3を発表できることを嬉しく思います。本日から利用可能です。VO3にはネイティブオーディオ生成が含まれています。指示を与えるだけで、キャラクターが話せるようになります。品質が非常に良いので、まるでその人とボートに乗っているような感覚です。Gemini Liveの機能は無料で、AndroidとiOSで展開される予定です。
最近、プロ品質の高忠実度音楽とオーディオを生成できるLIA 2を発表しました。音楽は声、ソロ、コーラスを備えたメロディアスなものです。聴いてわかるように、表現力豊かで豊かな音楽を作り出します。LIA 2は今日から企業、YouTubeクリエイター、ミュージシャン向けに利用可能です。
2年前、私たちは生成されたメディアに不可視の透かしを埋め込むSaintidの先駆けとなりました。新しいSaintidディテクターは、画像、オーディオトラック、テキスト、ビデオにSaintid透かしが含まれているかどうかを識別できます。今日から最初のテスターへの展開を開始します。
映画製作者向けの新機能を開発しました。ビデオを作成するとき、キャラクター、シーン、スタイルなどの与えられた要素を使用し、一貫性を保ちます。または、カメラに具体的な指示を与えてVOを指示し、特定の経路に沿って撮影させることができます。
クリエイター向けにAIベースの新しいビデオ作成ツールを開発しました。VO、Imagen、Geminiの最高の機能を組み合わせたツールです。これをFloと呼び、今日発表します。私たちの主人公のおじいさんは、羽のある友人の助けを借りて飛行車を作ります。こちらが素材、老人と彼の車です。
ツールに自分の画像をアップロードしやすくしています。また、直接統合されているImagenを使用して、その場で生成することもできます。1つの指示で、非常に正確なカメラコントロールを含め、あなたが望むものを記述できます。Flowがすべてを設定します。キャラクターの一貫性、シーンの一貫性、すべてがうまく機能します。
しかし、新しい方法でAIアシスタントを発見できるような新しいフォームファクターはどうでしょうか?それがまさに私たちがAndroid XRを開発している理由です。XRにはワンサイズフィットオールがなく、一日を通して異なるデバイスを使用すると考えています。
SamsungとチームでAndroid XRを構築し、Qualcommと共にSnapdragon向けに最適化しました。こちらはSamsungのProject MO、最初のAndroid XRデバイスです。SamsungのProject Muhanは今年後半に購入可能になります。Android XRを搭載したグラスは軽量で一日中着用できるように設計されていますが、技術がたっぷり詰まっています。
カメラとマイクがGeminiに世界を見て聞く能力を与えます。スピーカーでAIを聞いたり、音楽を再生したり、通話したりできます。そして、オプションのディスプレイがプライベートに、必要なときだけ役立つ情報を表示します。
これらのグラスはスマートフォンと連携し、ハンズフリーでアプリにアクセスできます。みなさん、こんにちは。現在、私のAndroid XRグラスのレンズを通して見えているものと全く同じものが見えているはずです。例えば、ここにある私のおいしいコーヒーのように。そして、今届いたCharamからのメッセージです。
彼が何を言ったか見てみましょう。よし、ショータイムだ。Geminiを起動して始めましょう。Charamにメッセージを送って開始すること、そして通知をオフにすることをお願いします。了解、メッセージを送り、すべての通知をオフにしました。カップに書かれていたカフェの名前は何でしたか?おそらくBlombergingだったかもしれません。
見た限り、Castro Streetにあるにぎやかなカフェです。このカフェの写真を見せてもらえますか?雰囲気を知りたいです。もちろんです。これらはMapste Steadの写真ですか?これはリスクのあるデモですが、試してみましょう。私たちは母国語で会話します。
話してみてください、私はとても下手に話します。(複数の言語でのやり取り)Gentle Monster、etby、Parkerは、Android XRを搭載したグラスを作る最初のアイウェアパートナーになります。皆さんが自分でAndroid XRを試すのが待ち遠しく、今後数ヶ月でさらに多くの情報を共有する予定です。どうもありがとうございました。
この人工知能に関する分析に興味を持ち、この魅力的な分野の進歩についての理解を深めたいなら、人工知能に特化した私のx.comページをぜひご覧ください。そこでは、私たちの日常を変え、未来を形作る人工知能の最新イノベーションと具体的なアプリケーションに関する詳細な分析をご覧いただけます。


コメント