
5,992 文字

この事務所シミュレーションはGoogleの主任エンジニアがGemini 2.5 Proを使って構築したものです。見てください。机がたくさんあり、小さな会議スペースがあります。これらすべてが小さなシムズのような人形でシミュレートされています。あそこにピンポン台があり、そちらにはランチやコーヒーエリアがあります。
Janet Dogenは「オフィスはかなり手狭ですが、最初はもっとディストピア的でした」と言っています。これが彼女が見ているものです。彼女の最初のプロンプトからこの結果が得られ、その後「Googleらしく」と要求しました。より多くの色、モダンな外観、遊び心のある要素、卓球台などを追加しました。いくつかのアクティブなプロジェクト、生産性の割合、従業員数があり、会議を開始したりプロジェクトを追加したりできます。これは単なる労働者シミュレーションです。
彼女は図書館とオープンエアの会議スペースがある数台のソファを追加しました。彼女はこれをボードゲームテーブルと呼んでいます。また、彼女は「マイクロキッチンは地獄だ」と言っており、人々が食事を待つのにとても長い時間がかかりそうですが、とても素晴らしいシミュレーションです。
これをご覧ください。これはGoogle AI Studioの手書き図面で、写真を撮ってGemini 2.5 Proにアップロードするだけです。この人は手書きの図面と単一のプロンプトだけでAI Studioを再現することに成功しました。
Google AI Studioといえば、Gemini 2.5 Pro、地球上で最高のモデルが誰でも完全に無料で利用できます。ここにそのお知らせがあります:「Gemini 2.5 Proが離陸しました。チームは全力疾走中、TPUはフル稼働中です。私たちは最も知的なモデルをより多くの人々の手に渡すことを急いでいます。Gemini 2.5 Pro experimentalをすべてのGeminiユーザーに提供することを決定しました」
つまり、AI Studioだけでなく、Geminiアプリ自体でも利用可能になり、私はこのモデルを使うために数日前に初めてダウンロードしました。ちなみにGoogleのGeminiとCanvasは誰でも無料で利用できます。これは2日前のことです:「モバイルでもGemini 2.5 Proをすべての人に提供するために懸命に取り組んでいます」そして既に利用可能になっています。
ただし利用制限があります。どうやらこれらのモデルプロバイダーはすべて需要に追いつけていないようです。最高品質のモデルであるだけでなく、私が今まで使った中で最高のコーディングモデルであり、ここに書かれているように100万トークンのコンテキストウィンドウを持っています。これは私が見た他のどのモデルよりも多いです。
「なぜ100万トークンが必要なの?」と思うかもしれませんが、私が使った用途の一つをお見せします。ここで私は文字通り自分のYouTubeビデオをコピーペーストしました。実際、最近のアップデートではYouTube URLを貼り付けるだけで自動的にアップロードされるようになりました。私のビデオは約30万トークンを使用したので、利用可能な全コンテキストウィンドウの3分の1以下です。私は「このビデオのYouTubeタイムスタンプチャプターを作成して」と依頼しました。
最初の結果はひどかったのですが、間違ったモデル(Gemini 2.0 Flash)を選択していたことに気付きました。Gemini 2.5 Pro experimentalを使ったところ、多くの思考プロセスを経て、ほぼ完璧なタイムスタンプが提供されました。覚えておいてほしいのは、ビデオのトランスクリプトだけを見ているのではなく、実際にビデオをフレームごとに見ているため、これらのチャプターマーキングをとても正確に行うことができたということです。
それだけではありません。Gemini 2.5 Proは非常に高いIQを持っているようです。Mark Kretchmanによると、Gemini 2.5 ProはMensa Norwayで130のIQスコアを獲得しています。実際に様々なモデルとMensaテストの結果を見ることができます。驚くべきことにGrokは2桁で、もっと高いと思っていました。GPT-4.5は100をわずかに超え、そこから「思考」モデルが始まります。ここにO1、O3 mini high、O3 mini、O1 proがあり、最上位にIQ 130でGemini 2.5 Pro experimentalがあります。私にとっては納得できます。確かに私が今まで試した中で最高のモデルです。
Gemini 2.5 Proで人々が構築しているその他の例をいくつか紹介します。これはKlein(VS Code拡張機能で遺伝的AIコーディング支援を可能にする)によるものです。本当にクールな製品なので、ぜひチェックしてください。Claude 3.7 Sonnetを使ってBlender MCPでクライアントロゴを作成しようとしましたが、発売時には共有する価値がありませんでした。Gemini 2.5 Proは最初の試みで成功しました。印象的です。
これはMCP、つまりBlenderに直接接続するツールであることを覚えておいてください。文字通り平易な英語で探しているものを入力するだけで、それが完成します。完璧です。これはクライアントロゴがどのように見えるかを正確に示しており、Blenderに簡単に統合できます。
Ilianneは、Gemini 2.5 Proで本当にクールなものを構築しました。1日1ドルで、毎日ブリーフィングを提供する個人インテリジェンスエージェンシーです。24時間体制で何百ものニュースソースをスクレイピングし、すべての重労働(読解、要約、分析)にGemini 2.0 Flashを使用しますが、最終的なブリーフィングを書くために、より重要なGemini 2.5 Proを使用します。
これは実際に良いポイントで、すべてのことに最高のフロンティアモデルが必要というわけではありません。無料で高速である場合(Gemini 2.5 Proはその両方です)、ぜひ使用してください。しかしAPIでは無料ではなく、支払いが必要になるため、どのモデルでもできることの多くにはGemini 2.0 Flashを使用し、重労働はGemini 2.5 Proや他のフロンティアモデルに任せることができます。
これが実際に何であるかを示します。彼が言ったように何百ものニュースサイトをスクレイピングし、すべての主要なトピックについて概要を書き上げます。そしてオープンソースなので、自分でセットアップしたい場合はすべてのコードを提供しています。
これをチェックしてください。信じられない!Google DeepMindのGemini 2.5 Proがワンショットで「Papers Liquid Metal Shader」を作成しました。とても美しい液体金属のAppleロゴがあり、さまざまな設定を変更できます。背景色、屈折量、エッジパターンのぼかし、液体量、速度、パターンスケールなどがあり、絶対に豪華です。
自分で試したい場合は「liquid-tal.vercel.app」で簡単です。エッジを調整できます。これがエッジ量で、パターンのぼかしです。ぼかしを少なくしてみましょう。それは少し変に見えるので、少しぼかしを追加します。液体量を調整することもでき、任意の画像をアップロードすることもできます。
私たちは皆、Levelsがある程度人気にしたおかげでフライトシミュレーターを見たことがありますが、こちらはCedricによる投稿です:「15回以上の迅速かつ段階的な反復を経て、1つのGemini Advanced chatセッションでVibe Codingを使用してVibeJetを構築しました。Gemini 2.5 Proは凄まじいです」。
見てみましょう。戦闘機の物理演算は良好で、雲もかなり良く見えます。巨大なロボットがあり、左上に速度表示、プレイヤー数1、高度、素敵な小さな飛行船があります。15回の反復でこれができるのは本当に素晴らしいです。ブーストして速く移動するときにジェット機が小さくなるのは素敵な演出です。地面に小さな家、いくつかの木、建物が見えますが、建物の詳細はあまりありません。山はそれほど素晴らしく見えませんが、全体的には良好だと思います。実際の飛行機のモデルは本当に良く見えます。
コードは完全にオープンソースなので確認できます。これはVibeJetと呼ばれ、コードを提供するだけでなく、Gemini 2.5でどのように反復して組み立てたかについても詳しく解説しています。Vibe Codingを学びたい場合は、私のビデオをいくつか見るだけでなく、これもチェックしてください。説明欄にリンクを載せておきます。
これはFlavio Adamoによる投稿で、非常に人気のある回転する六角形と内部に浮かぶボールの比較です。左にGemini 2.5 Pro、右にGPT-O1 Proが表示されています。どちらも見栄えが良いと思います。GPT-O1 Proはボールの弾むような動きがより大きく、何かに当たったときに素敵な効果があります。しかしリアリズムの観点ではGemini 2.5 Proが勝者だと思いますが、どちらも良いです。ただ異なるだけです。
こちらはRender Fictionによるワンショットの物理シミュレーションです。プロンプトは「ソレノイドのような単純な例を使用して電気と磁気を実証してください。帯電した銅コイルと関連する磁場を描写するためにアニメーション化された3jsシーンを作成してください。three.js、GLSL、スプライト、ブルームなどを使用してください…HTMLファイルとして」。
これがGemini 2.5 Proによるコードと実際の出力です。コイルが見え、磁力(それが何であるかと思います)が通過しているのが見えます。そうですね、「動くテクスチャでシミュレートされた電流が銅コイルを流れ、磁場(青い粒子)を生成しています。マウス/タッチを使用して軌道を描いたり、ズームしたり、平行移動したりできます」。非常に素晴らしいです。
同じ人による別の例です。「Einsteinの一般相対性理論を3jsを使って実証してください。高密度グリッドのワイヤーフレームメッシュを作成し、メッシュの中央に大きな発光する黄色い球体を配置してください。青い球体を軌道上でアニメーション化し、球体の位置に応じてメッシュを変形させてください」。
そして結果がこれです。平面サイズ、平面セグメント、軌道半径、軌道速度、重力強度、中央重力強度、軌道重力減衰などがあります。これはかなり良く見えると思います。素晴らしいですね。
これがどれほど素晴らしいかご覧ください。この人は紙に描いた絵から画像、3Dモデルを作成し、実際に3Dプリントしました。見てください。誕生日ケーキのキャラクターで足がついたようなものを描き、Geminiがそれから画像を作成しました。とてもシンプルな画像です。次に3Dマッピングを作成し、それを使って3Dプリントを行いました。文字通り自分が描きたいものを描くだけで、その粗いスケッチの物理的な具現化としてのキャラクターを現実世界に作ることができます。本当にクールです。
これが元の絵で、「この3段ケーキのおもちゃの3Dレンダリングを作成してください。かわいく作り、白い背景に配置してください」というプロンプトでした。これが最初の出力です。次に「この3段ケーキのおもちゃのOpenSCADコードを作成してください。かわいくして、シンプルにしてください。モデルは3Dプリントする必要があるので、パーツが接続されていることを確認してください」というプロンプトでした。
これが思考プロセスで、これが結果です。正直言って驚きです。3Dプリンターを手に入れて、何か描いてそれをプリントしたくなります。これが小さな3Dケーキのおもちゃです。何と呼べばいいのか分かりませんが、とても素敵に見えます。ちなみにこの人、Fay Ja(名前を正しく発音していればいいのですが)はGoogle DeepMindのスタッフリサーチサイエンティストです。
次はBeyangです。これはGemini 2.5 ProとSonnet 3.7を使って作った3Dフラッピーバードゲームの進化です。コードを1行も書いておらず、ゲームやグラフィックスの経験はゼロです。通常のVS Codeと統合されたツールを使って1時間でVibe Codingしました。
これが最初の試み、2回目の試み(これは3Dフラッピーバードであることを忘れないでください)、3回目の試みです。今では速度が出てきて、音も出せるようになり、そして最終バージョンがこれです。かなり良いですね。
iOSアプリも作成できます。「PencilKitフレームワークを使用して、完全に機能するSwiftUI描画アプリを作成してください」というプロンプトで、すべてのコードが出力されました。これはワンショットまたはゼロショットです。こちらがコードで、こちらがアプリです。実際にiPadの誰もが持っていると思われるArtアプリとほぼ同じに見えます。驚くほど優れています。これはGemini 2.5 Proでワンショットで作成された美しいアプリです。
次はギャラガです。AIエージェントを構築し、ギャラガを作成するよう依頼したところ、数秒で完全にプレイ可能なアーケードシューティングゲームを生成しました。仕組みとしては、Pygameを使用してゲームを作成し、保存して即座に実行します。Composioのファイルとシェルツールによってパワーアップされ、Gemini 2.5 Proで構築されています。ちなみにこれはオープンソースなので、確認したければできます。
こちらがゲームです。シンプルなゲームですが、それでも非常に楽しく、一度に作成されました。私たちはVibe Codingの時代にいるのです。
というわけで、Gemini 2.5 Proは私の心を驚かせ続けています。私は毎日これを使って何かを構築しています。あなたが何を構築しているか、コメントを残してください。もしこのビデオを楽しんでいただけたなら、いいねと登録を検討してください。


コメント