
11,709 文字

こんにちはコミュニティの皆さん、お帰りなさい。バイブコーディングについて話しましょう。そして、もしかするとバイブサイエンスへの飛躍もできるかもしれません。詳しく見ていきましょう。
まずはバイブコーディングから始めましょう。あなたはそれを経験したかもしれませんし、あるいは「それは一体何だ?」と思うかもしれません。単純にGPTについて深い調査をすると、16分後にシステムが戻ってきて「24のソースを詳細に調べましたが、それが何なのか見当がつきません」と言います。システムは2025年にAndrej Karpathyとのやり取りを生成し、彼はこう言ったとされています。「これは新しいタイプのコーディングであり、バイブスに完全に身を委ね、指数関数的な成長を受け入れ、コードが存在することさえ忘れるものだ」と。これはソフトウェアエンジニアにとって全く新しい興味深い見方です。
このビデオを開いて、バイブコーディングをどう活用できるか、またその限界は何かを見てみましょう。この深い調査の結果によると、AIを監督するには経験が必要とされています。なぜなら、今やAIは人間が全くコードを書かなくても、完全なコードを生成するからです。これは素晴らしいと思うかもしれませんが、彼らはまたバイブコードは技術的負債があり管理不能になる可能性があると述べています。そして、バイブコーディングはプログラミングを学ぶための代替手段としてではなく、新しい層として見るべきかもしれません。
教育者たちは、学生がコードを学ぶことを完全にスキップして、AIの結果だけに頼るかもしれないことを心配しています。あなたはこれが良いアイデアなのか疑問に思うかもしれません。
もっと深く見てみると、彼らは「二つの美しいアイデアが一緒になった」と言っています。そして今こそバイブコーディングにとって適切な時期です。なぜなら、プログラミングタスクの自動化という長期的なトレンドと、プログラミングを民主化したいという願望があるからです。誰もがプログラマーになれ、AIにコードを書かせ、アプリやホームページ、美しいソフトウェアを構築できるようになるのです。
これは素晴らしく聞こえます。ただ欲しいものを説明するだけで、AIがそれを構築します。これは直感的にとてもワクワクします。もう何かを構築する方法について考える必要はなく、ただマシンに行って「これが欲しい」と言えば、AIがコードを書き、アプリを生成し、ホームページを生成し、私のためにタスクを実行します。私はただ欲しいものを説明するだけでいいのです。これは私たちの社会に完璧に適合していませんか?
そして、これはOpenAIのような世界的企業の商業化にも完璧に適合します。なぜなら、彼らは新しい顧客基盤を見つけているからです。コードの書き方を知らないすべての人々に対して、「今やあなたはコーダーのすべての選択肢を持っています。コードを知っている人のようにできます」と伝えることができます。これは素晴らしいことではありませんか?これによって全く新しい市場が開かれるのです。
特定の理由で選んだ例を示しましょう。なぜそれを選んだのかすぐに理解できるでしょう。
ここでは、2025年3月末にForbesで発表された「バイブコーディングとは何か、なぜ気にすべきか」という美しい記事があります。彼らは、ある人が特定の化学プロセスに関する1週間分の実験データを持っていたと言います。その情報をAIに提供すると、AIはそのプロセスを説明する正確な数学方程式を見つけることができました。15回の反復後、つまりAIが何度もコードを書き直し、人間が数値シミュレーションと実際の実験データを比較した後、人間は「シミュレーションコードが私の実際の物理実験の複雑さをほぼ捉えた」と感じました。
この人間とAIのインタラクションが興味深い部分です。化学相互作用について考えてみてください。ニールス・ボーアは1885年に生まれ、1922年にノーベル賞を受賞し、ボーアモデルで原子構造の基礎的理解を確立しました。その後、物理学はポテンシャルエネルギー面を発展させ、化学反応の風景は反応座標に沿った動きとして見られるようになりました。電子構造、分子軌道が登場しました。
そして、遷移状態、活性化エネルギー、臨界高エネルギー状態、化学反応の反応速度を決定するアレニウスの法則があります。学校で習った様々な種類の化学結合について考えてみてください。共有結合、イオン結合、水素結合、非共有相互作用、π-π相互作用など。
この人は、AIによる数値シミュレーションを見て、自分の実験データと照らし合わせ、例えば「水素結合が抜けている」といったことを理解できました。そこでAIに戻って「水素結合を含めるのを忘れていますよ」とか「非共有相互作用があるようです。数値計算で非共有相互作用を確認して、これをシミュレーションに含めてください」と言うことができました。
この特定の例で必要な専門知識の量は、本当に大きな挑戦です。私はこれができるとは思いません。化学反応からの実験データを与えられても、それが何であるかも知らず、推測しなければならないのは難しいことです。これは非常に素晴らしいことだと思います。なぜなら、とても多くのことを学ぶことができるからです。
理論的観点からこれについて考えてみましょう。理論物理学者として、熱力学についてはどうでしょうか?欠けている量子力学的記述についてはどうでしょうか?いくつかのマクロスコピックなエネルギー項ではどうでしょうか?エントロピー、ギブスの自由エネルギー分析を統合するのはどうでしょうか?量子力学と統計力学による熱力学的な量からの異なる視点ではどうでしょうか?
AIが書いたコードを取得し、コードの結果から熱力学的補正係数や量子力学的イテレーション項がどれだけ含まれているかを理解できるなら、これは本当に多くを学ぶことができるシステムだと思います。したがって、このバイブコーディングの例は、学習するのに最適だと思います。なぜなら、人工知能とやり取りし、それを修正する必要があり、化学反応の完全な理論に深い理解を持ち、さまざまな要素の知識を持っているからです。
計算方法について考えてみてください。コンピュータサイエンスについて考えてみてください。分子動力学の数学的理解をどのようにコード化するか。最も単純なニュートンの運動方程式で進むこともできますが、電子相互作用のための量子力学的手法を使うと、完全に異なる分野に入ります。特に密度汎関数理論に踏み込むと。
一般的な疑問は、AIはフリーのインターネットリソースにアクセスしていますが、利用可能な計算モデルについてはバックグラウンドを何も知りません。AIはインターネット検索で何らかのGitHubリポジトリを見つけ、そこに化学反応などのシミュレーションがあり、理論についての理解なしにそのモデルを使用します。このコード実装に統合された物理モデルや化学的理解についての理論を全く理解していません。
一般的に言えば、インターネットからこのソフトウェアを入手したとしても、これらの計算モデルは単純でも正確でも安価でもありません。化学を大学で勉強する場合、専門的なソフトウェアパッケージがあり、それらは決して安くなく、ほとんどの場合インターネット上で自由に利用できるものではありません。
このように、バイブコーディングは、この特定の例で示されたように素晴らしいアイデアだと思います。なぜなら、物理学や数学や化学などを勉強している場合、1週間の実験データがあって「AIと一緒に数値計算シミュレーションモデルを見つけましょう」と言えば、理論について非常に多くのことを学ぶことができるからです。AIがインターネット上で見つけたフリーのコードシーケンスに基づいて、数値シミュレーションだけから理論的仮定が何であったか、熱力学に基づいていたのか、量子場理論や量子力学的側面に基づいていたのかを理解する必要があります。本当に急な学習曲線があります。
興味深いことに、このバイブコーディングは依然として人間の監視を必要とします。フィードバックの提供方法、特定のプロンプトデザイン、出力の検証において、AIが生成したコードを見て「量子力学的項を見逃していますよ、古典的な力学モデルで進めていましたね」などと言う必要があります。
文献によると、バイブコーディングは、人間がこのフィードバックにおいて積極的な要素、制御要素として機能し、AI生成コードの積極的な管理者として機能する場合に最も効果的であり、受動的な消費者としてではないということです。
私はあなたが「気にしない、AIに何かを生成してもらいたいだけだ、コーディングや内部の仕組みについて何も理解していない、AIにやらせて解決策を見つければいい」と言うかもしれないことは知っています。もちろん、これは一つの見方ですが、このバイブコーディングの新しいアイデアから最大限の利益を得たいなら、化学反応のAI数値シミュレーションのこの例は、私たちがどれだけ多くを学べるかを示す美しい例だと思います。これは私たちのためのインタラクティブな学習環境です。
このバイブコーディングには、迅速なプロトタイピングという別の美しい利点があります。これは素晴らしいことではありませんか?しかし、GPTの深い調査の結果に目を向けると、人間が何が起きているのか、コードの基礎となる理論が何であるのかを理解できないという切断の問題も潜在的にあります。
この場合、私たちは学習段階の問題だけでなく、AIシステムを提供する企業が法的問題に遭遇している可能性があります。そして彼らはこれに対して美しい解決策を見つけました。人間として理解できないことをする場合、誰に責任があるのでしょうか?世界的なAIプロバイダーが非常に小さな価格で提供するシステムやコードでしょうか、それとも責任を負う人間でしょうか?
これは製品になる可能性があり、特にヨーロッパでは特定の製品に対する消費者保護があります。そこで突然、法的な領域に入ります。世界的な再販業者によるこの議論を理解することは興味深いことです。彼らはバイブコーディングの核心は人間と機械の境界を再構成することだと言います。先ほどの例で示したように、正しい方法で使用すれば、これは本当です。これは究極の学習マシンであり、あなたに継続的に挑戦し、あなたは深い理解を持ち、何をしているのかを知る必要があります。
バイブコーディングは、あなた個人の超特定のツールを構築することを可能にします。量子重力のインターフェースで働く理論物理学者であれば、店やインターネット上で買えない非常に特定のツールが必要になります。これは素晴らしいことではありませんか?
そして今、世界的な企業はこの超特定のツールというアイデアを商業的、法的、知的財産権のセクターから、あなたが何をしているのかに責任を持つという美しい出口を見つけました。「一人のための(one-for-one)ソフトウェア」という用語が登場し、これは市場を乱さず、競争ルールの中にありません。特定の目的のために一人の人によって作られた一回限りの自動化であり、商業的に利用可能ではありません。このソフトウェアは「最小限の実行可能な視聴者(the smallest viable audience)」に対応するもので、それはあなた一人です。
バイブコーディングは、これは美しいマーケティングアイデアであり、法的な前提を確保します。バイブコーディングは計算をパーソナライズします。OpenAIや利益を最大化したい他の世界的な企業にとって、これは美しいアイデアではありませんか?AIがバイブコーディングを行いますが、世界的な企業としてあなたは責任を負わないと言えます。なぜなら、「これは一人のためのソフトウェアです。あなたは市場で行動しているのではなく、ただ一人のためだけです」と言えるからです。これは最小限の実行可能な視聴者であり、法的な観点から見れば、これは美しい解決策です。
バイブコーディングには複数の視点があります。時々、マルチエージェントコーディングなのか、バイブコーディングなのか、それ以上なのか以下なのか、と考えることがあります。バイブコーディングには主に2つの要素があります。コードLLMなどのAIがあり、例えばGemini 2.5 Proがあなたのコードアプリケーションを書き、それが地球上で最高のAIモデルかもしれません。そして10〜15回の反復、10〜15回のフィードバックループがあり、人間はコードを書かず、コードを見るわけではありませんが、コードの結果を解釈することができます。
例えば、特定の化学反応の数値シミュレーションを見て、「要素が欠けている」とか「スペクトルにスパイクがあり、これはまだ古典的なモデルで、量子力学的補正がない」といったことがわかります。このような知識を持つ必要があります。AIがコードの実行結果に誤りを犯したことを理解した人間は、より深い戦略的なアイデアで舵を取り、最終的に創造性を実装するという美しい任務を持っています。
これで円環を閉じることができます。なぜなら、これは5年前のAIのアイデアではなかったでしょうか?人間の創造性、これが人間がAIに貢献するものだと。そして今、私たちはここでマーケティングストーリーを見つけました。それは一貫していて、これは美しいことではありませんか?AIを支払えば何でもできるようになるという点で、AI企業はこの地球上のほぼ全人口に門戸を開きました。
さらに一歩進んで考えると、なぜ人間が考え、自分の脳を使うという問題を持つべきなのかと思うかもしれません。これはAIなのですから、人間を置き換えましょう。理論化学や理論物理学、数学的実装の専門家でない場合、AI専門家システムを購入し、「人間が修正要素である必要があることは理解していますが、別のAIシステムを使うのはどうでしょうか」と言うことができます。
これでマルチエージェントシステムができ、より高額なこの新しいAIシステムはより良い理解を持ち、より多くの自由にトレーニング可能なパラメータを持ち、人間が提供すべき戦略的入力を提供します。そして今度は、このAIが人間と機械のやり取りで人間が学ぶべきことを学び、マルチAIエージェント環境で創造的な解決策を生み出す部分を担当します。これは美しいことです。
GitHub、Copilot、クエラ、B new、何でもありますが、考えてみてください。私たちが持っているのはコードベースだけであり、時にはコメントや短い説明がコード内に隠れていますが、GitHubには何百万ものリポジトリがあり、すべてが利用可能で、他のすべてのコード要素がこれでトレーニングされています。AIが他のAI生成コードシステムから生み出すAIがあります。これは美しいことではありませんか?
しかし、より深い戦略的理解を持ちたい場合、何が欠けているのでしょうか?基本的なレポートが欠けています。コードとは何かについてのより深い理解が欠けています。コードは数学なので、私たちが量子化して数学で表現し、Pythonや C++などでコード化しようとする化学プロセスの数学的記述は何なのでしょうか?
そこで、GitHubのCopilotやCoreなどはシステムの一部に過ぎず、システムの他の部分は何かという興味深い動きがあります。ここに天才的な瞬間があります。2025年3月末、私たちは車のデザインのためのマルチAIエージェントフレームワークを持っています。彼らはマサチューセッツ工科大学(MIT)出身であることを強調し、車に関することなので、もちろんドイツのミュンヘン工科大学やBMWなども含まれています。
彼らは、アイデアをスケッチするためのソフトウェア、C生成のためのソフトウェア、車のデザインのシミュレーションとモデリングのためのソフトウェア、モーフィングと最適化のためのソフトウェア、風洞試験、風洞をシミュレートする数学モデル、そして特定の車を製造するための完全に自動化された製造プロセスを持っています。
これらすべてを非常に専門的なエージェントとして考えると、エージェントから次のエージェントへの入力だけが必要であり、このソフトウェアはすでに持っています。欠けているのは、この知性レベルだけです。そして今、マルチエージェントAIでMITの助けを借りて、DeepSeek、Claude、GPTでこれを実行できるか、私たちの幾何学的深層学習モデルを適用できるか、CATエージェント、スタイリングエージェント、風洞のコンピュータシミュレーションのためのグラフニューラルネットワークを持つことができるかを探求しています。
自動車産業はコンピュータプログラムを持っており、それらは高度に独自のソフトウェアです。今、彼らは人間のコーディングなしでバイブコーディングに到達するために、専門的なAIエージェントのチェーンを構築しようとしています。マシンが自分自身と対話するのです。これは美しいことではありませんか?バイブコーディングは可能かという質問をする必要はありません。彼らは積極的に完全な仮想統合を研究しています。
私が達成したいと思っている中心的なアイデアは、バイブサイエンスのモダリティですが、バイブサイエンスについて話す前に、私たちがすでに持っているものを見てみましょう。
約1年前、スタンフォード大学とMITの科学エージェントについてのビデオを作り、グラフ推論能力を比較しました。6ヶ月前には、医学、材料科学、バイオテクノロジー、製薬のためのAIによるタンパク質設計について取り上げ、タンパク質のための分子言語モデル、融合モデルを見ました。産業界向けの特定のタンパク質を設計するためのAIの可能性を検討しました。
数日前、私はGoogle、スタンフォード、ハーバードの共同研究者である「co-scientist」について発表しました。また、2025年初頭にはAMDとジョンズ・ホプキンス大学から、研究助手としてのLLMエージェントに関する論文もあります。このトピックは少なくとも過去2年間存在しており、私たちが欠けているものがあります。
今日の論文、これです。ワシントン大学のAllen人工知能研究所からのPeter Jensen氏によるものです。「コード科学者:コードベースの実験による端から端までの半自動科学的発見」という美しい論文です。これは新しいトピックであり、ソフトウェアアーティファクトの「自律的科学的発見(ASD)」と呼ばれています。
仮想モデルを構築できるもの、数値シミュレーションがあるもの、風洞をシミュレートできるもの、化学反応をシミュレートできるもの、美的デザインをシミュレートできるものなど、これらからAIシステムを構築し、複数のエージェントが相互作用すると、これは興味深いことではありませんか?
私は「あなたはそれを見ますか?」と尋ねました。もう一つのヒントを与えましょう。エージェント研究所を見ると、すべての実験構成、データ、Pythonファイル、実験を実行するためのPythonコード、研究室で役立つ研究助手となるためのコードを含む完全なGitHubがあります。
コードはここにありますが、AIの次の世代に欠けているのは、まさに理論的理解、コードの生成に入る言語学的プロセスです。なぜ私たちはソースを特定の方法でPythonにエンコードしたのでしょうか?コードベース自体を見るだけでは、これを推測することはできません。モデル、ソース、これらのモデルの作成の背後にある理解が必要です。
現在、「純粋なコードのカーソル実装に満足していない」と言うと、AIモデルの次の世代は両方を組み合わせるでしょう。完全な理論、完全なモデル、完全な開発履歴、研究助手のための完全なニーズをすべての考えと組み合わせます。これを完璧な方法で組み合わせると、このAIは本当にPythonエージェントのコードが特定の方法で見える理由と、その限界を理解できるようになります。なぜなら、限界はコードの中ではなく、理論の発展、数学的公式の中にあるからです。そして、数学はコードです。
次のAIシステムをこの組み合わせでトレーニングし、これはすでにAllenの論文で起こっていることです。これは美しい論文だと思います。ASD、この自動科学的発見を見てみましょう。あなたは「彼らは科学を私たちの人間の思考から奪い取っている」と言うかもしれませんが、これは考え、実行するのに美しいことです。はい、今やあらゆるセクターでAIが使われています。
完全なプロセスフローを見てみましょう。彼らが構築したものです。人間がいて、その人間が何らかの関心のある論文、科学論文を提供します。素晴らしいことではありませんか?そして人間は「そこに行きましょう」と言います。「この論文があります。ああ、GitHubリポジトリもあります。コードを提供します。GitHubリポジトリをコピーし、コードを提供し、コードブロックと一緒にここで理論と言語的理解を提供します」と。これは人間によって行われます。
そして、これをAIシステムに供給し、ミューテーターとしてLLMがあります。入力は論文とコードであり、出力は新しいアイデアであるべきです。これを「アイデア創出フェーズ」と呼びます。スタッフに「創造的になって、新しいアイデアを思いつく」と頼むように、AIは今まさにこれを行うよう任されています。
AIは200や2,000のアイデアを生成し、この特定の出版物では再び人間がいて、最も有望なアイデアのサブセットを選択します。彼らはAI生成のアイデアをすべて読み、「これは可能性があり、これは絶対にナンセンスだ」と言います。人間は最も有望なアイデアを選択し、各アイデアにコメントを提供します。
これをAIシステムに戻し、別のエージェント、計画エージェントがあるかもしれません。この目的のためにOmni Miniを使用します。選択された有望なアイデアと人間による追加コメント、20の論文からのコードから、計画段階が必要です。コードでこれを実際に行う方法のいくつかの計画を作成する戦略を作るべきです。
もちろん最良のものだけを選択し、実験を行います。コードを作成し、コードを実行し、コードからの結果を得ます。必要なすべてのコードブロックのライブラリがあり、コード生成があり、結果があります。これはAIによって生成されます。AIがデバッグするかもしれませんし、より良いシステムに支払えば何でもできます。特定の項目を実行した後、報告書を作成します。AIが結果の要約を書き、書面による報告があります。
そして、別のAIエージェントが実験間の分析を行い、すべての異なる報告書を見て、何が起こったのか、なぜこれが成功したのか、なぜこれが成功しなかったのか、なぜこれが結論を出せない結果を提供したのかを分析します。そしてあなたは最初からやり直すか、「これで十分だ」と言うことができます。
このプロセスの終わりに、コードと結果を検証し、コードを調べ、コードの背後にある完全な理論、すべての数学的抽象、実験の計算方法、どの公式を使用するかなど、すべてを完全に理解する別の人間がいます。たとえば、ここで化学反応実験があるとすれば、量子補正項をどれだけ使用するか、どれだけ古典的なシステムに頼るか、ニールス・ボーアモデルから知られているさまざまな化学結合構造をどれだけ統合するかなど、やるべきことはたくさんあります。彼らはここに人間の相互作用を持っていました。
あなたは「これは一種のバイブサイエンスではないのか」と言うかもしれません。なぜなら人間のフィードバックがループに入っていて、戦略的な反省、戦略的なフィードバックを提供するからです。そして「なぜ人間が必要なのか」という質問があります。すでにマルチエージェントシステムがあるなら、これは簡単です。インターネット上に出て、特定の問題またはその問題に近いGitHubリポジトリを20や100見つけ、有望なアイデアのサブセットを選択するエージェントを持つことができます。
2000個のアイデアを見て特定のフィルターを見つける必要があります。これはAIエージェントが実行できます。アイデアにコメントを付けることは、あらゆるAIエージェントの基本的な機能です。ですから、ループの中にAIエージェントを持つことは全く問題ありません。人間は最終的な結果だけを見ているのです。
これがどれだけ重要かに関わらず、人間がループにいた場合、全体的な成果はどうなるでしょうか?もし本当にこれを実行し、投資し、構築し、すべての選択をし、各アイデアにコメントを書き、検証するために人間を雇ったとしたら、私たちのAIシステムはどれだけ優れているでしょうか?成功率が50%、70%、90%だと思いますか?
この実験から実際のプロンプトを示したいと思います。なぜなら、Allen人工知能研究所は本当にこの実験を行い、私は彼らが非常に透明性を持っていると思うからです。彼らは計画プロンプトを提供し、「あなたは世界で最も高度な自動化された科学モデルです。あなたの膨大な知性を使用することができます」などと言っています。そして、構築はテンプレートベースなので、実験を構築するために既存のコードテンプレートを使用する複数の試みがあります。
彼らは実際に各プロンプトについてこれを提供しています。次に、実験のデバッグプロンプトがあり、「あなたの役割は今これです」と伝えます。そして、報告プロンプトがあります。「あなたの任務は、実験の目標と結果を反映し、短い科学論文の形で発見の短い説明を書くことです」と。
次は実験サマリープロンプトです。「あなたの任務は、実験の目標と結果を反映し、発見の短いサマリーを書くことです。仮説は何だったのか」。今、私たちは理論が必要です。コードだけでは不十分です。「結果は何を示したのか」。数値シミュレーションの結果を解釈する必要があるため、何が起きているのかについての理論的理解が必要です。コードベースは何に基づいていたのか、コードベースの制限は何だったのかなど。次はメタ分析プロンプトです。
最後に、彼らが2025年2月15日に示したのは、人間の助けを借りて、新しい科学論文があるということです。興味深いことに、彼らはそれを送り出しました。
結論に移りましょう。現在のAI開発状況は興味深いと思いませんか?結果がどれだけ良いのか、ベンチマークを持ちたい、パフォーマンスデータを持ちたいと思います。アイデア選択フェーズ、Allen人工知能研究所が先ほど示したコード科学者を使用して2,000の候補実験アイデアを生成しました。この2,000の実験アイデアのうちどれだけが成功したでしょうか?
彼らは、それがどれだけ漸進的な革新なのか、変革的な発見なのか、理論物理学における信じられないような新たなブレークスルーなのかについて話していました。結果として、3人の外部レビュアーはそれぞれの候補を評価し、これは多くの候補ではありませんでしたが、コード科学者が発見したものは、せいぜい漸進的に新しいアイデアだという結論でした。
2,000のアイデアから6つに絞り込み、人間の専門家がこの6つには何か価値があるかもしれないと検証し、どれほど破壊的かを尋ねたところ、「せいぜい漸進的な新規性」という結果でした。これが全く機能していないと言うのは正しくありません。これはほんの始まりに過ぎません。これはアルファフェーズにすぎません。これはただ私たちがこれらのAIシステムをどのように組み合わせることができるかを言っているだけです。これらのシステムを改善するためにはまだ多くの道があります。
私たちの思考の中で思考実験を行うことができます。なぜここで止まるのでしょうか?なぜ実験の理論的理解とその実験のコード実装だけに止まるのでしょうか?次のステップは何でしょうか?次のビデオのための展望は何でしょうか?それは単純です。バイブサイエンスで知っていることや、何と呼びたいにしても、次のステップは抽象化を進め、「バイブAI」を行うことです。しかし、これは次のビデオのトピックになるでしょう。楽しんでいただければ、あるいは新しいアイデアが見つかれば幸いです。もし登録していただければ、次のビデオでお会いしましょう。


コメント