Googleの新しいAIが指示なしで不可能な問題を解決する

4,581 文字

Google’s New AI Solves Impossible Problems WITHOUT Instructions

Google DeepMind has developed a groundbreaking AI that can solve complex real-world problems like delivery planning and ...

さて、ここで驚くべきことをお話しします。実のところ、ほとんどのAIは現実の意思決定において非常に苦手だということが分かりました。私が言っているのは、実際に重要なことです。ルートの計画、締切の遵守、燃料を無駄にすることなく配送を時間通りに行うことなどです。AIが世界を変えているとよく聞きますよね。しかし、50人のドライバーのスケジュールを組んだり、都市全体の配送ルートを計画するよう求めると、安物のGPSのように故障してしまいます。
それが今回変わりました。なぜなら、DeepMindがやってのけたことは、AIの最大の盲点の一つを実際に修正する可能性があるからです。そして、もしこれが規模を拡大して機能するなら、あなたの食料品が自宅に届く方法、医師が手術をスケジュールする方法、さらには都市が交通渋滞を回避する方法を変える可能性があります。これはAIに実際の生活の知恵を与えるようなものです。そして、これは大きな出来事なのです。
では、このことについて話していきましょう。さて、こういうことです。配送ルートの計画、作業員のスケジューリング、あるいは店舗に供給品を届ける最適な方法を見つけることは、非常に困難です。これらは技術者が組み合わせ問題と呼ぶもので、つまり膨大な数の選択肢があり、ルールを破ることなく最良のものを選ぶ必要があるということです。
例えば、配送トラックが容量不足にならないようにしたり、時間枠を逃さないようにすることです。例を挙げると、配送ドライバーが市内の50軒の家を回る必要があり、それぞれに荷物が必要な特定の時間があり、トラックは一定量しか運べないとします。完璧なルートを見つけることは、10億のピースがあるパズルを高速で解くようなものです。頑張ってくださいという感じですね。
技術の世界では、これらの問題をNP困難と呼んでいます。これは基本的に非常に複雑で、最速のコンピュータでさえ完璧な答えを見つけるのに永遠に時間がかかるということを意味します。さて、あなたは「おい、我々にはAIがあるじゃないか。これを解決できないのか」と思うかもしれません。
まあ、ここで話が複雑になります。AI、特にニューラルネットワークは、写真の顔認識や過去の履歴に基づいて好みそうな映画を予測するなど、パターンを見つけるのが得意です。彼らは画像、音声、テキストなどの滑らかで連続的なデータで最も良く機能します。
しかし、厳しいタイミングと容量のルールがあるトラックルートの計画のような、厳格でオール・オア・ナッシングの決定となると、彼らは不足します。これらの種類のタスクには明確な論理と制約処理が必要で、ニューラルネットワークはそのために構築されていないのです。
一方で、これらの決定を処理できる従来の方法、高度な数学的ソルバーのようなものは、信じられないほど遅く、完璧な情報を要求します。これは、リアルタイムで大量の荷物を動かそうとしているときには現実的ではありません。
そこで、これらの研究者たちは、AIをこれらの困難な物流パズルでより優れたものにする方法が必要だと考えました。そして彼らは何か素晴らしいものを考え出しました。AIに人間の計画者のように考えることを教える方法ですが、はるかに高速です。
彼らはMCMC層と呼ばれるトリックを作成しました。この名前に怖がらないでください。これは単に、AIに異なる選択肢を探索し、最良のものを選ぶツールを与えたということです。交通を避けるためにGoogleマップで異なるルートを試すような感じです。
ちなみに、MCMCはマルコフ連鎖モンテカルロの略ですが、スマートエクスプローラーと呼びましょう。これは完璧な地図を必要としないGPSのようなものです。2つのストップを入れ替えたり、トラックを迂回させるなど、近くの選択肢をチェックし、いくつかの賢いルールに基づいて良い動きかどうかを決定します。
ここで、私たち全員が理解できる方法で、これがどのように機能するかを説明します。あなたが配送ルートを計画していて、まともな計画があるが完璧ではないと想像してください。スマートエクスプローラーは、1つのストップを早く移動したり、2つの家を入れ替えるなどの小さな調整を見て、時間やガソリンを節約するかどうかをチェックします。
これは焼きなまし法と呼ばれるものにインスピレーションを得た方法を使用します。これは熱い金属片をゆっくりと冷却してより強くするようなものです。この場合、時間の経過とともに最良の選択に焦点を当てるために、AIの選択を冷却しています。
研究者たちはこれをニューラルネットワークにぴったり収まる層に変換したので、AIはその間違いから学び、高速で柔軟性を保ちながらルート選択がより上手になることができます。本当にクールなのは、これが機能するために完璧な解決策を必要としないことです。
昔ながらの方法は正確なソルバーと呼ばれるものに依存していました。これは、すべての単一のピースをチェックすることによって、その10億ピースのパズルを解こうとするようなものです。それは永遠に時間がかかります、特に大きな問題では。
この新しいアプローチは局所探索ヒューリスティックと呼ばれるものを使用します。これらを完璧さに執着することなく、優れた解決策に近づけてくれる迅速で賢い推測と考えてください。研究者たちは、これらの推測が微分可能であることを確認しました。これは単に、パーティーの計画時に試行錯誤から学ぶように、AIがそれらから学ぶことができることを意味します。
彼らはまた、フェレンシャル・ヤング損失と呼ばれるものを使用しました。わかりました、もう一つの技術用語ですが、ついてきてください。これは、AIの計画が可能な限り最良の計画にどれだけ近いかをAIに伝えるスコアカードのようなものです。
AIが1つの迅速な推測しか試さなくても、このスコアカードは学習プロセスを軌道に乗せ続けます。これは、より高速なトレーニングとより少ない計算能力を意味するため、大きなことです。彼らは、グラウンドトゥルースと呼ばれる既知の良い計画から始めるか、ヒューリスティックを使用してわずかに改善されたものから始めるなど、AIの推測を開始するさまざまな方法をテストしました。これは、ルートの下書きでAIにヘッドスタートを与えるようなものです。
さて、ジューシーな部分、結果に入りましょう。彼らはこれを、Euro meets NeurIPS 2022という大きな技術競技会からの時間窓を持つ動的車両ルーティング問題またはDVRPTWと呼ばれる非常に困難な問題でテストしました。
一日中配送リクエストがポップアップし続ける都市を想像してください。そして、各ストップに時間通りに到着し、トラックを過積載しないことを確認しながら、トラックにルートを割り当てる必要があります。これは、新しい挑戦が続々と来て、決定するのに数秒しかないリアルタイム戦略ゲームをプレイするようなものです。
研究者たちは、各トラックのルートが波で計画され、新しいリクエストが追加され、古いものが進行中にクリアされる設定を使用しました。これらのMCMC層によって動かされた彼らのAIはロックスターでした。
彼らが決定するのにわずか1ミリ秒、まばたきの瞬間を与えたとき、それは将来のすべてのリクエストを知っている完璧な計画、予測ベースラインと呼ばれるものよりも7.8%、8%だけ悪いルートを考え出しました。
摂動と呼ばれるもの、基本的に物事を揺さぶるためにランダムノイズを追加することを使用した古い方法と比較すると、それは驚くべき65.2%悪いものでした。これは、1時間で荷物を受け取ることと来週受け取ることの違いのようなものです。
1,000ミリ秒のようにより多くの時間を与えても、彼らの方法は5.9%を達成し、古いアプローチの5.5%と比較して、最良のものと首の差でしたが、実世界での使用にははるかに実用的でした。
彼らはまた、競技会のベースラインからの完璧なルートや、わずかに調整されたバージョンなど、良い計画でAIを開始することが、さらに良いパフォーマンスをもたらすことを発見しました。例えば、100ミリ秒で、調整されたスタートは5.9%の相対コストに到達しました。理想に非常に近いです。
彼らは温度と呼ばれる設定で遊びました。これは、機能していることに固執することに対して、新しいアイデアをどれだけ探索するかをAIに伝えるようなものです。良い計画から始めるときは温度100が最適でしたが、ゼロから始めるときは低い温度が役立ちました。
これが単なる偶然ではないことを確認するために、彼らはアイテムの最良の組み合わせを選ぶなど、より簡単な問題でテストしました。彼らは、スマートエクスプローラーが数回の試行でも完璧な答えに非常に近づくことを発見しました。複数のエクスプローラーを一度に実行することは、計画者のチームが一緒に働くようなもので、精度を失うことなく物事をスピードアップしました。
彼らはまた、彼らの方法が数学的に堅固であることを証明し、収束保証などの用語を使用して、非常に複雑な問題でも、時間の経過とともに最良の解決策を確実に学習することを示しました。
車両ルーティングテストでは、彼らは2つのストップの交換、配送を別の場所に移動、またはルートの一部を反転するなどの特定の調整を使用し、トラックの過積載や時間窓の見逃しなどのルールに従うことを確認しました。
彼らは、波あたり最大100のリクエストで、トレーニング用に30の問題セット、テスト用に25を使用して、単一のCPUでこれらのテストを実行しました。結果は、単に運が良かっただけではないことを確認するために、50回の実行で平均化されました。そして彼らは、データを処理するために、超組織化されたスプレッドシートのようなグラフニューラルネットワークを使用しました。
では、なぜあなたが気にするべきなのでしょうか。この技術は配送をより高速で安価にする可能性があり、これはあなたにとってより低い価格と企業にとってより少ないストレスを意味します。あなたの食べ物が温かく到着し、荷物が時間通りに届き、さらには病院がより効率的に手術をスケジュールすることを想像してください。
これはトラックだけの話ではありません。イベントの組織化や交通管理など、スマートな計画が必要なものすべてに役立つ可能性があります。
しかし、まだ完璧ではありません。研究者たちは、それを機能させるためにAIの内部構造をいじる必要がありました。これは常に簡単ではありません。しかし、彼らはすでに、より大きな選択肢を探索するためのよりスマートなショートカットを使用するなど、さらに良くする方法について考えています。
さて、これがすべての始まりなのでしょうか。今日は配送ルートを解決するAI、明日は誰が医療を受けるかを決定するAI。うーん。あなたがどう思うか知りたいです。そして、この解説が気に入ったら、いいねボタンを押し、より多くのワイルドテック話のために購読し、視聴してくれてありがとうございます。次回でお会いしましょう。