Large Language Models

物理AI:LLMを超えて、真のボトルネックはデプロイメントにある

LLMが車を運転するなんていう煽り文句はもう忘れよう。AIの本当の課題は、泥臭い物理世界にある。Applied Intuitionの創設者たちがその理由を語る。

Applied IntuitionのQasar Younis氏とPeter Ludwig氏が物理AIについて議論している。

Key Takeaways

  • 物理世界におけるAIの主要なボトルネックは、もはやモデルの知性ではなく、制約のあるハードウェアへの効率的かつ安全なデプロイメントである。
  • 物理AIは、画面ベースのAIとは異なるパラダイムを要求し、安全性が最優先される機械にはるかに高い信頼性とリアルタイムパフォーマンスが求められる。
  • 自律システムの未来は、断片化された専有的なスタックではなく、車両や機械向けのAndroidのような標準化されたプラットフォームに似ている可能性がある。

データセンターに響くサーバーの微かなハム音は、アスファルトを軋ませる金属音とは宇宙の彼方ほど隔たっている。しかし、その二つの現実の間で、新たな種類のAIが鍛えられつつあるのだ。

YC時代の自動運転ツールから、静かに150億ドル規模の巨大企業へと変貌を遂げたApplied Intuitionは、この「物理AI」を構築するという使命を担っている。共同創業者のQasar Younis氏とPeter Ludwig氏は、映画の筋書きをハルシネーションするチャットボットの話をしているわけではない。彼らが焦点を当てているのは、AIが重機を確実に操作し、賑やかな日本の都市をトラックで走り抜け、建設現場や防衛システムの容赦ない地形をナビゲートできるようにすることだ。彼らの10年にわたる道のりは、インテリジェントなアルゴリズムと、触れることのできる現実世界へのデプロイメントとの間にある、しばしば見過ごされがちな深い溝を詳細に示している。

ここで重要なのは、誰もがモデルに興奮しているということだ。OpenAIの最新リリース、Googleの進歩——これらは見出しを飾る。しかし、Younis氏とLudwig氏は、モデルの知性はもちろん重要だが、もはやそれが主要なボトルネックではないと指摘する。真の難問、現代の本当のエンジニアリング課題は、これらの洗練されたAIシステムを、制約のあるハードウェア上で、リアルタイムの要求、電力制限、そして容赦のない物理的制約すべてを考慮して、安全かつ効果的に実行させることなのだ。

なぜ物理AIは根本的に異なるのか

考えてみてほしい。LLMはプロンプトを誤解したり、無意味なテキストを生成したり、さらには事実を捏造したりすることさえある。苛立たしいか?もちろん。しかし、それは通常、物理的な危害を引き起こす壊滅的な失敗にはつながらない。自動運転トラック、自律走行車、産業用ロボットといった安全性が最優先される機械にとって、リスクは文字通り桁違いだ。間違いは単なるグリッチではなく、潜在的な大惨事なのだ。これは、デジタルアシスタントに期待するものとは桁違いの、信頼性と決定論を要求する。

Applied Intuitionの進化は、この複雑さを反映している。彼らは当初、シミュレーションとデータインフラを構築することから始めた。実質的には、ロボタクシー企業のためのデジタル検証場だ。しかし、深く掘り下げるにつれて、より全体的なアプローチの必要性を認識した。シミュレーションでテストするだけでは不十分であり、移動する機械特有の要求のために設計された強力なオペレーティングシステムと、物理世界のニュアンスを理解する基本的なAIモデルが必要だった。

現在、30以上の製品にまたがる彼らのプラットフォームは、シミュレーション、オペレーティングシステム、AIモデルに触れている。これは、物理AIが単一のものではなく、ソフトウェア、ハードウェア、そして現実世界の物理学が調和しなければならない複雑なエコシステムであるという考え方の証だ。

ハードウェアは新境地か?

Ludwig氏は説得力のある比較を提示する。今日の複雑な車両や機械のソフトウェアスタックは、AndroidやiOSが登場する前の携帯電話のようだ。断片的で、 proprietär (専有的)で、管理が難しい。Applied Intuitionは、より標準化され、信頼性が高く、スケーラブルな物理AIアプリケーション開発を可能にする基盤プラットフォーム、オペレーティングシステムレイヤーとなることを目指している。これはiPadの機能を再現することではない。リアルタイムのセンサーストリームを処理し、ミリ秒単位の遅延を管理し、フェイルセーフを保証し、多トンの車両を「文鎮化」させる恐ろしいリスクなしに、信頼性の高いオーバー・ザ・エア・アップデートを可能にするOSを構築することなのだ。

純粋なモデル開発からデプロイメントとインフラへの焦点のシフトは、数年前には少し時代遅れに感じられたツーリング企業が再び注目を集めている理由だ。AIブームは、よりスマートなモデルを生み出しただけでなく、それらのモデルを現実世界のシステムに効果的に統合することを可能にするワークフローとツールの極めて重要な重要性を浮き彫りにした。

“安全、遅延、電力、コスト、信頼性の制約下で、実ハードウェアにモデルをデプロイすることが難しい部分だ。”

Applied Intuition内でも、AIは単なる製品ではなく、エンジニア自身のツールになりつつある。CursorやClaude Codeのようなコーディングエージェント、そして社内の採用リーダーボードは、最も安全性が最優先される組み込みシステムでさえ、彼らがソフトウェアを書く方法を変えている。これは、AIが技術開発のあらゆるレイヤーに浸透している様子の魅力的なミクロコスモスだ。

検証への終わりのない探求

Younis氏とLudwig氏が強調する最も重要な課題の一つは、検証と妥当性確認だ。AIモデルがよりインテリジェントになるにつれて、そのパフォーマンスの評価は逆説的に困難になる。従来の決定論的なテストは機能しなくなる。エンドツーエンドの自律性には、単に正確であるだけでなく、実用的な強化学習を可能にするほど高速かつ安価なシミュレーションが必要とされる。目標は、バイナリの合格/不合格から、特定の「ナイン」(安全性の統計的アプローチ)で信頼性を定量化することへとシフトする。

ここで、現実世界でのテストが決してなくならない理由がある。どんなに高度なシミュレーターでも、現実の混沌と予測不可能性を完全に再現することはできない。CruiseやWaymoのような企業が関与した悪名高いインシデントは、この点を強調している。公衆の信頼は、技術的な腕前だけで築かれるのではない。それは、一貫した信頼性の高いパフォーマンスと、物事が必然的にうまくいかなくなったときに企業が規制当局や一般の人々とどのように関わるかによって築かれるのだ。彼らは、Waymoが慎重なアプローチを通じて業界に高い基準を設定したと示唆している。

ワールドモデルも、集中的な注目の分野だ。視覚的な手がかりだけでなく、水たまりでのスリップが車両にどう影響するか、建設機械のダイナミクスが負荷によってどう変化するかといった因果関係を理解することが重要だ。しかし、これらのワールドモデルは、遅延、電力消費、サイズに厳しい制限があるオンボードシステムにとって、信じられないほど効率的でなければならない。これは、大規模なデータセンターモデルを、その本質的でパフォーマンスの高いコアにまで縮小する蒸留のような技術を意味する。

これは、ロボット工学デモの脆い最後の1%とは程遠い。Younis氏の創業者へのアドバイスは鋭い。「商用問題を限定し、成熟した企業への早期の模倣を避け、技術的な複利は、それを見るまで生き残る時間がなければ価値がないことを覚えておくことだ。」彼らは、状況が変わったと示唆している。2014年のYCのアドバイスは、資本市場とAIスタートアップのダイナミクスにおける変化を考えると、2026年には通用しないかもしれない。

Applied Intuitionの10年間の地道な努力は、彼らに独自の先見の明を与えた。彼らはロボット工学のデモを見て、企業が直面する次の20の問題を予測できる。物理的なAIデプロイメントの最前線で鍛えられた、この苦労して得た知恵こそが、彼らを真に際立たせている。彼らは単にスマートな機械を構築しているのではなく、動く世界の知能インフラを構築しているのだ。


🧬 関連インサイト

Written by
theAIcatchup Editorial Team

AI news that actually matters.

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by Latent Space