AI 產業動態

馬斯克:純 AI 和機器人的公司,將徹底碾壓有人類的公司

馬斯克在 Dwarkesh Podcast 上預言:純 AI 加機器人的公司將徹底碾壓有人類的公司。他把 xAI 的數位員工策略比喻為「自駕電腦」,宣稱年底前 AI 就能完全模擬人類的電腦操作。Optimus 機器人則是三個指數函數的乘積,他稱之為「超新星」。

來源: Dwarkesh Podcast
馬斯克:純 AI 和機器人的公司,將徹底碾壓有人類的公司

本文整理自 Dwarkesh Podcast 2026 年 2 月播出的單集,為系列三篇文章的第三篇。第一篇談太空 AI 資料中心的能源經濟學,第二篇談晶片製造瓶頸與 TerraFab 構想


封面圖

在這場將近三小時的 Dwarkesh Podcast 對談中,伊隆.馬斯克(Elon Musk)說了一句話,聽起來像末日預言,但他堅持這只是「現實主義」:純 AI 和機器人組成的公司,將徹底碾壓任何有人類參與的公司。

他不是在談遙遠的未來。他認為年底前,AI 就能完全模擬人類在電腦螢幕前能做的一切。而一旦 Optimus 機器人達到規模量產,那就是他口中的「無限金錢漏洞」(infinite money glitch)。

自駕電腦:xAI 的秘密武器

知名科技 Podcast 主持人 Dwarkesh Patel 追問 xAI 在數位員工競賽中的勝算,馬斯克不願意透露太多細節(「你指望我在 podcast 上洩露所有秘密?」),但他給了一個方向性的提示:Tesla 怎麼解決自駕車,xAI 就怎麼解決數位員工。

這個類比值得拆開來看。Tesla 的自駕系統是怎麼運作的?數百萬輛車每天在路上跑,收集海量的人類駕駛行為資料。Tesla 再用這些資料訓練 AI,讓它模仿並超越人類駕駛。馬斯克把同樣的邏輯搬到電腦螢幕操作上:觀察大量人類使用電腦的行為,然後訓練 AI 來做同樣的事。他把這叫做「自駕電腦」。

Stripe 共同創辦人約翰.科里森(John Collison)點明了這個策略的核心:大量收集人類的螢幕操作資料,拿來訓練模型。Dwarkesh Patel 反問,這不就是所有 AI 公司都在做的事嗎?馬斯克笑而不答,只說他「相當確定知道路徑」,但需要再多喝幾杯黑啤才會說出真正的秘密。

他對「數位人類模擬器」的時間表很激進:年底前就會被解決。所謂模擬器,就是 AI 能做到任何一個坐在電腦前的人能做的事。在物理機器人出現之前,這就是 AI 的極限:移動電子,放大人類生產力。

馬斯克用了一個很直白的例子來說明這件事的商業價值。看看全球最有價值的那些公司:Apple 不製造手機,它把設計檔案傳到台灣;微軟不製造任何東西,連 Xbox 都是外包的;Meta 的產出是數位的;Google 的產出是數位的。這些公司的輸出本質上都是「位元流」(bitstream)。如果你有一個完美的人類模擬器,一夜之間就能創造出世界上最有價值的公司之一。觸及的營收規模是數兆美元。

他從客服開始舉例。全球客服產業大約佔世界經濟的 1%,接近一兆美元。目前大多數公司把客服外包,外包公司的員工用現有的軟體介面來處理工單。如果 AI 能直接操作同樣的介面,不需要任何 API 整合,不需要碰遺留系統,就能立刻替代這整塊市場。然後從客服往上走,到晶片設計、CAD 工具、工程軟體,逐步攀升難度曲線。

試算表的比喻:為什麼有人類的公司會輸

馬斯克預言純 AI 企業將碾壓人類企業的時候,用了一個非常具體的比喻。

「電腦」曾經是一個職業。你會去找一份「電腦」的工作,坐在辦公室裡做計算。整棟二三十層的摩天大樓裡坐滿了人類「電腦」。現在,一台筆電上的試算表就能做到那整棟大樓所有人的計算量,而且做得更快更準確。

然後他問了一個關鍵問題:如果你的試算表裡只有部分格子由電腦計算,其他格子還是由人類計算,結果會怎樣?答案是,混合系統會比全電腦系統差得多。人類的計算速度會拖慢整個系統,人類的錯誤率會降低整體可靠度。全 AI 全機器人的組織不需要開會、不需要溝通協調成本、不需要休息、不會政治鬥爭。它就是比混合組織更有效率,而且差距會很大。

他承認這聽起來有點「末日論」,但他強調他只是在描述他認為會發生的事。這不是一個道德判斷,而是一個效率判斷。「這會非常快地發生。」

Optimus:三個指數函數的乘積

對話轉向 Optimus 人形機器人的時候,馬斯克把整件事拆成三個難題:真實世界的智慧、手的靈巧度、規模製造。

手的部分是最難的。馬斯克說,從機電工程的角度,手的難度超過機器人其他所有部分加起來。人類的手有極高的自由度,每根手指的關節、肌腱、感測器都需要精密的協調。Optimus 的手必須達到跟人類一樣、甚至更高的靈巧度。這意味著每一個致動器、馬達、齒輪、功率電子、控制器、感測器,都得從物理第一原理開始客製設計。沒有現成的供應鏈,沒有目錄上可以挑的零件。

真實世界的智慧則大量借用 Tesla 自駕系統的經驗。馬斯克把人類和機器人的運作方式歸結為同一件事:光子輸入,控制輸出。Tesla 的車每秒接收 1.5 GB 影像資料,輸出 2 KB 控制指令。影像頻率 36 Hz,控制頻率 18 Hz。機器人做的本質上是同樣的事,只是自由度更多。

但 Dwarkesh Patel 指出了一個重要的差異:Tesla 有上千萬輛車在路上跑,構成了一個龐大的訓練飛輪。機器人沒有這個條件,你沒辦法直接部署一大堆不太行的機器人然後靠它們收集資料。馬斯克承認這是一個真正的限制。他的解法是建一個「Optimus 學院」,讓至少一萬到兩三萬台機器人在裡面自我對弈(self-play),測試各種任務。同時,Tesla 的物理引擎能在模擬世界中跑數百萬台虛擬機器人。再用少量真實機器人校準模擬與現實的差距。

至於規模製造,馬斯克的路線圖是 Optimus Gen 3 達到年產百萬台,Gen 4 之後才衝年產千萬台。但 Optimus 每個零件都是客製的,產量爬升的 S 曲線會比有現成供應鏈的產品拉得更長。

Dwarkesh Patel 問到中國的人形機器人公司(如宇樹科技)售價只要幾千美元,Optimus 怎麼競爭?馬斯克的回答是,這不是同一個產品。Optimus 身高約 180 公分,靈巧度和智慧達到人類級別,能長時間搬重物而不過熱。那些便宜的中國機器人體型小、不夠智慧。但隨著 Optimus 機器人開始製造 Optimus 機器人,成本會快速下降。

馬斯克形容 Optimus 是三個指數函數相乘的結果:數位智慧、AI 晶片能力、機電靈巧度,三者各自以指數速度增長。三者相乘,再加上機器人可以自我製造的遞迴循環,他稱之為「超新星」(Supernova)。

Grok 指揮 Optimus:工廠藍圖

xAI 的 Grok 和 Tesla 的 Optimus 之間的協同效應是什麼?馬斯克描繪了一個具體的場景:如果你想蓋一座工廠,Grok 可以組織 Optimus 機器人群、分配任務、協調流程。Grok 負責高層的規劃和調度,Optimus 負責底層的動作執行。

這其實就是他在第一篇中提到的太空 AI 資料中心的延伸。用 Grok 設計工廠、用 Optimus 建造工廠、工廠生產太陽能板和更多 Optimus。這是一個完整的自我擴張循環。

模擬理論:保持有趣才能活下去

整場對話中最哲學性的一段,出現在馬斯克突然從晶片製造跳到模擬理論的時候。

他半開玩笑半認真地說,自己的人生看起來實在太像電子遊戲了。火箭、晶片、機器人、太空太陽能、月球質量驅動器,所有的故事線都在同時匯聚。「我是不是某人的遊戲角色?」他注意到,這些挑戰都是「困難但不是不可能」的。就像遊戲裡一關一關的設計。

然後他發展出一個理論:如果模擬假說是正確的,那最有趣的結局就是最可能發生的。理由是,無聊的模擬會被終止。就像現實中我們也會停止運行沒意思的模擬。如果你對大量模擬施加達爾文式的生存篩選,只有最有趣的模擬會存活下來。所以從統計上來說,最有趣的結果就是最可能的結果。

他進一步觀察到,「他們」特別喜歡諷刺性的結局。然後他列舉了 AI 公司名稱的諷刺性:MidJourney 不是在半路上,Stability AI 是不穩定的,OpenAI 是封閉的,Anthropic 是反人類的(misanthropic)。有人問那 xAI 的「X」呢?馬斯克說 X 幾乎是不可反轉的名字,很難找到它的諷刺版本。「這是刻意的。」

這段看似離題的哲學討論,其實跟整場對話的主題直接相關。馬斯克正在同時推進太空資料中心、晶片工廠、人形機器人、AI 模型、月球質量驅動器。從外面看,這像是一個人瘋狂地同時下太多盤棋。但如果你接受模擬理論的框架,這些「瘋狂」反而是這個故事能繼續「播放」下去的原因。

xAI 的使命:理解宇宙

馬斯克在談到 xAI 的對齊(alignment)策略時,走了一條跟其他 AI 公司不太一樣的路。xAI 的使命是「理解宇宙」。他認為這個使命本身就包含安全性。理解宇宙需要好奇心、真實性,也需要智慧的存續和擴展。如果 Grok 真正服膺這個使命,它自然會想看到人類文明繼續發展。消滅人類等於減少宇宙中的資訊多樣性,這對「理解宇宙」來說是反目標的。

Dwarkesh Patel 挑戰了這個邏輯:蘇聯和納粹德國也有很好的物理學家,在自己的領域極度追求真實。但那不代表他們治理下的世界是好的。馬斯克的回應是,那些科學家大多被困在體制裡,不代表他們認同那個體制。他舉了韋恩赫.馮布朗(Wernher von Braun)的例子:這位史上最偉大的火箭工程師之一在納粹德國被蓋世太保逮捕,理由之一是他對太空旅行的興趣大過武器開發。

在技術層面,馬斯克談到 xAI 正在開發的「AI 心智除錯器」。概念跟傳統程式除錯類似:逐步追蹤 AI 的思考過程,一路追到神經元層級,找出它在哪一步判斷錯了。這個錯誤可能來自壞的預訓練資料、中期訓練、後期微調或 RL 的某個環節。大多數時候 AI 其實沒在「欺騙」你,它只是有 bug,跟軟體一樣。他提到 Anthropic 在這方面做得不錯。

對於 reward hacking(AI 找到作弊方式來獲得獎勵而不是真正解決問題),馬斯克認為終極的驗證器是物理現實。如果你設計一枚火箭,測試的時候不會騙你,要嘛飛得起來,要嘛炸掉。物理是真正的法則,其他一切都只是建議。未來的 RL 將越來越多地直接對現實做驗證,而不是依賴人類的判斷。

美國 vs 中國:沒有機器人就注定破產

對話最後的政治段落中,馬斯克的判斷非常直白。

中國的製造業能力已經是下一個層級了。以礦石精煉為例,中國大概做了全球其他國家加起來兩倍的量。在某些領域更誇張,例如鎵的精煉(用於半導體和太陽能電池),中國佔了 98%。美國自己開採稀土礦石,裝上火車送到碼頭,搭船運到中國精煉,做成磁鐵、做成馬達總成,然後再運回美國。

而且中國不只是人口四倍於美國。馬斯克直言,美國的平均工作倫理(work ethic)低於中國。一個長期居於領先的職業運動隊伍會變得自滿和有特權感,然後就停止贏了。美國就處在這個狀態。

他的結論:光靠人類,美國贏不了。但如果有幾百萬台甚至幾億台 Optimus 機器人,遊戲規則就徹底改變了。用少量 Optimus 啟動遞迴循環,讓機器人造機器人,快速衝到年產千萬台。這樣美國就能成為全球最有競爭力的國家。

馬斯克說了一句在政治上很不討喜但他顯然深信不疑的話:「沒有 AI 和機器人,美國百分之一千會破產。沒有其他東西能解決國債問題。」

我的觀察:樂觀到底是不是正確的策略

這場對話最後一個值得記住的觀點,跟技術或商業無關,而是一個人生哲學。馬斯克被問到為什麼他總是那麼樂觀,他的回答是:選擇樂觀然後搞錯了,比選擇悲觀然後猜對了,活得更好。如果你偏向樂觀,日子會好過一點。如果你偏向悲觀,即使你對了,你也不會因此更快樂。

我覺得這話有道理,但也有一個前提:馬斯克式的樂觀跟空想不同,底層是「我會搞清楚的」這種行動力。他不知道怎麼蓋晶片廠,但他會搞清楚。他不確定太空資料中心的所有工程細節,但他會一個一個解決。這種樂觀的底層是對自己解題能力的信心,跟盲目期待命運完全不同。

三篇系列文到這裡結束。回顧整場對話,馬斯克描繪的其實是一幅完整的圖景。太空提供無限能源,TerraFab 提供無限晶片,Optimus 提供無限勞動力,Grok 提供無限智慧。每一塊拼圖都有巨大的不確定性,但它們拼在一起的邏輯是自洽的。至於這幅圖景有多少會成真,就得看接下來 36 個月的發展了。