AI 產業動態

Microsoft 為何主動放棄數十億美元的資料中心計畫?Satya Nadella 解釋背後邏輯

2024 年下半年,Microsoft 做了一個令外界意外的決定:主動放棄了大量已規劃的資料中心計畫,讓 Google、Meta、Oracle 撿走了這些站點。Satya Nadella 首次完整解釋這個決策的戰略邏輯,涉及 OpenAI 關係重新定位、硬體世代更迭風險、以及對超大規模運算業務本質的重新思考。

來源: Dwarkesh Patel Podcast

本文整理自 Dwarkesh Patel Podcast 2024 年 12 月播出的單集,由 Dwarkesh Patel 與 SemiAnalysis 創辦人 Dylan Patel 共同訪問 Microsoft CEO Satya Nadella。

2024 年下半年,一件令業界困惑的事情發生了。

Microsoft 原本在 AI 基礎設施競賽中遙遙領先。根據 SemiAnalysis 的追蹤數據,他們本來有望在 2026 或 2027 年超越 Amazon,成為全球最大的 AI 基礎設施供應商。但突然間,Microsoft 開始放棄已經談好的資料中心租賃案,這些站點隨後被 Google、Meta、Amazon、Oracle 搶走。到了 2028 年的預估容量,Microsoft 從原本可能達到的 12-13 gigawatts,下修到約 9.5 gigawatts。

更令人驚訝的是,在這段時間裡,Oracle 從 Microsoft 五分之一的規模,預計將在 2027 年底超越 Microsoft。Oracle 的毛利率可能只有 35%,比不上 Microsoft 的水準,但這終究是一門賺錢的生意。Microsoft 為什麼要把這塊肥肉讓給別人?

Dylan Patel 在訪談中直接問了這個問題。Satya 的回答,揭示了一套不同的戰略思維。

「我們不想只當一家公司的房東」

Satya 的第一個解釋非常直白:「我們不想只當一家公司的房東,擁有一本只有一個客戶的大訂單。那不是一門生意。」

這句話需要放在脈絡裡理解。Microsoft 與 OpenAI 的合作關係舉世皆知,Microsoft 提供運算資源,OpenAI 用這些資源訓練模型。但隨著 OpenAI 規模越來越大、野心越來越大,他們需要的運算資源也呈指數成長。如果 Microsoft 按照原本的計畫全速擴張,很大一部分產能會被 OpenAI 一家公司吃掉。

問題在於,OpenAI 是一家獨立公司,而且正在成為一家越來越成功的獨立公司。他們遲早會像 Meta 一樣,建立自己的第一方運算基礎設施。到那時候,Microsoft 為他們建的所有產能會變成什麼?閒置資產。

Satya 用了一個很有說服力的類比:如果一家模型公司最終會成為自己的超大規模運算供應商(hyperscaler),那麼你為他們建的基礎設施,本質上是替別人打工。你應該和那家公司垂直整合,而不是當他們的外包廠商。

這個邏輯解釋了為什麼 Microsoft 在新的合作協議中重新定位了與 OpenAI 的關係。根據 Satya 的說法,OpenAI 的 API 業務(他稱之為 PaaS 業務)仍然是 Azure 獨家,但 OpenAI 的 ChatGPT(SaaS 業務)可以跑在任何地方。這是一種更平衡的安排,Microsoft 不再把所有雞蛋放在一個籃子裡。

硬體世代更迭的風險

Satya 的第二個考量是技術世代的快速更迭。

訪談當天,他們正站在 Microsoft 在亞特蘭大的 Fairwater 2 資料中心裡,這是目前全球最強大的 AI 訓練設施之一,裝滿了 NVIDIA 的 GB200 晶片。但 Satya 立刻指出:GB300 很快就要來了,Vera Rubin 也在路上,Vera Rubin Ultra 更是會帶來完全不同的功率密度和冷卻需求。

這意味著什麼?如果你在 2024 年一口氣建了大量針對某一代晶片優化的資料中心,你可能會被卡住四、五年的折舊週期,使用的卻是過時的技術。Satya 形容這是「一次性規模化」的風險——你應該「在時間中規模化」(scale in time),而不是一次把籌碼全押上。

Jensen Huang 給了他兩個建議。第一,要達到「光速執行」(speed of light execution)——從拿到晶片到交付給實際工作負載,亞特蘭大的資料中心只花了 90 天,這是頂級的執行速度。第二,要保持彈性,每一代都建一些,而不是在一代上建太多。

這個策略的好處是,五年後你會有一個更平衡的設備組合,而不是一大堆同一代的老舊設備。壞處是,你會失去短期內的規模優勢,讓 Oracle 這樣更激進的競爭者暫時超越你。Satya 顯然認為這個取捨是值得的。

「可替代性」是關鍵字

Satya 反覆強調的一個詞是「fungibility」——可替代性。

傳統的資料中心建設思維是:你知道客戶要什麼,你就建什麼。但在 AI 時代,Satya 認為這種思維很危險。如果你為單一模型架構優化你的整個網路拓撲,萬一那個架構過時了呢?萬一有人發明了一種新的 Mixture of Experts(MoE)技術,讓你的整個網路設計變得不合適呢?

他的解法是建設「支援多種模型」的基礎設施。不只是 OpenAI 的模型,也要能跑 Anthropic 的模型、開源模型、Microsoft 自己的 MAI 模型。這樣無論哪個模型家族勝出,你的基礎設施都還有用。

這個思維也體現在地理分佈上。大型 AI 訓練叢集往往集中在電力便宜的地方,比如德州。但 Satya 指出,隨著 AI 任務的時間長度增加——從秒級的即時回應,到分鐘級的推理,再到小時甚至天數的自主工作——對延遲的敏感度會下降,地理位置的重要性也會改變。更重要的是,歐盟的資料邊界法規意味著你不能隨便把歐洲客戶的工作負載路由到德州。

所以 Microsoft 選擇分散建設:在亞特蘭大建、在威斯康辛建、在歐洲建、在印度建、在中東建。這些設施會透過「AI WAN」高速網路連接起來,可以把多個站點的算力聚合成一個大型訓練任務。這是一種更有彈性的架構,但也意味著你無法用最快速度衝刺單一數字。

超大規模運算的本質是什麼?

Dylan Patel 追問:為什麼不兩者都做?既服務長尾客戶,也承接大型模型公司的訂單?

Satya 的回答揭示了他對超大規模運算業務本質的理解。他說,Microsoft 不想變成「只做五個合約、服務五個客戶、提供裸機服務」的公司。那不是 Microsoft 的業務。

他的願景是這樣的:一個真正的工作負載不只是一個 API call。它需要模型,但也需要 Cosmos DB 存 session 資料,需要 SQL DB 做結構化查詢,需要儲存空間,需要運算資源。所有這些東西加在一起,才是一個完整的應用。模型公司自己也需要這些東西來建構他們的產品。

所以 Microsoft 的策略是:成為所有這些元件匯聚的平台。你想用 Grok 加 OpenAI 加開源模型?來 Azure Foundry,一站搞定。這個平台策略的利潤率比純粹的裸機服務高很多,而且客戶黏著度也高。

至於大型模型公司的訓練需求,Microsoft 還是會接,但不會讓這塊業務擠壓掉其他更有價值的部分。Satya 說得很直接:「我們會有一些領先的裸機服務能力,包括給我們自己的模型用,但這不能排擠掉其他業務。」

軟體才是差異化的來源

訪談快結束時,Dylan 指出一個事實:AI 正在把軟體公司變成資本密集型企業,CapEx 在過去兩年增加了三倍,其他超大規模運算公司甚至開始借錢(Meta 剛簽了 200 億美元的路易斯安那州貸款)。自由現金流似乎都在歸零。

Satya 承認這個結構性轉變是真實的。他說:「我們現在既是資本密集型企業,也是知識密集型企業。」但關鍵字是後半句——知識密集。

他舉了一個數字:對於同一個 GPT 模型家族,光靠軟體優化,Microsoft 每一季、每一年都能把「每美元每瓦特的 token 數」提升 5 倍、10 倍、甚至 40 倍。這是硬體摩爾定律之外的改進,純粹靠系統工程和軟體能力。

這就是超大規模運算公司和傳統主機託管商的差別。兩者都在花大錢建資料中心,但超大規模運算公司有軟體能力來最大化每一美元的投資回報。Satya 說,排程演算法、工作負載遷移、跨設備優化——這些都是軟體問題,而這些軟體能力才是 Microsoft 真正的護城河。

這也解釋了為什麼 Satya 不急著和 Oracle 比拼 gigawatts 數字。如果你的軟體能力比對手強,同樣的硬體在你手上能產出更多價值,那麼追求最大規模就不是最重要的事。重要的是,你建的每一 gigawatt 都能產生最高的回報。

五年 vs 五十年

Satya 在訪談中說了一句話:「你不該只想未來五年要做什麼,而是未來五十年。」

這句話解釋了很多看似反直覺的決策。短期內,Microsoft 可能會在容量數字上落後於更激進的競爭者。但 Satya 押注的是:二十年後,誰有最強的軟體能力、最平衡的資產組合、最多樣化的客戶群,誰才是贏家。

他也承認這不是唯一正確的策略。Oracle 的策略可能對 Oracle 來說是對的。但對 Microsoft 來說,「追逐」Dylan 追蹤的那些 gigawatt 數字,並不是最重要的事。

「我追蹤你的數據,」Satya 告訴 Dylan,「但這不代表我要追逐那些數字。」

這可能是整個訪談最有啟發性的一句話。在一個每個人都在比拼規模、比拼速度的產業裡,Microsoft 選擇了一條不同的路:不急著當最大,而是確保自己建的每一座資料中心,二十年後還有價值。