這位連續創業家為何「瘋狂」到要挑戰 NVIDIA
Naveen Rao 賣掉過兩家公司、當過 Databricks AI 負責人。現在他創辦 Unconventional AI,想用類比電路重新定義 AI 運算。很多人說他瘋了,他說:人類需要一些瘋子去探索。
本文整理自 NeurIPS 2024 期間的訪談。
「很多人說我瘋了。」Naveen Rao 講這句話的時候,語氣裡沒有任何防禦性,反而帶著一種習慣了的坦然。「我家人也這麼說。當年我放棄一份很好的科技業工作,跑去念博士的時候,他們就說過一次。」
這不是他第一次被叫瘋子,大概也不會是最後一次。
從 Nervana 到 Databricks
Rao 的履歷讀起來像是矽谷創業教科書的標準案例。他是那種「OG 全端」——不是現在說的「會寫 JavaScript 和 Python」的全端,而是從矽晶片設計、邏輯電路、作業系統、到應用程式都能碰的那種全端。這種背景在今天已經很稀有了,但在他那個年代,這是做硬體必須具備的能力。
他的第一家公司 Nervana 做的是 AI 晶片加速器。那是 2014 年左右,比現在的 AI 熱潮早了將近十年。當時 GPU 跑深度學習還不是主流,大多數人覺得神經網路只是學術玩具。Nervana 設計了專門為深度學習優化的晶片架構,2016 年被 Intel 收購。Rao 進入 Intel 擔任高層,主導 AI 硬體策略。
Intel 那段經歷讓他看到了大公司的運作方式。「我是少數會親自跑去實驗室看晶片點亮的高管,」他回憶。「大多數人只看報告,但我想親眼見證那個時刻。」有時候晶片一上電就冒煙,那是幾個月心血化為烏有的時刻。有時候一切順利,那是值得慶祝的時刻。「那種多巴胺衝擊,跟寫軟體按下編譯鍵完全不同等級。」
離開 Intel 後,他共同創辦了 Mosaic ML,一家專注於 AI 訓練效率的雲端公司。這次是軟體,不是硬體。2023 年,Mosaic 被 Databricks 以超過 10 億美元收購,Rao 成為 Databricks 的 AI 負責人。
從晶片到雲端再回到晶片。看起來像是繞了一圈,但 Rao 說這些經歷讓他能夠「跨越邊界思考」。軟硬體之間的界線其實是人為劃定的,取決於你在哪裡畫那條「可以配置」和「不可以配置」的線。問題是什麼?解決方案應該在哪一層?這才是真正該問的問題。
為什麼放棄舒適圈
Databricks 是一家市值數百億美元的公司。Rao 在那裡有資源、有團隊、有影響力。為什麼要離開,去做一件「很多人說瘋狂」的事?
「純粹是熱情,」他說。這聽起來像是套話,但他接下來的解釋不是。
「1990 年代我在大學學神經科學的時候,第一次知道人腦只用 20 瓦的能量。那時候我就被震撼到了,到現在還是覺得不可思議。」人腦能做的事情——辨識臉孔、理解語言、產生創意、做出判斷——遠遠超過任何電腦,而功耗只有一顆省電燈泡。貓腦更誇張,只要 0.1 瓦,但牠能精準跳躍、能追蹤獵物、能在黑暗中導航。
「我們從來沒有真正接近過那個效率,」Rao 說。「我一直在等一個機會,讓這個問題變得『值得解決』。」意思是:不只是學術上有趣,而是商業上也有價值。
現在這個機會來了。AI 產業的能源消耗已經大到影響電網穩定,未來只會更嚴重。誰能用更少的能源做更多的運算,誰就有巨大的市場。這不是「也許有用」,而是「如果能做到就是改變世界」。
「我在這個產業夠久了,知道純粹想做酷東西是不行的,」他說。「必須有商業上的理由。但現在兩個條件都滿足了:這東西很酷,而且世界真的需要它。」
Unconventional 在做什麼
公司名字就叫 Unconventional,中文可以翻成「非傳統」或「不走尋常路」。這個命名很直白:他們想做的就是跟過去 80 年的計算架構不一樣的東西。
核心想法是「類比計算」。不用 0 和 1 來代表數字,而是用物理量本身——電壓、電流、電容——來執行運算。這不是新概念,1940 年代就有類比電腦了,但它輸給了數位電腦,因為製造精度不夠,系統一做大就出問題。
但 Rao 認為 AI 是重新審視這條路的機會。神經網路不需要精確到小數點後很多位,它需要的是大量平行運算和模式識別。這正是類比電路擅長的。而且現在的製程技術比 80 年前好太多了,當年的「致命傷」可能已經不是問題。
「我們不是在造更好的 GPU,」他強調。「我們在問一個更根本的問題:用物理本身來計算,而不是用數位電路去模擬物理,能不能更高效?」
他們目前的進度是理論研究和概念驗證。Rao 刻意不讓團隊太早跳進「這東西怎麼製造」的問題。「我一直在把對話拉回來:這東西會不會動?先證明它會動,再來擔心怎麼量產。」這是研究機構的思維方式,但他認為在這個階段是對的。過早考慮工程限制,會讓人不敢想大的可能性。
五年目標是拿出可量產的原型。這意味著要跟 TSMC 合作,確保設計能在現有製程上實現。Rao 提到他們的第一顆晶片可能是「有史以來最大的類比晶片」——光是這一點就是工程挑戰。
與 NVIDIA 的關係
所有做 AI 晶片的人都會被問同一個問題:NVIDIA 怎麼辦?
「我們會跟 NVIDIA 對立嗎?我不知道,」Rao 的回答很直接。「也許會合作。我們在試圖打造一個比矩陣乘法更好的基板。如果這個基板真的更好,對所有人都有價值。」
他沒有把 NVIDIA 定位成敵人。NVIDIA 建立了整個 AI 運算的生態系統,CUDA 是今天每個 AI 研究者都在用的工具。但 CUDA 是為 GPU 設計的,而 GPU 是為圖形渲染設計的。它剛好也能跑矩陣乘法,剛好矩陣乘法是神經網路的核心運算,所以 NVIDIA 贏了這一輪。但這不代表 GPU 是「最佳解」,只是代表它是「現有最佳解」。
「Google 有 TPU,他們在做漸進式改良,讓現有架構更好更省錢,」Rao 分析。「這完全合理,他們有業務要維持。但我們想做的是不同的事。」
TSMC 幾乎確定會是合作夥伴。不管你的架構多激進,最後都需要有人幫你製造晶片。全世界能做到這件事的公司只有少數幾家,TSMC 是其中最大的。Rao 提到他們已經在接觸 TSMC,確保設計出來的東西能夠量產。
硬體人的浪漫
訪談快結束時,主持人問 Rao:每天早上起床是什麼讓你有動力?
他的回答帶著一種老派工程師的浪漫:「如果我們成功,這會被寫進歷史書裡。」
做產品、改功能、提升指標——這些事很重要,但五年後可能沒人記得。改變計算的底層架構不一樣。這是那種「如果成功,世界會記得很久」的事。上一次有人成功做到這件事,是 1945 年的 ENIAC 團隊。
「你可以去大公司,做一些有趣的事,拿不錯的薪水,」他說。「但如果你想做有機會改變世界的事,你得去新創,而且是願意冒大險的新創。」
他在找的是「願意跨界」的人。不是只會做類比電路的人,也不是只會訓練模型的人,而是願意學習對方領域、願意在模糊地帶探索的人。理論物理學家、神經科學家、系統架構師、電路設計師——這些不同背景的人要能一起工作,才能做出真正不一樣的東西。
「很多人說我瘋了,」他最後說。「但人類需要一些瘋子去探索。如果每個人都走安全的路,我們永遠到不了新的地方。」