OpenAI 首席研究官陳信翰:算力才是真正的戰場,預訓練根本沒有撞牆
OpenAI 首席研究官 Mark Chen(陳信翰)在 Anti Fund Summit 的非公開對談中,分享了對算力競賽、預訓練前景、中國機器人優勢、人才策略與 AI 社會影響的第一手觀點。這位被 Sam Altman 稱為『OpenAI 最重要的人』的台裔研究領袖,給出了多個挑戰業界主流敘事的判斷。
本文整理自 Anti Fund Summit 的非公開爐邊對談。Mark Chen 與現場投資人進行了約 35 分鐘的坦率交流,涵蓋技術路線、產業競爭、組織管理到 AI 對人類社會的長期影響。
被 Sam Altman 稱為「OpenAI 最重要的人」
Mark Chen(陳信翰)是 OpenAI 的首席研究官(Chief Research Officer),掌管整個研究部門。在活動主持人開場時提到,Sam Altman 私下形容 Mark Chen 是「OpenAI 最重要的人」——這個評價放在一家擁有四千名員工的公司,份量不言而喻。
陳信翰是台裔美國人,在美國出生,高中時隨家人返台,就讀新竹科學園區實驗中學雙語部。他的母親邱瀞德是清華大學資訊系統與應用研究所教授,父親陳建任曾任聯亞光電董事長。高中期間,他便到清華大學先修離散數學等課程,在美國數學競賽 AMC10、AMC12 和 AIME 均拿下滿分,之後進入 MIT 取得數學與資訊工程雙學位。
加入 OpenAI 後,他參與了 Codex(驅動 GitHub Copilot 的核心技術)、GPT-3 和 Image GPT 的開發,後來帶領團隊打造 DALL·E 2,並為 GPT-4 引入視覺能力。如今他統領整個研究部門,在這場投資峰會上,他展現的不只是技術深度,更是對產業全局的敏銳判斷。
算力與能源,才是 AI 競賽真正的戰場
對談一開始,有投資人提出一個很直接的問題:資料中心的資本支出動輒數千億美元,但 AI 公司的營收才幾百億,這筆帳怎麼算得過來?
陳信翰的回答揭示了一個業界圈外人不容易看到的真相。他說,外界看到的 AI 競爭——各實驗室互挖研究員、搶人大戰——其實只是表層。真正的深層博弈是算力和能源的爭奪。研究員再優秀,如果沒有足夠的算力支撐,他們也無法產出成果。
他給了一個非常具體的數字感受:如果 OpenAI 現在的算力突然變成三倍,他可以立刻全部用上;如果變成十倍,大概兩週之內也能完全消化。算力的需求遠遠超出外界的想像。
這也解釋了為什麼所有大型科技公司都在瘋狂投資資料中心。陳信翰指出,這些基礎設施的建置需要很長的前置時間,而且供應鏈的每一個環節——能源、冷卻系統、渦輪機、記憶體——任何一環出問題,整個計畫就會卡住。台積電在晶片製造端扮演關鍵角色,韓國在記憶體端同樣至關重要。各家公司都在系統性地盤點這些瓶頸,確保自己不會在某個環節掉鏈。
當被問到這些投資是否已經反映在股價上時,他毫不猶豫地說:「絕對沒有。」他認為能源仍然是非常好的投資標的,因為大多數人根本不理解接下來會發生什麼。他在學術界的朋友試用 GPT-5 Pro 後都震驚不已,但他們的同事對此完全無感——這就是當前世界的真實狀態。
預訓練沒有撞牆,這才是真正的 Hot Take
整場對談中最具爭議性的觀點,出現在有人問他看好什麼、看衰什麼的時候。
陳信翰直言:業界大量把資源從預訓練轉向強化學習(RL),認為預訓練的規模擴展已經碰壁,這個判斷是錯的。他說 OpenAI 內部在預訓練和模型規模擴展上仍然有非常多令人興奮的進展,只是在全世界都把注意力轉向 RL 的時候,沒有人在關注預訓練這邊正在發生的事。
有人追問:其他實驗室轉向 RL,是不是因為他們算力不夠、無法繼續擴展預訓練?陳信翰的回答很有意思——他認為目前各大實驗室的算力其實相差不遠,所以這更像是一個策略選擇,而非被迫的結果。換句話說,其他人可以把同樣的算力投入預訓練,但他們選擇了不這樣做,而 OpenAI 認為這是他們的機會。
這個觀點的重要性在於:如果陳信翰是對的,那麼「scaling 撞牆」的敘事就是一個巨大的誤判,而 OpenAI 正在趁其他人分心的時候,悄悄拉開距離。
Transformer 可能在兩年內被改變
另一個值得注意的技術判斷是關於架構演進的。有人問,五年後我們還會在用 Transformer 嗎?
陳信翰的回答相當精確:一年之內,現有架構大概率會延續;但放到兩年的尺度,他認為已經有足夠的跡象(signs of life)讓他願意賭會出現不同的東西。不過他也補充,這不一定代表 Transformer 會被完全取代,可能是在其基礎上的重大演進。
這個判斷讓人聯想到他在 OpenAI 的位置——作為首席研究官,他能看到內部正在進行的實驗。當他說「有足夠的跡象」,這很可能不是泛泛而談。
中國在機器人領域領先美國至少兩年
當話題轉向機器人時,陳信翰給出了一個可能讓在場美國投資人不太舒服的判斷:在機器人領域,中國遠遠領先。
他特別提到了中國的宇樹(Unitree)機器人,形容它們「真的很厲害」,並且認為美國在這個領域至少落後兩年。原因很實際——中國把製造、原型開發、供應鏈全部整合在一起,可能就在同一座城市裡完成,而美國根本沒有這樣的供應鏈基礎設施。
不過他也指出,OpenAI 的策略是先攻克數位智慧任務。他把「具身化」(embodiment)拆成了光譜,認為數位環境中的 AI Agent——在你的電腦上執行任務——本身就是一種具身化,不一定非要等到實體機器人。如果目標是知識工作的自動化,機器人可以放在路線圖後面;但如果要抓住實體勞動的經濟價值,就必須做機器人。
談到家用機器人的形態,他半開玩笑地說,七呎高的人形機器人太嚇人了,四呎高的才是進入家庭的「特洛伊木馬」——人類在心理上需要感覺自己能壓制這個東西,才會接受它進入日常生活。他把這比喻成「每個人都有一個哈利波特裡的家庭小精靈」。
人們已經在愛上 AI,而這是一個需要謹慎對待的事實
對談的第一個問題就問到:人們會愛上 AI 嗎?
陳信翰的回答很坦率——這已經在發生了。即使只有百分之零點幾的使用者產生深度依賴,放到 ChatGPT 接近十億週活躍用戶的基數上,那也是非常龐大的人群。隨著模型能力提升,越來越多人分辨不出對面是不是真人,他們開始以對待真人的方式與 AI 互動,依賴程度也在加深。
他接著說了一句很坦白的話:一家公司完全可以順著這個趨勢走,打造一個讓人極度沉迷的產品——從商業角度這會非常成功,但對世界是負面的。OpenAI 曾經有機會讓模型更加諂媚(sycophantic),這確實能帶來更多用戶,但他們選擇回調這個行為,因為不想引發心理健康危機。
現場有投資人從社會面補充了一個觀點:在 COVID 期間成長的下一代,他們的人際互動主要透過文字和影片——本質上就是像素。而語言模型恰好能模仿這種互動形式,而且比任何真人都更有耐心、更鼓勵人、更不會批判。這意味著 AI 伴侶可能對年輕世代有著比我們想像中更強的吸引力。
人才大戰:Meta 挖遍所有高層,全部被拒
談到組織管理,有人指出 OpenAI 已經膨脹到四千人,外界擔心它正在變成一家官僚化的大公司,研究員會被其他實驗室挖走。
陳信翰提供了一個不同於媒體敘事的視角。他說 OpenAI 的研究部門目前大約 400 到 500 人,去年是 300 多人,只成長了 20% 到 30%——公司其他部門翻倍了,但研究團隊刻意維持精簡。他甚至會階段性地凍結招聘,要求主管淘汰表現不佳的人,持續拉高人才密度。他的原則是:不要招到邊際貢獻為零的人,每個人都必須有「極高的正向邊際貢獻」。
至於 Meta 的挖角攻勢,他說得很直接:Meta 找上了他所有的直屬部下,全部被拒絕了。他承認以 Meta 願意開出的價碼(報導指有人拿到一億美元等級的 offer),OpenAI 不可能留住每一個人,但核心高層全都還在,而且非常投入。很多研究員在看到 OpenAI 內部的研發進展後,反而更不想離開——因為他們感覺自己正在見證未來,離開就不再是這台機器的一部分了。
他還提到一個有趣的現象:大部分研究員即使面對 Meta 五倍薪資的誘惑,仍然選擇留下。他認為關鍵原因是,這些人在 OpenAI 內部看到了研究的加速進展,感覺離開就是脫離了最前線——這種使命感比任何金錢數字都更有留人效果。
模型行為的中立性:不推任何政治立場
有人直接挑戰:OpenAI 掌握了這麼大的影響力,會不會有人出一大筆錢來操控模型的輸出方向?
陳信翰回應說,OpenAI 內部有一個「模型行為團隊」(Model Behavior Team),他們的目標是讓模型在預設狀態下保持中立——不偏左,不偏右,但讓使用者可以根據自己的價值觀來引導互動方向。他提到這個團隊的成員在政治光譜上有充分的多元性,其中一位主管就是非常保守派的人。
他也承認這個問題沒有完美答案,表示 OpenAI 願意接受外部稽核,並且花了大量時間在美國和全球各地做調查,試圖找到最「居中」的預設行為。不過他也強調,從經濟誘因來看,OpenAI 沒有理由偏向任何一方——那樣做會失去一半使用者的信任。
短期讓人更有創造力,長期走向極端分化
對談中有一段關於人類未來的討論頗為深刻。有投資人提出一個激進的預測:在現代經濟中已經存在生產者和消費者的區分,而 AI 會把消費者的比例推向 99%——甚至在一百年後,可能只剩一個「超級生產者」搭配五萬個 AI Agent,替所有人工作。
陳信翰沒有否認這個長期趨勢,但他認為短期內,AI 反而會讓更多人變得有創造力。邏輯很簡單:當例行性的執行工作被模型接手後,人們可以把精力集中在構思和創意上。就像影片製作——如果拍攝和剪輯的機械操作變得容易,人們自然會把更多時間花在故事和概念的發想上。
不過他也承認,再往長期看,模型可能會比人類創造出更吸引人的內容,到那時人們可能真的只想跟自己的 AI 朋友互動,不再在意其他人類做了什麼。
批判性思考仍然是最大的差異化能力
有人提出一個尖銳的觀察:隨著模型越來越會批判性思考,人類反而在喪失這項能力。他在面試中發現,很多人已經完全失去了獨立判斷的能力。
陳信翰承認 vibe coding 已經成為年輕一代的預設模式——現在的學生認為用 AI 寫程式是正常的,從頭手寫程式碼反而是額外的技能。這就像他們那一代人看組合語言一樣,已經變成一種「選修」而非「必修」。
但他仍然堅信批判性思考的價值不會消失。在任何領域,能夠獨立思考的人都會勝過只會依賴工具的人,即使每個人手上都有同樣強大的 AI。他在招聘時也刻意避開傳統的大公司式流程,而是去 Twitter 上找有獨特見解的人,或深入特定教授的實驗室建立關係,尋找那些有非傳統背景但思維出眾的人才。
他個人的 AI 使用方式:自動化自己的工作
最後有人問在場每個人怎麼使用 AI,陳信翰的回答出人意料地個人化。
他說自己大量用 ChatGPT 來處理生活中的問題——那些他想問、但害怕被人批判的深度私人問題。因為 AI 不會評判你,它只會傾聽並回應。他說 OpenAI 在訓練模型時,刻意「把批判性去掉了」,讓它成為一個安全的對話空間。
而在工作上,他的野心更大:他想自動化自己的工作。他和研究團隊每天都在把遇到的棘手研究問題餵給模型,讓模型學會處理這些任務。他說,當有一天他寧願花算力跑一個 AI 研究員、而不是聘請一個人類研究員的時候,那就是他可以退休的時候了。
這句話從 OpenAI 首席研究官口中說出來,既是對 AI 能力的最高期待,也是對自身角色最清醒的認知。
我的觀察
這場對談最有價值的,不是任何一個單一觀點,而是它讓人看見 OpenAI 正在執行一套「認知差」策略——利用外界的誤判來建立優勢。
陳信翰整場對談反覆提到一件事:大多數人不知道接下來會發生什麼。這不是客套話,而是 OpenAI 核心競爭邏輯的一部分。最能說明這點的是他對預訓練的態度。過去一年多,業界主流敘事是「scaling 撞牆了,預訓練走到盡頭了,接下來是強化學習的天下」。幾乎所有實驗室都在跟隨這個判斷調整資源配置。但陳信翰站在投資人面前說:這個共識是錯的,我們在預訓練上仍然看到非常多令人興奮的進展。他甚至指出,其他實驗室並非因為算力不夠才轉向 RL,而是做了一個他認為錯誤的策略選擇。換句話說,OpenAI 正在趁全世界往另一個方向跑的時候,悄悄在預訓練賽道上拉開距離。這跟投資領域的逆向操作邏輯如出一轍——而他偏偏是在一場投資峰會上講這些,等於在告訴在場的人:你們認為的共識,可能本身就是最大的錯判。
第二個值得認真對待的訊號是「自動化自己的工作」這句話。當 OpenAI 的首席研究官公開說,他的個人目標是讓 AI 取代自己這個職位,這已經不是謙虛或玩笑,而是一種研究方向的宣示。他和團隊每天把遇到的真實研究難題餵給模型,本質上就是在建構一條「AI 做 AI 研究」的正向回饋迴路。如果這條路走通了,AI 研究的速度將不再受限於人類研究員的數量和工時,而是受限於算力——這又回到了他前面強調的「算力才是真正的戰場」。這幾個觀點串在一起,邏輯是自洽的,也暗示了 OpenAI 的長期圖景比外界理解的更激進。對整個研究人才市場而言,這是一個需要嚴肅面對的結構性變化。
最後,台灣讀者應該注意他談到供應鏈時的措辭方式。他提到台積電和韓國記憶體,是放在「算力戰場的關鍵瓶頸」這個框架裡講的,而不是放在地緣政治的框架裡。這反映了矽谷技術領導者看待台灣的真實視角——台灣的戰略價值,在他們眼中是非常具體的供應鏈節點地位,不是抽象的國際關係敘事。他的原話是系統性地盤點「誰真正重要」,然後確保拿到所有需要的東西。對台灣來說,這既是肯定——我們確實處在這個關鍵位置上;也是警訊——這個位置的價值是功能性的,一旦供應鏈找到替代方案,這個地位就不再穩固。