AI 產業動態

「每家 Infra 都有 bug,誰修得多誰就贏」—— OpenAI 核心工程師談 AI 競賽的真正戰場

OpenAI 核心工程師翁家翌在訪談中揭示 AI 競賽的殘酷真相:決定勝負的不是演算法創新,而是 Infra 的 bug 數量和迭代速度。這個觀點徹底顛覆了學術界對 AI 研究的想像。

來源: WhynotTV Podcast

本文整理自 WhynotTV Podcast 第四集,嘉賓為 OpenAI 核心工程師翁家翌。


一個反直覺的觀點

在 AI 領域,我們習慣聽到的成功故事通常是這樣的:某個天才研究員提出了突破性的演算法,然後改變了世界。

但翁家翌在訪談中說了一句話,徹底顛覆這個敘事:

「每家的 Infra 都有不同程度的 bug,然後誰修的 bug 越多,那誰的模型性能就越好。」

這不是謙虛,這是他在 OpenAI 三年多的實戰經驗。

Infra 才是真正的戰場

翁家翌是 OpenAI 從 ChatGPT、GPT-4、GPT-4o 到 GPT-5 背後的核心貢獻者。他的貢獻可以用三個關鍵字概括:強化學習、post-training、Infra。

但他自己最認同的身份是「賣鏟子的人」。

「我喜歡賣鏟子。如果我做 Infra 的話,大家都用我,所以可以 scale up。我又擅長寫 RL Infra,所以這是個非常適合的機會。」

他甚至給自己設定了一個職涯指標:最大化自己在 OpenAI Blog 上出現名字的次數

怎麼做到?不是發論文,而是搭建整個 post-training 的 RL Infra。因為每發一個大模型,用到這套 Infra 的團隊都會把他的名字放上去。

演算法創新沒那麼重要

這個觀點可能會讓很多學術研究者不舒服,但翁家翌說得很直接:

「如果你把 bug 全修了,那你有可能演算法連改都不用改,就很好。」

他解釋,目前前沿 AI Lab 的研究,拼的都是 Infra 的正確性。如果你的 Infra 正確,剩下的就是看單位時間內能迭代多少次。

「Idea 非常便宜,你要做的就是在單位時間內能夠驗證多少有效的 idea。」

那些有強烈 research 直覺的人?翁家翌說,那些人「就那些人」——從 GPT-1 時代就開始做的資深研究員。對於其他人來說,與其動腦想演算法,不如把 Infra 修好。

DeepSeek 真正讓 OpenAI 緊張的地方

訪談中有一個細節很值得注意。主持人問翁家翌,外部競爭(包括中國的大模型公司)會不會傳導到 OpenAI 內部?

翁家翌的回答是:「不太會,除了 DeepSeek 那一波。」

為什麼?不是因為 DeepSeek 在榜單上贏了,而是因為:

「他們在 Twitter 上聲稱他們的迭代速度非常快。這引起了很多人的警覺,因為內部的迭代速度其實相比於其他是有點慢的。」

OpenAI 內部因此決定重構整個 Infra,翁家翌目前就在做這件事。

他甚至直接說,OpenAI 在「單位時間迭代速度」這個指標上,肯定不是全世界第一

未來大模型的瓶頸在哪?

訪談最後,主持人問翁家翌:未來大模型加強化學習這條路,最大的瓶頸會在哪?

他的答案依然是 Infra:

「瓶頸在於修 Infra 的 throughput,你單位時間內能修多少 bug,以及單位時間內能迭代多少次、能正確的迭代多少次。剩下不重要。」


我的觀察

翁家翌的觀點對台灣 AI 產業有很深的啟示。

我們的學術環境還在教學生追逐論文數量,但業界真正需要的是修 bug 的速度。這不是說研究不重要,而是說在當前這個階段,工程執行力的權重被大幅低估了。

台灣有很多優秀的軟體工程師,但我們可能還沒意識到,這群人在 AI 時代的價值可能比我們想像的更高。

當全世界都在搶 AI 研究員的時候,真正稀缺的可能是那些能把 Infra 修對、讓迭代速度飆上去的工程師。

這是一個值得重新思考的人才觀。