AI 產業動態

OpenAI 推理模型之父離職:不是公司不好,是我想做沒人敢做的事

Jerry Tworek 在 OpenAI 待了七年,主導了 Q-Star、Strawberry、O1 等推理模型的開發。他為什麼選擇離開?這位親歷者怎麼看 OpenAI 的困境、Google 的追趕、Anthropic 的崛起,以及整個 AI 產業的同質化危機?

來源: Core Memory Podcast

本文整理自 Core Memory Podcast 於 2026 年 1 月播出的訪談。


Jerry Tworek 在 OpenAI 待了七年。他加入時公司只有三十個人,離開時已經膨脹到三千人。這七年間,他參與了這家公司最重要的幾個專案:從早期的 Dota 遊戲 AI,到後來定義整個產業走向的推理模型 Q-Star、Strawberry、O1。

2026 年 1 月,他在 X 上宣布離職,整個 AI 圈都在問:為什麼?

在 Core Memory Podcast 的這場訪談中,Tworek 給出了答案。但這個答案比大多數人想像的更複雜,也更值得深思。

不是公司不好,是路線分歧

Tworek 在訪談中反覆強調一件事:他不是因為對 OpenAI 失望而離開。

「有時候人會走到一個點,覺得彼此的路必須分開。」他說,「對一家公司來說,內部的人對目標和路線有共識是非常重要的。而在某個時刻,我對前進方向的想法,和 OpenAI 選擇的路線產生了足夠大的分歧。」

這個分歧是什麼?Tworek 沒有明說,但他點出了幾個結構性的問題。

第一個問題是組織架構。當公司有了組織圖,每個團隊就需要有自己的身份認同、研究範疇、負責的問題集。跨組織的研究變得很難做。Tworek 用了一個業界常見的說法:「你在交付你的組織圖。」意思是,你做的專案往往是組織結構允許你做的專案,而不是你真正想做的專案。

第二個問題是風險承受度。當一家公司必須在激烈的競爭中維持領先,每一季都要證明自己有最好的模型,願意承擔的風險自然就會降低。「展現實力、持續擁有最好的模型,對所有主要 AI 公司來說都非常重要。」Tworek 說,「但這確實會影響你願意承擔多少風險。」

他想做的研究,是 OpenAI 現有的組織架構不太容易支持的那種。

全世界都在做一樣的事

讓 Tworek 真正感到憂心的,不只是 OpenAI 的問題,而是整個產業的問題。

「我非常、非常難過的是,所有 AI 實驗室都在試圖做跟 OpenAI 一樣的事。」他說,「OpenAI 顯然是一家非常成功的公司,做對了很多事,把世界帶進了 scaling transformer 的典範。但我們到底需要多少家公司做完全一樣的事?」

他算了一下:現在有五家認真在做大規模 AI 的公司,用的是完全一樣的配方,只是試圖在同樣的技術上蓋出稍微不同的產品。

「如果你看現在世界上最好的那些模型,很少有人能真正分辨它們的差異。」Tworek 說,「我覺得應該要有更多盲測,讓人跟一個模型對話、再跟另一個模型對話,看看他們能不能分辨出哪個是哪個。我認為 99.9% 的使用者分辨不出來。」

這種同質化讓他很擔心。如果大家都在做一樣的事,那創新在哪裡?差異化在哪裡?

對於想做不一樣研究的人來說,現在幾乎找不到地方可去。這是他離開後面臨的最大挑戰:「如果你想做跟 ML 主流不一樣的事,很難找到地方做。這是我最難過的一點。」

Google 追上來,是 OpenAI 自己掉球

訪談中有一段很直接的評論。主持人問 Tworek 怎麼看 Google 最近的追趕,他的回答出乎意料:

「坦白說,你應該把 Google 的追趕看成 OpenAI 自己掉球。」

他解釋,OpenAI 有先發優勢、有資源、有人才,照理說應該一直保持領先。但如果你在過程中做了錯誤的決定,而別人做了對的決定,差距就會縮小。

「Google 有很多優勢,硬體、人才都是。當 OpenAI 剛成立的時候,Google 在幾乎所有機器學習的面向都是第一名。OpenAI 能夠差異化的方式,主要是對某個特定方向、特定路線的研究信念。」

有趣的是,這個信念花了很長時間才被世界認可。Tworek 回憶,即使在 GPT-2、GPT-3、GPT-3.5 訓練出來的時候,也沒有太多人當回事。「你去 NeurIPS,跟很多研究員聊,OpenAI 當時已經算酷了,但其他實驗室的態度是:喔,我們也會複製一下,那些語言模型蠻有趣的,但也就那樣。」

直到 ChatGPT 開始賺錢,其他公司才驚覺:這東西是真的。但這也給了 OpenAI 一段巨大的時間窗口,從開始建技術到商業化,競爭對手都還沒認真。Google 是在那之後才開始認真訓練大型語言模型的。

「透過 OpenAI 自己掉球,現在 Google 在能力和模型上已經非常接近了。恭喜 Google,恭喜所有把那些團隊轉向、讓他們好好執行的人。那肯定是很多很棒的工作。」

Anthropic 讓他印象深刻

當被問到哪個實驗室讓他最印象深刻,Tworek 毫不猶豫:Anthropic。

「過去一年,Anthropic 讓我印象深刻的程度大幅增加。」他說,「我不是一個很在意模型個性的人,雖然聽說 Claude 的個性很好。但他們在 coding model 和 coding agent 上做的事,還有他們為此建立的品牌,以及那麼多開發者對他們的喜愛,絕對是了不起的成就。」

更讓他佩服的是 Anthropic 的處境:他們起步比 OpenAI 晚,算力更受限,團隊更小。但他們有專注,有出色的執行力,即使在取得好的算力上遇到很多困難,還是做出了非常優秀的產品。

「Claude Code 被開發者普遍喜愛的程度,從 ChatGPT 以來沒見過。」主持人補充。

Tworek 承認自己在 OpenAI 時沒怎麼用過 Claude Code(畢竟他是員工),「但光從 Twitter 上的情緒來看,Claude 真的被全世界的開發者愛著。」

波蘭幫與努力工作的價值

訪談中有一段有趣的閒聊,關於 OpenAI 早期的「波蘭幫」。

Tworek 來自波蘭,而 OpenAI 早期有相當高比例的波蘭人。主持人問這是不是跟前蘇聯的數學教育有關,Tworek 笑說他自己當初是完全隨機加入 OpenAI 的,之前並不認識公司裡的人。

但他確實觀察到波蘭人的一個特質:努力工作。

「隨著時間過去,在很多已開發國家,人們越來越不那麼強調努力工作了。」他說,「生活可以很好,人生有很多其他事情可以強調和優先。但波蘭人真的很在乎。」

他把這歸因於波蘭的歷史。他出生那年,波蘭剛從共產主義轉型到自由市場經濟。「有點殘酷,但波蘭社會真的擁抱了這個改變,試圖變得有創業精神,知道必須為自己的未來和繁榮而努力。」

每次回波蘭,他都看到國家變得更好、更美、更繁榮。「這是一個很棒的故事。」

他用一句話總結波蘭人:「非常努力工作,不搞那些有的沒的。這在人生中可以讓你走得很遠。」

我的觀察

聽完這場訪談,有幾件事讓我印象深刻。

第一,頂尖研究員的「出走」其實是健康的信號。

Tworek 離開 OpenAI,不是因為失敗,而是因為他想做的事跟公司的方向不同。這種分歧在任何高速成長的組織都會發生。當一家公司從三十人變成三千人,它必然會變得更結構化、更風險趨避、更難支持那些「不知道會不會成功」的瘋狂想法。

這不是 OpenAI 的問題,而是所有大公司的結構性挑戰。真正值得擔心的不是頂尖人才離開,而是他們離開之後有沒有地方可去。如果整個產業都在做一樣的事,那些想嘗試不同路線的人就無處可去。這才是 Tworek 真正在意的問題。

第二,領先者優勢為什麼常常守不住。

Tworek 說 Google 追上來是因為 OpenAI「自己掉球」,這個觀點很值得玩味。

在商業史上,領先者被後來者追上的故事太多了。領先者有資源、有人才、有先發優勢,照理說應該一直贏。但領先者也有包袱:既有的成功模式讓你不敢嘗試新東西,龐大的組織讓你動作變慢,對市場的自信讓你忽略競爭對手的進步。

OpenAI 從 GPT-2 到 ChatGPT 之間有好幾年的領先時間,但這段時間裡,其他人也沒閒著。一旦 ChatGPT 證明了這東西能賺錢,所有人都全力投入了。領先者的窗口比想像中短。

第三,Anthropic 的故事說明專注的力量。

Anthropic 的資源比 OpenAI 少,起步比 OpenAI 晚,但他們在 coding 這個領域建立了極強的品牌和用戶喜愛度。Tworek 把這歸功於「專注」和「執行力」。

這對台灣的 AI 發展或許有啟示。我們不可能在算力上跟美國的大型實驗室競爭,但有沒有可能在某個特定領域建立專注的優勢?當所有人都在做一樣的事,做不一樣的事反而可能是機會。

當然,這需要願意承擔風險的人,也需要能夠支持這種風險的環境。Tworek 說他是「風險容忍度最高的人之一」,願意把接下來的時間拿去賭一兩個大膽的研究方向。這種人在任何地方都是稀有的。

問題是:我們的環境能不能讓這種人有地方發揮?