AI 產業動態

OpenAI 元老的創業啟示:「和平時期」vs「追趕模式」,新創該選哪條路?

John Schulman 比較早期 OpenAI 與現在 AI 新創的處境:前者是「和平時期」可以探索,後者被迫先追趕 state-of-the-art。但他刻意在 Thinking Machines 避免純追趕模式——因為探索性研究的肌肉,晚了就練不起來。

來源: Cursor Podcast

本文整理自 Cursor Podcast 對 John Schulman 的訪談。


John Schulman 是 OpenAI 共同創辦人、PPO 演算法發明者。他在 OpenAI 待了近十年,見證了公司從小型研究群變成全球 AI 領頭羊的過程。2024 年離開後,他創辦了 Thinking Machines。

在這場訪談中,他反覆提到一個對比:早期 OpenAI 的「和平時期」,對比現在 AI 新創的「追趕模式」。這個觀察對所有想進入 AI 領域的創業者,都有深刻啟示。


早期 OpenAI:沒有人知道該往哪走

Schulman 回憶,2015-2016 年的 OpenAI 更像學術研究群——ragtag(雜牌軍)風格,一到三人的小團隊根據個人品味做研究。

「當時有 DeepMind,但不是每個人都在同一個方向競爭。沒有一個明確的軸線讓大家都想要去 scale。」

他用一個詞形容:peacetime(和平時期)。和平時期的特徵是沒有明確的「正確答案」要追趕,可以做探索性研究,可以嘗試看起來瘋狂的想法,失敗的成本相對低。這種環境催生了大量探索性工作。雖然很多專案失敗(如 Universe、機器人專案),但也培養了做大型研究工程專案的能力。


現在的 AI 新創:被迫先追趕

對比之下,2024-2025 年成立的 AI 公司處境完全不同。

Schulman 說:「現在的公司更被迫進入追趕模式,必須先複製 state-of-the-art。」

原因很直接:領域進展太快,其他公司都在快速前進,投資人和客戶期待你至少能達到基準線,不追上基本盤就沒有資格談創新。這是 wartime(戰時) 的特徵。


Schulman 的刻意選擇:不能只追趕

有趣的是,Schulman 在 Thinking Machines 刻意避免純追趕模式。

「我非常意識到這點,一直在確保我們不只是在追趕模式。我們也在建立做探索性研究的肌肉,探索不一定沿著主流路徑的新想法。」

他給出的理由很關鍵:

「如果你只在追趕模式,之後就很難建立探索性研究的肌肉。文化這東西,晚了就很難建立。」

這是個組織能力的論述。追趕和探索需要不同的技能、不同的思維方式、不同的容錯空間。一個習慣追趕的團隊,很難突然切換成探索模式。


Universe 專案的教訓:正確但太早

Schulman 舉了 Universe 專案為例。這個專案想建立大量 RL 環境(電玩、網頁導航),訓練出能泛化的通用 agent。

他的評價:「這是個 deeply correct idea,但太早了——可能早了十年。」

當時缺乏太多前提條件:系統笨重難用,從零訓練的模型無法泛化,基礎設施不成熟。專案失敗了,但團隊縮小範圍到模擬器電玩,獲得更好成果。而現在,2026 年,大規模 RL 環境訓練終於變得可行。

這說明什麼?探索性研究的價值不是立即的。它建立的是認知、是方向感、是「知道什麼可能有用」的直覺。


我的觀察:台灣 AI 新創的兩難

這個「和平 vs 戰時」的框架,對台灣 AI 新創特別有啟發。

台灣的處境是雙重追趕:技術上追趕 OpenAI、Anthropic、Google 的模型能力,市場上追趕已經拿到大客戶的國際競爭者。在這種壓力下,幾乎所有資源都會被吸進「追趕模式」。先做出能用的東西,先拿到客戶,先活下來。

但 Schulman 的警告值得深思:純追趕模式會讓你失去探索的能力。

這不只是「沒時間創新」的問題。而是組織的肌肉、文化、思維方式都會被塑造成追趕型態。等你終於追上了,想要創新,卻發現團隊不會、不敢、也不想做探索性嘗試。

Schulman 的做法是「同時進行」——追趕的同時,保留一部分資源做探索。對資源有限的新創來說,這很奢侈。但或許可以這樣思考:定義你的「探索預算」,即使只有 10-20% 的時間,也要保護它。選擇有槓桿的探索方向,不是漫無目的的研究,而是「如果成功,能帶來不對稱優勢」的嘗試。接受多數探索會失敗,這是探索的本質,不是管理失敗。記錄和累積,即使專案失敗,學到的東西要沉澱下來。

Universe 專案「失敗」了,但培養了 OpenAI 做大型工程研究的能力。十年後,這些經驗變得無價。

和平時期做的探索,是戰時的彈藥庫。

問題是:你有沒有在打仗的同時,偷偷存一點彈藥?