AI 產業動態

翁家翌:OpenAI 每一個模型背後的那個「賣鏟子的人」

從小學奧數、清華開源作業、天授框架、退學 online,到成為 GPT 系列核心貢獻者——翁家翌的故事是一個關於「資訊平權」與「投資未來」的旅程。但這個熱愛開源的工程師,如何自處於一個閉源的公司?

來源: WhynotTV Podcast

本文整理自 WhynotTV Podcast 第四集,這是一場長達兩小時的深度訪談。


一個從小就在「投資未來」的人

翁家翌的故事要從小學一年級開始說起。

他從小喜歡奧數,做數學題比誰都快。他形容那種感覺是「不用過腦子的,直接表層意識直接過,看一眼答案就出來」。

但他同時也意識到,自己學新東西比別人慢,需要花兩到三倍的時間。所以他從初中就開始「投資未來」——初二的時候學完高中數學,初三開始學微積分。

「與其說我現在浪費時間在刷題上面,那不如學一點對未來有用的東西,後面的收益可能更多。」

這種「投資未來」的思維,貫穿了他整個人生。

清華:打破資訊差

進入清華之後,翁家翌做了一件讓很多學長學姐不高興的事:他把所有作業都開源了

「我想打破這個資訊差。資訊差如果你在清華生存的話,是一個很有用的東西,但我覺得每個人都應該平等地擁有這個資訊。」

他的邏輯是:很多人並不擅長蒐集資料,但他們其實很有能力。如果能給這些人一個資訊平權的機會,他們在清華會活得更好。

這個 GitHub repo 後來成為清華計算機系廣為流傳的資源。翁家翌開玩笑說,現在去清華抓一個計算機系的學弟問「你認不認識翁家翌」,應該是認識的,因為「大家都看我的作業活的」。

天授與 tuixue.online:做慈善的工程師

2020 年疫情期間,翁家翌在家裡做了兩個專案。

第一個是天授(Tianshou),一個強化學習框架。他花了兩週寫出第一版,因為他覺得當時的 RLlib「太複雜了,幾十萬行程式碼,完全不夠人接受」。天授的設計哲學是:程式碼短、抽象做對、你想改什麼地方只有一個地方能改。

第二個是 tuixue.online,一個簽證查詢系統。因為疫情期間各地領事館一直關關開開,他自己有查簽證的需求,就寫了一個爬蟲,然後免費開源給大家用。這個系統的總點擊量超過一千萬。

「我想做一些能夠產生影響力的事情,哪怕是虧錢也行。做天授跟做 tuixue online 都是做慈善,完全 non-profit,然後做這種慈善專案讓我感覺非常滿足。」

他甚至說,比起錢,impact 更讓他滿足

人生的計分方式

翁家翌在高中的時候,腦子裡突然蹦出一個 idea:

「如果人生是一場遊戲的話,那麼你的遊戲結算分數是——記得你名字的人的數量。」

這個想法一直影響著他。他做開源、做免費工具、做能夠幫助別人的事情,某種程度上都是為了讓更多人記得他。

但他強調,這不是追求名望:

「有些名望名氣可能是不好的。我想要的是那種,做一些對大家有意義的事,讓更多的人記得你。」

進入 OpenAI

2022 年,翁家翌加入 OpenAI。面試他的是 John Schulman(張書曼),看中的是他「GitHub 非常漂亮」。

他很清楚自己在 OpenAI 要做什麼——賣鏟子

「我喜歡賣鏟子。如果我做 Infra 的話,大家都用我,所以可以 scale up。我又擅長寫 RL Infra,所以這是個非常適合的機會。」

他給自己設定的職涯指標是:最大化在 OpenAI Blog 上出現名字的次數

怎麼做到?搭建整個 post-training 的 RL Infra。因為每發一個大模型,用到這套 Infra 的團隊都會把他的名字放上去。

從 ChatGPT、GPT-4、GPT-4o 到 GPT-5,翁家翌的名字都在 contributor 名單上。

開源與閉源的矛盾

訪談中有一個很微妙的時刻。主持人問翁家翌:你之前那麼熱愛開源,現在待在一個被批評「跟 Open 沒什麼關係」的公司,這會不會產生衝突?

翁家翌的回答是:

「我覺得這是個 tradeoff。我其實還是很熱愛開源的,如果 OpenAI 有開源的東西,我可能會參與一些。但我覺得我應該去做我自己認為更重要的事情。」

他解釋,OpenAI 不開源是因為「公司要生存」。如果把最好的模型開源,其他人馬上變第一,然後閉源,OpenAI 就融不到資了。

「造福全人類目前的拆解是做產品,然後以盡可能便宜的價格,讓更多人接觸到這個技術。比如免費的 ChatGPT 用戶可以直接接觸到,這可能是更有利於造福全人類的,而不是直接開源丟一個裸的模型權重,那他也不知道怎麼用。」

他甚至透露,John Schulman 曾經問過他要不要把他的 RL Infra 開源,他當時覺得「為了公司的考量」不太好。但 DeepSeek 的出現,讓 OpenAI 內部開始重新評估這件事。

現在的狀態

訪談最後,主持人問翁家翌:你希望十年後的自己是什麼樣的?

他的回答有點出人意料:

「我會希望他做自己那個時候想做的事。然後有足夠的資源、足夠的能力做自己想做的事。」

他說自己曾經想通了想要什麼,但現在又想不通了:

「我手頭上的事,比如說 RL Infra,在很長一段時間都是我想做的事。但隨著時間的推移,逐漸穩定之後,或者說發生了一些事情之後,每個人的重心是會變的。」

「我曾經想通了我想要什麼這個事情,但是我現在又想不通了。我覺得這其實也很正常。」

他最後的留言是:

「去探索自己到底想要什麼。雖然我對這個問題,我曾經一度想通了我自己想要什麼,但是我其實還是沒有那麼想通。這個問題值得用一生去思考。」


我的觀察

翁家翌是一個充滿矛盾的人。

他熱愛開源,在清華開源作業、開發免費的強化學習框架和簽證查詢系統,信奉「資訊平權」。但他現在待在一個被批評「跟 Open 沒什麼關係」的公司,而且是核心成員。

他在訪談中給出了解釋:這是 tradeoff,公司要生存,開源會讓競爭對手拿走成果然後閉源。他甚至重新定義了什麼是「造福全人類」——不是開源模型權重,而是以便宜的價格讓普通人用到產品。

這個解釋合理嗎?

從商業邏輯來看,確實合理。但從一個熱愛開源的人的角度來看,這個解釋是不是有點太圓滑了?

我不知道答案。但我覺得這個矛盾本身就值得思考。

也許我們的邏輯太直線了。我們習慣說「你喜歡 A,所以你應該做 A」,但真實世界不是這樣運作的。一個人可以同時熱愛開源,又選擇待在閉源的公司,只要他能說服自己這是在做「更重要的事」。

這是刻意掩飾嗎?還是人本來就是這麼複雜的動物?

翁家翌說,他曾經想通了自己想要什麼,但現在又想不通了。也許這才是最誠實的答案——我們以為自己有清晰的價值觀,但當現實的 tradeoff 擺在面前,事情就沒那麼簡單了。

這不是批評,這是觀察。而且我覺得,這種矛盾比那些「我很清楚自己要什麼」的宣言,更接近真實的人生。