AI 產業動態

從 Codex 到科學革命:OpenAI 科學副總裁的第一手觀察

OpenAI 科學副總裁 Kevin Weil 在 Cisco AI Summit 上分享,2026 年之於科學研究,就像 2025 年之於軟體工程。他以自身使用 Codex 的經歷為起點,描繪 AI 如何加速科學發現、改變材料科學實驗流程,並預言「高主動性」將成為 AI 時代最稀缺的人類特質。

來源: Cisco AI Summit 2026
從 Codex 到科學革命:OpenAI 科學副總裁的第一手觀察

封面圖

本文整理自 Cisco AI Summit 2026 年 2 月播出的爐邊對話,由 Cisco 總裁暨首席產品長 Jeetu Patel 主持。


一個在科技業最瘋狂的轉彎

Kevin Weil 的職涯路徑,大概是理解當前 AI 浪潮最好的一面鏡子。他在哈佛念物理和數學,拿了史丹佛物理碩士,博士讀到一半就跑去矽谷創業。之後的履歷讀起來像一部矽谷名人錄:Twitter 的產品資深副總裁(帶公司從 40 人衝到 4,000 人、經歷 IPO)、Instagram 的產品副總裁(推出 Stories、用戶從 4 億飆到 10 億)、衛星影像公司 Planet Labs 的總裁(帶公司上市)。2024 年 6 月,他加入 OpenAI 擔任首席產品長。

但真正有意思的是他最近一次轉彎。2025 年 9 月,Weil 把產品長的位子交給前 Instacart 執行長 Fidji Simo,自己轉任一個全新的職位:OpenAI 科學副總裁。他的任務是打造「下一個偉大的科學儀器」,一個用 AI 加速科學發現的平台。從社群媒體產品大神,到 AI 科學革命的推手,這個轉彎本身就在說明一件事:AI 正在把觸角伸向遠超過我們日常使用的領域。

在 Cisco AI Summit 2026 的爐邊對話中,Weil 從這幾個月的第一手經驗出發,描繪了一幅讓人既興奮又有些不安的圖景:AI 改變科學研究的速度,可能比我們想像的快得多。

底層技術每個月都在變,12 個月路線圖已經沒用了

Weil 開場先拿自己在 Twitter 和 Instagram 的經歷做對比。在那個年代,你用的底層技術(資料庫、API 框架)基本上一年比一年好一點點,但本質不變。你知道手上有什麼工具,就在那些工具上蓋東西。產品團隊可以規劃 12 個月的路線圖,然後按表操課。

但在 OpenAI,一切都不一樣了。每個月電腦都能做到以前從來做不到的事。下一季你可能突然擁有今天完全無法想像的能力。在這種環境下,傳統的由上而下管理方式根本行不通。你不可能站在那裡對團隊說「這是我們未來一年的計畫,去執行吧」,因為你根本不知道三個月後的世界長什麼樣子。

Weil 認為,策略和方向當然還是重要的,但執行方式必須徹底改變。現在的時代更適合「由下而上」的創新,讓團隊成員理解大方向之後自主決策、快速行動。他用了一個很直白的說法:這個時代選拔的是 high agency(高主動性)的人,那些不等指令、看到機會就動手的人。

這個觀察其實跟很多企業面臨的困境直接相關。Cisco 總裁 Jeetu Patel 在對話中也坦承,企業的 AI 吸收率(absorption rate)還是太慢。Weil 的回應很簡單:讓所有人都動手試。不要等 AI 完美了才用,因為 AI 的進步模式是這樣的:某個功能一開始只有 5% 到 10% 的成功率,讓人覺得不太靠譜;但三到六個月後,同一個功能突然有了 80% 的成功率,你會覺得沒有它簡直無法工作。如果你不在 5% 的階段就開始嘗試,等它到 80% 的時候你已經落後別人一大截。

Codex 怎麼改變了一個產品副總裁的工作方式

Weil 接著分享了一段很私人的故事。他說自己之前也用 Codex(OpenAI 的程式碼代理工具),但只是偶爾用用,沒有真正改變工作方式。轉捩點出現在他帶領一個小團隊做一款叫 Prism 的新產品時。因為團隊小、人手不夠,他開始親自寫程式碼,並且密集使用 Codex。

有一天他坐在老闆的主管會議裡。會議開始,大家都合上筆電專心開會。Weil 闔上螢幕的那一刻突然想到:糟了,我忘了在關電腦之前給 Codex 派一個任務。這表示他白白浪費了一個小時的生產力,因為 Codex 本來可以在他開會的時候,幫他修一個 bug 或開發一個新功能。

從那之後,他的工作模式徹底改變了。睡前他會想:今晚可以給 Codex 什麼特別困難的任務,讓它在我睡覺的時候工作?他開始同時開十幾條平行任務。當 AI 代理做出不完美的結果,他不是抱怨,而是把問題記錄到代理的設定檔裡,讓它下次不再犯同樣的錯。

Patel 在一旁補充了 Cisco 的數據:目前接近 80% 的工程師已經在日常使用 Codex,而且已經有一個產品團隊是 100% 用 Codex 來開發的。Patel 自己的目標是 2026 年底前至少有半打這樣的團隊。Weil 聽了直說他一定會超標。他觀察到一個很重要的擴散模式:當其他團隊看到那個全面使用 AI 的團隊跑得飛快,自然會問「為什麼我們不能也這麼快?」需求就會從內部自然生長出來。

這段故事之所以重要,不只是因為它展示了 Codex 的能力。更關鍵的是它揭示了一個使用 AI 工具的心理轉變過程。Weil 不是什麼都不懂的新手,他是矽谷頂級產品人,有物理學背景,身處 OpenAI 內部。即便如此,他也是密集使用了一段時間之後,才真正改變思維模式。換句話說,對多數人而言,第一次用 AI 工具的體驗不會很驚豔,你得堅持用下去才能突破那個臨界點。

2026 之於科學,就像 2025 之於軟體工程

講完 Codex 的故事後,Weil 把這個類比直接延伸到科學領域。他說,2025 年初,如果你已經在用 Codex 寫大部分程式碼,你算是早期採用者。但到了 2025 年底,如果你還沒在用 AI 寫程式,你就已經在落後了。短短 12 個月,一個價值數兆美元的產業就完成了典範轉移。

他的核心預測是:科學研究在 2026 年會經歷同樣的事。

Weil 承認他不是在說 2026 年底科學的所有問題都會被解決。當然不會,就像軟體工程的所有問題也沒有被解決一樣。但他預測的是一個不可逆的轉變:2026 年初,正在大量使用 AI 做科學研究的人是早期採用者;到了年底,如果你還沒擁抱 AI 輔助研究,你的競爭對手已經跑到你前面去了。

支撐這個預測的不只是願景,而是已經發生的事實。Weil 提到,光是在 2026 年 1 月,就有好幾個長年懸而未決的數學開放問題,被 AI 驅動的方法(主要是 GPT-5.2)攻克了。這些不是簡單的計算題,而是世界上最頂尖的數學家嘗試了多年都無法解決的問題。AI 不只是在做我們以為它擅長的事(彙整資訊、回答問題),它正在突破人類認知的疆界。

這種突破不限於數學。物理、生物、化學、材料科學,都開始出現類似的跡象。

假說的金屬探測器:材料科學如何被 AI 改造

Weil 舉了材料科學的例子來說明 AI 怎麼具體改變科學研究的流程。傳統的材料科學研究是這樣的:科學家先盡可能綜合所有已知資訊,提出一個假說(比如,我認為某種元素組合可以產生具有某種特性的新材料),然後帶著這個假說走進實驗室,花大量時間和金錢去做實驗驗證。問題在於,真實世界的實驗非常昂貴,而且大部分假說最終會被證明行不通。

一位材料科學家給了 Weil 一個精準的比喻:AI 對我來說,就像是「假說的金屬探測器」。在所有可能的研究方向中,AI 能幫他快速篩選,把不同來源的知識整合在一起,找出最有希望成功的那條路。與其做十個實驗然後九個失敗,科學家可以更精準地鎖定那個最可能成功的方向。光是這一點,就是一種巨大的加速。

但 Weil 描繪的未來不只是幫科學家選更好的假說。他認為很快我們就會看到一個完整的閉迴路系統:AI 先幫忙篩選和設計實驗方案,然後把實驗指令送到機器人手臂操作的自動化實驗室,機器人可以 24 小時不間斷地跑實驗,而且可以大規模平行化(你想跑多少組同時跑都行)。實驗結果再自動回傳給 AI,AI 根據結果進一步推理、設計下一輪實驗,如此循環。

想想這跟傳統研究的差距有多大。傳統上,研究生得自己操作移液管,做完一組實驗可能就是一天,然後還得睡覺、上課、寫論文。AI 加上機器人的閉迴路系統不需要休息,可以水平擴展,而且每一輪迭代的品質都在提升。Weil 說這種模式今年就會開始出現,很快就會成為常態。

如果這個願景成真,科學研究的瓶頸將從「人力不夠」變成「算力和實驗設備不夠」。遊戲規則完全不同了。

當模型比你聰明,誰來判斷它對不對?

不過 Weil 也沒有迴避一個棘手的問題:當 AI 模型在某個科學領域的前沿解決問題時,我們怎麼知道它的答案是對的?

他解釋說,在任何一個科學領域的最前沿,AI 對的機率和錯的機率差不多。模型可能產出一個看起來很漂亮的證明或假說,但裡面可能有微妙的錯誤。要判斷這些細微差異,需要那個領域最頂尖的少數幾個人才有能力。即便是 Weil 本人,雖然有物理學碩士學位,也坦承自己無法判斷模型在物理前沿的輸出是否正確。

所以 OpenAI 做了一件有意思的事:他們從大學延攬了頂尖學者(不是辭職,是以留職停薪或兼任的方式)加入 AI for Science 團隊,因為只有這種等級的專家才能建構有效的評估標準(evals)。

但 Weil 也承認,這個做法有其極限。總有一天,模型的能力會超過任何單一人類專家的判斷能力。到那個時候,我們可能不得不用模型來評估模型,用上一代的 AI 來設計下一代 AI 的考題。這聽起來有點自我循環的味道,但 Weil 覺得這是必然的方向。

這是整段對話中最值得深思的片段之一。我們習慣了用人類專家來驗證工具的輸出,但當工具的能力超過了人類專家,驗證機制本身就面臨根本性的挑戰。這不是一個遙遠的哲學問題,在某些數學和科學子領域,這個情境已經開始出現。

人類不會滿足於吃葡萄和寫詩

對話尾聲,Patel 問了一個很多人都在想的問題:當 AI 變得越來越強大,社會要怎麼適應?全民基本收入(UBI)是不是遲早會來?

Weil 的回答很坦誠:他不知道 UBI 會不會成為必要,但他很確定一件事。他不認為人類會滿足於「坐在那裡吃葡萄、領 UBI 支票、寫寫詩」的生活。人類天生就有追求更大目標、完成某件事的渴望,這個本能不會因為 AI 而消失。這也是他對人類適應 AI 變革保持樂觀的根本原因。

他用搭 Waymo(Google 旗下的自駕計程車)的經驗來類比人類適應 AI 的速度。第一次坐上 Waymo 的前十秒,你會緊張得要命,看到腳踏車就想大叫「小心!」但五分鐘後,你開始覺得「哇,我正在被機器人載著逛舊金山,這太未來了」。再五分鐘後,你已經無聊到在滑手機了。一個剛才還讓你驚嘆不已的技術,十分鐘就變成了理所當然。

同樣的事情正在科學領域發生。半年前,AI 能解開數學開放問題這件事根本是天方夜譚。現在它做到了,人們的反應卻是:「嗯,但那又不是黎曼猜想。」我們對 AI 成就的期望值,永遠在以指數速度上升。

那在這個 AI 什麼都能做的時代,什麼才是稀缺資源?Weil 的答案不是算力(雖然算力確實稀缺),而是判斷力和主動性。他認為這個時代最選拔的,是那些具備高主動性(high agency)的人:有了想法就去做,不等別人許可,早上想到一個點子、下午就有原型、晚上就在迭代。過去,如果你不是工程師,一個涉及程式碼的想法可能永遠停留在想法階段。現在你只要寫一段 prompt 給 Codex,一個小時後就有可運行的版本了。

創造力的門檻從來沒有這麼低過。但門檻低了,不代表所有人都會走過去。願意走過去的人,就是 Weil 所說的 high agency 的人。

我的觀察

這段對話最讓我觸動的,不是 AI for Science 的宏大願景,而是 Weil 那個「忘了給 Codex 派任務」的小故事。一個矽谷頂級產品人,在 OpenAI 內部,都需要經過一段密集使用期才能真正改變工作模式。這暗示了什麼?對大多數人來說,AI 工具的學習曲線不是「我知道它很強」就能跨過的,你得真的沉浸進去,讓它變成你的肌肉記憶。

Weil 提到的「吸收率」問題,在臺灣的場景裡感受特別深。很多企業和研究機構都知道 AI 很重要,也買了工具、辦了培訓,但實際的使用率還是偏低。根據我的觀察,最大的瓶頸往往不是技術,而是心態:「等它成熟了再用」「先觀望一下」「我的領域比較特殊,AI 不太適用」。但 Weil 的 5%-to-80% 模型告訴我們,如果你等到 80% 才開始,你已經少了半年的學習時間,而你的競爭者已經跑了半年。

AI for Science 的部分讓我想到臺灣的幾個強項。半導體材料的研發、生醫領域的蛋白質研究、精密製造的品質預測,這些都是可以直接受益於 Weil 描述的「AI 閉迴路實驗系統」的領域。臺灣有世界頂尖的半導體材料專家,如果他們願意成為 AI 輔助研究的早期採用者,而不是等到變成標準配備才跟進,可能在國際競爭中取得不對稱的優勢。

最後,Weil 關於科學評估的擔憂值得認真對待。當 AI 的推理能力超越人類審查者的理解能力,我們面對的已經不是技術問題,而是認識論層面的挑戰:我們怎麼相信一個自己無法完全理解的系統?這不是科幻小說的情節,在數學和某些物理子領域,這個問題現在就擺在桌上。整個科學社群需要開始認真思考新的驗證機制,而不是等問題爆發才回頭處理。