AI 技術前沿

OpenAI 內部人士:2026 是 Agent 元年,但最大瓶頸不是算力

OpenAI Codex 負責人 Alexander Embiricos 揭示 AI agent 發展的真正瓶頸:不是算力,而是人類的打字和審核速度。他預測 2026 年新創公司將率先看到生產力的 hockey stick 曲線,因為它們可以從零設計對 agent 友善的系統架構。

來源: Lenny's Podcast

本文整理自 Lenny’s Podcast 2024 年 12 月播出的單集,主持人 Lenny Rachitsky 專訪 OpenAI Codex 產品負責人 Alexander Embiricos。 收聽連結:YouTube


一個前創業者的震撼

Alexander Embiricos 在加入 OpenAI 之前,自己經營了五年的新創公司。他以為自己知道什麼叫「快」。

結果他錯了。加入 OpenAI 之後,他發現自己對「速度」和「野心」的理解需要徹底重建。他在訪談中坦承,這是一個有點難為情的體悟——每個創業者都覺得自己的公司夠快、團隊夠強、目標夠遠大。但 OpenAI 讓他意識到,那些都還不夠。

這種速度有數字可以佐證。Codex(OpenAI 的程式碼 agent)幾個月內成長了十倍,「之後又成長了更多」。Sora 的 Android app 從零到上線只花了 28 天,然後登上 App Store 第一名。這不是漸進式改善,是不同量級的執行力。

但真正讓我注意的,不是這些數字,而是 Embiricos 對 AI agent 未來瓶頸的分析。他的觀點跟主流敘事不太一樣。


「聰明的實習生,但不讀 Slack」

要理解 Embiricos 的觀點,首先要理解 Codex 現在是什麼、還不是什麼。

Codex 是一個程式碼 agent。你可以把它裝進 VS Code,給它一個任務——修 bug、寫功能、理解程式碼——它會去執行。它可以跑測試、讀檔案、寫程式碼,做很多軟體工程師日常在做的事。

Embiricos 用了一個比喻:Codex 現在就像一個「非常聰明的實習生,但這個實習生拒絕讀 Slack,除非你叫它看 Datadog 否則它不會去看」。

這個比喻很精準。不管實習生多聰明,如果它不知道公司正在發生什麼、不知道上下文、不知道哪些事情重要,你能信任它做多少事?你還是得一直盯著它、給它指令、審核它的產出。它是一個需要大量管理的聰明工具,還不是可以獨立運作的隊友。

Codex 團隊的目標是讓它從「實習生」變成「真正的隊友」。這意味著什麼?Embiricos 說,真正的隊友不只是執行你交代的任務。你剛招進來一個人,一開始你會給他具體的工作、跟他對齊方向、讓他熟悉程式碼。但最終,你希望他能自己判斷什麼事情該做、主動發現問題、不需要你一直管。

這就是他們說的「proactivity」(主動性)。一個有主動性的 agent,不只是等你下指令,而是會去讀 Slack、看監控儀表板、發現有個指標掉了、甚至在你還沒注意到之前就提出修復方案。


瓶頸不在算力,在人類打字速度

當主持人問 Embiricos 對 AGI 時程的看法時,他給了一個出乎意料的答案。

他說,目前被低估的限制因素是「人類打字速度」和「人類審核速度」。

這聽起來有點荒謬。我們不是一直在討論算力不夠、GPU 短缺、資料中心蓋不夠快嗎?怎麼會說瓶頸是人類打字速度?

但仔細想想,這觀察很到位。今天你用任何 AI 工具,流程大概是這樣:打一段 prompt,AI 給你輸出,你審核,給反饋,AI 再改,你再審核。這個迴圈的速度,完全被人類的打字速度和審核速度卡住了。

假設 AI 可以在五分鐘內幫你寫完一個功能的程式碼。但你要花二十分鐘審核那段程式碼、確認它是對的、跑測試、確認沒有 bug。然後你發現有問題,又要花時間描述問題、等 AI 改、再審核。這個過程裡,AI 在等你的時間,遠遠多於你在等 AI 的時間。

Embiricos 描述了一個更極端的情境:想像未來 agent 一天可以幫你做一千件事。如果每一件事都需要推播通知你、等你審核確認,你會收到一千則通知,這不是加速,這是災難。

所以真正的突破點不是讓 AI 更快或更聰明,而是讓 AI 能夠自己驗證自己的工作。當 agent 可以自己跑測試、自己確認結果正確、只在真的需要人類判斷時才來找你,那時候生產力曲線才會真正起飛。


Hockey Stick 會從新創開始

Embiricos 對時程的預測是這樣的:從明年(2026)開始,早期採用者——特別是新創公司——會開始看到生產力的「hockey stick」曲線。

為什麼是新創?因為新創可以從零開始設計系統。如果你今天創業,你可以選擇一套對 agent 友善的技術架構:良好的測試覆蓋率、清楚的程式碼結構、讓 agent 可以自己驗證工作的流程。在這種環境下,agent 可以更自主地運作,需要人類介入的頻率更低。

但如果你是大企業——假設你在 SAP 工作——情況完全不同。你有幾十年累積的複雜系統,這些系統不是為 agent 設計的。你不能期待 agent 明天就能在這些系統裡自主運作。你需要逐步改造:也許先從某些模組開始,慢慢擴大 agent 可以處理的範圍,同時建立讓 agent 可以自我驗證的機制。

這帶來一個有趣的動態:接下來幾年,新創跟大企業在 AI 生產力上的差距會擴大,不是縮小。新創可以直接跳到新的工作模式,大企業需要時間轉型。對新創來說,這是一個用執行速度彌補資源劣勢的窗口。

Embiricos 說,在那個「模糊的中間地帶」,當 hockey stick 開始回流到 AI 實驗室本身——當 AI 可以顯著加速 AI 的研發——那就是 AGI 級別的里程碑。但他認為這會是漸進發生的,不會是某一天突然宣布「AGI 達成了」。


對個人的啟示

如果 Embiricos 的分析是對的,這對個人意味著什麼?

首先,學會用 agent 是一種新的核心技能。這不只是會用 ChatGPT 聊天,而是知道怎麼把 agent 整合進工作流程、怎麼設計讓 agent 可以自我驗證的環境、怎麼有效地分配人類注意力和 agent 執行力。

其次,審核能力變得比執行能力更重要。當 agent 可以處理越來越多執行層面的工作,人類的價值會往「判斷」和「品質把關」移動。你不需要自己寫每一行程式碼,但你需要能判斷 agent 寫的程式碼是不是好的、是不是符合整體架構、有沒有潛在的問題。

最後,這是一個重新思考工作流程的時機。你現在的工作方式,有多少是被「等待 AI 回應」或「審核 AI 產出」佔據的?有沒有辦法讓某些步驟自動化驗證,減少人工介入?這些問題的答案,可能決定了你能不能趕上那條 hockey stick 曲線。

瓶頸不在算力。瓶頸在我們自己。