AI 技術前沿

Karpathy:「這是 Agent 的十年,不是 Agent 的一年」

當各大 AI 實驗室都在喊 2025 是 Agent 元年時,Andrej Karpathy 潑了一盆冷水:真正可用的 Agent 還需要十年。這個判斷來自他 15 年的 AI 經驗,以及對業界預測紀錄的觀察。

來源: Dwarkesh Podcast

本文整理自 Dwarkesh Podcast 2025 年 10 月播出的單集。


「這是 Agent 的十年,不是 Agent 的一年。」Andrej Karpathy 這句話是對業界的直接回應。不知道是哪家實驗室先說的,但「2025 是 Agent 元年」這個說法在圈子裡傳開了。Karpathy 看到這些預測時被「觸發」了——他的原話是 triggered——因為在他看來,這種過度樂觀的預測已經成為 AI 產業的慣性毛病。

Agent 現在到底缺什麼?

Karpathy 使用 Claude 和 Codex 這類工具,而且是每天使用。他認為這些早期 Agent「極其令人印象深刻」。但當你問他:什麼時候這些 Agent 可以取代你的員工或實習生?他的答案很直接:現在不行,因為它們就是不能用。

具體來說,它們缺什麼?Karpathy 列了一串:智能還不夠、多模態能力不足、電腦操作能力有限、沒有持續學習能力。最後一點他特別強調——你沒辦法告訴它一件事,然後期待它記住。每次對話開始,它都是從零開始的狀態。這些「認知缺陷」讓 Agent 在實際工作環境中根本派不上用場。

他用了一個類比:想像 Agent 是你要雇用的實習生。你會讓現在的 Claude 或 Codex 獨立處理工作嗎?答案顯然是不會。它們可以幫忙做一些事情,但離「可以放手讓它們去做」還差很遠。這中間的差距,就是需要十年來填補的。

為什麼是十年?不是一年,也不是五十年?

主持人 Dwarkesh 問了一個關鍵問題:你憑什麼判斷是十年?這種時間表從何而來?

Karpathy 承認這很大程度是直覺,但這個直覺有 15 年的經驗支撐。他見過太多人做預測,也見過這些預測如何落空。他經歷過 AlexNet 帶來的「地震級轉變」,經歷過深度強化學習的遊戲熱潮,也經歷過那些熱潮如何冷卻。這些經驗給了他一個校準過的內部時鐘。

他的判斷邏輯是這樣的:問題是「可處理的」(tractable)、是「可克服的」(surmountable),但仍然「困難」。如果把所有這些因素平均一下,感覺就是十年左右。這不是精確的計算,而是一種對技術難度的整體評估。

歷史教訓:我們一直太早嘗試做 Agent

Karpathy 回顧了 AI 發展的幾個階段,指出一個有趣的模式:人們總是太早嘗試建構完整的 Agent。

第一次是 2013 年前後的深度強化學習熱潮。DeepMind 用神經網路玩 Atari 遊戲,整個領域都被這個方向吸引了。OpenAI 早期也投入大量資源在遊戲上。Karpathy 當時就對此持懷疑態度——他想要的是能做知識工作的 Agent,比如會計師,而不是會打遊戲的 AI。遊戲怎麼能通往 AGI?

他在 OpenAI 的專案是 Universe 計劃的一部分,讓 Agent 用鍵盤和滑鼠操作網頁。這個方向在概念上是對的,但時機完全錯誤。因為如果你只是「亂按鍵盤亂點滑鼠」試圖從環境中獲得獎勵,獎勵訊號太稀疏了,你永遠學不會任何東西。你會燒掉一整片森林的算力,卻什麼都得不到。

問題出在哪?缺少神經網路的表徵能力。今天的電腦操作 Agent 之所以有可能,是因為它們建立在大型語言模型之上。你必須先有語言模型,先有表徵能力,先完成預訓練,然後才能在上面疊加其他東西。這個順序不能亂。

這段歷史給 Karpathy 的教訓是:人們反覆嘗試「太早做完整的東西」。Atari 是這樣,Universe 是這樣,現在的 Agent 熱潮可能也是這樣。每次我們都必須先退一步,把基礎打好,然後才能往前走。

對開發者和創業者的意義

如果 Karpathy 是對的,那麼現在的 Agent 熱潮意味著什麼?

他沒有說這是泡沫,也沒有說不應該投入。他說的是:要有正確的時間預期。Agent 會變得更好,會變得很棒,但這是一個十年的旅程,不是一年的狂歡。那些喊著「Agent 元年」的人,很多只是在募資。這是他的原話:「很多(誇大的預測)老實說就是募資。」

對於正在這個領域工作的人,他的建議可能是:做好長期投入的準備,不要被短期的 demo 迷惑。他特別強調「demo 到產品」的差距。他在 Tesla 做自動駕駛的五年經驗告訴他,demo 可以在很早就做出來,但產品需要「走過一個又一個的 9」——從 90% 成功率到 99%,到 99.9%,每個 9 都需要同樣多的工作量。

現在的 Agent 可能在 demo 階段看起來很厲害,但要變成可以信任的產品,還有很長的路要走。這不是悲觀,而是務實。Karpathy 說他其實是樂觀的——他相信問題可以解決。他聽起來悲觀,只是因為他在回應 Twitter 上那些「對他來說毫無意義」的過度預測。