「沒人想要智慧本身」——DSPy 創建者談 AI 的下一步不是 AGI,而是可程式化智慧
MIT 助理教授、DSPy 創建者 Omar Khattab 認為,追求 AGI 的方向有誤。真正重要的是建構「可程式化智慧」(Artificial Programmable Intelligence)——讓人類能有效表達意圖、建構可靠系統的能力。
本文整理自 The a16z Show 於 2026 年 1 月播出的 Podcast 單集,由 a16z 合夥人 Martin Casado 主持,專訪 MIT 助理教授、DSPy 創建者 Omar Khattab。
為什麼臺灣讀者該認識這個人
Omar Khattab 可能不是臺灣科技圈最熟悉的名字,但他的研究直接關係到一個臺灣企業正在面對的問題:如何把 AI 從「展示用的玩具」變成「真正能用的系統」。
臺灣有強大的硬體製造能力,但在 AI 應用層面,多數企業還在摸索。很多團隊花了大量時間調整 prompt,卻發現模型一更新就要重來。Khattab 的研究提供了一個更有系統的思考框架——不是教你怎麼寫更好的 prompt,而是教你怎麼設計一個不會因為模型更新就壞掉的系統。
這對於正在導入 AI 的臺灣企業來說,是非常實用的觀點。
一句話點破 AGI 迷思
「沒人想要智慧本身。他們想要的是別的東西,而那個東西總是更具體的。」
Omar Khattab 這句話,直接挑戰了當前 AI 產業對 AGI(通用人工智慧)的執念。他認為,與其追求一個無所不能的「上帝模型」,不如專注於建構「可程式化智慧」(Artificial Programmable Intelligence, API)。
這不是文字遊戲。Khattab 指出,當前 AI 發展的核心問題不在於模型能力不足,而在於我們缺乏有效的方式來表達意圖。自然語言太模糊,程式碼又太死板——我們需要一個新的抽象層。
DSPy 是什麼?為什麼重要?
在解釋 DSPy 之前,先用一個生活譬喻。
想像你開了一家餐廳,需要跟廚師溝通菜單。傳統的 prompt engineering 就像是每次都要跟廚師說:「我要一道菜,用雞肉,不要太辣,口感要嫩,擺盤要漂亮,對了上次那個醬汁不錯可以再用……」每換一個廚師,你就要重新摸索他的習慣,重新調整你的說法。
DSPy 的做法不同。它像是設計一份標準化的點菜單:主食欄位、調味偏好欄位、擺盤風格欄位。你只要填好這份單子,不管換哪個廚師,他都能照著做出你要的菜。廚師的技術可能不同,但你的需求規格是穩定的。
這就是 DSPy 的核心價值:把你的意圖(要什麼)和實作細節(怎麼做)分開。
從 Prompt Engineering 到系統思維
Khattab 在 2019 年開始攻讀史丹佛博士時,「基礎模型」這個詞甚至還沒被創造出來。他花了整個博士生涯研究一個問題:如何讓這些模型真正可用?
他的答案是 DSPy——一個已經發展三年的開源框架,目前是 GitHub 上最受歡迎的 LLM 程式設計框架之一。它的核心概念異常簡單:把模糊性隔離到函數中。
傳統的 prompt engineering 本質上是在猜測「怎麼說話模型才會聽懂」。但模型一直在變,而你想做的事情變化相對慢。DSPy 試圖捕捉你的「純粹意圖」,讓這個意圖與具體的模型實作解耦。
DSPy 的核心抽象是「signature」(簽名)——一個描述函數輸入輸出的正式結構,但內容是用自然語言描述的。Khattab 說:「這就是 prompt 長大後想成為的樣子——一個更乾淨的 prompt。」
意圖的三個不可化約部分
Khattab 提出一個重要觀點:完整表達意圖需要三種形式,缺一不可:
- 程式碼:有些東西就是要用程式碼表達,沒有任何自動化能取代
- 自然語言:沒有人想從頭用 Python 描述一個複雜的 AI 系統
- 資料/強化學習視角:某些問題需要用輸入分佈和判斷標準來定義
這解釋了為什麼很多人誤用 DSPy——他們試圖用過於簡化的程式搭配大量資料來「蒸餾」意圖,但這是錯誤的做法。如果你知道自己要什麼,沒有任何東西比直接說出來更好。資料優化只是用來處理邊緣案例,不是主要的意圖表達方式。
從 Assembly 到 C 的類比
Khattab 用程式語言的演進來類比 AI 工程的發展:
當年從組合語言跳到 C 語言,不是因為 C 跑得比較快(其實通常更慢)。人們選擇 C 是因為它更接近人類思考的方式,更容易維護、更具可攜性。同樣的道理適用於 DSPy:你願意犧牲一些效能,換取更好的抽象層級。
關鍵在於編譯器生態系統。人們建構了各種優化演算法,在不改變高階程式碼的情況下提升效能。DSPy 的願景也是如此:讓優化器(optimizer)持續進化,但讓使用者的程式碼盡可能保持不變。
系統才是重點,不是模型
當主持人 Martin Casado 問到:未來人類還需要正式宣告意圖嗎?還是這一切都會變成 Agent 的內部運作?
Khattab 的回答很有意思:「這就像問我家裡有椅子,難道我希望它們都變成桌子嗎?我兩個都需要。」
有時候你需要跟機器正式溝通(DSPy 的用途),有時候你只是想聊天(chatbot 的用途)。這是兩種不同的解決方案,面對不同的問題。
但無論哪種情況,當你想要建構可重複、可維護的複雜系統時,你就需要結構。Khattab 說:「人類的處境是,我們會想要越來越複雜的東西。而要以可重複的方式建構這些複雜的東西,你就得建構系統。」
我的觀察
一、DSPy 的實務意義:解耦「意圖」與「實作」
目前多數開發者還停留在 prompt engineering 的思維——花大量時間調整措辭,祈禱模型能「理解」我們的意思。但這種做法有個根本問題:模型會更新,你的 prompt 可能就失效了。
DSPy 的 signature 概念提供了一個解法:把「我要什麼」跟「模型怎麼做」分開。對於需要長期維護 AI 應用的團隊來說,這是一個關鍵的架構思維轉變。你的意圖應該是穩定的,而實作細節(包括 prompt 怎麼寫、用哪個模型)應該是可替換的。
二、「沒人想要智慧本身」:AI Agent 熱潮的反思
這句話精準點出了當前 AI 產業的一個盲點:大家都在追 AGI,但使用者真正要的是「能解決特定問題的系統」。
回頭看現在的 AI Agent 熱潮,很多產品華而不實。它們展示了模型的「智慧」,卻沒有解決具體問題。為什麼?因為它們缺乏系統思維——沒有好好設計輸入輸出、沒有處理邊緣案例、沒有考慮如何與現有工作流程整合。
智慧是便宜的,規格說明才是困難的。這句話值得每個做 AI 產品的人深思。
三、抽象層會演進,但系統設計永遠重要
Omar Khattab 用「Assembly → C」來類比 AI 工程的抽象層演進。這個類比可以延伸:Anthropic 推出的 Skills 與 CLAUDE.md 這類以 Markdown 自然語言描述為基礎的文件,本質上也是在做同樣的事——增加一層更容易讓人類溝通理解的抽象層。
但無論抽象層怎麼演進,核心始終不變。這讓我想起孔祥重院士在台大的演講中強調的:AI 時代最稀缺的能力是「系統設計」——決定要做什麼系統、怎麼設計系統。
Omar Khattab 談的「可程式化智慧」,與孔祥重強調的「系統設計」,其實是同一件事的兩種表述。模型會越來越強,抽象層會越來越高,但「決定要解決什麼問題、如何拆解問題、如何設計系統」這件事,永遠需要人來做。
這或許才是 AI 時代真正值得投資的能力。