AI 產業動態 2026 年 1 月 20 日

AI 產品開發的兩大根本差異：非確定性與代理控制權衡

為什麼 AI 產品開發和傳統軟體完全不同？OpenAI Codex 負責人 Kiriti Badam 與 AI 顧問 Aishwarya Reganti 這對夫妻檔，用 Booking.com vs ChatGPT 的對比，解釋 AI 產品的兩個根本性挑戰。

來源： Lenny's Podcast

本文整理自 Lenny’s Podcast 2026 年 1 月播出的單集，為系列第二篇。

來賓背景

這集的兩位來賓是夫妻，也是 AI 產品領域最有實戰經驗的組合之一：

Kiriti Badam：OpenAI Codex 產品負責人，曾在 Google 和 Kumo 打造 AI/ML 基礎設施
Aishwarya Reganti：前 Alexa、Microsoft AI 研究員，現為企業 AI 轉型顧問，發表過 35+ 篇論文

兩人合計參與 50+ AI 產品部署，從 Amazon 到新創公司都有。他們在 Maven 開設的 AI 產品課程是平台上評價最高的課程。

對臺灣讀者來說，Kiriti 正在打造全球最前沿的 coding agent，而 Aishwarya 則是協助傳統企業 AI 轉型的實戰專家。他們的觀點結合了「技術前沿」與「落地實踐」兩個視角。

第一個差異：非確定性

Aishwarya 指出，很多人忽略了 AI 產品與傳統軟體的第一個根本差異：非確定性（Non-determinism）。

傳統軟體：可預測的流程

想像你用 Booking.com 訂旅館。你有一個意圖（在舊金山住兩晚），產品設計了一連串按鈕、選項、表單，讓你一步步完成這個意圖。每次流程都一樣，結果可預測。

AI 產品：雙重不確定性

但 AI 產品完全不同。使用者用自然語言表達意圖，而同一個意圖可以有無數種說法。這是輸入端的不確定性。

同時，LLM 是機率性的 API，對 prompt 的微小變化很敏感，而且本質上是黑盒子。這是輸出端的不確定性。

你既不知道使用者會怎麼跟你的產品互動，也不知道 LLM 會怎麼回應。輸入、輸出、處理過程——三者你都無法完全掌握。

這是缺點，也是優點

Aishwarya 補充：這其實也是 AI 最美的地方。人類天生更習慣用說話來溝通，而不是點按鈕。AI 產品的使用門檻因此大幅降低——你可以像跟人說話一樣自然地表達需求。

但問題是：你的後端系統是確定性的，你想達成確定性的結果，卻要透過非確定性的技術來完成。這就是挑戰所在。

第二個差異：代理-控制權衡

Kiriti 指出第二個差異：代理-控制權衡（Agency-Control Trade-off）。

什麼是代理-控制權衡？

每次你讓 AI 系統擁有更多自主決策能力（agency），你就放棄了一些控制權（control）。

很多人只想著打造全自動的 agent——可以自己做決定、自己完成工作。但 Kiriti 強調：在給予 AI 更多自主權之前，它必須先贏得你的信任。

為什麼這很重要？

UC Berkeley 的 Matei Zaharia 團隊（也是 Databricks 的人）做過一項調查：約 74-75% 的企業表示，可靠性是他們最大的問題。這也是為什麼他們不敢把 AI 產品部署給終端客戶——他們就是不放心。

這導致了一個現象：目前大多數企業 AI 產品都是「提升生產力」的工具（低自主性），而不是「端到端替代工作流程」的 agent（高自主性）。

實際案例：從低代理到高代理

Kiriti 用客服 agent 舉例，說明如何逐步增加 AI 的自主性：

版本	功能	代理程度	控制程度
V1	分類並路由工單到正確部門	低	高
V2	根據 SOP 產生回覆草稿，人工審核後送出	中	中
V3	端到端解決工單，包括退款、提交功能需求等	高	低

為什麼不直接做 V3？

因為你會被問題淹沒。Aishwarya 分享他們曾經為一個客戶做全自動客服 agent，結果問題多到修不完，最後只能關掉產品。Air Canada 也發生過類似事件——agent 幻覺出一個不存在的退款政策，公司被迫照做。

V1 看起來簡單，其實不簡單

光是「路由」這件事，在企業環境就可能極度複雜。Aishwarya 舉例：她遇過零售公司的產品分類系統，「鞋子」底下同時有「女鞋」和「男鞋」，但另一個地方又有「for women」和「for men」的分類，而且根本沒整合。人類客服知道哪些是過時的死節點，但 AI 沒有這個脈絡。

更多案例：coding assistant 與 marketing assistant

主持人 Lenny 補充了兩個例子：

Coding Assistant

V1：建議 inline completion 和樣板程式碼
V2：產生較大區塊（測試、重構），由人類審核
V3：自動套用修改、開 PR

Marketing Assistant

V1：草擬 email 或社群貼文
V2：建立多步驟行銷活動並執行
V3：自動上線、A/B 測試、跨渠道優化

重點都一樣：從低代理開始，隨著信任建立，逐步增加自主性。

關鍵心態：Problem First

Aishwarya 強調一個被低估的原則：Problem First（問題優先）。

在 AI 快速發展的時代，很容易陷入一個陷阱：一直想著解決方案的複雜性，卻忘了你到底要解決什麼問題。

當你從小規模、低自主性開始，你會被迫思考：「我到底要解決什麼問題？」這反而是好事。

小結

AI 產品開發與傳統軟體的兩大根本差異：

非確定性：輸入和輸出都無法完全預測
代理-控制權衡：自主性越高，風險越大，必須逐步建立信任

理解這兩點，是避免 AI 產品失敗的第一步。

本系列共四篇。下一篇將介紹 CCCD 框架——持續校準、持續開發的具體方法論。