Anthropic 經濟學家:API 自動化成功率不如你想的高,企業用 AI 的真相是什麼?
Anthropic 經濟主管 Peter McCrory 分析數百萬筆 Claude 對話資料,發現企業透過 API 部署 AI 的成功率,遠低於一般使用者在聊天介面的表現。關鍵差異在於:複雜任務需要更多脈絡資訊,而多數企業還沒準備好。
本文整理自 Azeem Azhar 的 Exponential View Podcast,訪談 Anthropic 經濟主管 Peter McCrory,討論最新一期 Anthropic 經濟指數報告的發現。
兩種截然不同的使用模式
Anthropic 分析了數百萬筆與 Claude 的真實對話,發現一個有趣的現象:同一個 AI 模型,透過不同管道使用,呈現出完全不同的樣貌。
透過聊天介面(Claude.ai)使用時,使用者傾向讓 AI「增強」自己的工作能力,透過多輪對話逐步完成複雜任務,成功率較高。但當企業透過 API 程式化部署時,情況就不一樣了——約 75% 的使用情境是想讓 AI 直接「自動化」特定任務,成功率卻明顯較低。
這不只是技術上的差異。這是兩種完全不同的 AI 導入哲學,也預示著不同的未來。
複雜任務需要的不只是聰明
為什麼企業透過 API 自動化的成功率較低?Peter McCrory 指出一個關鍵原因:複雜任務需要的背景資訊,遠比多數企業準備好提供的還要多。
Anthropic 的資料顯示,當企業要求 Claude 執行最複雜的任務時,必須提供大量的脈絡資訊。如果企業的資料架構不完整、內部知識沒有被妥善記錄,AI 的能力就會被卡住。
想像一下:你請一個非常聰明的新員工處理複雜專案,但只給他一句話的指令,卻期待他產出完美成果。這不是員工的問題,是你沒給足夠的資訊。
電力的啟示
McCrory 用電力做了一個有意思的類比。
當你在咖啡店點一杯拿鐵,你不會想到背後需要多少電力。電力作為通用技術,已經「隱形」到日常生活中,你甚至感覺不到它的存在。
AI 可能也會走上同樣的路。現在企業還在摸索如何部署 Claude,過程中跌跌撞撞。但終有一天,AI 會像電力一樣,成為商業運作中看不見但不可或缺的基礎設施。
問題是:在那之前,企業需要做很多準備工作。重新設計流程、整理資料、把員工腦中的隱性知識文件化。這些苦工沒有捷徑。
誰最容易被取代?
報告也發現,AI 對不同職業的影響非常不均衡。
資料輸入員是高風險職業。Claude 在從自然語言中萃取、標準化資訊方面非常可靠,而這正是資料輸入工作的核心。最新資料顯示,辦公室行政類的 API 使用量正在攀升,企業已經開始將 AI 部署到後勤行政工作。
相對安全的是微生物學家這類職業。雖然約一半的任務 Claude 理論上能處理,但最耗時的核心工作——使用專業實驗設備進行實驗——AI 目前無法觸及。
這裡有個重要的觀念:關鍵不是「AI 能做你工作中多少任務」,而是「AI 能做的,是不是你最花時間的那些任務」。
只是換成機器做,還是真的重新想像?
Azeem Azhar 提出一個犀利的觀察:很多企業導入 AI,只是把原本人做的事換成機器做,規模完全沒變。
過去因為人力成本,企業一天只能處理一萬筆資料。現在用 AI,成本降了一千倍,但很多企業還是只處理一萬筆——差別只是改成機器在跑。
真正的機會在於:如果成本降了一千倍,為什麼不處理一千萬筆、甚至一百億筆資料?這才是會帶來質變的可能。但這需要企業從根本重新思考商業模式,不只是把現有流程搬上去而已。
生產力會成長多少?
Anthropic 的報告估算,如果目前觀察到的 AI 效率提升在未來十年完全實現,每年可為勞動生產力貢獻約 1.8 個百分點。
McCrory 認為這個數字可能還是保守的,因為它只計算「把現有工作做得更快」,沒有考慮 AI 可能「加速創新本身」的潛力。
如果 AI 能加速科學發現、縮短從基礎研究到商業應用的時間,影響會遠超過任務層級的效率提升。但 Azeem 也提醒,這可能只是把瓶頸從「發現」轉移到「驗證」——當 AI 一個下午就能產出三千五百萬種材料組合,真正的挑戰變成:誰有能力判斷哪些值得繼續研究?
這是另一種形式的負擔。發現變快了,但篩選和驗證的能力沒有跟上,最後可能還是卡在同一個地方。