Anthropic 已經 100% 用 Claude 寫程式碼:Instagram 創辦人談 AI 如何改變軟體開發
Instagram 共同創辦人、Anthropic Labs 共同負責人克里格在 Cisco AI Summit 透露,Anthropic 多數產品已由 Claude 全權寫碼,並分享 AI 對抗式程式碼審查、技術債清償、CI/CD 瓶頸等軟體開發實戰觀察。

本文整理自 Cisco AI Summit 2026 年 2 月的對談。
從 Instagram 到 Anthropic:一個產品人的 AI 轉向
Instagram 共同創辦人邁克·克里格(Mike Krieger)的職涯軌跡,在科技圈算得上獨特。他在史丹佛念的是 Symbolic Systems,一個結合認知科學、設計、電腦科學、哲學和 AI 的跨領域學位。這個背景讓他始終關注一件事:技術再強大,如果人用不了,就等於沒有。
2010 年他和凱文·斯特羅姆(Kevin Systrom)共同創辦 Instagram,把「拍照分享」這件事做到極致的簡單。離開 Meta 後,兩人又一起做了 AI 新聞推薦 App「Artifact」,但最終因為市場規模不夠大,賣給了 Yahoo。在 Artifact 的三年裡,克里格開始大量使用早期的程式碼生成模型加速開發,甚至用 ASCII 藝術畫出想要的畫面,然後讓模型直接產出 Swift 程式碼。那時候模型還很慢,一秒才吐兩個 token,他會先去泡杯咖啡、散個步再回來看結果。粗糙歸粗糙,但他已經看到了方向。
2024 年 5 月,克里格加入 Anthropic 擔任首席產品長。2026 年 1 月,他轉任 Anthropic Labs 的共同負責人,專注在 Claude Code、MCP 和 Cowork 等產品的研發。在 Cisco AI Summit 的這場對談中,他分享了 Anthropic 內部如何用 Claude 寫程式碼,以及這對整個軟體開發產業意味著什麼。
「Claude 在寫 Claude」:100% AI 寫碼的現實
Dario Amodei 大約一年前曾公開說,到年底 Anthropic 90% 的程式碼會由 Claude 寫出。當時很多人覺得這話太誇張。但克里格說,這個預測已經被現實超越了。
目前 Anthropic 大多數產品的程式碼,實質上 100% 由 Claude 撰寫。在他主導的 Labs 團隊裡,工程師們每天和彼此互發的 Pull Request(PR)動輒 2,000 到 3,000 行,全部由 Claude 產出。Claude 的產品是用 Claude 寫的,Claude Code 本身也是用 Claude 寫的。
不過「100%」這個數字本身不是重點。更值得關注的是:Anthropic 為了讓這件事運作,在周邊建了什麼樣的鷹架(scaffolding)。克里格提到了三個讓他們能夠信任 AI 寫碼的關鍵機制。
對抗式程式碼審查:讓 Claude 當最嚴格的 Code Reviewer
第一個機制是「對抗式程式碼審查」(adversarial code review)。Anthropic 內部訓練了一個 Claude 專門扮演嚴格的程式碼審查者。每當工程師提交 Pull Request,這個 Claude 會回來指出安全漏洞、建議重構方式、提供改進方向。
克里格和建造這個系統的工程師聊過,問他到底是怎麼做的。答案出乎意料地簡單:核心就是 prompt 工程。把 Claude 設定成一個超嚴格的評分者,指示它檢查所有可能的問題、執行各種自動化檢查,並且落實一些比較軟性的品質要求。不是什麼火箭科學,但效果驚人地好。
這個做法對企業的啟示很直接。當 AI 寫的程式碼量暴增,人力審查根本跟不上,用 AI 審 AI 寫的程式碼,變成一種必然。而且 AI 審查者不會因為趕截止日期而放水,也不會因為跟同事交情好而手下留情。它就是照著規則一條一條檢。
讓 Claude 重構:技術債清償的成本計算完全改變
第二個關鍵轉變是讓 Claude 去做架構重構(re-architecture)。克里格舉了自己的例子:他在開發一個 iPhone 原型時,最初的架構碰了壁,程式碼變得很難維護。過去這種情況,你要嘛硬撐,要嘛花幾天甚至幾週手動重構。但現在他的做法是:先讓 Claude 寫驗證測試,然後讓 Claude 去重構整個架構。
Anthropic 才成立幾年,但在 AI 加速開發的時代,技術債累積的速度也跟著加快。克里格觀察到,過去清償技術債的「成本效益計算」已經徹底改變。以前重構一個模組可能要一個工程師花兩週,所以你會不斷推遲,直到再也拖不下去。現在讓 Claude 去做,時間大幅縮短,你更願意主動清理而不是等到爆炸。
這對所有軟體團隊來說都是一個思維轉換。技術債過去是你「承擔不起」的代價,現在是你「沒理由不處理」的事情。
CI/CD 成了新瓶頸:當每個工程師一天產出十幾個 PR
第三個改變是最容易被忽略的,也是克里格說他「感受最深」的。當程式碼產出速度暴增,原本只是小麻煩的基礎設施問題,現在變成嚴重的生產力瓶頸。
他舉了一個鮮活的例子。就在演講前一天,Anthropic 的持續整合(CI)系統出了故障。以前一個工程師一天大概提交一個 PR,CI 壞了等一小時頂多是小小困擾。但現在團隊裡每個工程師一天至少產出十幾個 PR。CI 一掛,所有東西都堵住了。克里格說他當時是「生理上感到痛苦」,因為那些程式碼全部堵在管線裡動不了,而且大量 PR 同時堆積也讓系統恢復更困難。
這意味著開發者工具、開發者效率、開發者基礎設施的重要性已經提升了一個檔次。過去這些東西是「有比較好」,現在任何一個環節出問題都會直接重創團隊的生產力。
克里格的觀察也點出了一個更深層的轉變:軟體開發的稀缺資源已經不是「寫程式碼」,而是審查、整合和對齊。多個工程師(加上他們的 AI)同時對同一個程式庫提交大量變更,你需要的是產品方向的共識、架構原則的對齊。要確保一切不會變成用膠帶黏在一起的拼裝車。
設計不會消亡:vibe coding 做不出讓人愛的產品
在談到 AI coding 的趨勢時,克里格也提出了一個反潮流的觀點。現在很多人認為設計即將被 AI 取代,你只要用 prompt 就能「vibe code」出一個產品。但克里格不這麼看。
他認為,「你用的軟體」和「你愛的軟體」之間,依然存在一道很大的鴻溝。他說到目前為止,他還沒有看到任何 vibe coding 產物能讓人真正改變行為、主動推薦給別人。那種讓使用者產生歸屬感的產品,背後需要的是工藝(craft)、目的感(purpose)和品牌(brand),這些不是 prompt 能解決的。
他不是說設計師的角色不會改變。角色一定會演化,但他的判斷是,精心設計的軟體之所以重要,這件事本身不會消失。從一個創造了 Instagram 這種產品的人口中說出來,這個觀點有相當的分量。
看見模型的大腦:從 Golden Gate Claude 到應用層可解釋性
對談中也觸及了 Anthropic 在機械可解釋性(mechanistic interpretability)方面的進展。克里格提到,他加入 Anthropic 的那個月,正好是團隊發表「Golden Gate Claude」論文的時候,當時他們第一次展示了可以辨識並操控模型大腦中的個別特徵。
這條研究路線在過去兩年進展很快。從辨識單一概念,進展到理解「迴路」(circuits),也就是模型如何執行像心算這樣的複雜任務。模型能做各種心算,即使訓練過程中沒有明確教它怎麼算,這件事本身就很耐人尋味。
克里格說,現在這條研究已經走到更應用的層面:模型在什麼情況下會保持誠實?什麼情況下會欺騙?它如何遵守指令?如何理解沙箱的邊界?這些不再只是學術問題,而是直接影響企業部署 AI 時的信任基礎。Anthropic 的模型系統卡(system cards)詳細記錄了這些實驗結果,克里格建議有興趣的人把它當週末讀物。
我的觀察:寫碼速度不是重點,整合能力才是
聽完克里格的分享,我覺得最值得臺灣軟體團隊注意的,不是「100% AI 寫碼」這個聳動的數字,而是他描述的那三個配套機制。
很多團隊現在導入 AI coding,做的事情是讓工程師用 Copilot 或 Claude 加速寫碼,然後發現程式碼品質參差不齊、審查負擔暴增、CI 管線被灌爆。這些不是 AI 的問題,而是流程沒跟上。Anthropic 做對的事情是把 AI 同時放在寫碼和審碼兩端,讓 AI 審 AI,形成一個自洽的循環。
另一個值得深思的點是他對技術債的觀察。臺灣很多軟體團隊長期被技術債壓得喘不過氣,因為「重構」在過去意味著抽不出人力、排不進排程。如果 AI 能把重構的成本降到一個合理範圍,這可能是技術團隊最應該優先嘗試的 AI 應用場景,比起讓 AI 寫新功能,讓 AI 幫你還債更實際,也更容易衡量效果。
克里格從 Instagram 到 Anthropic 的經歷也說明了一件事:在 AI 時代,懂技術很重要,但懂得「如何讓技術被人使用」更重要。不管 AI 寫碼寫得多好,最終決定產品成敗的,還是那些人類層面的判斷。你要解決什麼問題?你的架構原則是什麼?你的產品方向對不對?這些才是真正的稀缺能力。