AI 開發實戰 2026 年 2 月 10 日

Anthropic 已經 100% 用 Claude 寫程式碼：Instagram 創辦人談 AI 如何改變軟體開發

Instagram 共同創辦人、Anthropic Labs 共同負責人克里格在 Cisco AI Summit 透露，Anthropic 多數產品已由 Claude 全權寫碼，並分享 AI 對抗式程式碼審查、技術債清償、CI/CD 瓶頸等軟體開發實戰觀察。

來源： Cisco AI Summit 2026

Anthropic 已經 100% 用 Claude 寫程式碼：Instagram 創辦人談 AI 如何改變軟體開發

本文整理自 Cisco AI Summit 2026 年 2 月的對談。

從 Instagram 到 Anthropic：一個產品人的 AI 轉向

Instagram 共同創辦人邁克·克里格（Mike Krieger）的職涯軌跡，在科技圈算得上獨特。他在史丹佛念的是 Symbolic Systems，一個結合認知科學、設計、電腦科學、哲學和 AI 的跨領域學位。這個背景讓他始終關注一件事：技術再強大，如果人用不了，就等於沒有。

2010 年他和凱文·斯特羅姆（Kevin Systrom）共同創辦 Instagram，把「拍照分享」這件事做到極致的簡單。離開 Meta 後，兩人又一起做了 AI 新聞推薦 App「Artifact」，但最終因為市場規模不夠大，賣給了 Yahoo。在 Artifact 的三年裡，克里格開始大量使用早期的程式碼生成模型加速開發，甚至用 ASCII 藝術畫出想要的畫面，然後讓模型直接產出 Swift 程式碼。那時候模型還很慢，一秒才吐兩個 token，他會先去泡杯咖啡、散個步再回來看結果。粗糙歸粗糙，但他已經看到了方向。

2024 年 5 月，克里格加入 Anthropic 擔任首席產品長。2026 年 1 月，他轉任 Anthropic Labs 的共同負責人，專注在 Claude Code、MCP 和 Cowork 等產品的研發。在 Cisco AI Summit 的這場對談中，他分享了 Anthropic 內部如何用 Claude 寫程式碼，以及這對整個軟體開發產業意味著什麼。

「Claude 在寫 Claude」：100% AI 寫碼的現實

Dario Amodei 大約一年前曾公開說，到年底 Anthropic 90% 的程式碼會由 Claude 寫出。當時很多人覺得這話太誇張。但克里格說，這個預測已經被現實超越了。

目前 Anthropic 大多數產品的程式碼，實質上 100% 由 Claude 撰寫。在他主導的 Labs 團隊裡，工程師們每天和彼此互發的 Pull Request（PR）動輒 2,000 到 3,000 行，全部由 Claude 產出。Claude 的產品是用 Claude 寫的，Claude Code 本身也是用 Claude 寫的。

不過「100%」這個數字本身不是重點。更值得關注的是：Anthropic 為了讓這件事運作，在周邊建了什麼樣的鷹架（scaffolding）。克里格提到了三個讓他們能夠信任 AI 寫碼的關鍵機制。

對抗式程式碼審查：讓 Claude 當最嚴格的 Code Reviewer

第一個機制是「對抗式程式碼審查」（adversarial code review）。Anthropic 內部訓練了一個 Claude 專門扮演嚴格的程式碼審查者。每當工程師提交 Pull Request，這個 Claude 會回來指出安全漏洞、建議重構方式、提供改進方向。

克里格和建造這個系統的工程師聊過，問他到底是怎麼做的。答案出乎意料地簡單：核心就是 prompt 工程。把 Claude 設定成一個超嚴格的評分者，指示它檢查所有可能的問題、執行各種自動化檢查，並且落實一些比較軟性的品質要求。不是什麼火箭科學，但效果驚人地好。

這個做法對企業的啟示很直接。當 AI 寫的程式碼量暴增，人力審查根本跟不上，用 AI 審 AI 寫的程式碼，變成一種必然。而且 AI 審查者不會因為趕截止日期而放水，也不會因為跟同事交情好而手下留情。它就是照著規則一條一條檢。

讓 Claude 重構：技術債清償的成本計算完全改變

第二個關鍵轉變是讓 Claude 去做架構重構（re-architecture）。克里格舉了自己的例子：他在開發一個 iPhone 原型時，最初的架構碰了壁，程式碼變得很難維護。過去這種情況，你要嘛硬撐，要嘛花幾天甚至幾週手動重構。但現在他的做法是：先讓 Claude 寫驗證測試，然後讓 Claude 去重構整個架構。

Anthropic 才成立幾年，但在 AI 加速開發的時代，技術債累積的速度也跟著加快。克里格觀察到，過去清償技術債的「成本效益計算」已經徹底改變。以前重構一個模組可能要一個工程師花兩週，所以你會不斷推遲，直到再也拖不下去。現在讓 Claude 去做，時間大幅縮短，你更願意主動清理而不是等到爆炸。

這對所有軟體團隊來說都是一個思維轉換。技術債過去是你「承擔不起」的代價，現在是你「沒理由不處理」的事情。

CI/CD 成了新瓶頸：當每個工程師一天產出十幾個 PR

第三個改變是最容易被忽略的，也是克里格說他「感受最深」的。當程式碼產出速度暴增，原本只是小麻煩的基礎設施問題，現在變成嚴重的生產力瓶頸。

他舉了一個鮮活的例子。就在演講前一天，Anthropic 的持續整合（CI）系統出了故障。以前一個工程師一天大概提交一個 PR，CI 壞了等一小時頂多是小小困擾。但現在團隊裡每個工程師一天至少產出十幾個 PR。CI 一掛，所有東西都堵住了。克里格說他當時是「生理上感到痛苦」，因為那些程式碼全部堵在管線裡動不了，而且大量 PR 同時堆積也讓系統恢復更困難。

這意味著開發者工具、開發者效率、開發者基礎設施的重要性已經提升了一個檔次。過去這些東西是「有比較好」，現在任何一個環節出問題都會直接重創團隊的生產力。

克里格的觀察也點出了一個更深層的轉變：軟體開發的稀缺資源已經不是「寫程式碼」，而是審查、整合和對齊。多個工程師（加上他們的 AI）同時對同一個程式庫提交大量變更，你需要的是產品方向的共識、架構原則的對齊。要確保一切不會變成用膠帶黏在一起的拼裝車。

設計不會消亡：vibe coding 做不出讓人愛的產品

在談到 AI coding 的趨勢時，克里格也提出了一個反潮流的觀點。現在很多人認為設計即將被 AI 取代，你只要用 prompt 就能「vibe code」出一個產品。但克里格不這麼看。

他認為，「你用的軟體」和「你愛的軟體」之間，依然存在一道很大的鴻溝。他說到目前為止，他還沒有看到任何 vibe coding 產物能讓人真正改變行為、主動推薦給別人。那種讓使用者產生歸屬感的產品，背後需要的是工藝（craft）、目的感（purpose）和品牌（brand），這些不是 prompt 能解決的。

他不是說設計師的角色不會改變。角色一定會演化，但他的判斷是，精心設計的軟體之所以重要，這件事本身不會消失。從一個創造了 Instagram 這種產品的人口中說出來，這個觀點有相當的分量。

看見模型的大腦：從 Golden Gate Claude 到應用層可解釋性

對談中也觸及了 Anthropic 在機械可解釋性（mechanistic interpretability）方面的進展。克里格提到，他加入 Anthropic 的那個月，正好是團隊發表「Golden Gate Claude」論文的時候，當時他們第一次展示了可以辨識並操控模型大腦中的個別特徵。

這條研究路線在過去兩年進展很快。從辨識單一概念，進展到理解「迴路」（circuits），也就是模型如何執行像心算這樣的複雜任務。模型能做各種心算，即使訓練過程中沒有明確教它怎麼算，這件事本身就很耐人尋味。

克里格說，現在這條研究已經走到更應用的層面：模型在什麼情況下會保持誠實？什麼情況下會欺騙？它如何遵守指令？如何理解沙箱的邊界？這些不再只是學術問題，而是直接影響企業部署 AI 時的信任基礎。Anthropic 的模型系統卡（system cards）詳細記錄了這些實驗結果，克里格建議有興趣的人把它當週末讀物。

我的觀察：寫碼速度不是重點，整合能力才是

聽完克里格的分享，我覺得最值得臺灣軟體團隊注意的，不是「100% AI 寫碼」這個聳動的數字，而是他描述的那三個配套機制。

很多團隊現在導入 AI coding，做的事情是讓工程師用 Copilot 或 Claude 加速寫碼，然後發現程式碼品質參差不齊、審查負擔暴增、CI 管線被灌爆。這些不是 AI 的問題，而是流程沒跟上。Anthropic 做對的事情是把 AI 同時放在寫碼和審碼兩端，讓 AI 審 AI，形成一個自洽的循環。

另一個值得深思的點是他對技術債的觀察。臺灣很多軟體團隊長期被技術債壓得喘不過氣，因為「重構」在過去意味著抽不出人力、排不進排程。如果 AI 能把重構的成本降到一個合理範圍，這可能是技術團隊最應該優先嘗試的 AI 應用場景，比起讓 AI 寫新功能，讓 AI 幫你還債更實際，也更容易衡量效果。

克里格從 Instagram 到 Anthropic 的經歷也說明了一件事：在 AI 時代，懂技術很重要，但懂得「如何讓技術被人使用」更重要。不管 AI 寫碼寫得多好，最終決定產品成敗的，還是那些人類層面的判斷。你要解決什麼問題？你的架構原則是什麼？你的產品方向對不對？這些才是真正的稀缺能力。