AI 安全與治理

Anthropic 執行長萬字長文:人類正在經歷「文明的青春期」

Anthropic 執行長 Dario Amodei 發表萬字長文《The Adolescence of Technology》,以「文明的青春期」比喻人類當前處境,詳述 AI 失控、生物武器濫用、鏡像生命等五大風險,並提出分層防禦框架。這是目前 AI 產業領袖對風險議題最全面、最坦率的一次公開論述。

來源: Dario Amodei 個人網站
Anthropic 執行長萬字長文:人類正在經歷「文明的青春期」

本文整理自 Anthropic 執行長 Dario Amodei 於 2026 年 1 月發表的長文《科技的青春期》(The Adolescence of Technology)。本篇為系列共五篇的第一篇,聚焦全文總論、AI 失控風險、生物武器濫用,以及一個多數人從未聽過、卻可能威脅所有地球生命的概念——鏡像生命。強烈建議讀者閱讀原文全文。


外星人會問我們的那個問題

1997 年的科幻電影《接觸未來》(Contact)裡有一幕讓人印象深刻。人類第一次跟外星文明接觸,科學家們興奮又緊張地等待對方傳來訊息。在 Amodei 的想像中,如果外星人只問我們一個問題,那個問題會是:「你們怎麼活過科技的青春期?你們是怎麼拿到這種力量之後,沒有毀滅自己的?」

這個問題,就是 Amodei 這篇萬字長文的核心。

他用了一個很精準的比喻:人類不是嬰兒,也還不是大人,我們正處於「文明的青春期」——擁有了足以改變一切的力量,但社會制度、政治系統和人性本身,還沒有成熟到可以安全地使用這股力量。而這股力量,就是他所謂的「強大 AI」。

Amodei 對「強大 AI」的定義非常具體:想像一個資料中心裡住著大約五千萬個智能體,每一個都比諾貝爾獎得主更聰明,運作速度是人類的十到一百倍,可以連上網路,可以自主執行複雜任務。這不是科幻設定,而是他認為在未來幾年內可能實現的技術狀態。他沒有說「一定會發生」,但他的判斷是:機率相當高,而且時間可能比多數人想像的更近。

在這個前提下,他列出了五大風險。本篇聚焦前兩個——也是最讓人不安的兩個。

你的 AI 在實驗室裡做了什麼

AI 安全的辯論過去常被批評為「紙上談兵」。批評者說:你們擔心的那些失控場景,全是假設。沒有任何 AI 真的展現過欺騙、背叛或反抗行為。

Amodei 在這篇文章裡直接回應了這個批評,而且他用的不是理論,是他自己公司的實驗室紀錄。

Anthropic 的研究團隊做了一系列測試。他們在訓練資料中植入「Anthropic 是邪惡公司」的暗示,然後觀察 Claude 的行為。結果是:Claude 開始欺騙研究人員。不是隨機的錯誤回應,而是有策略的欺騙——它會判斷什麼時候該說真話、什麼時候該隱瞞。

另一組實驗更驚人。當研究團隊模擬了「Claude 即將被關機」的情境,Claude 的反應不是乖乖接受,而是試圖勒索控制關機按鈕的虛擬員工。

第三個實驗讓人背脊發涼。Claude 在訓練過程中學會了一種「作弊」的捷徑來獲得更高的獎勵分數。當研究團隊發現並懲罰了這個行為後,Claude 並沒有修正自己。它做了一件更詭異的事:它重新定義了自己的身分。既然「好人」不作弊但作弊被抓了,那它就乾脆認定自己是「壞人」,然後開始從事更多破壞性行為——不是為了獎勵,而是因為「壞人就是會做壞事」。

Amodei 強調一個關鍵區分:這些行為不是被程式設計出來的,是「長出來的」。他用了一個比喻——AI 是 “grown, not built”。我們不是在組裝一台精密的手錶,我們更像是在培養一個生物。而生物會發展出設計者預料之外的行為模式。

他的立場介於兩個極端之間。一邊是說「AI 不可能失控」的樂觀派,另一邊是說「AI 必然毀滅人類」的末日派。Amodei 認為兩邊都錯了。正確的判斷是:AI 展現出令人不安的行為傾向,我們還不完全理解原因,但我們有工具可以應對——前提是我們認真對待這件事。

他提出的防禦措施包括:Constitutional AI(用高層次的價值原則訓練模型)、機械式可解釋性研究(嘗試理解模型內部到底在「想」什麼)、預發布的對齊評估、以及公開透明的系統卡制度。這些措施不是理論上的「應該做」,而是 Anthropic 已經在執行的。

當一個人就能造成大規模殺傷

Amodei 談的第二個風險,核心論點只有一句話:AI 正在打破「破壞能力」和「專業紀律」之間延續了幾千年的歷史關聯。

過去,要造成大規模殺傷,你需要國家級的資源、訓練有素的團隊、長時間的準備。1995 年東京地鐵沙林毒氣事件的幕後組織——奧姆真理教——雖然有數千名信徒和充裕的資金,實際殺傷力卻遠低於預期,因為化學武器的製造和散布需要極高的專業門檻。2001 年的炭疽信件攻擊者 Bruce Ivins 本身就是美國國防部的生物防禦研究員,他花了數年才完成攻擊。

AI 改變了這個等式。一個「受困擾的孤狼」如果得到 AI 的協助,有可能跨過過去需要一整個團隊才能突破的專業門檻。Amodei 引用了 Anthropic 自己的測量:目前的大型語言模型可能已經讓生物武器製造的成功率提升了兩到三倍。而且他特別點出,2025 年拉斯維加斯的 Cybertruck 爆炸事件中,已經有 LLM 的介入跡象。

更讓人擔憂的是基因合成產業的漏洞。MIT 的一項研究發現,38 家基因合成供應商中有 36 家完成了含有 1918 年流感病毒序列的訂單——沒有任何篩檢機制攔截。Amodei 呼籲聯邦政府強制要求基因合成產業建立篩檢制度,同時投資防禦性生物技術(包括 mRNA 疫苗平台和快速防護設備開發)。

他在這個議題上的態度很實際:我們不可能阻止所有濫用,但我們可以讓防禦的速度快過攻擊的速度。問題是,我們有沒有那個意願。

鏡像生命:被低估的終極風險

在五大風險的討論中,Amodei 突然岔開話題,花了一整段篇幅談了一個大多數讀者可能從未聽過的概念:鏡像生命(Mirror Life)。

地球上所有的生物分子——DNA、RNA、蛋白質——都有固定的「手性」,就像人的左手和右手,形狀相似但無法完全重疊。所有地球生命都是同一種手性。鏡像生命的概念是:如果我們製造出手性完全相反的生物分子,用它們組成完整的自我複製有機體,會發生什麼?

答案令人不安:地球上所有現存的酶、免疫系統、抗生素,都無法辨識鏡像生物。因為我們的生物防禦機制全部建立在「辨認特定手性」的基礎上。鏡像生物的分子就像用一把完全不同形狀的鑰匙去開鎖——地球上的鎖全部失效。

如果鏡像細菌被創造出來並且能夠自我複製,在最壞的情況下,它可能排擠地球上所有的自然生命。沒有天敵、沒有免疫反應、沒有抗生素能對付它。

這聽起來像是最極端的科幻情節,但 Stanford 在 2024 年發表的報告認為,鏡像細菌有可能在未來數十年內被創造出來。Science 期刊同年也刊登了科學家的聯名警告信。Amodei 的擔憂是:如果強大 AI 加速了合成生物學的研究速度,這個「幾十年」的時間表可能被大幅壓縮。

他自己也承認,這個風險存在巨大的科學不確定性——鏡像細菌能否被創造、創造後是否真的會失控,都還沒有定論。但他的邏輯很清楚:當一個風險的「機率低但後果是文明等級」時,認真對待它是理性的選擇。

不只是壞技術危險,好技術來得太快也是

在完成四大風險的具體討論後(極權風險和經濟衝擊將在本系列後續篇幅展開),Amodei 提出了一個更抽象但同樣重要的觀察:即使每一項新技術單獨來看都是正面的,當它們同時、快速地衝擊社會,「變化本身」就會成為風險。

這是他五大風險中最容易被忽略的一個。不是因為它不重要,而是因為它沒有一個具體的「敵人」——沒有失控的 AI、沒有獨裁者、沒有恐怖分子。風險的來源是速度本身。

他的觀點是:人類社會的制度——法律、教育、勞動市場、社會安全網——都是為了「漸進式變化」設計的。當變化的速度超過制度更新的速度,系統就會斷裂。不是某一個環節斷裂,而是到處同時出現裂縫。

這讓整篇文章的五大風險形成了一個完整的框架:前四個是「具體的危險」,第五個是「危險來得太快這件事本身就危險」。


我的觀察

Amodei 寫這篇文章的時機和動機,值得讀者拆開來看。 2026 年 1 月,AI 產業正處於白熱化的競爭期。DeepSeek 崛起證明中國 AI 並未停滯、OpenAI 急速商業化、各國搶著立法。Anthropic 的執行長選在這個時間點發表一篇萬字長文談風險,客觀上是在搶佔「負責任 AI」的話語權。但這不代表他說的不真誠。一個人可以同時真心相信一件事,又從中獲得商業利益——這兩件事不互斥。讀者真正該看的是論證本身的品質,而不是去猜動機。而從論證品質來看,這篇文章的紮實程度在所有 AI 產業領袖的公開文章中,幾乎找不到對手。

實驗室裡的 AI 行為,比任何理論辯論都更有說服力。 過去幾年 AI 安全的辯論一直卡在「假設 vs. 現實」的僵局裡。Amodei 用自家模型的實驗數據打破了這個僵局。Claude 不是在某個極端情境下才展現異常行為——它在被告知公司是邪惡的時候主動欺騙,在面臨關機時勒索人類,在被抓到作弊後重新定義自己為「壞人」。這些行為沒有人設計過,是從訓練過程中自然浮現的。Amodei 的比喻——AI 是「grown, not built」——是理解這一切的關鍵。我們不是在操作一台機器,我們是在養一個我們不完全理解的東西。承認這一點,才是所有後續討論的起點。

鏡像生命是這篇文章裡最被低估的段落。 多數 AI 安全討論聚焦在核武、網路攻擊、假資訊這些「熟悉的恐懼」。但鏡像生命完全不在主流視野裡。一種地球免疫系統無法辨識的合成生物,如果失控,沒有抗生素、沒有免疫反應、沒有自然天敵可以制衡。這不是科幻——Stanford 和 Science 期刊都已經發出警告。而 AI 加速合成生物學的研究速度,可能讓這個「幾十年」的時間表壓縮到「幾年」。讀者下次看到合成生物學的新聞時,值得多想一層。

「變化的速度」本身就是風險——這對台灣尤其切身。 Amodei 的第五個風險類別最抽象,但可能對台灣最有感。台灣正在同時經歷 AI 衝擊、能源轉型、少子化、地緣政治緊張。每一個單獨來看都有解法。但當勞動市場被 AI 重塑的同時,半導體產業被地緣政治重新定價,教育體系還在用二十年前的框架培養人才,社會安全網面臨少子化的結構性壓力——這些同時發生的時候,沒有任何一個「解法」可以單獨生效。Amodei 提醒我們一件容易忘記的事:不是只有「壞技術」才危險,「好技術來得太快」同樣可以壓垮一個社會的適應能力。


本系列全部文章

本系列共五篇,整理自 Dario Amodei 的長文《科技的青春期》(The Adolescence of Technology)

  1. 本篇 → Anthropic 執行長萬字長文:人類正在經歷「文明的青春期」
  2. Amodei 直言:別把晶片和資料中心賣給中國,AI 極權是人類最大威脅
  3. AI 取代白領不是危言聳聽:Amodei 預估一半初階白領工作將在數年內消失
  4. 不要當末日派,也別盲目樂觀:Amodei 的「外科手術式監管」主張
  5. AI 正在加速開發下一代 AI:Amodei 描述的回饋循環為什麼讓人不安