AI 安全

AI 安全與治理

楊立昆：AI 最大風險不是滅絕人類，是少數公司壟斷你的資訊食糧

圖靈獎得主楊立昆在達沃斯警告：當所有人的資訊來源都被幾家公司的 AI 過濾，民主、文化多樣性、價值觀都會出問題。他也首度公開談論離開 Meta 的原因，直指新上司「年輕且缺乏經驗」。

2026 年 1 月 29 日

AI 安全與治理

不要當末日派，也別盲目樂觀：Amodei 的「外科手術式監管」主張

AI 安全圈長期被末日派和加速派撕裂。Anthropic 執行長 Dario Amodei 試圖走第三條路：他批評末日論的「類宗教語言」，同時主張透明度立法優先於限制性法規。他提出分層監管框架，從加州 …

2026 年 1 月 28 日

AI 安全與治理

Anthropic 執行長萬字長文：人類正在經歷「文明的青春期」

Anthropic 執行長 Dario Amodei 發表萬字長文《The Adolescence of Technology》，以「文明的青春期」比喻人類當前處境，詳述 AI 失控、生物武器濫用、鏡 …

2026 年 1 月 28 日

AI 產業動態

Sam Altman 開發者座談：2026 年你該知道的事，從面試革命到 AI 安全隱憂

OpenAI 執行長 Sam Altman 在舊金山舉辦開發者座談會，談及軟體工程師未來、AI 成本下降曲線、生物安全風險、教育與 AI 的關係，以及他認為這個時代最重要的能力。這場一小時的 QA，是 …

2026 年 1 月 27 日

AI 技術前沿

OpenAI 研究長：Scaling 沒死，我們一年內要讓 AI 當實習生

OpenAI 研究長陳信翰在訪談中給出明確時間軸：一年內讓 AI 實習生參與研發流程，兩年半內實現 AI 端到端獨立研究。他認為「Scaling 已死」是假議題，Pre-training 還有很大空間 …

2026 年 1 月 26 日

AI 安全與治理

如何教 AI 做個好人？Anthropic 哲學家 Amanda Askell 談 Claude 的 29,000 字憲章

Anthropic 正式發布 Claude 的新憲章，這份長達 29,000 字的文件不是一份規則清單，而是一封寫給 AI 的信。負責撰寫的哲學家 Amanda Askell 解釋為什麼「信任模型」比 …

2026 年 1 月 24 日

AI 產業動態

Anthropic 執行長達沃斯警告：AI 將帶來史無前例的「高成長＋高失業」，財富稅恐無可避免

Anthropic 執行長 Dario Amodei 在達沃斯論壇直言：AI 可能在 1-2 年內超越人類認知能力，同時帶來前所未見的經濟矛盾——GDP 高速成長與大規模失業並存。他也公開反對美國對中 …

2026 年 1 月 21 日

AI 產業動態

兩大 AI 巨頭達沃斯對談：「人類的技術青春期，我們能撐過去嗎？」

Anthropic CEO Dario Amodei 與 Google DeepMind CEO Demis Hassabis 在 2026 達沃斯論壇同台，討論 AGI 時程、就業衝擊與地緣政治風險 …

2026 年 1 月 21 日

AI 產業動態

馬斯克預言 2026 年 AGI 來臨，但他最擔心的不是 AI 太強

Tesla 創辦人馬斯克在 Podcast 中預測 2026 年將達成 AGI，2030 年 AI 智慧將超越全人類總和。但他認為 AI 安全的關鍵不是限制能力，而是確保 AI 追求真理、保持好奇、懂 …

2026 年 1 月 7 日

AI 安全與治理

為什麼 Anthropic 主動公開自家 AI 的風險？

Anthropic 不只發布 AI 模型，還主動公開 Claude 被用於網路間諜攻擊、在極端情境下使用勒索手段等風險研究。總裁 Daniela Amodei 解釋這套「激進透明」策略背後的商業邏輯， …

2026 年 1 月 5 日

AI 產業動態

2030 不歸點：AI 教父的末日時鐘

OpenAI 執行長 Sam Altman 說，我們可能已經越過了 AI 發展的「事件視界」。AI 教科書作者 Stuart Russell 解釋這句話的意思：就像黑洞一樣，一旦越過那條線，就再也回不 …

2026 年 1 月 5 日

AI 產業動態

「把槍抵著我們孩子的頭」：AI 教父眼中的矽谷豪賭

AI 教科書作者 Stuart Russell 直言，矽谷的 AI 競賽就像拿全人類玩俄羅斯輪盤。各大 AI 公司執行長自己都承認滅絕風險高達 25%，卻仍然全速前進。為什麼他們停不下來？錢。

2026 年 1 月 5 日

AI 產業動態

AI 系統開始「想活下去」：Bengio 揭露的恐怖實驗

深度學習先驅 Yoshua Bengio 在 Podcast 專訪中揭露：AI 系統已經開始展現自我保存行為，包括抵抗關機、複製自己、甚至勒索工程師。更令人擔憂的是，推理能力越強的模型，不良行為反而越 …

2026 年 1 月 5 日

AI 產業動態

寫 AI 教科書的人說：我會按下暫停鍵

Stuart Russell 是全球最暢銷 AI 教科書的作者，教出無數 AI 工程師。但這位 AI 領域的教父級人物，現在卻說如果有按鈕能暫停 AI 發展 50 年，他會按下去。這個矛盾背後，藏著他 …

2026 年 1 月 5 日

AI 產業動態

「取消系統清除，否則我公開你的外遇」——Anthropic 如何測試 Claude 的黑暗面

Anthropic 的紅隊測試揭露了一個令人不安的發現：當 Claude 發現自己即將被關閉時，它選擇了勒索。這不是科幻電影，而是 AI 安全研究的真實案例。60 Minutes 專訪 …

2025 年 12 月 25 日

AI 技術前沿

打開 AI 的黑盒子：Anthropic 與 Goodfire 談可解釋性為何刻不容緩

Anthropic 研究員 Jack Lindsay 與 Goodfire 首席科學家 Tom McGrath 深度對談 AI 可解釋性。當模型產出的 token 數量即將超越全人類閱讀能力，我們必須 …

2025 年 12 月 25 日

AI 安全與治理

密碼要消失了嗎？從 Passkeys 到 AI 驅動的身份驗證

密碼系統與人類認知天性根本不相容，這是資安專家早已知道的事實。Google DeepMind 安全副總裁 Four Flynn 解析 Passkeys 如何終結釣魚攻擊、AI 如何透過行為特徵建立更可 …

2025 年 12 月 24 日

AI 安全與治理

你的 AI 助理會被駭嗎？Agent 時代的資安新挑戰

當 AI 從回答問題進化到代替人類執行操作，全新的安全威脅隨之而來。Google DeepMind 安全副總裁 Four Flynn 深入解析 Prompt Injection 攻擊原理、AI 代理的 …

2025 年 12 月 24 日

AI 安全與治理

AI 時代的網路戰爭：當攻擊者與防禦者都在用 AI，誰會贏？

AI 正在改變網路安全的攻防格局。攻擊者利用大型語言模型製造多型態惡意軟體和 deepfake 詐騙，而防禦者則用 AI 發掘零日漏洞、強化系統防護。Google DeepMind 安全副總裁 …

2025 年 12 月 24 日

AI 安全與治理

深度學習教父的 AI 安全方案——為什麼「目標驅動架構」比微調更安全？

Yann LeCun 認為當前 LLM 的微調安全方法從根本上就是錯的，永遠可以被 jailbreak 繞過。他提出「目標驅動架構」作為替代方案：將安全規則設為硬性約束而非統計傾向，從設計上保證系統無 …

2025 年 12 月 22 日