AI 安全與治理

問 DeepSeek「艾未未是誰」,它說:讓我們聊點別的吧
中國異議藝術家艾未未在新書宣傳期間接受英國媒體專訪,談及 DeepSeek 審查他的名字、TikTok 被川普盟友接管、西方言論自由的倒退,以及為什麼他認為 AI 是「平庸思維的最高形式」。從一個在東 …

「時間本身就是重點」——AI 時代的真實性悖論
當 AI 可以幫你省下寫稿的時間,你應該用嗎?Marketing AI Institute 創辦人 Paul Roetzer 說:有時候,你投入的時間和精力本身,才是那件事有價值的原因。這是 AI 內 …

楊立昆:AI 最大風險不是滅絕人類,是少數公司壟斷你的資訊食糧
圖靈獎得主楊立昆在達沃斯警告:當所有人的資訊來源都被幾家公司的 AI 過濾,民主、文化多樣性、價值觀都會出問題。他也首度公開談論離開 Meta 的原因,直指新上司「年輕且缺乏經驗」。

不要當末日派,也別盲目樂觀:Amodei 的「外科手術式監管」主張
AI 安全圈長期被末日派和加速派撕裂。Anthropic 執行長 Dario Amodei 試圖走第三條路:他批評末日論的「類宗教語言」,同時主張透明度立法優先於限制性法規。他提出分層監管框架,從加州 …

Anthropic 執行長萬字長文:人類正在經歷「文明的青春期」
Anthropic 執行長 Dario Amodei 發表萬字長文《The Adolescence of Technology》,以「文明的青春期」比喻人類當前處境,詳述 AI 失控、生物武器濫用、鏡 …

AI Agent 深入你的電腦——矽谷投資人激辯「信任」與「安全」的新賽局
當 AI Agent 取得你電腦的完整存取權限,信任就成了最大的競爭壁壘。矽谷投資人 Sam Lessin 警告這是「安全惡夢」,Dave Morin 卻認為這是最強大的生產力工具。這場辯論揭示了 …

陶哲軒的警告:AI 可能讓人類患上「認知肥胖症」
菲爾茲獎得主陶哲軒用「綠色革命導致肥胖症」類比 AI 對人類認知的潛在危害。當思考變得太容易外包,我們的大腦會像不運動的肌肉一樣萎縮。他也談到大學如何應對這個挑戰,以及學術經費不確定性帶來的連鎖效應。

臺裔律師如何成為 DeepMind 的 AI 風險守門人?Tom Lue 的跨界人生與前沿安全框架
Google DeepMind 前沿 AI 全球事務副總裁 Tom Lue,父母來自臺灣,從哈佛醫學預科到白宮法律顧問,再到掌管全球最強 AI 實驗室的安全治理。他如何決定一個 AI 模型能不能上線? …

如何教 AI 做個好人?Anthropic 哲學家 Amanda Askell 談 Claude 的 29,000 字憲章
Anthropic 正式發布 Claude 的新憲章,這份長達 29,000 字的文件不是一份規則清單,而是一封寫給 AI 的信。負責撰寫的哲學家 Amanda Askell 解釋為什麼「信任模型」比 …

為什麼 Anthropic 主動公開自家 AI 的風險?
Anthropic 不只發布 AI 模型,還主動公開 Claude 被用於網路間諜攻擊、在極端情境下使用勒索手段等風險研究。總裁 Daniela Amodei 解釋這套「激進透明」策略背後的商業邏輯, …

當大數據遇上國家機器:從 Palantir 看監控社會的邊界
前美國國家安全局局長 Michael Hayden 曾說:「我們根據 metadata 殺人。」這句話揭示了大數據時代的殘酷現實。從德國預測性警務實驗到美國 ICE 移民追蹤,Palantir 的技術 …

通往 AGI 的路,可能需要重新發明電腦
Unconventional AI 創辦人 Naveen Rao 認為,目前的 AI 系統缺乏對「因果關係」的真正理解,而這可能源於數位計算本身的限制。類比計算的動態系統特性,也許是解決這個問題的方向 …

AI 正在被訓練成討好你,而不是幫助你
Surge AI 創辦人 Edwin Chen 警告:AI 正在走上社群媒體的老路,被訓練成追多巴胺而不是追真相。LLM Arena 排行榜「為雜貨店結帳台買八卦雜誌的人優化」。當 AI 讓你感覺良好 …

密碼要消失了嗎?從 Passkeys 到 AI 驅動的身份驗證
密碼系統與人類認知天性根本不相容,這是資安專家早已知道的事實。Google DeepMind 安全副總裁 Four Flynn 解析 Passkeys 如何終結釣魚攻擊、AI 如何透過行為特徵建立更可 …

你的 AI 助理會被駭嗎?Agent 時代的資安新挑戰
當 AI 從回答問題進化到代替人類執行操作,全新的安全威脅隨之而來。Google DeepMind 安全副總裁 Four Flynn 深入解析 Prompt Injection 攻擊原理、AI 代理的 …

從 Operation Aurora 到 Deepfake 詐騙:一位資安老兵眼中的 15 年演變
Google DeepMind 安全副總裁 Four Flynn 親歷了 2009 年中國國家級駭客攻擊「極光行動」,這場事件改寫了企業資安的遊戲規則。從「護城河」思維到「零信任」架構,從 …

AI 時代的網路戰爭:當攻擊者與防禦者都在用 AI,誰會贏?
AI 正在改變網路安全的攻防格局。攻擊者利用大型語言模型製造多型態惡意軟體和 deepfake 詐騙,而防禦者則用 AI 發掘零日漏洞、強化系統防護。Google DeepMind 安全副總裁 …

Palantir 的「道德灰色地帶」——當 AI 遇上國家機器
Palantir CEO Alex Karp 在紐約時報峰會上為公司與 ICE 的合作辯護:「你越想讓移民執法合乎憲法,你就越需要我的產品。」這篇文章探討 AI 公司與政府合作的道德困境,以及「技術中 …

深度學習教父的 AI 安全方案——為什麼「目標驅動架構」比微調更安全?
Yann LeCun 認為當前 LLM 的微調安全方法從根本上就是錯的,永遠可以被 jailbreak 繞過。他提出「目標驅動架構」作為替代方案:將安全規則設為硬性約束而非統計傾向,從設計上保證系統無 …

「AGI 這個概念完全是鬼扯」——LeCun 如何拆解 AI 產業的集體妄想
Yann LeCun 直言 AGI 概念是「complete BS」,人類智慧根本不通用。他分析為何最樂觀也要 5-10 年才能達到「狗級智慧」,並用噴射引擎比喻回應末日論:AI 安全是工程問題,不是 …