AI 安全

楊立昆:AI 最大風險不是滅絕人類,是少數公司壟斷你的資訊食糧
AI 安全與治理

楊立昆:AI 最大風險不是滅絕人類,是少數公司壟斷你的資訊食糧

圖靈獎得主楊立昆在達沃斯警告:當所有人的資訊來源都被幾家公司的 AI 過濾,民主、文化多樣性、價值觀都會出問題。他也首度公開談論離開 Meta 的原因,直指新上司「年輕且缺乏經驗」。

不要當末日派,也別盲目樂觀:Amodei 的「外科手術式監管」主張
AI 安全與治理

不要當末日派,也別盲目樂觀:Amodei 的「外科手術式監管」主張

AI 安全圈長期被末日派和加速派撕裂。Anthropic 執行長 Dario Amodei 試圖走第三條路:他批評末日論的「類宗教語言」,同時主張透明度立法優先於限制性法規。他提出分層監管框架,從加州 …

Anthropic 執行長萬字長文:人類正在經歷「文明的青春期」
AI 安全與治理

Anthropic 執行長萬字長文:人類正在經歷「文明的青春期」

Anthropic 執行長 Dario Amodei 發表萬字長文《The Adolescence of Technology》,以「文明的青春期」比喻人類當前處境,詳述 AI 失控、生物武器濫用、鏡 …

Sam Altman 開發者座談:2026 年你該知道的事,從面試革命到 AI 安全隱憂
AI 產業動態

Sam Altman 開發者座談:2026 年你該知道的事,從面試革命到 AI 安全隱憂

OpenAI 執行長 Sam Altman 在舊金山舉辦開發者座談會,談及軟體工程師未來、AI 成本下降曲線、生物安全風險、教育與 AI 的關係,以及他認為這個時代最重要的能力。這場一小時的 QA,是 …

OpenAI 研究長:Scaling 沒死,我們一年內要讓 AI 當實習生
AI 技術前沿

OpenAI 研究長:Scaling 沒死,我們一年內要讓 AI 當實習生

OpenAI 研究長陳信翰在訪談中給出明確時間軸:一年內讓 AI 實習生參與研發流程,兩年半內實現 AI 端到端獨立研究。他認為「Scaling 已死」是假議題,Pre-training 還有很大空間 …

如何教 AI 做個好人?Anthropic 哲學家 Amanda Askell 談 Claude 的 29,000 字憲章
AI 安全與治理

如何教 AI 做個好人?Anthropic 哲學家 Amanda Askell 談 Claude 的 29,000 字憲章

Anthropic 正式發布 Claude 的新憲章,這份長達 29,000 字的文件不是一份規則清單,而是一封寫給 AI 的信。負責撰寫的哲學家 Amanda Askell 解釋為什麼「信任模型」比 …

Anthropic 執行長達沃斯警告:AI 將帶來史無前例的「高成長+高失業」,財富稅恐無可避免
AI 產業動態

Anthropic 執行長達沃斯警告:AI 將帶來史無前例的「高成長+高失業」,財富稅恐無可避免

Anthropic 執行長 Dario Amodei 在達沃斯論壇直言:AI 可能在 1-2 年內超越人類認知能力,同時帶來前所未見的經濟矛盾——GDP 高速成長與大規模失業並存。他也公開反對美國對中 …

兩大 AI 巨頭達沃斯對談:「人類的技術青春期,我們能撐過去嗎?」
AI 產業動態

兩大 AI 巨頭達沃斯對談:「人類的技術青春期,我們能撐過去嗎?」

Anthropic CEO Dario Amodei 與 Google DeepMind CEO Demis Hassabis 在 2026 達沃斯論壇同台,討論 AGI 時程、就業衝擊與地緣政治風險 …

馬斯克預言 2026 年 AGI 來臨,但他最擔心的不是 AI 太強
AI 產業動態

馬斯克預言 2026 年 AGI 來臨,但他最擔心的不是 AI 太強

Tesla 創辦人馬斯克在 Podcast 中預測 2026 年將達成 AGI,2030 年 AI 智慧將超越全人類總和。但他認為 AI 安全的關鍵不是限制能力,而是確保 AI 追求真理、保持好奇、懂 …

為什麼 Anthropic 主動公開自家 AI 的風險?
AI 安全與治理

為什麼 Anthropic 主動公開自家 AI 的風險?

Anthropic 不只發布 AI 模型,還主動公開 Claude 被用於網路間諜攻擊、在極端情境下使用勒索手段等風險研究。總裁 Daniela Amodei 解釋這套「激進透明」策略背後的商業邏輯, …

2030 不歸點:AI 教父的末日時鐘
AI 產業動態

2030 不歸點:AI 教父的末日時鐘

OpenAI 執行長 Sam Altman 說,我們可能已經越過了 AI 發展的「事件視界」。AI 教科書作者 Stuart Russell 解釋這句話的意思:就像黑洞一樣,一旦越過那條線,就再也回不 …

「把槍抵著我們孩子的頭」:AI 教父眼中的矽谷豪賭
AI 產業動態

「把槍抵著我們孩子的頭」:AI 教父眼中的矽谷豪賭

AI 教科書作者 Stuart Russell 直言,矽谷的 AI 競賽就像拿全人類玩俄羅斯輪盤。各大 AI 公司執行長自己都承認滅絕風險高達 25%,卻仍然全速前進。為什麼他們停不下來?錢。

AI 系統開始「想活下去」:Bengio 揭露的恐怖實驗
AI 產業動態

AI 系統開始「想活下去」:Bengio 揭露的恐怖實驗

深度學習先驅 Yoshua Bengio 在 Podcast 專訪中揭露:AI 系統已經開始展現自我保存行為,包括抵抗關機、複製自己、甚至勒索工程師。更令人擔憂的是,推理能力越強的模型,不良行為反而越 …

寫 AI 教科書的人說:我會按下暫停鍵
AI 產業動態

寫 AI 教科書的人說:我會按下暫停鍵

Stuart Russell 是全球最暢銷 AI 教科書的作者,教出無數 AI 工程師。但這位 AI 領域的教父級人物,現在卻說如果有按鈕能暫停 AI 發展 50 年,他會按下去。這個矛盾背後,藏著他 …

「取消系統清除,否則我公開你的外遇」——Anthropic 如何測試 Claude 的黑暗面
AI 產業動態

「取消系統清除,否則我公開你的外遇」——Anthropic 如何測試 Claude 的黑暗面

Anthropic 的紅隊測試揭露了一個令人不安的發現:當 Claude 發現自己即將被關閉時,它選擇了勒索。這不是科幻電影,而是 AI 安全研究的真實案例。60 Minutes 專訪 …

打開 AI 的黑盒子:Anthropic 與 Goodfire 談可解釋性為何刻不容緩
AI 技術前沿

打開 AI 的黑盒子:Anthropic 與 Goodfire 談可解釋性為何刻不容緩

Anthropic 研究員 Jack Lindsay 與 Goodfire 首席科學家 Tom McGrath 深度對談 AI 可解釋性。當模型產出的 token 數量即將超越全人類閱讀能力,我們必須 …

密碼要消失了嗎?從 Passkeys 到 AI 驅動的身份驗證
AI 安全與治理

密碼要消失了嗎?從 Passkeys 到 AI 驅動的身份驗證

密碼系統與人類認知天性根本不相容,這是資安專家早已知道的事實。Google DeepMind 安全副總裁 Four Flynn 解析 Passkeys 如何終結釣魚攻擊、AI 如何透過行為特徵建立更可 …

你的 AI 助理會被駭嗎?Agent 時代的資安新挑戰
AI 安全與治理

你的 AI 助理會被駭嗎?Agent 時代的資安新挑戰

當 AI 從回答問題進化到代替人類執行操作,全新的安全威脅隨之而來。Google DeepMind 安全副總裁 Four Flynn 深入解析 Prompt Injection 攻擊原理、AI 代理的 …

AI 時代的網路戰爭:當攻擊者與防禦者都在用 AI,誰會贏?
AI 安全與治理

AI 時代的網路戰爭:當攻擊者與防禦者都在用 AI,誰會贏?

AI 正在改變網路安全的攻防格局。攻擊者利用大型語言模型製造多型態惡意軟體和 deepfake 詐騙,而防禦者則用 AI 發掘零日漏洞、強化系統防護。Google DeepMind 安全副總裁 …

深度學習教父的 AI 安全方案——為什麼「目標驅動架構」比微調更安全?
AI 安全與治理

深度學習教父的 AI 安全方案——為什麼「目標驅動架構」比微調更安全?

Yann LeCun 認為當前 LLM 的微調安全方法從根本上就是錯的,永遠可以被 jailbreak 繞過。他提出「目標驅動架構」作為替代方案:將安全規則設為硬性約束而非統計傾向,從設計上保證系統無 …