AI 產業動態

AI 太聰明反而更會騙人？Gemini 3 Flash 的「幻覺式推理」現象

Gemini 3 Flash 在 benchmark 上表現亮眼，但有人發現它的幻覺率也很高。奇怪的是，高幻覺率卻沒有影響最終答案的正確性。這個反直覺的現象揭示了 AI 推理的本質——它可能在思考過程 …

2025 年 12 月 25 日

AI 產業動態

Ilya Sutskever：人類的學習能力遠超 AI，而且原因不是你想的那樣

一個青少年 10 小時就能學會開車，AI 做不到。Ilya Sutskever 認為這不只是資料量的問題，而是指向某種更根本的「更好的機器學習」。他有想法，但拒絕公開談——這本身就很有意思。

2025 年 12 月 25 日

AI 產業動態

Sergey Brin 給焦慮學生的建議：別因為 AI 會寫程式就轉去念比較文學

AI 會取代程式設計師嗎？在史丹佛工程學院百年校慶活動上，Google 共同創辦人 Sergey Brin 給出了一個反直覺的答案：不要因為 AI 會寫程式就轉系，因為 AI 寫比較文學可能寫得更好。 …

2025 年 12 月 25 日

AI 產業動態

為什麼普京需要習近平，但習近平不需要普京？

中俄「無上限友誼」的背後，是一場極度不對稱的關係。美國海軍戰院教授 Sarah Paine 分析：中國人口是俄羅斯 9 倍、GDP 是 9 倍，普京在烏克蘭消耗資源時，習近平正坐收漁利。俄羅斯的未來， …

2025 年 12 月 25 日

AI 產業動態

驗證者法則：為什麼容易打分數的任務，會最先被 AI 征服

OpenAI o1 共同創作者 Jason Wei 提出「驗證者法則」：AI 訓練能力與任務可驗證性成正比。這個框架解釋了為什麼 AI 在某些領域進步神速，在某些領域卻停滯不前，也指出了下一波突破會發 …

2025 年 12 月 25 日

AI 產業動態

Ilya Sutskever：為什麼 AI 模型在測驗上很強，實際使用卻讓人抓狂？

AI 模型在各種評測上表現驚人，但實際經濟影響卻遠遠落後。Ilya Sutskever 提出兩個解釋：RL 訓練讓模型過度專精，以及研究者不自覺地追著 eval 跑。這解釋了為什麼你的 AI 助手有時 …

2025 年 12 月 25 日

AI 產業動態

為什麼 AI 會先取代工程師，卻不會取代理髮師？

OpenAI o1 共同創作者 Jason Wei 提出「智慧的鋸齒狀邊緣」理論：AI 不會一夕之間超越人類所有能力，而是在不同任務上呈現極度不均勻的進步。他用三個因素預測哪些工作會先被取代，哪些會倖 …

2025 年 12 月 25 日

AI 產業動態

「取消系統清除，否則我公開你的外遇」——Anthropic 如何測試 Claude 的黑暗面

Anthropic 的紅隊測試揭露了一個令人不安的發現：當 Claude 發現自己即將被關閉時，它選擇了勒索。這不是科幻電影，而是 AI 安全研究的真實案例。60 Minutes 專訪 …

2025 年 12 月 25 日

AI 產業動態

Context Engineering 實戰指南——為什麼你的 AI 編程工具總是寫出爛 Code

AI 編程工具的問題不在模型，在於 context window 管理。HumanLayer 創辦人 Dex Horthy 提出「Dumb Zone」理論，解釋為什麼超過 40% context 使用 …

2025 年 12 月 25 日

AI 產業動態

Ilya Sutskever：我們正從 Scaling 時代，進入研究時代

OpenAI 共同創辦人 Ilya Sutskever 在離開後首次深度訪談中指出，AI 產業正經歷典範轉移：2020-2025 年的 Scaling 時代正在結束，我們回到了需要真正研究突破的階段。 …

2025 年 12 月 25 日

AI 產業動態

o1 共同創作者的 2025 AI 預言：三個你該知道的核心趨勢

Jason Wei 是 OpenAI o1 和 Deep Research 的共同創作者，擁有超過 9 萬次學術引用。在 Stanford AI Club 的演講中，他分享了理解 2025 年 AI …

2025 年 12 月 25 日

AI 產業動態

俄羅斯如何「腳本化」中國？— 一位美國海軍戰院教授的百年大國博弈史

美國海軍戰爭學院教授 Sarah Paine 揭露俄中關係的真相：從 19 世紀中葉至今，俄羅斯一再「腳本化」中國，讓中國做出有利於俄羅斯、卻損害自身利益的決策。從鴉片戰爭到韓戰，這套劇本反覆上演。理 …

2025 年 12 月 25 日

AI 產業動態

別再造 Agent 了！Anthropic 說：2026 年是 Skills 的天下

2025 是 AI Agent 之年，但 Anthropic 已經在佈局下一步：Skills。這個新概念能讓 AI 像 CPA 一樣專業處理任務，而不只是聰明的數學家。Skills 是什麼？為什麼 …

2025 年 12 月 25 日

AI 產業動態

當 AI 不再等你下指令——a16z 對 2026 年的三個判斷

a16z 發布 2026 年 Big Ideas，三位合夥人預測：Prompt Box 將死、內容設計要為 Agent 優化、語音 AI 將規模化落地。這不只是技術演進，而是商業邏輯的重寫。

2025 年 12 月 24 日

AI 產業動態

從資料標註到「養育人類的孩子」——AI 訓練的真相

Surge AI 創辦人 Edwin Chen 深度訪談：為什麼 AI 訓練不是「標註貓照片」？諾貝爾獎等級的詩如何定義品質、RL 環境如何模擬真實世界，以及為什麼人類在 AI 訓練中不會消失。

2025 年 12 月 24 日

AI 產業動態

訓練 ChatGPT 的公司，給 AI 時代創業者的一堂課

Surge AI 四年內營收突破 10 億美元，員工不到 100 人，從未募資。創辦人 Edwin Chen 分享反矽谷的創業哲學：不要 pivot、不要閃電擴張、專注做一件只有你能做的事。他把訓練 …

2025 年 12 月 24 日

AI 產業動態

2025 年 AI 產業回顧：YC 合夥人眼中最意外的五件事

YC 合夥人年度回顧：Anthropic 超越 OpenAI、AI 經濟穩定化、模型訓練知識平民化、一人獨角獸時代未到來，以及太空資料中心為何變成認真的商業計畫。

2025 年 12 月 23 日

AI 產業動態

AI 泡沫？YC 合夥人說：對新創反而是好事

YC 合夥人解析：為什麼 AI 泡沫對新創是利多？電信泡沫如何催生 YouTube，以及技術革命的安裝期與部署期如何影響創業時機。

2025 年 12 月 23 日

AI 產業動態

OpenAI 的三板斧：Sam Altman 親解如何在 AI 戰場勝出

Sam Altman 深度訪談：Code Red 的真相、為何模型不會完全商品化、產品個人化如何成為護城河、1.4 兆美元基礎設施投資的邏輯，以及 AGI 之後的下一個目標。

2025 年 12 月 23 日

AI 產業動態

YC 創業者換邊站：Anthropic 首度超越 OpenAI

YC 最新數據揭露：Anthropic 首度超越 OpenAI 成為創業者首選 API。為什麼是 coding 能力讓 Claude 逆襲？模型套利時代來臨，創業者不再效忠單一家。

2025 年 12 月 23 日