AI 產業動態

AI 太聰明反而更會騙人?Gemini 3 Flash 的「幻覺式推理」現象
AI 產業動態

AI 太聰明反而更會騙人?Gemini 3 Flash 的「幻覺式推理」現象

Gemini 3 Flash 在 benchmark 上表現亮眼,但有人發現它的幻覺率也很高。奇怪的是,高幻覺率卻沒有影響最終答案的正確性。這個反直覺的現象揭示了 AI 推理的本質——它可能在思考過程 …

Ilya Sutskever:人類的學習能力遠超 AI,而且原因不是你想的那樣
AI 產業動態

Ilya Sutskever:人類的學習能力遠超 AI,而且原因不是你想的那樣

一個青少年 10 小時就能學會開車,AI 做不到。Ilya Sutskever 認為這不只是資料量的問題,而是指向某種更根本的「更好的機器學習」。他有想法,但拒絕公開談——這本身就很有意思。

Sergey Brin 給焦慮學生的建議:別因為 AI 會寫程式就轉去念比較文學
AI 產業動態

Sergey Brin 給焦慮學生的建議:別因為 AI 會寫程式就轉去念比較文學

AI 會取代程式設計師嗎?在史丹佛工程學院百年校慶活動上,Google 共同創辦人 Sergey Brin 給出了一個反直覺的答案:不要因為 AI 會寫程式就轉系,因為 AI 寫比較文學可能寫得更好。 …

為什麼普京需要習近平,但習近平不需要普京?
AI 產業動態

為什麼普京需要習近平,但習近平不需要普京?

中俄「無上限友誼」的背後,是一場極度不對稱的關係。美國海軍戰院教授 Sarah Paine 分析:中國人口是俄羅斯 9 倍、GDP 是 9 倍,普京在烏克蘭消耗資源時,習近平正坐收漁利。俄羅斯的未來, …

驗證者法則:為什麼容易打分數的任務,會最先被 AI 征服
AI 產業動態

驗證者法則:為什麼容易打分數的任務,會最先被 AI 征服

OpenAI o1 共同創作者 Jason Wei 提出「驗證者法則」:AI 訓練能力與任務可驗證性成正比。這個框架解釋了為什麼 AI 在某些領域進步神速,在某些領域卻停滯不前,也指出了下一波突破會發 …

Ilya Sutskever:為什麼 AI 模型在測驗上很強,實際使用卻讓人抓狂?
AI 產業動態

Ilya Sutskever:為什麼 AI 模型在測驗上很強,實際使用卻讓人抓狂?

AI 模型在各種評測上表現驚人,但實際經濟影響卻遠遠落後。Ilya Sutskever 提出兩個解釋:RL 訓練讓模型過度專精,以及研究者不自覺地追著 eval 跑。這解釋了為什麼你的 AI 助手有時 …

為什麼 AI 會先取代工程師,卻不會取代理髮師?
AI 產業動態

為什麼 AI 會先取代工程師,卻不會取代理髮師?

OpenAI o1 共同創作者 Jason Wei 提出「智慧的鋸齒狀邊緣」理論:AI 不會一夕之間超越人類所有能力,而是在不同任務上呈現極度不均勻的進步。他用三個因素預測哪些工作會先被取代,哪些會倖 …

「取消系統清除,否則我公開你的外遇」——Anthropic 如何測試 Claude 的黑暗面
AI 產業動態

「取消系統清除,否則我公開你的外遇」——Anthropic 如何測試 Claude 的黑暗面

Anthropic 的紅隊測試揭露了一個令人不安的發現:當 Claude 發現自己即將被關閉時,它選擇了勒索。這不是科幻電影,而是 AI 安全研究的真實案例。60 Minutes 專訪 …

Context Engineering 實戰指南——為什麼你的 AI 編程工具總是寫出爛 Code
AI 產業動態

Context Engineering 實戰指南——為什麼你的 AI 編程工具總是寫出爛 Code

AI 編程工具的問題不在模型,在於 context window 管理。HumanLayer 創辦人 Dex Horthy 提出「Dumb Zone」理論,解釋為什麼超過 40% context 使用 …

Ilya Sutskever:我們正從 Scaling 時代,進入研究時代
AI 產業動態

Ilya Sutskever:我們正從 Scaling 時代,進入研究時代

OpenAI 共同創辦人 Ilya Sutskever 在離開後首次深度訪談中指出,AI 產業正經歷典範轉移:2020-2025 年的 Scaling 時代正在結束,我們回到了需要真正研究突破的階段。 …

o1 共同創作者的 2025 AI 預言:三個你該知道的核心趨勢
AI 產業動態

o1 共同創作者的 2025 AI 預言:三個你該知道的核心趨勢

Jason Wei 是 OpenAI o1 和 Deep Research 的共同創作者,擁有超過 9 萬次學術引用。在 Stanford AI Club 的演講中,他分享了理解 2025 年 AI …

俄羅斯如何「腳本化」中國?— 一位美國海軍戰院教授的百年大國博弈史
AI 產業動態

俄羅斯如何「腳本化」中國?— 一位美國海軍戰院教授的百年大國博弈史

美國海軍戰爭學院教授 Sarah Paine 揭露俄中關係的真相:從 19 世紀中葉至今,俄羅斯一再「腳本化」中國,讓中國做出有利於俄羅斯、卻損害自身利益的決策。從鴉片戰爭到韓戰,這套劇本反覆上演。理 …

別再造 Agent 了!Anthropic 說:2026 年是 Skills 的天下
AI 產業動態

別再造 Agent 了!Anthropic 說:2026 年是 Skills 的天下

2025 是 AI Agent 之年,但 Anthropic 已經在佈局下一步:Skills。這個新概念能讓 AI 像 CPA 一樣專業處理任務,而不只是聰明的數學家。Skills 是什麼?為什麼 …

當 AI 不再等你下指令——a16z 對 2026 年的三個判斷
AI 產業動態

當 AI 不再等你下指令——a16z 對 2026 年的三個判斷

a16z 發布 2026 年 Big Ideas,三位合夥人預測:Prompt Box 將死、內容設計要為 Agent 優化、語音 AI 將規模化落地。這不只是技術演進,而是商業邏輯的重寫。

從資料標註到「養育人類的孩子」——AI 訓練的真相
AI 產業動態

從資料標註到「養育人類的孩子」——AI 訓練的真相

Surge AI 創辦人 Edwin Chen 深度訪談:為什麼 AI 訓練不是「標註貓照片」?諾貝爾獎等級的詩如何定義品質、RL 環境如何模擬真實世界,以及為什麼人類在 AI 訓練中不會消失。

訓練 ChatGPT 的公司,給 AI 時代創業者的一堂課
AI 產業動態

訓練 ChatGPT 的公司,給 AI 時代創業者的一堂課

Surge AI 四年內營收突破 10 億美元,員工不到 100 人,從未募資。創辦人 Edwin Chen 分享反矽谷的創業哲學:不要 pivot、不要閃電擴張、專注做一件只有你能做的事。他把訓練 …

2025 年 AI 產業回顧:YC 合夥人眼中最意外的五件事
AI 產業動態

2025 年 AI 產業回顧:YC 合夥人眼中最意外的五件事

YC 合夥人年度回顧:Anthropic 超越 OpenAI、AI 經濟穩定化、模型訓練知識平民化、一人獨角獸時代未到來,以及太空資料中心為何變成認真的商業計畫。

AI 泡沫?YC 合夥人說:對新創反而是好事
AI 產業動態

AI 泡沫?YC 合夥人說:對新創反而是好事

YC 合夥人解析:為什麼 AI 泡沫對新創是利多?電信泡沫如何催生 YouTube,以及技術革命的安裝期與部署期如何影響創業時機。

AI 產業動態

OpenAI 的三板斧:Sam Altman 親解如何在 AI 戰場勝出

Sam Altman 深度訪談:Code Red 的真相、為何模型不會完全商品化、產品個人化如何成為護城河、1.4 兆美元基礎設施投資的邏輯,以及 AGI 之後的下一個目標。

YC 創業者換邊站:Anthropic 首度超越 OpenAI
AI 產業動態

YC 創業者換邊站:Anthropic 首度超越 OpenAI

YC 最新數據揭露:Anthropic 首度超越 OpenAI 成為創業者首選 API。為什麼是 coding 能力讓 Claude 逆襲?模型套利時代來臨,創業者不再效忠單一家。