AI 產業動態

AI 產業動態

那年被誤診的男孩,現在要讓 AI 自己做實驗

Andy Beam 小學六年級時得了百日咳,小兒科醫師卻診斷為鼻竇炎。這次誤診讓他看見醫療的認知盲點,最終成為哈佛教授、醫療 AI 先驅。2024 年他離開學界,加入 Lila Sciences 擔任 …

Context Engineering:AI Agent 開發的新核心能力
AI 產業動態

Context Engineering:AI Agent 開發的新核心能力

LLM 是純函數,輸入什麼就得到什麼。這個簡單的認知,正在重新定義 Agent 開發的核心能力。HumanLayer 創辦人 Dex Horthy 提出的 Context Engineering 概念 …

為什麼你的 AI Agent 總是不夠可靠?這個開發者訪談了 100 人後找到答案
AI 產業動態

為什麼你的 AI Agent 總是不夠可靠?這個開發者訪談了 100 人後找到答案

用框架快速做出 Agent 很容易,但要突破 70-80% 的完成度卻很難。HumanLayer 創辦人 Dex Horthy 訪談超過 100 位開發者後發現:生產環境中真正可靠的 Agent,其實 …

12-Factor Agents:當 Agent 開發遇上軟體工程的老派智慧
AI 產業動態

12-Factor Agents:當 Agent 開發遇上軟體工程的老派智慧

HumanLayer 創辦人 Dex Horthy 訪談超過 100 位開發者後,整理出建構可靠 AI Agent 的 12 條原則。核心洞見:Agent 就是軟體,LLM 就是純函數,Context …

訓練 AI 代理的四個不能妥協——OpenAI 的 Agent RFT 實戰指南
AI 產業動態

訓練 AI 代理的四個不能妥協——OpenAI 的 Agent RFT 實戰指南

OpenAI 分享使用 Agent RFT 訓練 AI 代理的四大成功原則:任務要明確可評分、訓練資料要像生產環境、讓模型有探索空間、以及獎勵函數不能被鑽漏洞。這些原則來自與 …

Devin 背後的秘密:Cognition 如何用 Agent RFT 讓 AI 學會平行處理
AI 產業動態

Devin 背後的秘密:Cognition 如何用 Agent RFT 讓 AI 學會平行處理

Cognition 使用 OpenAI 的 Agent RFT 訓練 Devin 的程式碼規劃功能,將工具呼叫步驟從 8-10 步降到 4 步。透過 F1 評分、獨立 VM 架構、以及從 100 到 …

10 個範例就能訓練出更強的 AI 代理——四家公司怎麼做到的?
AI 產業動態

10 個範例就能訓練出更強的 AI 代理——四家公司怎麼做到的?

OpenAI 的 Agent RFT 讓企業能用少量資料訓練出高效能的 AI 代理。Cognition、Kodo、Cosine、MACO 四家公司分享實戰經驗:從 100 個範例獲得 5% 提升、到用 …

80 年來首次,有人想重寫計算的底層架構
AI 產業動態

80 年來首次,有人想重寫計算的底層架構

Unconventional AI 創辦人 Naveen Rao 正在嘗試一件「瘋狂」的事:用類比電路取代數位電路來執行 AI 運算。這不是漸進式改良,而是對計算本質的重新思考。

2026 企業 AI 轉型生存指南——Klarna 的教訓與三個不踩雷原則
AI 產業動態

2026 企業 AI 轉型生存指南——Klarna 的教訓與三個不踩雷原則

Klarna 曾高調宣稱 AI 客服取代 700 名員工、一個月處理 230 萬通電話,卻在一年後全面撤回。前麥肯錫 QuantumBlack Labs 全球主管、現任 Invisible …

OpenAI 讓 AI 在訓練時操作真實世界——Agent RFT 是什麼?
AI 產業動態

OpenAI 讓 AI 在訓練時操作真實世界——Agent RFT 是什麼?

OpenAI 推出 Agent RFT,首次讓模型在訓練過程中與外部世界互動。這項技術允許 AI 代理在訓練時呼叫真實的工具端點,並透過自訂獎勵函數學習最佳行為模式。對於打造企業級 AI 代理的開發者 …

7 小時 vs 2 週——AI 編程的 10 倍速真相與代價
AI 產業動態

7 小時 vs 2 週——AI 編程的 10 倍速真相與代價

一個週六下午,35,000 行程式碼。HumanLayer 創辦人 Dex Horthy 分享他在 300,000 行 Rust codebase 中 one-shot fix 的實戰案例,以及在 …

Sergey Brin 在史丹佛百年校慶問了一個尷尬的問題:大學還需要存在嗎?
AI 產業動態

Sergey Brin 在史丹佛百年校慶問了一個尷尬的問題:大學還需要存在嗎?

在史丹佛工程學院百年校慶活動上,Google 共同創辦人 Sergey Brin 提出了一個令主辦方尷尬的問題:在 AI 和線上課程的時代,傳統地理集中式的大學還有存在的必要嗎?這位從史丹佛輟學創辦 …

從斯大林到普京 — 俄羅斯對中國百年不變的策略
AI 產業動態

從斯大林到普京 — 俄羅斯對中國百年不變的策略

沙皇、蘇聯、俄羅斯聯邦——政權更迭,但對中國的策略驚人一致:永遠不讓中國變強。美國海軍戰院教授 Sarah Paine 梳理 170 年歷史,揭露「中俄友誼」背後的真相。從鴉片戰爭到烏克蘭戰爭,這套劇 …

Anthropic 被控「偷降 Opus」?AI 公司的信任危機
AI 產業動態

Anthropic 被控「偷降 Opus」?AI 公司的信任危機

Opus 4.5 推出後獲得好評,但最近 Twitter 上出現大量使用者抱怨模型「變笨了」。是 Anthropic 偷偷降級模型來節省成本,還是使用者的期望值過高?這場爭議揭示了 AI 公司面臨的透 …

Sergey Brin 的史丹佛往事:從撬鎖、溜直排輪到創辦 Google
AI 產業動態

Sergey Brin 的史丹佛往事:從撬鎖、溜直排輪到創辦 Google

在史丹佛工程學院百年校慶上,Google 共同創辦人 Sergey Brin 回憶了他在 PhD 時期的往事:研究逆向碎紙機、學會撬鎖、爬鷹架入侵電腦系統取得萬能門禁卡。這些看似荒謬的經歷,揭示了什麼 …

大陸帝國的生存法則 — 理解俄羅斯與中國行為的底層邏輯
AI 產業動態

大陸帝國的生存法則 — 理解俄羅斯與中國行為的底層邏輯

為什麼古代廢墟都是廢墟?美國海軍戰院教授 Sarah Paine 提出「大陸帝國法則」:不要兩線作戰、不要有強鄰。這套法則解釋了俄羅斯和中國數百年來的行為模式,也解釋了為什麼海洋秩序創造繁榮,而大陸秩 …

從 Spec-Driven Dev 到 Context Engineering——AI 編程方法論的語意漂移
AI 產業動態

從 Spec-Driven Dev 到 Context Engineering——AI 編程方法論的語意漂移

「Spec-Driven Development」這個詞已經壞掉了。HumanLayer 創辦人 Dex Horthy 引用 Martin Fowler 的「語意擴散」理論,解釋為什麼流行術語會失去意 …

每小時 2 美元的 AI 夢:肯亞標註員揭露矽谷的隱藏人力成本
AI 產業動態

每小時 2 美元的 AI 夢:肯亞標註員揭露矽谷的隱藏人力成本

當我們讚嘆 AI 的神奇時,很少人知道背後有一支龐大的人類大軍正在訓練這些模型。在肯亞,數學系畢業生每小時賺 2 美元,整天看著暴力和色情內容,為 Meta 和 OpenAI 標註資料。60 …

Ilya Sutskever 離開 OpenAI 後首次深度訪談:10 個關鍵洞見
AI 產業動態

Ilya Sutskever 離開 OpenAI 後首次深度訪談:10 個關鍵洞見

OpenAI 共同創辦人 Ilya Sutskever 在離開後接受 Dwarkesh Patel 專訪,談論 AI 產業的典範轉移、模型泛化能力的根本問題、超級智慧的願景,以及他創辦 SSI 的真正 …

從圖書館到 ChatGPT:取得知識的成本正在歸零
AI 產業動態

從圖書館到 ChatGPT:取得知識的成本正在歸零

OpenAI o1 共同創作者 Jason Wei 用一個問題說明 AI 時代的變化:1983 年釜山有多少對新人結婚?這個問題在不同時代的回答成本,從幾天壓縮到幾分鐘。當知識取得成本趨近於零,什麼會 …