AI 訓練

AI 技術前沿
Karpathy:「強化學習很糟糕,只是之前的方法更糟」
Andrej Karpathy 對強化學習提出尖銳批評:我們正在「用吸管吸取監督訊號」。人類根本不是這樣學習的。但目前沒有更好的方法,所以我們只能繼續用這個「很糟糕」的工具。

AI 產業動態
從資料標註到「養育人類的孩子」——AI 訓練的真相
Surge AI 創辦人 Edwin Chen 深度訪談:為什麼 AI 訓練不是「標註貓照片」?諾貝爾獎等級的詩如何定義品質、RL 環境如何模擬真實世界,以及為什麼人類在 AI 訓練中不會消失。

AI 技術前沿
為什麼 Claude 寫程式碼這麼強?訓練 AI 的內幕人士揭露答案
Surge AI 創辦人 Edwin Chen 揭露 Claude 領先的秘密:不是更多資料,而是品味。Anthropic 對「什麼是好」有更高的標準,願意在 benchmark 上「輸」,換取真實任 …

AI 產業動態
訓練 ChatGPT 的公司,給 AI 時代創業者的一堂課
Surge AI 四年內營收突破 10 億美元,員工不到 100 人,從未募資。創辦人 Edwin Chen 分享反矽谷的創業哲學:不要 pivot、不要閃電擴張、專注做一件只有你能做的事。他把訓練 …

AI 技術前沿
Codex 用 Codex 來訓練自己——AI 自我改進的第一個徵兆
OpenAI 內部正在發生一件有趣的事:Codex 正在幫忙訓練 Codex。這不是概念描述,而是字面上的意思——Codex 寫程式碼來監控自己的訓練過程、發現問題、做出決策。這是 AI 遞迴自我改進 …