AI 訓練

Andrej Karpathy 對強化學習提出尖銳批評：我們正在「用吸管吸取監督訊號」。人類根本不是這樣學習的。但目前沒有更好的方法，所以我們只能繼續用這個「很糟糕」的工具。

Surge AI 創辦人 Edwin Chen 深度訪談：為什麼 AI 訓練不是「標註貓照片」？諾貝爾獎等級的詩如何定義品質、RL 環境如何模擬真實世界，以及為什麼人類在 AI 訓練中不會消失。

Surge AI 創辦人 Edwin Chen 揭露 Claude 領先的秘密：不是更多資料，而是品味。Anthropic 對「什麼是好」有更高的標準，願意在 benchmark 上「輸」，換取真實任 …

Surge AI 四年內營收突破 10 億美元，員工不到 100 人，從未募資。創辦人 Edwin Chen 分享反矽谷的創業哲學：不要 pivot、不要閃電擴張、專注做一件只有你能做的事。他把訓練 …

OpenAI 內部正在發生一件有趣的事：Codex 正在幫忙訓練 Codex。這不是概念描述，而是字面上的意思——Codex 寫程式碼來監控自己的訓練過程、發現問題、做出決策。這是 AI 遞迴自我改進 …