Agent RFT

OpenAI 分享使用 Agent RFT 訓練 AI 代理的四大成功原則：任務要明確可評分、訓練資料要像生產環境、讓模型有探索空間、以及獎勵函數不能被鑽漏洞。這些原則來自與 …

Cognition 使用 OpenAI 的 Agent RFT 訓練 Devin 的程式碼規劃功能，將工具呼叫步驟從 8-10 步降到 4 步。透過 F1 評分、獨立 VM 架構、以及從 100 到 …

OpenAI 的 Agent RFT 讓企業能用少量資料訓練出高效能的 AI 代理。Cognition、Kodo、Cosine、MACO 四家公司分享實戰經驗：從 100 個範例獲得 5% 提升、到用 …

OpenAI 推出 Agent RFT，首次讓模型在訓練過程中與外部世界互動。這項技術允許 AI 代理在訓練時呼叫真實的工具端點，並透過自訂獎勵函數學習最佳行為模式。對於打造企業級 AI 代理的開發者 …