Agent RFT

AI 產業動態
訓練 AI 代理的四個不能妥協——OpenAI 的 Agent RFT 實戰指南
OpenAI 分享使用 Agent RFT 訓練 AI 代理的四大成功原則:任務要明確可評分、訓練資料要像生產環境、讓模型有探索空間、以及獎勵函數不能被鑽漏洞。這些原則來自與 …

AI 產業動態
Devin 背後的秘密:Cognition 如何用 Agent RFT 讓 AI 學會平行處理
Cognition 使用 OpenAI 的 Agent RFT 訓練 Devin 的程式碼規劃功能,將工具呼叫步驟從 8-10 步降到 4 步。透過 F1 評分、獨立 VM 架構、以及從 100 到 …

AI 產業動態
10 個範例就能訓練出更強的 AI 代理——四家公司怎麼做到的?
OpenAI 的 Agent RFT 讓企業能用少量資料訓練出高效能的 AI 代理。Cognition、Kodo、Cosine、MACO 四家公司分享實戰經驗:從 100 個範例獲得 5% 提升、到用 …

AI 產業動態
OpenAI 讓 AI 在訓練時操作真實世界——Agent RFT 是什麼?
OpenAI 推出 Agent RFT,首次讓模型在訓練過程中與外部世界互動。這項技術允許 AI 代理在訓練時呼叫真實的工具端點,並透過自訂獎勵函數學習最佳行為模式。對於打造企業級 AI 代理的開發者 …