2020 年 1 月,OpenAI 的 Jared Kaplan 等人發表了 Scaling Laws 論文,用冪律方程式證明語言模型的表現與參數量、資料量、計算量之間存在可預測的數學關係。這篇沒有提 …