--:-- --
----年--月--日 週-
AI 新商業情報觀察站
台北
東京
倫敦
AINEXT
紐約
鳳凰城
舊金山
AI 技術前沿
AI 產業動態
AI 開發實戰
AI 安全與治理
科技巨頭觀察
地緣政治與經濟
領袖思維
職涯與學習
AI 活動
AI 公司
AI 人物
Custom Evals
AI 技術前沿
AI 基準測試革命——為什麼通用評測無法告訴你 AI 能不能用在你的業務
當 OpenAI 發布新模型,我們會看到各種基準測試分數:編程能力提升 20%、數學推理進步 15%。但這些數字對企業導入 AI 的意義有限。前麥肯錫 QuantumBlack Labs 主管 …
2025 年 12 月 25 日