AI 產業動態

AI 教母李飛飛:ImageNet 不是天才的發明,是站在巨人肩上的集體成果

李飛飛在 Tim Ferriss 節目中分享 ImageNet 的誕生故事。她強調科學進步不是單一天才的功勞,而是跨學科、跨世代的傳承——問對問題,比擁有大數據更重要。

來源: Tim Ferriss Show

本文整理自 Tim Ferriss Show 2025 年 12 月播出的訪談。


現代 AI 的起點:三要素的匯流

2012 年是現代 AI 的分水嶺。那一年,一篇名為「ImageNet Classification with Deep Convolutional Neural Networks」的論文,展示了三個要素匯流後的驚人成果:

  1. 大規模資料集(ImageNet)
  2. 快速平行運算(GPU)
  3. 神經網路演算法

這個組合在影像辨識領域達到了前所未有的表現,被許多人稱為「現代 AI 的誕生」。而李飛飛創建的 ImageNet,正是這三要素中的關鍵之一。

大數據假說的誕生

ImageNet 於 2007 至 2009 年間建立,當時李飛飛是普林斯頓大學的助理教授。這個資料集包含 1500 萬張經過人工標註的高品質影像,是當時 AI 領域最大的視覺訓練資料集。

但李飛飛強調,ImageNet 的成功不只是「量大」這麼簡單。

「很多人誤解 ImageNet 的意義,以為只是收集很多資料,」她說。「每個資料集背後都有一個科學假說——你要問對問題。」

例如,要訓練機器「看懂」世界,你可以建立一個辨識 RGB 色彩的資料集,也可以建立一個以「物件」為核心的資料集。表面上都是視覺任務,但科學意義完全不同。ImageNet 選擇以「視覺物件分類」作為核心假說,這個選擇本身就是成功的關鍵。

絕望中誕生的解決方案

確立假說後,李飛飛面臨一個棘手問題:要從數十億張網路圖片中篩選出高品質的訓練資料,需要大量人力標註。

「我試過雇用普林斯頓大學生,」她笑說,「但你知道的,他們對自己時間的估價很高。」

即使有足夠預算,用傳統方式標註也需要花費數年時間。在幾乎絕望的情況下,她發現了剛成立一年多的 Amazon Mechanical Turk——一個讓全球使用者完成微型任務賺取報酬的線上平台。

「我第一次登入時,試做的任務是辨識酒瓶標籤,」她回憶。「那時我意識到,這是一個大規模平行處理的機會——用全球人口的力量來完成標註。」

品質控制:比收集資料更難的事

但眾包標註有個致命問題:如何確保品質?

如果付錢請人標註「熊貓」,什麼能阻止他們在每張圖都標上熊貓,不管圖片裡有沒有?

李飛飛和學生花了無數小時設計品質控制機制:

  • 入門測驗:先確認標註者理解任務要求
  • 隱藏標準答案:在任務中混入已知正確答案的圖片,隱性監控標註品質
  • 多重驗證:同一張圖片由多人標註,交叉比對結果

這些「運算策略」讓他們從數十億張圖片中,提煉出 1500 萬張符合標準的 ImageNet 影像。

科學不是單一天才的故事

在訪談中,李飛飛反覆強調一件事:科學進步不是單一天才的功勞。

「我不喜歡科學史只聚焦在少數天才身上,」她說。「我們都知道牛頓發現了現代物理定律,但科學是一條傳承的脈絡,而且是非線性的。」

她以自己為例。為什麼她會想到「大數據」這個假說?因為她讀了心理學家 Irv Biederman 的論文,研究幼兒如何在早期學會辨識大量視覺物件。這篇論文本身不是 AI 研究,但啟發了 ImageNet 的假說。

「即使是我最崇拜的愛因斯坦,他的狹義相對論也是建立在洛倫茲變換之上。科學永遠是站在巨人肩上。」

這也是她寫書《The Worlds I See》的原因之一——她想呈現 AI 發展史中那些「無名英雄」:跨世代、跨學科的科學家們,用畢生心血交織出今天的成果。


我的觀察

聽完這集訪談,我一直在想李飛飛說的「科學是非線性的傳承」這句話。

我們這個行業太習慣天才敘事了。每次有新突破,標題一定是「某某天才又做出驚人成果」。這種故事好寫、好讀、好傳播,但它製造了一個錯覺:創新是靈光一閃的事。

李飛飛自己就是被貼上「AI 教母」標籤的人,但她花了很大篇幅在講那些啟發她的心理學家、認知科學家——很多人的名字我從沒聽過。她說得很直接:沒有 Irv Biederman 研究幼兒如何學習辨識物件,就不會有 ImageNet 的假說。這不是客套話,是她真心相信的事。

另一個讓我印象深刻的是 Mechanical Turk 的故事。那不是什麼深思熟慮的策略選擇,而是走投無路之下的絕望之舉。普林斯頓大學生太貴、傳統方式太慢,眼看計畫要卡死了,她偶然發現這個剛成立一年的線上平台,才找到出路。

很多時候我們回顧歷史,會把偶然說成必然,把絕望說成遠見。但真實的創新往往沒那麼光鮮。李飛飛願意講這些「不體面」的細節,反而讓我覺得更真實,也更有參考價值——做事的人都知道,很多好東西是被逼出來的。