AI 技術前沿

Karpathy 的教育願景:打造 AI 時代的星際艦隊學院

Andrej Karpathy 為什麼離開 AI 研究前線,轉向教育?他的答案是:他最擔心的不是 AI 會不會成功,而是人類會不會在這個過程中被邊緣化。他正在打造的 Eureka,是他對這個問題的回應。

來源: Dwarkesh Podcast

本文整理自 Dwarkesh Podcast 2025 年 10 月播出的單集。


Andrej Karpathy 可以選擇開一家 AI 公司。以他的經歷和人脈,募資不會是問題。但他選擇了教育。這個選擇背後的邏輯,比表面看起來更深刻——它關乎他對 AI 時代人類角色的根本擔憂。

為什麼不開 AI 公司?

Karpathy 的解釋很直接:他覺得 AI 實驗室正在做的事情有一種「確定性」。意思是,就算沒有他,那些事情也會發生。他可以在那裡幫忙,但不會「獨特地」改善什麼。

他真正擔心的是另一件事:人類會被邊緣化。他最怕的場景不是 AI 建不出戴森球,而是 AI 建出了戴森球,但人類變成了《瓦力》或 Idiocracy 裡那種廢人——坐在飄浮椅上,一切都被自動化處理,人類什麼都不用做,也什麼都不會做。如果那是未來,他根本不在乎有沒有戴森球。

所以他選擇教育。他認為這是他能「獨特地」增加價值的地方。讓人類在 AI 時代保持強大、保持有能力,這件事不會自動發生,需要有人去做。

星際艦隊學院是什麼?

Karpathy 把他正在建造的東西比作《星艦迷航記》裡的星際艦隊學院——一個專門培養前沿技術人才的精英機構。學生進來,學習建造太空船、駕駛太空船,然後成為探索宇宙的幹部。

具體來說,他目前在做的是 LLM101N——一門關於大型語言模型的完整課程。他最近發布的 nanochat 是這門課的「期末專題」:一個大約 8,000 行程式碼的專案,完整涵蓋從零開始訓練一個類 ChatGPT 模型的整個流程。但要學會這個專題,學生需要先學很多中間步驟,這些就是他正在建構的課程內容。

他的教育理念可以用一個詞概括:ramps to knowledge(知識的斜坡)。他認為教育是一個技術問題——如何把糾結在一起的知識解開,排列成一個斜坡,讓學習者可以一步一步往上走,每一步都只依賴於前一步學過的東西。這個「解糾結」的過程,對他來說是智識上最有趣的挑戰之一。

完美家教的體驗

Karpathy 分享了一個個人故事來說明他追求的標準。他最近在學韓文,經歷了三種不同的學習方式:自學、小班教學、一對一家教。

那個家教改變了他對教育的理解。幾分鐘的對話後,她就精確掌握了他目前的水平,知道他會什麼、不會什麼。接下來的每一刻,她都餵給他「剛好」的內容——不會太難讓他挫折,也不會太簡單讓他無聊。他感覺自己是唯一的限制因素——不是找不到資源,不是教材解釋得不好,純粹就是他自己吸收和記憶的速度。

這個體驗讓他意識到標準有多高。他說,經歷過真正好的家教後,你會覺得「怎麼可能用 AI 做到這個」。但這正是他想要達到的目標,只是目前的 AI 能力還不夠。

AI 在教育中的角色

有趣的是,Karpathy 認為現在還不是用 AI 做他心目中那種教育的時機。如果你去問 ChatGPT「教我 AI」,它會給你一些東西,但那是「slop」(廢話)。AI 不會寫出 nanochat,也不會創造性地設計課程結構。

他打了一個比方:他做過 AI 顧問,很多時候他帶給公司的最大價值就是告訴他們「不要用 AI」。在教育領域,他的判斷也類似——對於他想做的事情,現在還不是時候。但時候會來的。

目前的 Eureka 會是一個混合模式:有實體校園,也有線上內容。實體校園是頂級體驗——有老師、有 TA、有完整的學習環境。線上版本是次一級的體驗,但可以接觸到全球 80 億人。未來當 AI 能力提升後,線上體驗會越來越接近實體。

前 AGI 教育有用,後 AGI 教育有趣

Karpathy 對教育有一個時間軸的思考:

在 AGI 之前,教育的價值很明確——這是你賺錢的方式。學會 AI,就能在這個產業找到工作。動機不是問題。

但 AGI 之後呢?如果所有工作都被自動化了,為什麼還要學任何東西?

Karpathy 的答案是:因為這很有趣,而且讓你變得更有吸引力。他用健身房來類比。我們不需要人類的肌肉力量來搬重物——機器可以做到。但人們還是去健身房,因為這很有趣、對身體好、而且有六塊腹肌很帥。教育會變成同樣的東西。當學習變得簡單(因為有完美的 AI 家教),人們會學習更多東西,只是因為他們可以。

他預測,未來每個人都會說五種語言——為什麼不呢?如果學習變得那麼容易。每個人都會懂大學程度的基礎科學。今天的天才只是觸及了人類心智潛力的表面。有了完美的 AI 家教,人可以走得非常非常遠。

這不只是休閒。在過渡期——在 AI 完全接管之前——受過良好教育的人可以保持在迴圈中,可以參與決策,可以理解正在發生的事情。這是人類保持控制的方式之一。

物理學思維與教育設計

訪談中有一段關於 Karpathy 如何設計教材的討論,揭示了他的思考方式。他認為每個人都應該學物理,不是為了物理知識本身,而是為了物理學的思維方式。

物理學教你建立模型和抽象:真實世界很複雜,但你可以找到一階近似來描述大部分現象,然後再考慮二階、三階修正。物理學家走進教室說「假設有一頭球形的牛」,大家都笑,但這其實是天才級的思維——牛確實可以被近似成球體來解決很多問題。

這種思維方式可以遷移到任何領域。Karpathy 說他總是在尋找問題的「一階項」——什麼是真正重要的?什麼可以先忽略?如何用最簡單的東西展示核心概念?

MicroGrad 就是這種思維的產物。它是 100 行 Python 程式碼,展示了神經網路訓練的核心——反向傳播。其他所有東西——張量、GPU 加速、記憶體管理——都只是效率優化。核心的智識內容就在這 100 行裡。找到這個核心,把它漂亮地呈現出來,這就是他認為的「教育」。

知識的詛咒與如何克服

Karpathy 承認他自己也受「知識詛咒」所苦。當你成為專家後,很難記得初學者的視角,很難不把某些事情當作理所當然。

他分享了一個克服這個問題的技巧。最近有人給他看一篇生物學論文,他有很多「蠢問題」。他把論文丟給 ChatGPT,問那些蠢問題,然後把對話紀錄分享給論文作者。他的想法是:如果作者能看到他問的蠢問題,可能可以幫助他們未來解釋得更好。

他說,他很想看到人們跟 ChatGPT 討論他自己的教材時問了什麼蠢問題。這能幫助他重新回到初學者的視角。

另一個觀察:當論文作者在酒吧跟你解釋他們的論文時,那三句話的解釋幾乎總是比論文本身更清楚、更準確、更有洞察力。為什麼那不是摘要?因為人們在寫作時有一種傾向,會用最抽象、最充滿術語的方式來表達,會花四個段落清喉嚨才進入主題。但當你面對面跟一個人說話時,有某種力量會迫使你「直接說重點」。

這可能是為什麼他喜歡做 YouTube 教學影片——那更接近對話,更容易「直接說重點」。