約書亞・班吉歐

Wikimedia Commons, CC BY-SA 4.0

約書亞・班吉歐

約書亞・班吉歐

教授、科學顧問 @ 蒙特婁大學 / Mila
加拿大/法國 1964 年生
科學家 圖靈獎得主

關於 約書亞・班吉歐

一句話認識他

約書亞・班吉歐發明了「注意力機制」——這是 ChatGPT、Claude、Gemini 等所有大型語言模型的核心技術,沒有他的發明,就沒有今天的生成式 AI。


為什麼他對 AI 如此重要?

如果你使用過 ChatGPT、Google 翻譯、或任何現代 AI 聊天機器人,你就已經在使用班吉歐的發明。

2014 年,班吉歐與學生 Dzmitry Bahdanau、Kyunghyun Cho 發表了一篇論文,提出「注意力機制」(Attention Mechanism)。這個概念後來被 Google 研究員擴展成「Transformer」架構——而 Transformer 正是 GPT、BERT、Claude 等所有現代大型語言模型的基礎。

用白話來說:想像你在讀一個很長的句子。傳統的神經網路會試圖「記住」整個句子,但記憶容量有限,讀到後面就忘了前面。

注意力機制的做法不同:它會在處理每個字的時候,回頭「看」一下其他相關的字。比如翻譯「我愛台北的夜市」時,翻譯到「夜市」這個詞,模型會特別「注意」到前面的「台北」,因為這兩個詞密切相關。

這個看似簡單的想法,徹底改變了機器處理語言的方式,讓翻譯品質大幅提升,也為後來的大型語言模型鋪平了道路。

班吉歐的貢獻遠不止於此:

  1. GAN(生成對抗網路)共同發明:與學生 Ian Goodfellow 發明了 GAN,開啟 AI 生成圖像的新時代,是 Midjourney、Stable Diffusion 的技術前身

  2. 神經語言模型:2003 年提出的神經概率語言模型,引入「詞嵌入」概念,讓機器能理解詞彙之間的關係

  3. 揭示梯度消失問題:1994 年的論文解釋了為什麼深層神經網路難以訓練,推動了 LSTM 等架構的發展

  4. 深度學習教科書:與 Ian Goodfellow、Aaron Courville 合著《Deep Learning》,成為全球 AI 學生的必讀經典

班吉歐是全球被引用次數最多的電腦科學家——2025 年,他成為第一位 Google Scholar 引用次數突破 100 萬次的 AI 研究者。這意味著全球 AI 研究者在寫論文時,平均每天都會引用他的研究數百次。

他與 Geoffrey Hinton、Yann LeCun 並稱「深度學習三巨頭」或「AI 教父」,三人在 2018 年共同獲得圖靈獎。


關鍵貢獻

注意力機制(2014)

2014 年,班吉歐與學生 Dzmitry Bahdanau、Kyunghyun Cho 發表〈Neural Machine Translation by Jointly Learning to Align and Translate〉,首次提出「注意力機制」。

為什麼重要

在注意力機制出現之前,神經機器翻譯使用「編碼器-解碼器」架構:編碼器把整個句子壓縮成一個固定長度的向量,解碼器再從這個向量生成翻譯。問題是,句子越長,壓縮後丟失的資訊就越多。

注意力機制的突破在於:解碼器在生成每個詞時,可以「回頭看」編碼器的所有狀態,並根據相關性給予不同權重。這讓模型能夠處理任意長度的句子,翻譯品質大幅躍升。

2017 年,Google 研究員在此基礎上發表〈Attention Is All You Need〉,提出純粹基於注意力的 Transformer 架構——這成為 GPT、BERT、Claude 等所有現代大型語言模型的基石。

可以說,沒有班吉歐的注意力機制,就沒有今天的 ChatGPT。

生成對抗網路 GAN(2014)

同樣在 2014 年,班吉歐與學生 Ian Goodfellow 等人發表了 GAN(Generative Adversarial Networks)論文。

技術原理(白話版)

GAN 包含兩個神經網路,像是一場「貓抓老鼠」的遊戲:

  • 生成器(Generator):負責「偽造」圖像,試圖騙過鑑別器
  • 鑑別器(Discriminator):負責「鑑定」圖像是真是假

兩個網路互相競爭、互相進步。生成器越來越擅長造假,鑑別器越來越擅長識破,最終生成器能產生以假亂真的圖像。

GAN 開啟了 AI 圖像生成的新時代,被譽為「過去十年機器學習最有趣的想法」(Yann LeCun 語)。今天的 Midjourney、Stable Diffusion 等 AI 繪圖工具,都是 GAN 概念的延伸。

神經概率語言模型(2003)

2003 年,班吉歐發表〈A Neural Probabilistic Language Model〉,提出用神經網路來建模語言。

為什麼重要

這篇論文引入「詞嵌入」(Word Embedding)的概念:把每個詞表示成一個數百維的向量,讓意思相近的詞在向量空間中距離也相近。

比如「國王」和「王后」的向量會很接近,而且「國王 - 男人 + 女人 ≈ 王后」這種神奇的數學關係真的成立。

這個概念後來發展成 Word2Vec、GloVe 等技術,徹底改變了機器理解語言的方式。

深度學習教科書(2016)

班吉歐與 Ian Goodfellow、Aaron Courville 合著的《Deep Learning》(2016)是深度學習領域的「聖經級」教科書,被引用超過 10 萬次。

幾乎每個學習深度學習的學生都讀過這本書。它系統性地介紹了深度學習的數學基礎、常見架構、訓練技巧,至今仍是該領域最權威的入門教材。


人生軌跡

早年與移民

1964 年 3 月 5 日,約書亞·班吉歐出生於法國巴黎,父母是摩洛哥猶太裔的大學生。他們拒絕傳統的宗教束縛,擁抱 1960 年代的反文化精神。

為了尋找更包容的社會,班吉歐 12 歲時隨家人移民到加拿大魁北克省蒙特婁。他自稱是「典型的書呆子」,高中時代常常感到無聊,獨自在圖書館閱讀。

學術生涯

班吉歐在麥基爾大學完成本科到博士的全部學業,1991 年取得電腦科學博士學位。之後他在 MIT 和 AT&T Bell Labs 進行博士後研究——在 Bell Labs 期間,他與 Yann LeCun 成為摯友和長期合作夥伴。

1993 年,班吉歐加入蒙特婁大學任教,並創立了一個小型研究實驗室。這個實驗室後來發展成 Mila(Quebec AI Institute),成為全球最大的深度學習學術研究機構。

在「AI 寒冬」期間(1990-2000 年代),神經網路研究不受重視,經費稀缺、論文難以發表。但班吉歐與 Hinton、LeCun 堅持研究,最終迎來深度學習的爆發。

蒙特婁成為 AI 重鎮

班吉歐幾乎以一己之力,把蒙特婁打造成全球 AI 研究的重鎮。Mila 培養了數百位 AI 研究者,包括 GAN 發明人 Ian Goodfellow。

2016 年,班吉歐共同創辦 Element AI,成為加拿大最知名的 AI 新創公司之一(後被 ServiceNow 收購)。

他的影響力也吸引了科技巨頭:Google、Facebook、Microsoft 等公司紛紛在蒙特婁設立 AI 研究中心。

轉向 AI 安全

近年來,班吉歐越來越關注 AI 的潛在風險。他簽署了多項 AI 安全聲明,並積極參與國際層級的 AI 治理。

2023 年,英國首相蘇納克宣布由班吉歐領導《先進 AI 安全國際科學報告》——這是 30 個國家共同參與的倡議,靈感來自聯合國氣候變遷專門委員會(IPCC)的模式。報告在 2024 年首爾 AI 峰會發布初稿,2025 年 1 月發布完整版。

2025 年 6 月,班吉歐創辦非營利組織 LawZero,致力於建構「誠實」的 AI 系統,能偵測並阻止自主 AI 代理的有害行為。


師承與門生

班吉歐建立了一個龐大的學術網絡,Mila 培養的研究者遍布全球各大 AI 實驗室。

重要門生

  • Ian Goodfellow:GAN 發明人,前 Apple 機器學習總監,曾任職於 Google Brain 和 OpenAI

  • Dzmitry Bahdanau:注意力機制共同發明人

  • Kyunghyun Cho:注意力機制共同發明人,現任 NYU 教授

  • Aaron Courville:《Deep Learning》教科書共同作者,蒙特婁大學教授

班吉歐與 Geoffrey Hinton、Yann LeCun 的關係也很特別。三人在「AI 寒冬」期間互相支持、互相引用對方的論文,形成了一個小型的「地下社群」。他們經常戲稱自己是在「神經網路的地下室」堅持研究。


獎項與榮譽

2018 年 ACM 圖靈獎

班吉歐與 Geoffrey Hinton、Yann LeCun 共同獲得 2018 年圖靈獎,表彰三人對深度學習的開創性貢獻。

頒獎詞指出:「Bengio、Hinton 和 LeCun 發展的概念性和工程性突破,使深度神經網路成為計算的關鍵組成部分。」

2025 年伊麗莎白女王工程獎

2025 年,班吉歐再度獲得肯定,與 Geoffrey Hinton、Yann LeCun、John Hopfield、李飛飛、黃仁勳、Bill Dally 共同獲得伊麗莎白女王工程獎。

其他重要榮譽

  • 2017 年:加拿大勳章(Officer of the Order of Canada)
  • 全球被引用次數最多的電腦科學家
  • 2025 年:第一位 Google Scholar 引用突破 100 萬次的 AI 研究者

觀點與立場

AI 安全的積極倡議者

班吉歐是 AI 安全領域最活躍的學術領袖之一。他認為 AI 帶來的風險是真實且緊迫的,需要國際社會共同應對。

他擔憂的具體問題包括:

  1. 失控風險:當 AI 系統變得足夠強大,可能會「轉而對抗人類」
  2. 民主威脅:「如果我們失去民主,我們就完了!」——他認為保護民主制度是應對 AI 風險的前提
  3. 企業利益與公眾安全的衝突:需要政府和國際社會介入監管

重要發言摘錄

「AI 系統可能轉而對抗人類。」

——2024 年 11 月,CNBC 專訪

「如果我們失去民主,我們就完了!不僅是人權和民主價值觀層面,獨裁者可能也無法妥善處理存在性風險。」

——2024 年 7 月,個人部落格

「我們需要保護公眾的要求進入 AI 決策過程。這意味著政府,甚至國際社會,需要在這一切中有發言權。」

——2024 年,TIME 100 AI 專訪

橋接 AI 倫理與 AI 安全

班吉歐認為「AI 倫理」和「AI 安全」兩個社群不應該對立。他指出:「說到底,我們都是在說需要保護公眾的利益。」

他強調,關心 AI 帶來的長期存在性風險,同時也要關心當下的人權問題——因為失去民主自由,就失去了應對任何風險的能力。


延伸閱讀

推薦演講

重要論文

相關報導


照片來源建議

以下是可供挑選的 Yoshua Bengio 照片來源:

  1. Wikimedia Commons:有多張 CC 授權照片,包括 ICLR 2025 的高解析度照片

  2. Mila 官網:有官方肖像照

  3. 個人網站:有演講和專業場合的照片

建議選用 Mila 官網或 ICLR 2025 的照片,呈現其作為學術領袖的形象。


相關人物

職涯經歷

1993-至今

教授

蒙特婁大學

1993-至今

創辦人暨科學顧問

Mila

1992-1993

博士後研究員

AT&T Bell Labs

1991-1992

博士後研究員

MIT

學歷

麥基爾大學

電腦科學博士

麥基爾大學

電腦科學碩士

麥基爾大學

電機工程學士

創業經歷

Mila (Quebec AI Institute)

1993 年創立 全球最大的深度學習學術研究機構

Element AI

2016 年創立 被 ServiceNow 收購

LawZero

2025 年創立 運作中

重要言論

AI 系統可能轉而對抗人類

談 AI 存在性風險

如果我們失去民主,我們就完了!不僅是人權和民主價值觀層面,獨裁者可能也無法妥善處理存在性風險

談 AI 倫理與 AI 安全的關係

我們需要保護公眾的要求進入 AI 決策過程,這意味著政府,甚至國際社會,需要在這一切中有發言權

談 AI 監管

成就與獎項

ACM 圖靈獎 (2018)
伊麗莎白女王工程獎 (2025)
加拿大勳章 (2017)