AI 產業動態

AI 改變公共政策的真實案例:從印度 WhatsApp 到美國 SNAP

AI 在公共政策領域有巨大潛力,但從研究發現到實際落地,中間隔著一道難以跨越的鴻溝。芝加哥大學專家分享 SNAP 糧食援助計畫的困境,以及發展中國家如何用 WhatsApp + AI 找到另一條出路。

來源: The Pie: An Economics Podcast

本文整理自《The Pie》2025 年 6 月播出的單集「AI, the Economy, and Public Policy」。


研究人員發現了一個能讓更多人獲得糧食援助的方法,數據清楚顯示效果顯著。政策制定者也認同這個發現很有價值。然後呢?什麼都沒發生。

這個故事聽起來令人沮喪,但它精準描述了 AI 研究如何在公共政策領域遭遇現實的挑戰。在芝加哥大學 Becker Friedman Institute 的一場論壇上,Booth 商學院行銷學教授、同時也是 Center for Applied AI 學術主任的米斯拉(Sanjog Misra)分享了這個案例,以及他對 AI 如何能(與不能)改變公共政策的觀察。

他的結論既務實又帶著一絲樂觀:在富裕國家,基礎設施和政治障礙讓 AI 政策應用困難重重;但在發展中國家,一些意想不到的條件反而創造了 AI 落地的機會。

SNAP 案例:研究說有效,為什麼沒人採用?

SNAP(Supplemental Nutrition Assistance Program,補充營養援助計畫)是美國最大的糧食援助計畫,每年幫助數千萬低收入家庭獲得食物。米斯拉和他的研究團隊發現,透過 AI 優化計畫的資訊傳遞和申請流程,可以顯著提高援助的觸及率。換句話說,更多有資格的人會實際獲得他們應得的援助。

這聽起來應該是雙贏的局面:需要幫助的人得到幫助,政府的錢花得更有效率。研究結果也很漂亮,如果全面推廣,影響將會相當可觀。但當米斯拉在論壇上展示這些發現時,他也不得不承認一個尷尬的事實:這個方法並沒有被廣泛採用。

為什麼?第一個問題是 SNAP 的行政結構。這個計畫不是由聯邦政府或各州政府統一管理,而是下放到縣(county)層級。美國有超過三千個縣,每個縣都有自己的行政體系、預算限制、技術能力。這意味著,就算某個縣願意採用這個 AI 優化方案,這個決定和其他縣完全無關。要達到全國性的改變,你理論上需要說服三千多個不同的決策者。

更根本的問題是基礎設施的落差。米斯拉觀察到,舊金山縣或洛杉磯縣這樣的大都會區,有資源、有技術人才、有數位基礎設施來嘗試新方案。但如果你去加州中央谷地的小縣,情況就完全不同了。很多縣政府連基本的資料系統都不夠現代化,更別說導入 AI 工具。

這裡有一個殘酷的諷刺:往往是資源最匱乏、最需要政策創新來改善居民生活的地區,也正是最沒有能力採用這些創新的地區。技術進步的紅利,再一次沿著既有的發展落差線被分配。

發展中國家的意外優勢

如果美國這樣的富裕國家在政策落地上遇到這麼多障礙,發展中國家的情況是不是更糟?米斯拉的觀察讓人意外:在某些方面,情況恰恰相反。

他提到一個關鍵因素:WhatsApp。在印度,幾乎每個有手機的人都在用 WhatsApp。這個訊息應用程式已經內建了 AI 功能,這意味著——即使使用者沒有特別意識到——他們已經在使用 AI 了。更重要的是,WhatsApp 提供了一個可以大規模觸及人群的管道,而且這個管道已經被廣泛採用,不需要額外的基礎設施建設。

對政策制定者來說,這創造了一個寶貴的機會。你可以把 Claude 或 OpenAI 的模型接入 WhatsApp,用自然的對話方式向民眾傳遞政府計畫的資訊、回答他們的問題、甚至協助他們完成申請程序。這種「嵌入式」的 AI 應用,繞過了很多在傳統渠道會遇到的障礙。

印度政府正在大舉投資這類應用,把 AI 作為傳播政策資訊、改善政府服務的工具。類似的趨勢也出現在中東和非洲的一些國家。這些地方可能沒有美國那樣成熟的數位基礎設施,但正因為如此,他們沒有「舊系統」的包袱,可以直接跳到以行動通訊和 AI 為核心的新模式。

米斯拉對這個趨勢抱持樂觀。他認為,技術成本的快速下降,加上行動通訊在發展中國家的高滲透率,創造了前所未有的機會。過去需要大量人力才能執行的政策干預,現在可能只需要一個設計良好的聊天機器人就能達成。

AI 輸出的主觀性:一個被低估的問題

在討論 AI 如何應用於公共政策時,米斯拉也提出了一個常被忽略的問題:AI 生成的內容本質上是「主觀」的。

這個判斷聽起來可能有點反直覺。我們不是常說 AI 是客觀的嗎?電腦不是沒有情緒和偏見嗎?米斯拉的解釋是:當你使用語言模型生成任何內容時,你必須先設計「提示詞」(prompt)。而這個設計過程本身就涉及主觀判斷——你不會停止調整提示詞,直到你得到一個「你喜歡」的結果。這意味著,最終的輸出反映的不只是模型的能力,也反映了設計者的偏好和判斷。

這個問題在「代理式 AI」(Agentic AI)的語境下變得更加重要。Anthropic 不久前發布了一個叫做 MCP(Model Context Protocol)的協議,讓 AI 代理可以更自主地執行複雜任務。想像一下,未來你可能有一個 AI 代理幫你談判價格、處理行政事務、甚至做投資決策。這些代理看起來是「客觀」地代表你行事,但實際上,每個代理的行為都是由設計它、訓練它的人所塑造的。

米斯拉做了一些小規模的實驗,發現不同的 AI 代理之間存在巨大的「異質性」(heterogeneity)。有些代理能使用更多的工具,有些則受到更多限制;有些在某些任務上表現出色,有些則不然。這種差異不是技術上的「錯誤」,而是設計選擇的結果。

這對公共政策的含義是:如果政府開始大規模使用 AI 來與民眾互動、處理申請、做出決定,我們需要非常小心這些系統是如何被設計的。它們的「偏見」可能比人類執行人員的偏見更難被識別和糾正,因為它們被包裝在技術中立的外殼裡。

不同產業的 AI 採用速度差異

論壇上另一位與談人、Anthropic 的研究科學家乃乃金(Alex Tamkin)提供了一個補充觀點:為什麼某些領域的 AI 採用這麼快,而其他領域(特別是公共部門)卻這麼慢?

他觀察到,軟體開發領域的 AI 使用已經非常普遍和深入。這不是偶然的,有幾個因素在起作用。首先,軟體工程師本來就是新技術的早期採用者——這是職業特性決定的。其次,目前的 AI 模型對程式碼的處理特別擅長,可能是因為程式碼有明確的語法規則和可驗證的正確性標準。第三,也是很重要的一點,軟體開發領域的監管相對較少,嘗試新工具的門檻低。

相比之下,醫療、法律、金融、政府服務這些高度監管的領域,AI 的滲透就慢得多。每一次嘗試都需要考慮合規性、責任歸屬、資料隱私等一系列複雜問題。這些考量是合理的——畢竟這些領域的錯誤可能造成嚴重後果——但它們也確實減緩了創新的速度。

這創造了一個奇怪的不對稱:AI 在「最不需要保護」的領域發展最快,而在「最可能帶來重大社會影響」的領域發展最慢。那些在 Twitter 上分享「我用 AI 花十分鐘就建了一個本來要花十萬美元和一年時間的 App」故事的人,和普通經濟中還沒感受到 AI 影響的人,似乎活在兩個不同的世界。

乃乃金認為,這個差距會隨著時間縮小。模型會持續進步,變得更有能力、更可靠。圍繞模型的產品會變得更易用、更直觀。成本會繼續下降。慢慢地,AI 會沿著那個「易用性」和「監管程度」的梯度擴散到更多領域。但這個過程需要時間,可能比很多人預期的更長。

AI 政策落地,需要的不只是技術

從這場論壇的討論中,浮現出一個清晰的主題:AI 在公共政策領域的應用,面臨的主要障礙往往不是技術本身,而是技術以外的因素。

行政結構是一個障礙。當決策權分散在無數個獨立的單位時,任何創新都需要被推銷、被採納無數次。基礎設施是另一個障礙。沒有足夠的數位基礎建設,再好的 AI 方案也無法落地。政治意願也是障礙。在資源有限的情況下,採用新技術意味著改變既有的做事方式,這會觸動既得利益,遭遇阻力。

但米斯拉的觀察也提供了一些希望。技術成本正在快速下降。在某些情境下(特別是發展中國家的行動通訊生態系統),新的可能性正在浮現。這些可能性可能會讓原本需要大量資源才能執行的政策干預變得可行。

對於關心公共政策的人來說,這場討論傳達的訊息是:不要只盯著技術本身,也要看技術落地的環境。一個在實驗室裡表現完美的 AI 方案,如果無法融入現有的行政流程、如果沒有人願意投入資源來導入它、如果使用者沒有能力或意願採用它,就只會停留在學術論文裡。

讓 AI 真正改變公共政策,需要的不只是更好的模型,還需要更好的落地策略、更務實的期望管理,以及對「技術之外」那些因素的深刻理解。