思想坦克》AI革命的震央,還是另一場晶片代工?取決於我們如何普及AI的使用

評論

上個禮拜,人在台北的輝達CEO黃仁勳,說台灣是AI革命的震央(epicenter)。Jensen也期望台灣不光要成為製造的樞紐,同時也應該盡力發展自己的AI量能。在黃仁勳離開台北的6月5日那一天,我早上參加了台北國際電腦展Computex 2026最後一天的展出,下午則去了由台灣人工智慧學校(AIA)舉辦的Anthropic開發者日活動(developer day)。這場由Anthropic共同創辦人Ben Mann、國家安全部門主管Tarun Chhabra,以及數發部長官出席的活動,同樣吸引了滿滿的人潮。

黃仁勳眼中的台灣角色

AMD執行長蘇姿丰曾經驚嘆於台灣人普遍熟悉CoWoS(晶片堆疊於基板封裝)這類專有名詞;這也顯示台灣人對AI與半導體相關技術的理解,全世界難出其右。輝達最新的NVL72機櫃裡,估計就有15到20家台灣製造商,從核心邏輯晶片的台積電,到做機櫃、冷卻、總成、滑軌的各家公司都在其中。台灣與以輝達為首的美國AI供應鏈體系深度綁定,也讓台北股市規模在這個月內躍居全球第五大,同時讓台灣投資人的損益,直接連動到美股的漲跌與震盪。
在AI硬體的製造中心之外,做為世界AI革命震央的台灣,在其他面向的表現又如何?

在算力主權(compute sovereignty)的發展上,我們與其他國家仍有不小的落差。雖然台灣是全球算力的工廠,但自己手上能調度的主權算力卻相對有限。國研院國網中心的 Nano 4 上線後,全國公共算力約在 114 petaFLOPS(千兆次/秒,即 114 × 10^15);而鄰近的韓國,國家 AI 運算中心規劃 2027 年達到 1 exaFLOPS(=1,000 petaFLOPS),旗艦超算電腦 KISTI-6 的理論峰值是 600 petaFLOPS,是我國預計 2029 年才達到的 480 petaFLOPS 的 1.25 倍。台韓之間差距的關鍵,不在於台灣造不出來:我們有製造的能力,但持有與分配的權力,掌握在 Nvidia 等大廠手上。
算力與主權AI的落差

在自有模型開發以及訓練數據取得(即所謂的主權AI)這一層,差距更為明顯。國科會主導的TAIDE模型建立在Meta的Llama之上,鴻海的FoxBrain、產學聯盟的Project TAME 也都是開源權重的後續訓練版本,台灣至今沒有一個自有的前沿或基礎模型。

大語言模型訓練的關鍵是資料。台灣人的數位足跡多半留在 Google、Meta、LINE、Shopee 這些境外平台上;繁體中文在全球中文語料裡又屬少數,加上著作權與隱私的限制與保護,台灣的訓練者在嘗試取得繁體中文語料來訓練本土大模型時,往往面臨不小的限制,甚至風險(如台大電機系博士生鍾浩霖,因使用未經授權的新聞內容遭中央社提告一事)。

韓國利用與模型的訓練上優勢超越台灣

相較之下,韓國有 Naver、Kakao 等大型平台,底座模型上有 LG 的 EXAONE 系列,以及AI新創獨角獸 Upstage 的 Solar 系列,在資料的利用與模型的訓練上,優勢遠遠超越台灣。

在這樣的情況之下,黃仁勳口中的「AI革命的震央」,其實還是在複製我們引以為傲的晶片代工模式。訓練並建構自有的大語言模型需要大量算力與語料,而這些正是我方難以負荷的。所以不論是聯發科的 Breeze 系列、鴻海的 FoxBrain 系列,或是國科會的 TAIDE 本土模型,都建立在 Mistral、Llama、Gemma 以及 OpenAI 等大語言模型的基礎之上。同時,台灣也積極與理念相近的AI開發者(如 Anthropic)合作,未來雙方其實有相當大的發展空間。

模型與語料的瓶頸

Anthropic 的 Claude AI 先前在美國對委內瑞拉等國所採取的軍事行動規劃中,扮演了相當出色的角色。AI 在安全層面所能發揮的功能,也非常值得台灣加以開發。川習會之後,美國總統川普以延宕第二批 140 億美元軍售作為與北京方面談判的槓桿,卻也對台灣下一階段的防務規劃造成了時序上的影響,特別是在防衛彈道飛彈等空中攻擊的「台灣之盾」(T-Dome)計畫,以及下一代無人機的發展上。
強大的AI,對於構成無人機指揮體系的作戰平台有著重要的貢獻。在無人機的作戰供應鏈中,我方近年來透過非紅供應鏈的建構、與美國國防新創企業的合作,並透過與烏克蘭方面的密切交流,已在這條嶄新的戰線上累積出相當的能力。但在無人機戰爭裡真正決定勝負的,是如何將飛行、群控、抗電子干擾整合起來的平台。少了這個平台,將近5萬架的無人機就需要5萬名飛手;但AI的整合與運用,可以把這5萬架無人機串連成一條擊殺鏈(kill chain)。

AI的運用與軍事上的戰術是可以結合的

AI的運用與軍事上的戰術戰法,在這裡就形成了一個可以彼此結合的接口。人工智慧的大模型掌握在屈指可數的大型公司手中,但在另一端,同時也存在著活力旺盛的開發者社群。這些開發者透過不斷改造模型,持續拓展AI的應用層面(applicability)。
台灣要補上主權AI的缺口,最好的方式就是讓各種人工智慧平台在社會的不同層面普及。烏克蘭在戰時的經驗便是如此:支撐烏克蘭持續作戰下去的能量,來自無人機的自製產能、充滿創意的運用,再加上一群會操作、會改裝的人,透過 Brave1 這種輕量的國家平台,把民間技術快速接上前線需求。對台灣來說,若真要在AI時代達成「寓兵於民」的目標,關鍵就在於把我們製造業的技術基底,與廣泛的AI知能以及使用能力結合起來。

普及與社會力的關鍵

AI 運用的普及,與國家級的中央算力集群並沒有直接的關係。集群是用來訓練大模型的;但操作、微調,以及把小模型部署到無人機的機載晶片或攜帶式設備上,卻是馬上就能做的事。而且,這種能力與素養並不僅限於理工科系。在無人機與認知戰的戰場上,不論是自主武器國際法的法律/國關學者、做認知作戰防禦的傳播人、設計社會動員的社會科學者、用 AI 做戰場分診的醫護,都可以成為戰力的一部分。
台灣完全可以透過AI教育和知識的普及,把國科會推動的「晶創台灣」計畫中的「百工百業」目標,和寓兵於民的全民國防目標結合起來。我們需要的,是一個把製造、運用、教育、結盟等領域結合起來的平台。與 Anthropic 這類國際AI企業合作,調動民間開發者的能量、培育開發者社群,會是一個很好的開始。台灣社會力的強大,在新冠肺炎流行期間,於平台建置、口罩製造、物流發放等環節上,都展現出高效率的一面。政府要做的,是扮演對接的角色,並把手中的能量、模型與算力,進一步下放給包括各大學在內的開發者社群。

back to top
navbar logo