國戰會論壇/蔡炫》DeepSeek逆風崛起 打破美AI「大院高牆」
文/蔡炫
中國AI新創公司「深度求索」(DeepSeek)近期先後推出DeepSeek-V3、DeepSeek-R1掀起話題,這兩款為開源大型語言模型(LLM),性能據傳可以媲美OpenAI o1,再度引發中美科技圈的熱議,在川普政府上任後成為點燃科技戰的全新引線。根據報載DeepSeek是杭州對沖基金兼AI公司幻方量化旗下公司,兩款大型模型透過低廉成本,成為中國AI未來發展的方程式,在美國封鎖下的AI突圍也讓DeepSeek逆風崛起。
美國《CNBC》報導指出,AI新創公司Scale AI的創辦人亞歷山大‧王(Alexandr Wang)揭露,DeepSeek大約擁有5萬個H100晶片,疑似透過輝達管道取得,等於違反美國晶片禁令下的出口管制措施。輝達隨即發布聲明指出,中國人工智慧 (AI) 公司 DeepSeek進展表明輝達晶片對中國市場的可用性,未來將需要更多晶片來滿足服務需求。
DeepSeek 同時登上中美應用程式商店榜首,主要仍是與當前AI模型效能對比不遑多讓,在深度學習上再創AI進程。DeepSeek「深度」意味一個層層深入的學習過程,能從複雜資料自動提取,無需人類耗費心力從頭做起,不論是自然語言還是圖像識別,正在走出中國發展特色下的技術突破。
中美科技惡戰 「大院高牆」崩壞
美國對中國AI技術發展的「大院高牆」戰術儼然崩壞,主張美國政府從晶片升級到資金,且聚焦人工智慧的全面圍堵(大院),劃定適當戰略邊界(高牆),從2018年對中科技防禦策略,再到2022年的高規晶片出口管制規範,都在遏制中國於先進科技領域突圍。然而,DeepSeek橫空出世再度證明,這類限制並未構成中國AI發展的致命打擊,DeepSeek仍以創新技術架構,成功降低AI模型訓練對高性能晶片的科技依賴。
DeepSeek的大語言模型以低成本運算為基礎,中國本地AI晶片供應鏈的快速成長已是崛起關鍵,例如華為、寒武紀等企業主導的國產晶片逐漸成熟,也為發展技術提供基礎支持,美國晶片出口限制政策,反而激發了中國自給自足的技術創新,對比OpenAI的ChatGPT不僅性能相當,具備更廣泛的語言文化需求的深度思考功能,意味在晶片資源受限的情況下,DeepSeek仍以軟體優化和硬體效率,推動了一波以效率為導向的技術革命。
援引Meta打造「開源模型」
中國研究機構去年早已使用Meta開源的Llama模型,開發一種軍事應用的人工智慧(AI)工具,Meta採取開源策略,在戰略意涵上為了提升AI技術普及,但也給予其他國家運用技術進行開發的契機,中國進而結合自己參數,也讓DeepSeek重新定義了AI競爭版圖。根據相關學者的分析,DeepSeek在多方面的技術指標上已經能與OpenAI抗衡,甚至在某些領域實現超越,例如DeepSeek的自然語言處理能力,並且針對亞洲市場進行在地優化,使其貼近用戶需求。
DeepSeek的AI程式在全球下載量迅速攀升,AI技術的競爭已從單純的技術指標轉向生態系統的全面對抗,Meta即便要求開源模型不能用於「軍事、戰爭、核工業應用等」,並禁止用於煽動暴力以及研發武器,但由於模型是公開取得,對於未經授權使用難以有效控制,更增加了政策的不確定性。DeepSeek的成功意謂著中國在AI競爭中逐漸站穩腳步,進而撼動美國技術霸權地位,使得AI領域的競爭將不再是一家獨大的局面,而是一場多角化的競逐。
中式創新的「深度學習」
DeepSeek注重應用導向的「深度學習」,中國式創新典範改變AI發展歷程,例如融合中國文化特色,滿足了本地用戶,舉凡語言、習慣和情感的多元需求。其中,AI模型能夠流暢處理中文指令、方言等語言特性,別於其他國際AI產品。從跟隨到自主創新的轉變過程,而這其中深度學習技術扮演了重要角色,DeepSeek的開發過程中,充分運用了中國本土的數據資源與演算優勢。
DeepSeek展現中國在技術生態系統建設上的優勢,在資源限制條件下的創新,突破傳統AI訓練的「演算至上」邏輯,DeepSeek 透過優化混合專家模型 (MOE),解決困擾產業的數值不穩問題,包含損失峰值的常態現象,技術方案無需依賴額外基礎設施即可穩定訓練流程,也讓DeepSeek透過垂直領域創新(整併深度思考與聯網搜尋),持續優化並縮小與美國通用大模型如 GPT-4的科技落差。
DeepSeek的橫空出世,揭開中美科技戰的全新篇章,不僅象徵美國「大院高牆」崩壞,中國成功降低AI模型訓練對高性能晶片的科技依賴;進而援引Meta打造「開源模型」,針對亞洲市場進行在地優化貼近用戶需求;中式創新的「深度學習」,充分展現中國本土的數據資源與演算優勢。未來,隨著傳播科技的日新月異,AI產業格局勢必走向多元,DeepSeek不僅逆風崛起還迎頭趕上,難怪川普談到DeepSeek直言不諱:「美AI產業一記當頭棒喝。」
(作者蔡炫為台灣國際戰略學會副研究員,國戰會專稿,本文授權與洞傳媒國戰會論壇、中時新聞網言論頻道、中天新聞網同步刊登)