兩岸國際經濟

DeepSeek涉嫌抄襲美國OpenAI模型?成本優勢也引質疑

DeepSeek人工智慧應用程式的使用演示

文/voa許寧

宣稱兼具低成本、高效能優勢的中國人工智慧(AI)模型DeepSeek本周在美國科技投資界引發震動。在眾多業界人士為美國AI技術領導地位岌岌可危深感擔憂之際,最新分析指出,DeepSeek可能以不正當方式「照搬」了美國OpenAI的產品模型,其真實成本也遠遠沒有此前傳說的那麼低廉。

DeepSeek被指違規「借用」美國AI模型

美國人工智慧研究機構 OpenAI 和白宮官員表示,中國人工智慧初創公司深度探索可能通過不正當的方式利用了OpenAI的專有技術來開發其自有的AI產品 DeepSeek。

OpenAI一名發言人通過電子郵件對美國之音說:「我們知道中華人名共和國的組織正在積極努力使用包括‘蒸餾’在內的方法,試圖複製美國先進的人工智慧模型。我們意識到並正在評估 DeepSeek 可能不恰當地‘蒸餾’了我們的模型的跡象,並將在我們瞭解更多資訊時分享資訊。」

這名發言人還說,OpenAI正在「採取積極、主動的對策來保護我們的技術,並將繼續與美國政府密切合作」,保護在美國建立的功能最強大的AI模型。

「蒸餾」是一種通過訓練小型模型模仿大型模型行為的技術,將複雜模型的知識提煉到簡單模型,廣泛應用於提高AI效率與降低成本。

中國媒體第一財經說,DeepSeek-V3 的技術文檔顯示,該模型使用資料蒸餾技術生成的高品質資料提升了訓練效率,通過已有的高品質模型來合成少量高品質資料,作為新模型的訓練資料,從而達到接近於在原始資料上訓練的效果。

OpenAI的發言人介紹說,AI技術開發人員可以合法方式以蒸餾方式來提高其開發的應用的水準,但是根據 OpenAI 的官方使用條款,不允許外界使用OpenAI模型的產出來開發與OpenAI競爭的AI模型。

白宮人工智慧與加密貨幣事務主管大衛·薩克斯 (David Sacks)星期二在接受福克斯新聞採訪時表示,DeepSeek「很可能」竊取了美國的智慧財產權。

他指出,「蒸餾」技術在AI領域中是一種常見的做法,但從 OpenAI 模型中提煉知識的行為可能引發了OpenAI的不滿。阻止外國AI公司「蒸餾」美國技術將可以有效減緩這些公司的抄襲行為。

他說:「有大量證據表明,DeepSeek 在這裡所做的是從OpenAI的模型中提取知識。我認為 OpenAI 對此並不滿意。我認為,在接下來的幾個月裡你會看到,我們領先的AI公司採取措施,防止蒸餾。我們要觀察的是,那些領先的人工智慧公司能否阻止協力廠商公司的蒸餾。

此前,社交媒體流傳的使用者使用 DeepSeek V3 模型的對話截圖顯示,DeepSeek 時常在提供答案是「坦言」自己是基於 OpenAI 出品的ChatGPT-4 人工智慧機器人的設計架構,有時甚至自稱自己就是ChatGPT,這似乎佐證了 DeepSeek 直接移植 OpenAI 技術的有關指控。

喬治城大學安全與新興科技中心資料研究分析師雅各·費爾德蓋斯(Jacob Feldgoise)說,AI技術日新月異,其開源的特點為制訂智慧財產權規則帶來許多挑戰。

費爾德蓋斯對美國之音說,「蒸餾基本上就是一種利用更大、更有能力的模型的輸出,讓較小的模型性能發揮到極致的方法。因此,這一系列關於 OpenAI 服務條款和潛在智慧財產權盜竊的問題,可以總結為DeepSeek 是否使用 OpenAI 的 o1 模型來訓練 DeepSeek 發佈的 R1 模型。」

他說:「這是一系列的新問題。這不僅是公司必須努力解決的問題,也是美國法律體系也要努力解決的問題。」

低成本說法遭質疑

DeepSeek 的另一個「高明」之處,在於其所聲稱的低開發成本。深度探索公司團隊最初聲稱,其開發 DeepSeek-V3 模型僅花費不到600萬美元,這一消息震動了美國科技投資界。然而,最新的分析質疑,這個數字可能遠低於其實際的研發成本。

半導體研究和諮詢公司 SemiAnalysis 在1月31日發表的研究報告中說,DeepSeek 的主要投資方幻方量化早在2021年美國出口管制生效前,就囤積了一萬塊輝達先進的A100 GPU。

報告認為,DeepSeek 僅在GPU方面的投資就超過五億美元,伺服器總資本支出約為16億美元,其中高達9.44億美元用於運行其晶片集群。

矽谷科技投資公司 Altimeter Capital 創始人布萊德·格斯特納 (Brad Gerstner) 在X平台上發文指出,此前盛傳的 DeepSeek 只用了6百萬美元就研發出媲美 OpenAI、Anthropic 等美國公司耗資數十億的AI工具的說法是「假新聞」。

OpenAI並未公開其AI產品「o1」的研發投入。但據格斯特納推測,「o1」成本在150萬美元左右。格斯特納1月28日在接受美國CNBC採訪時說,考慮到 DeepSeek 發佈時間比 OpenAI的o1(預覽版)更晚,研發成本更低是情理之中。

他說:「這不是一個重大的價格突破。這實際上是你所期望的——計算成本每年下降約50%。」

晶片來路引關注

另一方面,也有報導指出,DeepSeek不但利用了 OpenAI 的開原始程式碼和資料,並可能通過協力廠商繞開了美國對高端晶片的出口管制,獲得了大量高端輝達晶片來支援其AI模型的開發,這已經引發美國政府的關注和調查。

據路透社報導,美國商務部正在調查 DeepSeek 是否一直在使用被禁止運往中國的美國晶片。DeepSeek 表示,使用了輝達的H800晶片,這款晶片本可以在2023年合法購買。

彭博社報導說,美國政府還在調查DeepSeek是否能夠通過新加坡的協力廠商實體獲取高性能的輝達晶片。

輝達的一名發言人通過電子郵件對美國之音說,DeepSeek的成功是一種被稱為「測試時擴展」(test time scaling)技術優勢的典範,但沒有直接回應DeepSeek是否使用了目前受制裁的高端輝達晶片。

他說,DeepSeek的成就「說明了如何使用該技術創建新模型,利用廣泛可用的模型和完全符合出口管制的計算能力。而推理(inference)需要大量的輝達 GPU和高性能網路。」

與此同時,白宮本周表示,國家安全委員會已經開始調查 DeepSeek 是否對美國國家安全構成影響。

國會眾議院美國與中國共產黨戰略競爭特設委員會主席約翰·穆勒納爾(John Moolenaar)和首席民主黨議員拉賈·克裡希納莫蒂(Raja Krishnamoorthi)眾議員本週四致函白宮國安顧問邁克·沃爾茲(Mike Waltz),要求白宮方面考慮將目前允許向中國出口的輝達H20晶片列入出口管制物件,並嚴格管制可以被用於AI推理(inference)的晶片設計技術。

他們還要求聯邦政府設備和關鍵基礎設施禁止安裝中國的AI工具。公開信指出,DeepSeek的隱私政策明確規定,該軟體將收集的資訊「存儲在位於中華人民共和國的伺服器上」。

公開信要求白宮調查新加坡是否成為了中國實體獲取被禁晶片的中轉國,並表示,如果新加坡等國不願意打擊通過向中國轉運晶片的活動,就應該受到更嚴格的許可要求。

在輝達最近的季度報告中,新加坡占其收入的22%。該公司本身透露,這些出貨量中的大部分最終都運往新加坡以外的用戶。

輝達公司的發言人對美國之音表示,與新加坡相關的收入並不意味著有產品轉移到了中國。他說,輝達的盈利報告中顯示的帳單(bill to)地址不等同最終的發貨(ship to)地址。他說:「我們的許多客戶在新加坡都有商業實體,並將這些實體用於向美國和西方運送產品。」

他強調,輝達「堅持要求我們的合作夥伴遵守所有適用法律」,如果得知有任何違法情況,會要求其合作夥伴遵守相關法規。

與此同時,越來越多的國家和地區的政府以安全考量為由,禁止政府設備安裝 DeepSeek。義大利政府星期四宣佈,出自保護使用者資料隱私的考慮,封鎖 DeepSeek 在該國的使用,並對這款AI工具的所有者進行調查。

台灣政府星期五表示,禁止公務機關和關鍵基礎設施使用中國深度求索(DeepSeek)公司推出AI模型和產品。與此同時,美國德克薩斯州星期五也宣佈,禁止州政府分發的電子設備安裝 DeepSeek 等中國應用;其他被禁的應用程式還包括小紅書和 Lemon8。

連結:DeepSeek涉嫌抄袭美国OpenAI模型?成本优势也引质疑 (voachinese.com)

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *