美國AI公司試圖破解DeepSeek破壞性創新技術
文/美國之音
美國領先的人工智慧(AI)公司開發人員在讚揚迅速崛起而聲名大噪的DeepSeek AI模型的同時,也試圖找出其漏洞,以反駁「中國後來者以低成本替代方案擊敗他們耗資數十億美元的技術」這種觀點。
中國初創公司深度求索(DeepSeek)星期一(1月27日)引發了美股市場拋售,其免費AI助手在美國蘋果應用商店的下載量超越了OpenAI的ChatGPT。該公司聲稱,其模型利用性能較低的輝達(Nvidia)H800處理器晶片做訓練,花費不到600萬美元。
瞭解四大領先AI實驗室想法的知情人士表示,隨著對競爭的擔憂在美國股市蔓延,一些AI專家對深度求索的堅強團隊和最新研究表示讚賞,但對該發展依舊泰然自若而未感到震驚。
Open AI首席執行官薩姆·奧爾特曼(Sam Altman)在X平台上寫道,R1是深度求索最近幾周發佈的幾種模型之一,「是一款令人印象深刻的模型,尤其是考慮到它們能夠以這個價格提供。」
輝達在一份聲明中表示,深度求索的成就證明了市場有更多對輝達晶片的需求。
美國軟體製造商雪花(Snowflake)在收到客戶諮詢激增後,星期一決定將DeepSeek模型添加到其AI模型市場。
雪花產品執行副總裁克利斯蒂安·克萊納曼(Christian Kleinerman)表示,連其員工也稱DeepSeek的模型「令人驚歎」,並且該公司在權衡了託管該中國開發的AI技術可能面臨的潛在風險後,最終決定向客戶提供這項服務。
與此同時,美國AI開發人員正加緊分析DeepSeek的V3模型。深度求索去年12月伴隨該模型發表了一篇研究論文,該論文是其流行應用程式的基礎,但那篇論文中並未回答諸如總開發成本等許多問題。
一位知情人士表示,中國目前已將落後美國最先進的AI模型的時間從18個月大幅縮短至6個月;然而,由於DeepSeek的免費發佈策略引發了如此多的興趣和關注,該公司可能很快就會發現自己沒有足夠的晶片來滿足需求。
DeepSeek的進步並非僅依靠600萬美元的微薄預算。該研究論文指出,這筆成本特指最終訓練運行中的晶片使用,而不是整個開發成本。
兩家頂級實驗室的高管告訴路透社,訓練運行只是總成本的冰山一角,確定如何設計訓練運行的成本支出可能會高出很多。
該論文說,V3的訓練運行使用了2,048塊輝達的H800晶片,這些晶片的設計旨在符合2022年發佈的美國出口管制規定。專家告訴路透社,這些2022年美國出口管制規定幾乎沒有減緩中國AI的進展。
兩家AI實驗室的消息人士表示,他們預計早期開發階段依賴了大量的晶片。其中一位元消息人士說,這樣的投資可能高達10億美元。
一些美國AI領袖對深度求索將其模型以開源形式發佈的決定表示讚賞,這意味著其他公司或個人可以自由使用或更改這些模型。
「DeepSeek R1是我見過的最令人驚歎和令人印象深刻的突破之一,而且作為開源技術,它是給世界的一份大禮,」風險投資家馬克·安德森(Marc Andreessen)星期天在X平台上一篇貼子中表示。
業內觀察人士表示,DeepSeek模型獲得的讚賞凸顯了開源AI技術作為諸如OpenAI的ChatGPT等昂貴且嚴格控制技術的替代方案的可行性。
分析師估計,美國大型雲計算公司今年在AI基礎設施上將投入高達2500億美元。
近年來,華爾街最有價值的公司股價飆升,因為人們預期只有這些公司才能獲得開發和擴展新興AI技術所需的大量資本和計算能力。
本周和下周,許多美國科技巨頭將公佈季度收益,屆時這些假設將受到進一步的審視。