美國AI公司試圖破解DeepSeek破壞性創新技術

文/美國之音

美國領先的人工智慧(AI)公司開發人員在讚揚迅速崛起而聲名大噪的DeepSeek AI模型的同時，也試圖找出其漏洞，以反駁「中國後來者以低成本替代方案擊敗他們耗資數十億美元的技術」這種觀點。

中國初創公司深度求索(DeepSeek)星期一(1月27日)引發了美股市場拋售，其免費AI助手在美國蘋果應用商店的下載量超越了OpenAI的ChatGPT。該公司聲稱，其模型利用性能較低的輝達(Nvidia)H800處理器晶片做訓練，花費不到600萬美元。

瞭解四大領先AI實驗室想法的知情人士表示，隨著對競爭的擔憂在美國股市蔓延，一些AI專家對深度求索的堅強團隊和最新研究表示讚賞，但對該發展依舊泰然自若而未感到震驚。

Open AI首席執行官薩姆·奧爾特曼(Sam Altman)在X平台上寫道，R1是深度求索最近幾周發佈的幾種模型之一，「是一款令人印象深刻的模型，尤其是考慮到它們能夠以這個價格提供。」

輝達在一份聲明中表示，深度求索的成就證明了市場有更多對輝達晶片的需求。

美國軟體製造商雪花(Snowflake)在收到客戶諮詢激增後，星期一決定將DeepSeek模型添加到其AI模型市場。

雪花產品執行副總裁克利斯蒂安·克萊納曼(Christian Kleinerman)表示，連其員工也稱DeepSeek的模型「令人驚歎」，並且該公司在權衡了託管該中國開發的AI技術可能面臨的潛在風險後，最終決定向客戶提供這項服務。

與此同時，美國AI開發人員正加緊分析DeepSeek的V3模型。深度求索去年12月伴隨該模型發表了一篇研究論文，該論文是其流行應用程式的基礎，但那篇論文中並未回答諸如總開發成本等許多問題。

一位知情人士表示，中國目前已將落後美國最先進的AI模型的時間從18個月大幅縮短至6個月；然而，由於DeepSeek的免費發佈策略引發了如此多的興趣和關注，該公司可能很快就會發現自己沒有足夠的晶片來滿足需求。

DeepSeek的進步並非僅依靠600萬美元的微薄預算。該研究論文指出，這筆成本特指最終訓練運行中的晶片使用，而不是整個開發成本。

兩家頂級實驗室的高管告訴路透社，訓練運行只是總成本的冰山一角，確定如何設計訓練運行的成本支出可能會高出很多。

該論文說，V3的訓練運行使用了2,048塊輝達的H800晶片，這些晶片的設計旨在符合2022年發佈的美國出口管制規定。專家告訴路透社，這些2022年美國出口管制規定幾乎沒有減緩中國AI的進展。

兩家AI實驗室的消息人士表示，他們預計早期開發階段依賴了大量的晶片。其中一位元消息人士說，這樣的投資可能高達10億美元。

一些美國AI領袖對深度求索將其模型以開源形式發佈的決定表示讚賞，這意味著其他公司或個人可以自由使用或更改這些模型。

「DeepSeek R1是我見過的最令人驚歎和令人印象深刻的突破之一，而且作為開源技術，它是給世界的一份大禮，」風險投資家馬克·安德森(Marc Andreessen)星期天在X平台上一篇貼子中表示。

業內觀察人士表示，DeepSeek模型獲得的讚賞凸顯了開源AI技術作為諸如OpenAI的ChatGPT等昂貴且嚴格控制技術的替代方案的可行性。

分析師估計，美國大型雲計算公司今年在AI基礎設施上將投入高達2500億美元。

近年來，華爾街最有價值的公司股價飆升，因為人們預期只有這些公司才能獲得開發和擴展新興AI技術所需的大量資本和計算能力。

本周和下周，許多美國科技巨頭將公佈季度收益，屆時這些假設將受到進一步的審視。