Sora捲起輿論海嘯，中美AI差距被拉大？

2024 年 2 月 28 日 taiwanqut

文/觀察者網

生成式人工智慧又火了。

一夜之間，OpenAI開發的文生視頻模型Sora，在全球掀起一場海嘯。

從2月15號亮相到現在，中國大V和自媒體們已經給Sora疊上了一層又一層歷史意義，似乎在沒有趕上ChatGPT熱度後，憋了一整年的金句、警句都要在這次宣洩出來。

從展示的視頻看，Sora在技術上顛覆程度的確配得上這種流量「咖位」，可以說以一己之力改寫了技術應用的時間表。

在它亮相前一天，摩根大通剛剛發佈重磅研究報告，預測生成式人工智慧在視頻/3D遊戲領域具備生產力還要等到2030年，一天后，人人都能拍好萊塢大片的未來好像已經觸手可及。

被打臉的頂級投行可能會覺得很冤枉，因為基於過去一兩年文生視頻賽道的狀況，無論巨頭還是初創團隊，在研發上都走得很緩慢，生成的視頻時長不超過幾秒鐘，物體和場景動態變化很小，普遍存在物品或者屬性缺失，不能進行連續優化修正，「災難性遺忘」頻繁出現，無法提取解耦的內容表徵與運動資訊，視頻幀之間也缺乏內容關聯性。

相比之下，Sora在視頻時長、清晰度、提示理解能力、幀間連貫性上的表現是降維打擊。

Sora為什麼這麼牛？

儘管OpenAI還沒有公開技術文檔，不過合理推測，它可能還是「大力出奇跡」的結果。

Sora是一種擴散模型（Diffusion models），這種模型在生成式AI上的應用，奠基于2020年華裔青年學者喬納森·何（Jonathan Ho）提交的「去噪擴散概率模型（DDPM）」論文，自此之後短短兩三年裡，擴散模型已經取代生成對抗網路，一躍成為圖像類生成式人工智慧的最熱門技術路線。

不過擴散模型效果雖然驚豔，但從熱力學領域拿過來的模型本身卻有著更高的計算複雜性，所以你會發現文生圖、文生視頻越來越不是一個學術問題，而是一個工程問題，好的工程能力比好的想法重要得多，目前，業界最耀眼的不是學術天才或者三兩個人攢起來的初創公司，而是Meta、谷歌這些同時擁有成熟團隊和算力資源的巨頭。在這些巨頭裡，OpenAI的綜合優勢無疑是最強的，既擁有來自微軟無限量的算力資源供應，又是生成式人工智慧領域頂尖人才集散地，甚至擴散模型這條工程路線的開闢者喬納森·何及其導師皮耶特·阿布比爾（Pieter Abbeel），也曾經是OpenAI的員工，所以Sora誕生在它家也就在情理之中了。

誠然，Sora本身確實很不一般，展現出非常接近商業化質感的視頻輸出能力，並且讓人看到「世界模型」的潛力，資本當然也很願意為這樣的故事陪跑一段，所謂「早相信、早介入、早離場」，但這距離真正的產業落地，形成物理世界的生產力，還有一段距離。

核心的原因在於，即便經歷了ChatGPT、Sora這樣的標誌性傳播事件，生成式AI和消費場景結合仍然還有很長的路要去摸索，獵奇嘗鮮和願意持續付費顯然是兩個概念，當然，在和生產場景結合上，美國企業應用領域或者個人生產力工具的AI化正如火如荼展開，已經展示出提高服務業，尤其是金融、法律、程式設計這類高端服務業勞動生產率的巨大空間，但這些上層建築的發展瓶頸，到底是供給側還是需求側呢？

事實上，豐富的落地場景，正是中國發展AI產業的長板之一。

中國AI產業的兩大特點就是與硬體系統結合、與生產場景結合，所以我們會看到包括一眾智慧手機品牌、自主汽車品牌在內，硬體企業在國內生成式AI的研發上非常有存在感，華為無疑是其中最具公眾認知度的代表，至於AI與各類生產製造、城市管理場景的結合，中國企業探索的廣度和深度更是無出其右，比如智慧製造領域，世界經濟論壇評選的全球一百多家「燈塔工廠」裡，就有四成左右來自於中國，堪稱遙遙領先。

兜兜轉轉，生成式AI商業落地的上下求索中，硬體設備正越來越被重視，除了年初CES展會上大出風頭的AI Pin、Rabbit R1，其實蘋果的Vision Pro也可以被視為一個典型AI終端，包括數位分身、情緒檢測、智慧輸入，都離不開AI技術賦能。

在國內，一眾智慧手機廠商也同樣在以空前力度擁抱生成式AI，從去年鴻蒙小藝接入盤古大模型開始，主要手機品牌幾乎均已官宣接入自研大模型，而節後開工第一天，OPPO創始人兼CEO陳明永就發表內部信，稱2024年是AI手機元年。未來五年，AI對手機行業的影響完全可以比肩當年智慧手機替代功能機，通過AI可以把手機體驗重新做一遍，幫助用戶實現更高價值。更激進的魅族則索性宣佈停止傳統智慧手機新專案，All in AI，推出AI設備，包括XR形態的全天候AI Device。

硬體化，恐怕確實是生成式AI商業落地繞不開的路徑，只有顛覆既有人機交互的形態和模式，才有希望找到AI充分施展優勢的空間，而一旦進入到這條價值軌道的競賽，你永遠可以相信中國製造的競爭力。

AI晶片被美國人當成甩開中國競爭對手的「關鍵一招」，相比AI模型原始程式碼，先進AI晶片無疑是更容易用來「卡脖子」的抓手，輝達對華「特供版」AI晶片H20，正如其標號所顯示的，和主流產品H100相比性能砍掉了80%，美國方面甚至還有動議要封殺中國企業使用亞馬遜、谷歌雲計算服務，堵住一切中國人獲得算力資源的可能。

在各種各樣的段子裡，在中國生成式AI產業儼然只是個騙子俱樂部，主要靠美國GPU加速卡、美國頂會論文和美國開源大模型忽悠投資人，Sora出世之後，中美AI產業差距將進一步拉大到無法追趕的程度。

但現實是，作為打壓的副產品，中國積體電路產業界的需求空間被前所未有地打開，突圍已經呼之欲出，除了華為新一代昇騰晶片越來越多的「蛛絲馬跡」，在高端AI晶片不可或缺的HBM高頻寬記憶體上，也有國內存儲企業近期公開技術儲備。

人工智慧是一場長跑，上世紀50年代以來，已經有過兩起兩落，中國在第一波沒有趕上，第二波追上了一些，不僅在符號主義人工智慧研究上取得了世界級成果，也趕上了神經網路研究的浪潮，在這一次第三波浪潮，中國到底是追近了還是被拉遠了，答案是不言而喻的。

面對喧囂，中國AI產業人和關心這件事的公眾都有必要靜下心來，能夠見證人工智慧這個新質生產力的普及，是我們這一代人的幸運。

連結:科工力量：Sora卷起舆论海啸，中美AI差距被拉大？ (guancha.cn)