Sora捲起輿論海嘯,中美AI差距被拉大?
文/觀察者網
生成式人工智慧又火了。
一夜之間,OpenAI開發的文生視頻模型Sora,在全球掀起一場海嘯。
從2月15號亮相到現在,中國大V和自媒體們已經給Sora疊上了一層又一層歷史意義,似乎在沒有趕上ChatGPT熱度後,憋了一整年的金句、警句都要在這次宣洩出來。
從展示的視頻看,Sora在技術上顛覆程度的確配得上這種流量「咖位」,可以說以一己之力改寫了技術應用的時間表。
在它亮相前一天,摩根大通剛剛發佈重磅研究報告,預測生成式人工智慧在視頻/3D遊戲領域具備生產力還要等到2030年,一天后,人人都能拍好萊塢大片的未來好像已經觸手可及。
被打臉的頂級投行可能會覺得很冤枉,因為基於過去一兩年文生視頻賽道的狀況,無論巨頭還是初創團隊,在研發上都走得很緩慢,生成的視頻時長不超過幾秒鐘,物體和場景動態變化很小,普遍存在物品或者屬性缺失,不能進行連續優化修正,「災難性遺忘」頻繁出現,無法提取解耦的內容表徵與運動資訊,視頻幀之間也缺乏內容關聯性。
相比之下,Sora在視頻時長、清晰度、提示理解能力、幀間連貫性上的表現是降維打擊。
Sora為什麼這麼牛?
儘管OpenAI還沒有公開技術文檔,不過合理推測,它可能還是「大力出奇跡」的結果。
Sora是一種擴散模型(Diffusion models),這種模型在生成式AI上的應用,奠基于2020年華裔青年學者喬納森·何(Jonathan Ho)提交的「去噪擴散概率模型(DDPM)」論文,自此之後短短兩三年裡,擴散模型已經取代生成對抗網路,一躍成為圖像類生成式人工智慧的最熱門技術路線。
不過擴散模型效果雖然驚豔,但從熱力學領域拿過來的模型本身卻有著更高的計算複雜性,所以你會發現文生圖、文生視頻越來越不是一個學術問題,而是一個工程問題,好的工程能力比好的想法重要得多,目前,業界最耀眼的不是學術天才或者三兩個人攢起來的初創公司,而是Meta、谷歌這些同時擁有成熟團隊和算力資源的巨頭。在這些巨頭裡,OpenAI的綜合優勢無疑是最強的,既擁有來自微軟無限量的算力資源供應,又是生成式人工智慧領域頂尖人才集散地,甚至擴散模型這條工程路線的開闢者喬納森·何及其導師皮耶特·阿布比爾(Pieter Abbeel),也曾經是OpenAI的員工,所以Sora誕生在它家也就在情理之中了。
誠然,Sora本身確實很不一般,展現出非常接近商業化質感的視頻輸出能力,並且讓人看到「世界模型」的潛力,資本當然也很願意為這樣的故事陪跑一段,所謂「早相信、早介入、早離場」,但這距離真正的產業落地,形成物理世界的生產力,還有一段距離。
核心的原因在於,即便經歷了ChatGPT、Sora這樣的標誌性傳播事件,生成式AI和消費場景結合仍然還有很長的路要去摸索,獵奇嘗鮮和願意持續付費顯然是兩個概念,當然,在和生產場景結合上,美國企業應用領域或者個人生產力工具的AI化正如火如荼展開,已經展示出提高服務業,尤其是金融、法律、程式設計這類高端服務業勞動生產率的巨大空間,但這些上層建築的發展瓶頸,到底是供給側還是需求側呢?
事實上,豐富的落地場景,正是中國發展AI產業的長板之一。
中國AI產業的兩大特點就是與硬體系統結合、與生產場景結合,所以我們會看到包括一眾智慧手機品牌、自主汽車品牌在內,硬體企業在國內生成式AI的研發上非常有存在感,華為無疑是其中最具公眾認知度的代表,至於AI與各類生產製造、城市管理場景的結合,中國企業探索的廣度和深度更是無出其右,比如智慧製造領域,世界經濟論壇評選的全球一百多家「燈塔工廠」裡,就有四成左右來自於中國,堪稱遙遙領先。
兜兜轉轉,生成式AI商業落地的上下求索中,硬體設備正越來越被重視,除了年初CES展會上大出風頭的AI Pin、Rabbit R1,其實蘋果的Vision Pro也可以被視為一個典型AI終端,包括數位分身、情緒檢測、智慧輸入,都離不開AI技術賦能。
在國內,一眾智慧手機廠商也同樣在以空前力度擁抱生成式AI,從去年鴻蒙小藝接入盤古大模型開始,主要手機品牌幾乎均已官宣接入自研大模型,而節後開工第一天,OPPO創始人兼CEO陳明永就發表內部信,稱2024年是AI手機元年。未來五年,AI對手機行業的影響完全可以比肩當年智慧手機替代功能機,通過AI可以把手機體驗重新做一遍,幫助用戶實現更高價值。更激進的魅族則索性宣佈停止傳統智慧手機新專案,All in AI,推出AI設備,包括XR形態的全天候AI Device。
硬體化,恐怕確實是生成式AI商業落地繞不開的路徑,只有顛覆既有人機交互的形態和模式,才有希望找到AI充分施展優勢的空間,而一旦進入到這條價值軌道的競賽,你永遠可以相信中國製造的競爭力。
AI晶片被美國人當成甩開中國競爭對手的「關鍵一招」,相比AI模型原始程式碼,先進AI晶片無疑是更容易用來「卡脖子」的抓手,輝達對華「特供版」AI晶片H20,正如其標號所顯示的,和主流產品H100相比性能砍掉了80%,美國方面甚至還有動議要封殺中國企業使用亞馬遜、谷歌雲計算服務,堵住一切中國人獲得算力資源的可能。
在各種各樣的段子裡,在中國生成式AI產業儼然只是個騙子俱樂部,主要靠美國GPU加速卡、美國頂會論文和美國開源大模型忽悠投資人,Sora出世之後,中美AI產業差距將進一步拉大到無法追趕的程度。
但現實是,作為打壓的副產品,中國積體電路產業界的需求空間被前所未有地打開,突圍已經呼之欲出,除了華為新一代昇騰晶片越來越多的「蛛絲馬跡」,在高端AI晶片不可或缺的HBM高頻寬記憶體上,也有國內存儲企業近期公開技術儲備。
人工智慧是一場長跑,上世紀50年代以來,已經有過兩起兩落,中國在第一波沒有趕上,第二波追上了一些,不僅在符號主義人工智慧研究上取得了世界級成果,也趕上了神經網路研究的浪潮,在這一次第三波浪潮,中國到底是追近了還是被拉遠了,答案是不言而喻的。
面對喧囂,中國AI產業人和關心這件事的公眾都有必要靜下心來,能夠見證人工智慧這個新質生產力的普及,是我們這一代人的幸運。