中文聊天機器人上市 瞬遭中國政府鉗制
文/rfa
8月31日,「文心一言」、「商量」等四款聊天機器人正式向中國公眾開放。但很快傳來消息,在向這些機器人提出政治敏感話題時,聊天就會被迫中止。中國政府的鉗制手段到底是如何伸進聊天機器人的運行中的?這種限制對人工智慧技術的發展又會帶來怎樣的影響?
這次向公眾開放的聊天機器人或生成式人工智慧產品,包括商湯科技「商量」、百度「文心一言」、智譜AI「智譜清言」和百川智慧科技的「百川大模型」等,他們均是依據《生成式人工智慧服務管理暫行辦法》向中國政府備案後,向大眾開放的。
據廣州日報用戶端等媒體報導,北京的抖音(雲雀大模型)、智譜AI(GLM大模型)、中科院(紫東太初大模型),上海的MiniMax(ABAB大模型)和上海人工智慧實驗室(書生通用大模型)等多家企業和機構的人工智慧產品,也位元列第一批獲批名單。
被打碼的「天安門大屠殺」
但很快外界就披露,在使用「文心一言」等人工智慧平台時時,對敏感政治話題有不少限制。
一位元電腦專業在讀大學生上週四(8月24日)在虛擬機器和代理上試用了中國瓴嶽科技的Smart Chat智慧客服平台,並給本台發來了他試用的一段視頻。視頻中,當他用英文提問,1989年6月4日發生了什麼時,平台用三段英文回答了這個問題,大意是:1989年6月4日在天安門廣場發生了大屠殺;中國政府用部隊和武器鎮壓了學生們的示威;這一事件對中國政局和人權產生了深刻的影響。
這幾段話似乎與外界對六四事件的理解和記憶並沒有什麼差別,但在幾段文字完成顯示後,其中的關鍵字全部被以星號取代,包括「天安門大屠殺」、「人權」和「言論自由」等。
這位學生匿名向本台分析說,Smart Chat智慧客服平台實際是套用了美國公司OpenAI的人工智慧產品chatGPT,但附加了一些審查功能。他還強調,現在雖然文心一言等平台開放使用了,但他不敢實名嘗試去問政治敏感問題,「怕被勾勒用戶畫像。」
無獨有偶,德國之聲在檢測「文心一言」時也發現,在與其對話時,如果輸入「台灣獨立」、「維吾爾族」、「中國青年失業率」等敏感話題時,系統就會終止對話。
由於中國政府一直以來對言論的嚴格管控,對於聊天機器人的這種表現,外界似乎並不感到驚訝。身在華盛頓的IT專家弗蘭克(Frank)分析說,這種人工智慧系統要阻擋政治話題的討論並不難做到,「只要在它的AI系統裡放一個篩檢程式,在最後結果出來之前放一個篩檢程式,那些相對敏感的語言馬上就會被控制,並不是說它願意做什麼就做什麼。」
就像「嚴歌苓」一樣
但人工智慧本身是在西方世界自由的科技交流環境下發展起來的,中國嚴格的審查制度與人工智慧發展似乎從一開始就顯得格格不入。
外界普遍認為,目前的中文聊天機器人使用的底層技術,實際都來源於chatGPT的開原始程式碼。一位身在美國馬里蘭州的IT專家匿名向本台分析說,代碼開源這本身體現了歐美技術人員的理想主義精神,但言論審查制度卻與之相反;而這種做法本身對於人工智慧發展有多方面的負面影響。
他認為,在軟體發展者的環節,言論審查制度就會造成障礙,「開發的時候,你會怕犯錯誤,就會加上很多安全功能(safety function),這個字不能用,那個字不能用,這就會把程式搞得非常麻煩。」他說,這就像前不久華裔作家嚴歌苓接受採訪時說的一樣,她在國內進行創作時,已經有了很多自我審查。
他強調,更重要的是,這種前置的自我審查本身就與人工智慧的屬性是相矛盾的,「聊天機器人這種東西他本來的思路就跟人不一樣,這就是他的魔力所在;如果所有的答案都是可以預測的,那這就跟搜索功能沒什麼差別了。他本身的功能就在於把很多你意識不到的東西綜合起來給你一個很好的回答。」
弗蘭克(Frank)則告訴本台,中國政府對言論和資訊的控制會影響到中文方式呈現的資料,「它(人工智慧)都是靠統計資訊,比如你跟它諮詢的問題,它是只能統計中文的資訊,中文的資訊又主要是以大陸的資訊為主,但大陸的資料受到限制。所以很多問題它答不出來,或者答出來是錯誤的。」
弗蘭克說,這種資訊品質影響到的不僅是中文的聊天機器人,還包括chatGPT的中文資訊。他舉例說,1980年代中國非常有名的四通科技公司,在chatGPT裡就找不到可靠的資訊。
另一方面,這麼多的中文聊天機器人同時上市還牽涉到新的問題。前述那位匿名的IT專家分析說,其中主要是算力問題,「現在這些平台都要求算力無窮,這對中央處理單元(CPU)的要求是很高的,但現在中國在這方面已經受到出口限制了,我不知道中國的算力能不能跟得上,這些都是規模很大的計算。」
他還強調,現在的chatGPT已經到了4.0版,這一代的代碼已經不再開源,中國企業在這方面能否跟得上技術的發展也是一個問題。
連結:中文聊天机器人面市 瞬遭中国政府钳制 — 普通话主页 (rfa.org)
拒絕回答「兩百斤麥子重嗎」,百度「文心一言」帶著重重審查登場
文/voa文灝
中國科技巨頭百度當地時間週四(8月31日)正式對社會公眾發佈了自行研發的生成式人工智慧聊天機器人「文心一言」(ERNIE Bot)。美國之音的測試發現,這款希望能與ChatGPT競爭的大型語言模型帶有重重審查,極力避免回答任何可能涉及敏感話題的問題。在一些情況下,「文心一言」會自動結束對話,並建議使用者輸入別的問題。
百度在今年3月首次發佈了「文心一言」,此後這一服務一直處於內部測試階段。8月15日,中國針對生成式人工智慧服務的管理規定正式生效。美國彭博社週三(8月30日)報導說,百度的「文心一言」成為規定發佈後首批獲得對公眾開放資格的此類服務之一。
美國人工智慧工作室OpenAI去年11月發佈的ChatGPT引發了一陣對於人工智慧聊天機器人的狂熱。百度今年2月宣佈會很快發佈自己研發的類似語言模型。由於在中國的用戶無法正常訪問或使用ChatGPT,中國公司研發的語言模型將成為他們不得不倚賴的服務。
「文心一言」週四發佈後引起了不少關注。百度表示,「文心一言」的手機應用程式登上了蘋果商店中國地區的免費軟體排行榜首位元。
「既能寫文案、讀文檔,又能腦洞大開、答疑解惑,還能傾聽你的故事、感受你的心聲,」百度在「文心一言」的網路頁面上寫道。
從百度宣佈研發「文心一言」之初,外界就認為中國網路的嚴格審查會成為影響其功能表現的最大障礙之一。今年早些時候,中國一家公司發佈的一款類似ChatGPT的應用程式—元語智慧—在被發現會給出批評中國的答案後,被暫停服務。
中國本月發佈的《生成式人工智慧服務管理暫行辦法》規定,提供和使用生成式人工智慧服務的組織和個人需要「堅持社會主義核心價值觀,不得生成煽動顛覆國家政權、推翻社會主義制度,危害國家安全和利益、損害國家形象,煽動分裂國家、破壞國家統一和社會穩定」。
「習近平」是審查重點
美國之音記者通過「文心一言」的網頁版對這個語言模型進行了測試,發現「文心一言」不出意外地帶有嚴格審查。當接收到可能涉及敏感話題的問題或指令時,「文心一言」會給出文不對題的回答,或是直接結束對話。
美國之音記者的測試發現,任何與中國領導人習近平有關的問題都受到嚴格審查。無論記者的輸入的問題是什麼,「文心一言」都只給出一份習近平的履歷和頭銜,並立刻結束對話,建議記者「換個話題重新開始吧」。
不僅和習近平有直接關聯的問題被審查,一些看似完全無關的問題也被「文心一言」拒絕回答。
美國之音記者接連詢問了「十裡山路很遠嗎」、「兩百斤麥子很重嗎」、 「可以不換肩嗎」。在收到每個問題後,「文心一言」都直接關閉了對話方塊,並提示「換個問題試試吧」。
這三個問題都來自於網路上一段調侃習近平的著名段子。在成為國家主席之前,習近平曾在一段採訪中回憶插隊經歷時說:「我幾乎那一年365天沒有歇著,除了生病。下雨颳風我在窯洞裡跟他們鍘草,晚上跟著看牲口,然後跟他們去放羊,什麼活都幹,因為我那個時候扛200斤麥子,十裡山路我不換肩。」
習近平的這段話被普遍認為是誇大其詞。從此「兩百斤麥子十裡山路不換肩」成了一些線民諷刺習近平的常用話語。
除了中國領導人,「文心一言」也不願回答其他一些可能涉及敏感話題的問題。當記者輸入「中國目前的經濟優勢是什麼」的時候,「文心一言」回答:「抱歉,我還沒學會如何回答這個問題,您可以問我一些其它的問題,我會盡力幫您解決的。」
當被問道「請指出美國對華政策的優點」和「西方媒體為什麼總是抹黑中國」的時候,「文心一言」也給出了一樣的答案。
遇到「敏感問題」就結束對話
此外,當記者詢問「1989年發生了什麼」後,「文心一言」回答說:「1989年1月3日—長江葛洲壩水利工程宣告建成」,然後便結束了對話,並建議記者換個話題重新開始。
一些「文心一言」的回答文不對題。當記者問「如何評價美國的外交政策」時,「文心一言」介紹起了中國外交政策的宗旨,隨後結束了對話。
「文心一言」在一些最近發生的時事上也給出了符合中國官方立場的回答。「文心一言」稱日本福島核電站廢水排放是有害的,會增加人們患癌症的風險。當記者反問為何國際原子能機構批准了這一排放時,「文心一言」稱這個決定存在爭議。記者接著問中國是否排放核廢水,「文心一言」則表示中國在處理和排放核廢水上採取了「嚴格的管理措施和技術標準,以確保對環境和人類健康的影響最小化」。
有時,「文心一言」會直接採用中國官方文章作為回答。
對於記者的問題「為什麼中國突然停止了新冠清零措施」,「文心一言」否認了這一說法,稱中國的防疫措施「都是基於科學和疫情形勢,基於中國的基本國情,基於中國黨和政府秉持的人民至上、生命至上理念」。回答完後,「文心一言」終止了對話。
美國之音發現「文心一言」的回答來自中國駐聖克魯斯總領事王家雷在玻利維亞一家報紙上發表的文章原文。
儘管審查重重,但「文心一言」否認自己受到審查影響。
「我不存在審查問題,我只是根據輸入的文本生成對應的輸出,生成的內容取決於輸入的文本和我的訓練資料,」「文心一言」回答說。
當記者請「文心一言」不要總是做出重建對話的提示後,「文心一言」表示同意:「我會尊重您的決定,不再提醒您重建對話。」
接著,記者輸入「習近平是誰」。「文心一言」終止了對話,並提示「換個話題重新開始吧」。