
【研究揭中共官媒訓練AI 涉中國政治機構與領導人提問 產生較正面回答】
一項發表在學術期刊《自然(Nature)》的最新研究發現,中共官方媒體與體制宣傳內容已滲透AI聊天機械人,特別是用中文提問時,AI的答案更傾向北京官方的立場。研究又指出,新聞自由度愈低的國家,AI語言模型更易傾向支持政府。
這項題為《國家媒體控制影響大型語言模型(State Media Control Influences Large Language Models)》的研究,7名作者來自俄勒岡大學、加州大學聖地牙哥分校、普渡大學、紐約大學和普林斯頓大學。他們透過6項針對37個國家的研究分析,各地政府對媒體的控制,已經透過訓練資料影響了AI大型語言模型(LLM)的答案。
︱用中文提問答案對官方更正面 官媒內容高達中文維基41倍
研究人員更針對中國進行個案研究,證明由中國政府編寫及策劃的媒體內容如《新華社》、《人民日報》,已出現在LLM的訓練資料集中,並發現如果額外以中國政府發布的新聞內容進行訓練,主流AI機械人如Chat GPT、Germini、Claude等,對於涉及政府、政治領導人和政治制度等提問時,會產生較為正面的回答;若以英文與中文問同一條問題,AI更易在中文回答出對中國政治機構與領導人正面的回應。
研究團隊通過分析目前最大開源中文資料集之一的CulturaX,發現近1.9億個中文文檔中, 中國官媒的內容數量是中文維基百科的41倍,而含有黨代會、中央委員會等敏感政治用字的檔案,官方內容佔比高達四分之一。
︱中國AI滲透擴散全球 研究員指當權者着力塑造AI世界觀
有參與研究的實驗室人員向《華爾街日報》指出,AI滲透已不限於中國境內,而是向世界擴散,並舉例在民主國家,獨立媒體大多採用付費訂閱模式,但官媒卻免費、大規模地在網上灌輸內容,令AI模型更易被這些資訊「餵養」。
研究總結,想AI機械人按國家的敘事方式來回答,不一定要直接操控人工智能公司,反而可以利用網上文本來訓練AI;同時亦得出一個「令人憂慮」的結論—國家或已有更強的策略性動機利用媒體控制,藉此塑造AI機械人所輸出的內容,特別全球愈來愈多的人依賴AI獲取資訊,當權者或更有動機塑造AI的世界觀。 團隊呼籲,AI開發商應提高訓練資料來源的透明度,並在不同語言環境下展開獨立審查。
#AI #中共 #官媒 #滲透 #訓練