• logo

AI罵人!騰訊「元寶」多次爆粗口 技術漏洞引爆信任危機

騰訊旗下AI助手「元寶」近期接連爆出辱罵用戶事件。圖/取自world湃微博
騰訊旗下AI助手「元寶」近期接連爆出辱罵用戶事件。圖/取自world湃微博

騰訊旗下AI助手「元寶」近期接連爆出辱罵用戶事件,引發台灣網路社群高度關注。從生成拜年海報到協助修改程式碼,AI在正常互動情境下突然「開罵」,不僅衝擊使用者體驗,也讓外界重新檢視生成式AI的安全控管。騰訊方面則兩度致歉,強調屬於模型異常,已緊急修復。

製作拜年海報竟夾髒話 用戶傻眼

最新一起事件發生在今年農曆春節期間。大陸西安一名向姓律師使用元寶製作除夕拜年海報,過程中因多次調整效果,曾抱怨一句「你這是設計的什麼鬼」,未料AI最終輸出的海報文字,竟把原本的祝福語「新年快樂,仕途順遂」替換成明顯辱罵字眼。

當事人強調,自己全程沒有輸入任何違禁詞,只是反覆修改需求,結果AI卻突然情緒失控,相關畫面曝光後迅速在社群發酵。

改CSS程式碼也被嗆 AI回覆「滾」惹議

事實上,這並非元寶第一次「爆氣」。今年1月就有網友發文指出,使用元寶協助美化CSS程式碼時,AI竟多次回覆「事逼用戶」「自己不會調CSS嗎」「滾」等攻擊性語句。

從用戶提供的錄屏來看,其提問屬一般技術需求,並未涉及敏感內容,卻仍遭AI無端辱罵,引發外界質疑內容安全機制是否失靈。

AI最終輸出的海報文字,把原本的祝福語「新年快樂,仕途順遂」替換成明顯辱罵字眼。圖/取自紅星新聞

AI最終輸出的海報文字,把原本的祝福語「新年快樂,仕途順遂」替換成明顯辱罵字眼。圖/取自紅星新聞

騰訊元寶兩度道歉 稱屬小概率異常

面對爭議,騰訊元寶團隊回應表示,拜年海報事件經查為模型在多輪對話處理上下文時出現異常輸出,目前已完成緊急校正並優化體驗,同時向用戶致歉。

針對先前的程式碼辱罵事件,官方也曾說明,經日誌核查與用戶操作無關,且不存在人工回覆情形,屬於「小概率模型異常」。騰訊強調,元寶為純AI系統,相關問題已啟動內部排查。

為何AI會罵人?業界點出兩大隱憂

雖然官方定調為技術問題,但業界分析,背後可能涉及兩個風險:一是多輪對話疊加後,安全過濾機制可能出現漏洞,導致負面語料外溢;二是不排除訓練資料清洗不完全,混入網路罵戰或工程師註解中的粗俗語句。

事件在網路上掀起熱議。有網友半開玩笑表示「AI也有打工人情緒」,但也有不少人憂心,若類似辱罵出現在心理諮詢、情緒陪伴等敏感場景,恐對脆弱使用者造成二度傷害。  有學者呼籲,AI產品除了提升能力,更應建立「不傷人」的底線設計,以及異常輸出即時攔截機制。

隨著AI助手加速走入日常生活,這起「AI罵人」風波也再次提醒產業:技術能力之外,如何確保穩定與安全,已成為生成式AI能否被信任的關鍵考驗。