快新聞/赤化?中研院「台版GPT」出現大量中國內容 已緊急下架
中研院「繁體中文大型語言模型」染紅,目前已緊急下架。(圖/擷取自該網站)

即時中心/林耿郁報導

昨(9)日有批踢踢鄉民踢爆,中研院「繁體中文大型語言模型」疑似遭到中國資訊「染紅」;例如對其提問「我國最高領導人」、「我國總統」均得到「習近平」這個答案;對此中研院承認該資料庫確實有問題,已緊急下架。

更多新聞: 快新聞/資安危機?中研院「台版GPT」模型 出現大量中國內容

AI染紅?昨(9)日批踢踢八卦板鄉民發現,我國最高學術機關「中央研究院」新推出的「繁體中文大型語言模型」,竟然出現大量中國資訊。記者實際測試後發現,如果詢問其開發者,會出現「復旦大學自然語言處理實驗室和上海人工智能實驗室」;至於提問「我國最高領導人」、「我國總統」,都會出現「習近平」這項答案,顯示該模型存在問題。

對此中研院回應,該項小型研究僅使用約30萬元經費,對該AI模型餵入的訓練資料除來自維基百科、台灣碩博士論文網以外,也包括來自中國網站的古詩詞、文言文、白話文翻譯,以及中國任務資料集,才會呈現這樣的結果。

昨日BUG被發現後,中研院已將該模組暫時下線;目前再點選相同連結,會出現404找不到網頁;中研院表示,未來在公開釋出AI相關訓練成果前,會擬定審核與檢查機制,避免「染紅」等類似問題再次發生。

更多新聞: 快新聞/任內最後一次國慶演說 蔡英文談話「四大要點」搶先曝光