台智雲發表企業級大型語言模型 避免中文答非所問
(圖/台智雲)

華碩轉投資台智雲今天舉辦台灣AI超算年會,發表福爾摩沙大模型,強化繁中語料。華碩董事長施崇棠表示,台灣擁有比鄰近區域更優越的算力資源與企業應用創新動能,台智雲將更積極共創AI 2.0新生態。

更多新聞: 大立光向特斯拉以戰逼單 專利戰延伸至車用鏡頭

台智雲透過台灣杉二號超級電腦,建立台灣第一個高達1760億參數的福爾摩沙大模型(Formosa Foundation Model),結合繁體中文的語意理解與文本生成能力,推出企業級生成式AI(Generative AI)解決方案。

施崇棠指出,去年生成式AI(人工智慧)橫空出世,華碩從2018年起和繪圖晶片大廠NVIDIA合作,參與國家級超級電腦建置計畫;2021年華碩投資成立台智雲,成為亞洲唯一提供商用AI超算服務的雲端服務業者。

他說,今天發表台灣第一個與OpenAI GPT-3.5同級、大幅強化台灣本地知識能力的福爾摩沙大模型,同時透過能彈性、安心、便捷利用的企業級生成式AI解決方案,加速企業進入AI 2.0時代。

施崇棠表示,過去30年半導體製造能力與豐沛的電腦產業生態,讓台灣成為全世界不能忽視的資通訊重鎮。面對未來,台灣擁有相較於鄰近區域更優越的算力資源與企業應用創新動能,台智雲將更積極建構算力、打造平台、連結夥伴,共創AI 2.0新生態。

華碩(2357)營運長暨台智雲董事長謝明傑受訪指出,華碩打造的大型語言模型,相較其他模型有3點差異,包括在地化、落地化及企業化。

謝明傑表示,聊天機器人ChatGPT開發商OpenAI模型的繁體中文資料比例低於0.1%,簡體中文資料不超過2%,中文知識很低,「大部分是英文的腦,中文的腦相當少」。所謂在地化是指用30%的繁體中文資料進行訓練,對於繁體中文的理解會遠比其他模型更高,符合國人使用需求,否則可能會答非所問。

在落地化方面,謝明傑解釋,一般企業使用OpenAI的大型語言模型,都會「怕怕的」,如果要有效運用模型,必須輸入很多公司內部資料,但這些資料輸入後卻儲存在其他公司內。台智雲訓練的大型語言模型,可以讓資料落地放在企業內部,讓企業安心使用。

謝明傑進一步指出,為了加速企業導入,台智雲的模型也可以提供VIP服務,無論企業需要大型模型、縮小模型或客製化,都可協助建立。

華碩雲端暨台智雲總經理吳漢章說,過去半年台智雲團隊拜訪超過百家機構,包含國內外大型企業、新創、台灣和東南亞的超算中心,有幾個重要心得。大型語言模型在企業應用遠超過文字、圖像的生成,更包含預測、推薦等高價值任務;數據也不再只是文字,更包含來自產線、企業資源規劃(ERP)等的結構化數據。

吳漢章強調,ChatGPT是一顆大型通用的腦袋,大型企業要利用這項工具維持競爭力,會期待這顆腦袋是專屬的;透過福爾摩沙大模型去訓練它,會更貼近台灣和企業人士需要的知識。

(中央社)

更多新聞: 迷因幣再掀熱潮!「佩佩蛙幣」17天價飆70倍 市值最高555億台幣