異言堂/動態捕捉結合生成式AI 打造AI主播「敏熙」

 專題組/唐郁荃、賴冠諭  台北報導

民視推出全台首位AI虛擬主播,不只有著「女神級」外表,就連情、動作和口氣都相當生動、自然。而最近經過民眾踴躍提案,名字也終於定案,叫作「敏熙」。乍看韓系的名字,其實取自民視的台語諧音,相當俏皮。

更多新聞: 異言堂/潮汐影響地下管線 看不見的危機有解?


異言堂/動態捕捉結合生成式AI 打造AI主播「敏熙」
民視推出全台首位AI虛擬主播「敏熙」

AI主播之所以能生動地播報新聞,背後要靠大量的科技支撐。像是敏熙的外表,運用的就是生成式AI(AIGC)技術。所謂的生成式AI,就是當AI學會某一個特定領域的知識後,就能夠自己生成或創作出一個全新的作品。最具代表性的生成式AI,正是微軟所推出的ChatGPT。ChatGPT因為經過大型的語言模型訓練,因此已經能夠理解民眾以口語輸入的文字指令,並產生一段相應的文字。而AI主播敏熙也應用了類似的科技。

光禾感知科技創辦人王友光表示:「因為新聞倫理的關係,新聞台的稿件不可能讓電腦生成。但除了文本以外,聲音、影像都是藉由長年的累積產生。AI主播大量地去學習一個主播應該有的樣子是什麼。他講出來的話是什麼。」

王友光表示,AI主播敏熙的外表、表情、動作,其實是讓AI看了大量新聞主播播報的影片後,所生成出來的成果。而結合微軟的語音生成功能,AI主播敏熙就能依國際中心記者所撰寫的稿件,自動產生聲音和口型,出現我們現在所能看到的播報畫面。而AI主播能夠看懂這些影片的關鍵技術,其實就是動態捕捉科技。


異言堂/動態捕捉結合生成式AI 打造AI主播「敏熙」
光禾感知科技九宮格分析圖


2019年奧運棒球前哨站,光禾感知科技就曾利用動態捕捉技術,做出比賽轉播畫面上的九宮格分析圖。光禾感知科技專案副總監王灝說明:「AI追蹤球的運動軌跡,是透過高速影像,一秒250張、300張的影像,去擷取然後計算出來的。」而當被用在電視新聞真人主播的播報影片中,AI主播就能透過動態捕捉技術,看見真人主播每根臉部肌肉的變化、眨眼頻率、細微的動作。進而學會、模仿,甚至生成出只屬於自己的模樣。甚至隨著讀取的資料越來越多,AI主播敏熙的外貌和口氣也會繼續微調,變得更加符合大眾喜好。但因為敏熙無法為自己的言論負責,也沒辦法做好查證工作,短期間的還是只能扮演「讀稿機」的角色。暫時不會取代真人主播的工作。

更多新聞: 異言堂/不只好玩 「虛實融合」實現遠距醫療