大陸AI機器人應用無所不在,並已逐漸攻占民眾日常生活,舉凡旅遊、3C、食品、醫藥等行業,都可見到機器人的蹤影,現在連電視主播、主持人未來都可能面臨失業的威脅,在第五屆世界互聯網大會在浙江烏鎮開幕當天,搜狗公司和新華社聯合宣布全球第一個全模擬智慧虛擬主持人「AI合成主播」正式亮相。
全球第一個全模擬智慧合成主持人由搜狗與新華社合作開發,觀眾只需輸入一句既有的新聞文本,螢幕上就會出現一位虛擬的新華社新聞主播,他不僅會用和真人一樣的聲音進行播報,連唇形、面部表情也能完全吻合,這樣的效果,無論看上去還是聽起來,都與現實中的新華社主播的本人播報沒有太大差別。
搜狗分身技術支持
據瞭解,在合成主播的開發過程中,搜狗公司的相關技術人員與新華社的新聞主播一起進行各種探索嘗試,在「搜狗分身」技術的支持下,透過人臉關鍵點檢測、人臉特徵提取、人臉重構、唇語識別、情感遷移等多項前沿技術,並結合語音、圖像等多模態信息進行聯合建模訓練後,「AI合成主播」正式誕生。
搜狗公司智慧語音事業部總經理王硯峰表示,「搜狗分身」技術是搜狗人工智慧的核心技術之一,誕生於搜狗「自然交互+知識計算」。該技術能夠利用搜狗的AI能力,從圖像表情,聲音語言習慣,邏輯思維等層面對AI進行擬人化訓練,然後複製人類的AI分身,進而幫助人類提高資訊表達和傳遞的效率。
模擬真人播報畫面
以AI合成主播為例,就是創造性地使用新華社中、英文主播的真人形象,配合「搜狗分身」的語音、合成等技術模擬真人播報畫面,讓大眾享受到逼真度極高的圖像效果。
在「搜狗分身」技術的支持下,使用者透過文字鍵入、語音輸入、機器翻譯等多種方式輸入文本後,將獲得即時的播報視頻,這種操作方式將極大減少新聞媒體在後期製作的各項成本,極大的提高新聞影片的製作效率。
搜狗公司CEO王小川在受訪時表示,合成主播只是「搜狗分身」技術的一個應用分支,未來還將在娛樂、醫療健康、教育、法律等多個領域提供個性化的內容。
(記者/孫曜樟)