2022-10-21・Array

2022-10-21・Array
講台語嘛通 Meta實現說閩南語直翻英語

Meta於19日(當地時間)宣布推出全球第一款直接以語音對語音方式的AI翻譯系統。能讓原本沒有對應標準書寫文字內容的閩南語,直接透過口說方式翻譯成英語。而該系統的其中一位開發者就是來自台灣的軟體工程師陳鵬仁,Meta執行長祖克柏在發布會上還以該系統與陳鵬仁以英語和閩南語對話,向世界宣傳其翻譯性能。

Meta聲明表示,該系統被稱為通用語音翻譯器(UST),是Meta AI通用語音翻譯項目的第一個里程碑,此項目專注於開發人工智慧系統,提供所有語言的即時語音、口語翻譯。

Meta指出,至今為止,AI翻譯主要著重於各種書寫語言,標準技術需有大量書寫文字來訓練AI翻譯模型。但在全球超過7000種的現存語言中,超過40%主要是以口語表達,跟閩南語一樣沒有標準或廣泛使用的書寫文字系統。而UST系統正逐步克服這項挑戰。

UST的設計是,將沒有文字的語言念音轉為數位資料,並且將這些資料以不同語言對應文字進行標示分類。Meta在發布會上示範閩南語與英語翻譯過程中,便是將閩南語轉換成數位資料後,再以中文作為中間語言、透過機器學習方式進行比對訓練,而後再翻譯成英語 (將閩南語轉換成中文,再將中文轉換為英語),反之亦能將英語翻譯成閩南語。Meta為此建立了長達300小時長度的閩南語語料庫,並建立了第一個閩南語與英語雙向語音翻譯基準資料庫,以確保翻譯結果正確。

參與開發的陳鵬仁表示,他70歲的父親陳聖獎來自普遍使用閩南語的台灣南部,常覺得用中文進行複雜對話非常困難。他希望他爸跟所有人溝通時都能用閩南語對話,因為這是他爸最熟悉的語言。雖然他爸聽得懂中文,但若討論較複雜的主題時,他爸說話速度會比較慢。

祖克柏也宣布,將開放Meta打造的Speech Matrix大型語音對語音AI訓練模型,讓其他研究人員可以建立更多無法透過文字內容紀錄的語言庫,打破語言隔閡。(旺報/張國威)