/朝聞通/5月22日,網易有道宣布,決定将“子曰”大模型4.0的核心雙引擎 ——“多模态模型”與“語音合成(TTS)模型”,正式面向全球全量開源。開發者可以免費下載、部署,并基于此進行二次開發。

其中一個較為引人矚目的點在于它的【語音克隆】功能。
簡單概括這個功能:錄一段你說話的聲音,AI 就能用你的音色,帶着你的情緒,說 14 種語言的任何語句,而且聽不出是外國人說的。
對此,一位有着過萬關注者的技術大V做出了如下評價:網易有道這不聲不響就把子曰4給開源了,27B的參數量,數理能力直接沖到SOTA。
不過說實話,我最在意的倒不是這個——而是它的語音克隆能力。

Labs老早就能做。但有個老毛病一直沒人真正解決:跨語種的時候會自帶口音。你拿中文聲音去講日語,聽着就是個外國人在那兒硬凹,真是尬到腳趾摳地。
子曰4這次就是奔着這個痛點來的——你的聲音講日語,聽着就像地道的日本人在說話。3秒就能克隆,覆蓋14種語言,做口播配音數字人,省錢又好用。
更關鍵的是,這回是真開源——人家給的是真權重而不是隻給API,整整54個G直接讓你下,還能本地跑。連有道那個龍蝦智能體也一并開源了。
第一,不妨親自去試試這個語音克隆:傳一段你自己的聲音,讓它說外語,親耳聽聽到底帶不帶口音。