亚洲精品无码乱码成人|最近中文字幕免费大全|日韩欧美卡一卡二卡新区|熟妇性饥渴一区二区三区|久久久久无码精品国产AV|欧美日韩国产va在线观看|久久精品一本到99热动态图|99国产精品欧美一区二区三区

    1. <track id="5d89u"><dl id="5d89u"><delect id="5d89u"></delect></dl></track>

      • <i id="5d89u"><ins id="5d89u"></ins></i>

        
        

        <source id="5d89u"></source>
        您現(xiàn)在的位置是: 汽車 > > 正文

        趣丸科技聯(lián)合港中大(深圳)開(kāi)源語(yǔ)音大模型MaskGCT,刷新全球多項(xiàng)SOTA

        時(shí)間:2024-11-02 14:30:10 來(lái)源:中國(guó)網(wǎng) 發(fā)布者:DN032

        10月24日,趣丸科技宣布與香港中文大學(xué)(深圳)聯(lián)合研發(fā)的語(yǔ)音大模型“MaskGCT”正式開(kāi)源,面向全球用戶開(kāi)放使用。區(qū)別于傳統(tǒng)TTS模型,該模型采用掩碼生成模型與語(yǔ)音表征解耦編碼的創(chuàng)新范式,在聲音克隆、跨語(yǔ)種合成、語(yǔ)音控制等任務(wù)中展現(xiàn)出卓越能。

        據(jù)介紹,MaskGCT在三個(gè)TTS基準(zhǔn)數(shù)據(jù)集上都達(dá)到了SOTA效果,能超過(guò)當(dāng)前最先進(jìn)的同類模型,某些指標(biāo)甚至超過(guò)人類水。顯著特點(diǎn)如下:

        1、秒級(jí)超逼真的聲音克?。禾峁?秒音頻樣本即可復(fù)刻人類、動(dòng)漫、“耳邊細(xì)語(yǔ)”等任意音色,且能完整復(fù)刻語(yǔ)調(diào)、風(fēng)格和情感。

        2、更精細(xì)可控的語(yǔ)音生成:可靈活調(diào)整生成語(yǔ)音的長(zhǎng)度、語(yǔ)速和情緒,支持通過(guò)編輯文本編輯語(yǔ)音,并保持韻律、音色等方面的極度一致。

        3、高質(zhì)量多語(yǔ)種語(yǔ)音數(shù)據(jù)集:訓(xùn)練于香港中文大學(xué)(深圳)和趣丸科技等機(jī)構(gòu)聯(lián)合推出的10萬(wàn)小時(shí)數(shù)據(jù)集Emilia,是全球最大且最為多樣的高質(zhì)量多語(yǔ)種語(yǔ)音數(shù)據(jù)集之一,精通中英日韓法德6種語(yǔ)言的跨語(yǔ)種合成。

        據(jù)介紹,MaskGCT(Masked Generative Codec Transformer)是一個(gè)大規(guī)模的零樣本TTS模型,采用非自回歸掩碼生成Transformer,無(wú)需文本與語(yǔ)音的對(duì)齊監(jiān)督和音素級(jí)持續(xù)時(shí)間預(yù)測(cè)。其技術(shù)突破在于采用掩碼生成模型與語(yǔ)音表征解耦編碼的創(chuàng)新范式。實(shí)驗(yàn)表明,MaskGCT在語(yǔ)音質(zhì)量、相似度和可理解方面優(yōu)于當(dāng)前最先進(jìn)的TTS模型,并且在模型規(guī)模和訓(xùn)練數(shù)據(jù)量增加時(shí)表現(xiàn)更佳,同時(shí)能夠控制生成語(yǔ)音的總時(shí)長(zhǎng)。MaskGCT已在香港中文大學(xué)(深圳)與上海人工智能實(shí)驗(yàn)室聯(lián)合開(kāi)發(fā)的開(kāi)源系統(tǒng)Amphion發(fā)布。

        該模型研發(fā)團(tuán)隊(duì)在語(yǔ)音領(lǐng)域擁有深厚的研究積累和原創(chuàng)成果。這主要依托趣丸科技十年深耕音頻技術(shù)領(lǐng)域和億級(jí)高質(zhì)量語(yǔ)音用戶的服務(wù)經(jīng)驗(yàn),以及香港中文大學(xué)(深圳)國(guó)際一流水的師資隊(duì)伍。早在今年5月份,趣丸科技就與香港中文大學(xué)(深圳)宣布共建聯(lián)合實(shí)驗(yàn)室,針對(duì)人工智能音頻大模型相關(guān)的前沿課題進(jìn)行研究,旨在突破行業(yè)難題,促進(jìn)產(chǎn)學(xué)研深度融合,打造技術(shù)領(lǐng)先的生成式音頻大模型,填補(bǔ)業(yè)界空白。

        目前,MaskGCT在短劇出海、數(shù)字人、智能助手、有聲讀物、輔助教育等領(lǐng)域擁有豐富的應(yīng)用場(chǎng)景。為了加快落地應(yīng)用,在安全合規(guī)下,趣丸科技打造了多語(yǔ)種速譯智能視聽(tīng)臺(tái)“趣丸千音”。一鍵上傳視頻即可快速翻譯成多語(yǔ)種版本,并實(shí)現(xiàn)字幕修復(fù)與翻譯、語(yǔ)音翻譯、唇音同步等功能。該產(chǎn)品進(jìn)一步革新視頻翻譯制作流程,大幅降低過(guò)往昂貴的人工翻譯成本和冗長(zhǎng)的制作周期,成為影視、游戲、短劇等內(nèi)容出海的理想選擇臺(tái)。

        標(biāo)簽: 趣丸科 音大 多項(xiàng)

        搶先讀

        相關(guān)文章

        熱文推薦

        精彩放送

        關(guān)于我們| 聯(lián)系我們| 投稿合作| 法律聲明| 廣告投放

        版權(quán)所有© 2011-2023  產(chǎn)業(yè)研究網(wǎng)  m.www-332159.com

        所載文章、數(shù)據(jù)僅供參考.本站不作任何非法律允許范圍內(nèi)服務(wù)!

        聯(lián)系我們:39 60 29 14 2 @qq.com

        皖I(lǐng)CP備2022009963號(hào)-13


        仲巴县| 赫章县| 平遥县| 平远县| 兴宁市| 资源县| 广饶县| 清新县| 莱芜市| 富顺县| 洪雅县| 舞阳县| 灵川县| 深水埗区| 天镇县| 丁青县| 邵阳县| 白玉县| 巴马| 长子县| 永济市| 临泽县| 南投市| 柘城县| 翁牛特旗| 惠东县| 开平市| 桦川县| 梅州市| 九龙县| 遵化市| 定南县| 福清市| 五华县| 牟定县| 拜城县| 朝阳区| 淮北市| 临颍县| 白银市| 柳河县|