趣丸网络张人勇:AI克隆人声只需3秒样本

时间: 2024-12-30 11:07:07 |   作者: 绿植租赁

内容详情/Details of the content

  “Mask GCT语音大模型能够在必定程度上完结秒级超传神的声响克隆,只要对模型输入3秒左右的声响样本,就能做到带心情、复刻音色的声响输出。”广州趣丸网络科技有限公司的出资部负责人张人勇在2024年粤港澳大湾区文明产业出资大会(广东·广州)上如此介绍自己的公司产品。

  据介绍,这家超60%的人员都在做研制的“硬核”公司,产学研结合,与香港科技大学广州分校以及香港中文大学别离联合兴办趣丸科技两个人AI的联合实验室,旗下Mask GCT大模型采集了10万小时数据集,以改写多项业界目标的优异成果通过了3个数据集的测验。不久前的10月24日,趣丸科技宣告与香港中文大学(深圳)联合研制的语音大模型“Mask GCT”正式在Amphion体系中开源,面向全球用户敞开运用。

  “趣丸科技不是做通用大模型的,做这些模型都是源于咱们在事务开展中捕捉到的用户和职业的需求。咱们做的这些大模型未来也是期望使用在数字人、三维生成、智能音频和音乐生成傍边。”现在,趣丸正在做活跃的商业化探究。

  张人勇在现场表明,趣丸中心的事务在交际范畴,交际方面的使用包含言语陪同式谈天。据悉,趣丸旗下根本的产品tt语音是国内抢先的爱好交际渠道,为玩家供给组队开黑、队友匹配、电子竞技等多种文娱互动服务。

  另一方面,能调整长度、语速和心情的优势得以打造更精密可控的声响输出,Mask GCT语音大模型运用到短剧和影视剧优质的声响克隆和翻译上,助力文明出海。据张人勇介绍,趣丸参加规划的《第六只醒狮》微短剧当选了国家广电总局举行的我国影视剧大赛。

  在音乐方面,趣丸自研的天谱乐大模型给音乐创造供给了更低的门槛,其音乐APP唱鸭累计注册用户超越4600万人。一起,趣丸旗下Spark.AI是全球首个高价值网漫数字内容出产的AI提效创造渠道,以垂类漫画大模型给专业的漫画创造者供给一个快速上手的东西。

  “AIforfuture.”关于toB仍是toC的挑选,张人勇回复现场发问时答道,“企业界部成立了‘X’部分,咱们一直信任优势的主业集聚开展,对投入很多资金的职业寄予厚望,对B端的测验也会持续开展。”据悉,趣丸科技正处于港交所的上市过程中。

首页
一键拨号
留言反馈