中国首个支持30种方言混说语音大模型发布

来源：中国新闻网 2024-05-25 20:08

分享到微信

中新社福州5月25日电 (记者刘育英)AI(人工智能)正在为传承语言文化注入全新生命力。中国运营商发布首个支持30种方言混说语音大模型。

25日，在第七届数字中国建设峰会上，中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型，打破单一模型只能识别特定单一方言的困境，可同时识别理解粤语、上海话、四川话、温州话等30多种方言，是国内支持最多方言的语音识别大模型。

中国幅员辽阔，“百里不同俗，十里不同音”。各种方言语法语音特征各不相同，传统的方言研究依赖于调查者主观感知标注，人力工程量巨大且难以系统标注。而AI能够更高效、系统地对方言进行整理归纳，对方言保护和传承意义重大。

构建高质量方言数据库，是方言保护和研究的基础。中国电信人工智能研究院已构建超过30种、超30万小时的高质量方言数据库，方言数据库在丰富性和高质量等层面均居于业内前列。

此外，中国电信研发团队首创“蒸馏+膨胀”联合训练算法，解决超大规模多场景数据集和大规模参数条件下，预训练坍缩的问题。

据悉，星辰语音大模型已广泛应用落地。星辰语音大模型已在福建、江西、广西、北京、内蒙古等地的中国电信10000智能客服试点应用。接入星辰大模型以后，智能客服秒懂30种方言，实现日均处理约200万通电话。此外，星辰语音大模型还落地多地市的12345平台。(完)

【编辑:邵婉云】

【责任编辑：齐磊】

专题

推荐阅读

关于我们 | 联系我们

中国日报网版权说明：凡注明来源为“中国日报网：XXX（署名）”，除与中国日报网签署内容授权协议的网站外，其他任何网站或单位未经允许禁止转载、使用，违者必究。如需使用，请与010-84883777联系；凡本网注明“来源：XXX（非中国日报网）”的作品，均转载自其它媒体，目的在于传播更多信息，其他媒体如需转载，请与稿件来源方联系，如产生任何问题与本网无关。

版权保护：本网登载的内容（包括文字、图片、多媒体资讯等）版权属中国日报网（中报国际文化传媒（北京）有限公司）独家所有使用。未经中国日报网事先协议授权，禁止转载使用。给中国日报网提意见：rx@chinadaily.com.cn

C财经客户端

扫码下载