攻克“全国最难懂方言”!30种方言,轻松拿捏!
“窝次欧伐没”
“你掐饭了冒有”
“恁吃罢了吗”
“弄去饭了伐”
上面几句关于是否吃饭的方言
小伙伴们都看懂了吗?
我国幅员辽阔,人口众多
来自五湖四海的我们
拥有着各种浪漫的“乡音”
然而方言虽然各有各的美
当“十里不同音”的方言
应用到实际之中
却也不免有时令人难以理解
就比如曾经获得网友投票
“十大最难懂方言”之首的温州话
外地人简直一听一个不吱声
如何寻觅乡音,守护方言之美?
中国电信用AI能力
给出了答案
连温州话都能攻克的语音大模型来啦
近日
中国电信人工智能研究院(TeleAI)
发布业内首个
支持30种方言自由混说的
语音识别大模型——
星辰超多方言语音识别大模型
打破单一模型
只能识别特定单一方言的困境
可同时识别理解
粤语、上海话、四川话、温州话
等30种方言
是国内支持最多方言的语音识别大模型
勇担央企使命,搭建AI时代沟通桥梁
随着AI技术高速发展,人们享受着智能化、无人化服务的便利。然而,“老少边穷”地区及很多老人,由于方言限制,正逐渐被AI时代抛弃。
中国电信坚定地承担央企责任,用AI搭建沟通的桥梁,让每一个人都能享受AI时代便利。
如今,星辰语音大模型已广泛应用落地。
星辰语音大模型已在福建、江西、广西、北京、内蒙古等地的中国电信万号智能客服试点应用,接入星辰大模型以后,万号智能客服秒懂30种方言,自然流畅地服务用户,实现日均处理约200万通电话;
智能客服翼声平台接入星辰大模型的语音理解和分析能力,实现31省份全覆盖,每天处理125万通客服电话。
此外,星辰语音大模型还落地多地市的12345平台,赋能客服人员秒懂30种方言,更自然流畅理解更多市民需求,提升沟通效率,助力政务工作智能化升级,更高效、便捷地为每一位市民提供服务。
用AI守护方言,让语言文化焕发生命力
方言是中国文化的“活化石”,它的美无与伦比
如河南话把小雨叫做“滴星”,让人一听就能联想到辛弃疾笔下的“东风夜放花千树,更吹落,星如雨”;川渝话把雨伞叫做“撑花儿”,既形象又富有诗意;客家话里把彩虹叫做“天弓”,与传承了近千年的宋诗“怅望复怅望,云山挂天弓”交相辉映……
在保护方言的过程中,AI能够更高效、系统地对方言进行整理归纳,对方言保护和传承意义重大。
构建高质量方言数据库,是方言保护和研究的基础。当前,中国电信人工智能研究院已构建超30种,超30万小时的高质量方言数据库,方言数据库在丰富性和高质量等层面均居于业内前列。
在中国电信CTO、人工智能研究院院长李学龙带领下,星辰语音大模型被发布并开源。
为了解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,研发团队首创“蒸馏+膨胀”联合训练算法,实现80层模型稳定训练。
此外,星辰语音大模型也是业内首个开源的基于离散语音表征的语音识别大模型,通过“从语音到token再到文本”的建模新范式,将推理时语音传输比特率降低数十倍。
星辰语音大模型以绝对领先的性能,斩获多个国际权威赛事冠军。
在权威国际语音顶会INTERSPEECH2024离散语音单元建模挑战赛上,凭借星辰语音识别大模型的领先技术,人工智能研究院语音团队斩获语音识别赛道冠军。
在业内知名的多方言语音识别数据集KeSpeech任务上,星辰语音大模型打破纪录,领先之前最优结果20%,以高达92.97%的字准确率刷新最优结果。
同时在NIST(美国国家标准与技术研究院)组织的Babel低资源语音识别项目电话粤语赛道上,刷新纪录取得目前业内最好结果。
极佳的性能保证用户与星辰语音大模型对话,无需刻意切换普通话,也无需提高音量放慢语速,可以像和家人讲话一样自然地畅所欲言。
共同守护方言,传承语言文化
助力AI普惠
未来,中国电信人工智能研究院
将持续深耕研发创新
不断提高支持方言的数量和准确度
计划建成首个
覆盖全国333个地市方言
和主要少数民族语言的
语音识别大模型
切实让“老少边穷”等群体
都能享受到AI时代的便利
最后,你还知道哪些
诗意或者有意思的方言
评论区留言一下吧
