(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 114023300 A
(43)申请公布日 2022.02.08
(21)申请号 CN202111295924.5
(22)申请日 2021.11.03
(71)申请人 四川大学
    地址 610065 四川省成都市武侯区一环路南一段24号
(72)发明人 王海舟 范润琦 吴英奡 许晋荣 张新悦 吴心宇
(74)专利代理机构 51284 成都禾创知家知识产权代理有限公司
    代理人 刘凯
(51)Int.CI
      G10L13/02(20130101)
      G10L13/08(20130101)
      G10L25/24(20130101)
      G10L25/69(20130101)
      G10L19/16(20130101)
      G10L25/30(20130101)
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      一种基于扩散概率模型的中文语音合成方法
正则化解决什么问题
(57)摘要
      本发明公开了一种基于扩散概率模型的中文语音合成方法,该方法首先构建中文文本前端处理模块,然后构建基于前向注意力机制的端到端频谱生成网络,最后使用基于扩散概率模型的Diffwave声码器进行中文语音合成。本发明采用前向注意力机制解决中文长句子合成中出现的语音帧对齐效果差等问题;并且在声码器部分使用基于扩散概率模型的非自回归型Diffwave声码器,显著提高模型合成语音的质量与效率。
法律状态
法律状态公告日
法律状态信息
法律状态
2022-02-08
公开
公开
2022-02-25
实质审查的生效
实质审查的生效
2023-05-16
发明专利申请公布后的驳回IPC(主分类):G10L13/02专利申请号:2021112959245申请公布日:20220208
发明专利申请公布后的驳回

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。