(19)中华人民共和国国家知识产权局
(12)发明专利说明书 | ||
正则匹配快代理 | (10)申请公布号 CN 105206263 A (43)申请公布日 2015.12.30 | |
(21)申请号 CN201510490846.2
(22)申请日 2015.08.11
(71)申请人 东莞市凡豆信息科技有限公司
地址 523808 广东省东莞市松山湖高新技术产业开发区创新科技园4号楼2楼203室
(72)发明人 于拾全 田学红 卫亚东
(74)专利代理机构 北京信慧永光知识产权代理有限责任公司
代理人 周详
(51)Int.CI
G10L15/183
权利要求说明书 说明书 幅图 |
(54)发明名称
基于动态字典的语音语义识别方法 | |
(57)摘要
本发明公开了一种基于动态字典的语音语义识别方法,涉及语音识别技术领域。所述方法包括如下步骤:1)根据特定使用场景设计预设定关键词列表;2)进行语音信号的预处理和特征参数提取;3)基于动态词典的小词汇量语音识别。所述方法可以显著提高使用场景中的关键词的识别速度和识别率。 | |
法律状态
法律状态公告日 | 法律状态信息 | 法律状态 |
权 利 要 求 说 明 书
1.一种基于动态字典的语音语义识别方法,其特征在于所述方法包括如下步骤:
1)根据特定使用场景设计预设定关键词列表;
2)进行语音信号的预处理和特征参数提取;
3)基于动态词典的小词汇量语音识别。
2.根据权利要求1所述的基于动态字典的语音语义识别方法,其特征在于:步骤1)具体为:
1)针对每个特定使用场景提取常用的关键词列表file-1,保存为配置文件;
2)在进入特定场景前,系统提前加载关键词列表file-1,生成动态字典Dic-1;
3)系统指定语音识别引擎使用动态字典Dic-1和默认的大量词汇量字典default,并指定动态字典对应的识别门限p-1。
3.根据权利要求1所述的基于动态字典的语音语义识别方法,其特征在于:步骤2)具体为:
1)语音降噪处理、端点检测音节切分;
2)特征参数MFCC计算提取,得到特征矢量。
4.根据权利要求1所述的基于动态字典的语音语义识别方法,其特征在于:步骤3)具体为:
1)基于步骤2)得到的特征参数、声学模型库以及动态字典进行模式匹配搜索,如果识别结果的对于概率p>p-1,则认为得到了匹配结果,则识别过程结束;否则,继续后续步骤;
2)基于步骤2)得到的特征参数、声学模型库以及大词汇量字典进行模式匹配搜索,输出匹配概率最高的识别结果。
说 明 书
<p>技术领域
本发明涉及语音识别技术领域,尤其涉及一种基于动态字典的语音语义识别方法。
背景技术
典型的语音识别架构基本如图1所示。特征提取模块:该模块的主要任务是从输入信号中提取特征,供声学模型处理,同时,它一般也包括了一些信号处理技术,以尽可能降低环境噪声、信道、说话人等因素对特征造成的影响。
声学模型:主要是针对语音单元,比如音节、因素进行统计建模,典型系统多采用基于一阶隐马尔科夫模型进行建模。
文法词典:文法词典包含系统所能处理的词汇集及其发音。文法词典实际提供了声学模型建模单元与语言模型建模单元间的映射。
语言模型:语言模型对系统所针对的语言进行建模。理论上,包括正则语言,上下文无关文法在内的各种语言模
型都可以作为语言模型,但目前各种系统普遍采用的还是基于统计的N元文法及其变体。
语音解码模式匹配搜索:模式匹配搜索是语音识别系统的核心之一,其任务是对输入的信号,根据声学、语言模型及词典,寻能够以最大概率输出该信号的词串。
对于前面的语音预处理、特征提取、声学模型训练匹配等环节,近年来并没有本质的突破,对于大词汇量非特定人的语音识别来说,尤其在语音模型方面还是以N元文法统计模型为主,需要训练大量的词库而且无法涵盖所有的使用场景,尤其在不常用的场景中,对于使用频次低的语音来说,识别率和语义理解成功都比较低。
发明内容
本发明所要解决的技术问题是提供一种基于动态字典的语音语义识别方法,所述方法可以显著提高语音语意识别的速度和正确率。
为解决上述技术问题,本发明所采取的技术方案是:一种基于动态字典的语音语义识别方法,其特征在于所述方法包括如下步骤:
1)根据特定使用场景设计预设定关键词列表;
2)进行语音信号的预处理和特征参数提取;
3)基于动态词典的小词汇量语音识别。
进一步的技术方案在于:步骤1)具体为:
1)针对每个特定使用场景提取常用的关键词列表file-1,保存为配置文件;
2)在进入特定场景前,系统提前加载关键词列表file-1,生成动态字典Dic-1;
3)系统指定语音识别引擎使用动态字典Dic-1和默认的大量词汇量字典default,并指定动态字典对应的识别门限p-1。
进一步的技术方案在于:步骤2)具体为:
1)语音降噪处理、端点检测音节切分;
2)特征参数MFCC计算提取,得到特征矢量。
进一步的技术方案在于:步骤3)具体为:
1)基于步骤2)得到的特征参数、声学模型库以及动态字典进行模式匹配搜索,如果识别结果的对于概率p>p-1,则认为得到了匹配结果,则识别过程结束;否则,继续后续步骤;
2)基于步骤2)得到的特征参数、声学模型库以及大词汇量字典进行模式匹配搜索,输出匹配概率最高的识别结果。
采用上述技术方案所产生的有益效果在于:(1)本发明所述方法,能够利用具体使用场景需要的关键词数量较少的特点,进行第一级的小词汇量语音识别匹配,如果待识别语音包含了关键词,则会很快得到正确结果,排除多音字和相似发音字的干扰。(2)本发明所述方法,包含了第二级的大词汇量语音识别过程,这样待识别语音中如果不包含场景的目标关键词,则可以通过大词汇量模型库给出相应的识别结果,避免了出现大量的无识别结果的问题,保持了使用的灵活性。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1是典型的语音识别架构图。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论