(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 110555205 A
(43)申请公布日 2019.12.10
(21)申请号 CN201810552837.5
(22)申请日 2018.05.31
(71)申请人 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
    地址 100195 北京市海淀区杏石口路65号西杉创意园四区11号楼东段1-4层西段1-4层
(72)发明人 王颖帅 李晓霞 苗诗雨
(74)专利代理机构 北京律智知识产权代理有限公司
    代理人 王卫忠
(51)Int.CI
     
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      否定语义识别方法及装置、电子设备、存储介质
(57)摘要
      本公开提供了一种否定语义识别方法及装置、电子设备、计算机可读存储介质,属于计算机技术领域。该方法包括:从目标语句中识别否定词;对所述目标语句进行依存分析,获得依存关系树;根据所述依存关系树确定所述目标语句中与所述否定词关联的中心词;对所述中心词进行否定性标注。本公开可以识别出否定语句中否定词所修饰的具体对象,实现对语句的准确理解,并且可以用于识别各种不同表述方式的语句,适用范围较广。
法律状态
法律状态公告日
法律状态信息
法律状态
正则匹配一个或连续多个
权 利 要 求 说 明 书
1.一种否定语义识别方法,其特征在于,包括:
从目标语句中识别否定词;
对所述目标语句进行依存分析,获得依存关系树;
根据所述依存关系树确定所述目标语句中与所述否定词关联的中心词;
对所述中心词进行否定性标注。
2.根据权利要求1所述的方法,其特征在于,从目标语句中识别否定词包括:
对所述目标语句进行分词及词性标注,并根据所述目标语句中各词语的词性标注识别所述否定词。
3.根据权利要求2所述的方法,其特征在于,对所述目标语句进行依存分析,获得依存关系树包括:
将所述目标语句划分为一个或多个子句;
对各所述子句进行句法依存分析,生成各所述子句对应的子树,并提取各所述子树的根词语;
对所述根词语组成的序列进行语义依存分析,确定所述根词语之间的依存关系,以获得所述依存关系树。
4.根据权利要求3所述的方法,其特征在于,对各所述子句进行句法依存分析,生成各所述子句对应的子树包括:
根据各所述子句中各词语的词性标注,提取主结构词及所述主结构词的次结构词;
在各所述子句中,将所述主结构词与所述次结构词向两侧延伸,获得所述主结构词与所述次结构词的子节点词;
将所述子节点词依存到对应的所述主结构词或所述次结构词上,并将所述次结构词依存到对应的所述主结构词上,以生成各所述子句的一个或多个候选子树;
通过维特比算法计算每个所述候选子树的概率,将最大概率的所述候选子树确定为最终的所述子树。
5.根据权利要求3所述的方法,其特征在于,还包括:
当所述根词语之间存在并列关系时,合并相应的所述子树。
6.根据权利要求5所述的方法,其特征在于,还包括:
当全部的所述子树合并为一棵子树时,提取合并后的所述一棵子树的根词语,得到根词语序列;
对所述根词语序列进行句法依存分析,以获得所述依存关系树。
7.根据权利要求3所述的方法,其特征在于,还包括:
通过样本集训练所述句法依存分析的算法,并通过句法依存评价指标评价训练是否通过;
其中,所述句法依存评价指标包括标记正确率、标记召回率、节点正确率及节点召回率中的一种或多种。
8.根据权利要求3所述的方法,其特征在于,还包括:
通过样本集训练所述语义依存分析的算法,并通过语义依存评价指标评价训练是否通过;
其中,所述语义依存评价指标包括依存关系正确率、依存关系召回率、中心词正确率、根正确率及完全匹配率中的一种或多种。
9.根据权利要求1所述的方法,其特征在于,所述中心词包括父属性词、子属性词及否定属性词;基于所述依存关系树,确定所述目标语句中与所述否定词关联的中心词包括:
基于所述依存关系树,确定所述目标语句中与所述否定词关联的所述父属性词、子属性词及否定属性词。
10.根据权利要求9所述的方法,其特征在于,对所述中心词进行否定性标注包括:
根据预设规则,判断所述父属性词与所述子属性词是否具有相关性,以生成相关性标签;
当所述相关性标签为“是”时,为所述目标语句添加否定性标识,所述否定性标识包括所述父属性词、子属性词、否定属性词及相关性标签。
11.根据权利要求10所述的方法,其特征在于,还包括:
当所述相关性标签为“否”时,重新对所述目标语句进行依存分析。
12.根据权利要求1所述的方法,其特征在于,在从所述目标语句中识别否定词之前,所述方法还包括:
对所述目标语句进行正则清洗,以去除不包含关键信息的内容。
13.一种否定语义识别装置,其特征在于,包括:
否定识别模块,用于从目标语句中识别否定词;
依存分析模块,用于对所述目标语句进行依存分析,获得依存关系树;
中心词确定模块,用于根据所述依存关系树,确定所述目标语句中与所述否定词关联的中心词;
否定标注模块,用于对所述中心词进行否定性标注。
14.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-12任一项所述的方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-12任一项所述的方法。
说  明  书
<p>技术领域
本公开涉及计算机技术领域,尤其涉及一种否定语义识别方法及装置、电子设备、计算机可读存储介质。
背景技术
随着大数据与人工智能技术的发展,计算机语义识别及自然语言处理(NaturalLanguageProcessing,NLP)表现出巨大的发展潜力与商业价值,在搜索、机器翻译、智能客服、输入法等多个领域都已经得到广泛的应用。
在语义识别中,关于否定语义的识别是一个技术难点。现有识别否定语义的方法多数是人工维护否定词表,并编辑否定语义的匹配规则,通过正则匹配识别否定语义。然而在人们日常会话中,语言的表述方式很多,正则匹配难以穷尽所有的情况,特别是对于复杂语句或不规则语句的识别效果较差,例如包含多个定语的长句、否定倒装句、双重否定句等,因此现有方法对于否定语义的识别较为机械,准确率不高;此外,现有方法还需要人工
持续更新否定语义的匹配规则,也增加了人力成本。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。