(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 114238634 A
(43)申请公布日 2022.03.25
(21)申请号 CN202111518491.5
(22)申请日 2021.12.13
(71)申请人 北京智齿众服技术咨询有限公司
    地址 100071 北京市丰台区南四环西路186号二区9号楼-1至11层101内2层16室
(72)发明人 吴科 吴立楠
(74)专利代理机构 11369 北京远大卓悦知识产权代理有限公司
    代理人 靳雪华
(51)Int.CI
      G06F16/35(20190101)
      G06F40/242(20200101)
      G06F40/284(20200101)
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      正则表达式的生成方法及应用、装置、设备和存储介质
(57)摘要
      本申请实施例提供了正则表达式的生成方法及应用、装置、设备和存储介质,所述正则表达式的生成方法包括:获取样本语料库;确定样本语料库中的至少一个意图类簇;从意图类簇中确定种子句式,确定种子句式和对应意图类簇中每个语料的第一相似度,将第一相似度高于预设阈值的语料作为召回语料;对召回语料中的语料进行分词处理,获得分词结果,对分词结果中的分词进行聚类,获得至少一个词类簇;根据至少一个词类簇中的分词构建备选要素字典;根据备选要素字典,确定正则表达式。本申请实施例能够提高意图识别的效率,还能够提高意图识别的准确率。
法律状态
法律状态公告日
法律状态信息
法律状态
2022-03-25
公开
发明专利申请公布
2022-04-12
实质审查的生效IPC(主分类):G06F16/35专利申请号:2021115184915申请日:20211213
实质审查的生效
正则化工具箱2022-08-02
授权
发明专利权授予

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。