(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 正则匹配关键词CN 110019641 A
(43)申请公布日 2019.07.16
(21)申请号 CN201710625143.5
(22)申请日 2017.07.27
(71)申请人 北大医疗信息技术有限公司
    地址 100080 北京市海淀区北四环西路52号19层
(72)发明人 康亮环 王琦 陈中阳
(74)专利代理机构 北京友联知识产权代理事务所(普通合伙)
    代理人 尚志峰
(51)Int.CI
     
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      一种医疗否定术语的检出方法及系统
(57)摘要
      本发明提出了一种医疗否定术语的检出方法及系统,医疗否定术语的检出方法包括:获取电子病历文本以及搜索引擎对其进行索引得出的索引分词结果;根据电子病例文本,对索引分词结果进行处理,以得到新索引分词序列;在新索引分词序列中提取医疗否定术语;对医疗否定术语进行标记,以还原并输出新索引分词结果。本发明能够在电子病历搜索引擎得到的索引分词结果中,检索出具有否定意义的医疗术语,并将其转化为带有否定标记的词,最终得到一个新索引分词结果,实现了电子病历搜索引擎能够从语义层面准确区分出电子病例文本描述中明确否认的医疗问题,使医疗否定术语的检出结果符合用户的要求,提高了医疗否定术语的检出的合理性。
法律状态
法律状态公告日
法律状态信息
法律状态
2023-09-08
授权
发明专利权授予
权 利 要 求 说 明 书
1.一种医疗否定术语的检出方法,其特征在于,所述方法包括:
获取电子病历文本以及搜索引擎对其进行索引得出的索引分词结果;
根据所述电子病例文本,对所述索引分词结果进行处理,以得到新索引分词序列;
在所述新索引分词序列中提取医疗否定术语;
对所述医疗否定术语进行标记,以还原并输出新索引分词结果。
2.根据权利要求1所述的医疗否定术语的检出方法,其特征在于,在所述新索引分词序列中提取所述医疗否定术语之前,还包括:
将所述电子病例文本中的关键词整理为关键词词典;
根据所述新索引分词序列及所述关键词词典创建医疗特征模板;
分析所述索引分词结果中所述医疗否定术语表述特点,以归纳出所述索引分词结果中所述医疗否定术语的匹配规则。
3.根据权利要求1所述的医疗否定术语的检出方法,其特征在于,根据所述电子病例文本,对所述索引分词结果进行处理,以得到所述新索引分词序列具体为:
在所述索引分词结果的基础上,将所述电子病历文本中被过滤掉的过滤词按照在所述电子病历文本中的顺序添加到所述新索引分词序列中。
4.根据权利要求3所述的医疗否定术语的检出方法,其特征在于,
所述新索引分词序列由多个序列元组成;
每个所述序列元至少包括:所述索引分词结果或所述过滤词在所述电子病历文本中的首字位置、所述索引分词结果或所述过滤词的类型、所述索引分词结果或所述过滤词的分词种类。
5.根据权利要求1至4中任一项所述的医疗否定术语的检出方法,根据所述新索引分词序列及所述关键词词典创建医疗特征模板,具体为:
判断所述序列元中所述索引分词结果或所述过滤词的所述分词种类;
如果所述分词种类是主分词,则将所述序列元对应生成一个医疗特征模版特征元;
如果所述分词种类不是主分词,则将所述新索引分词序列中删除所述序列元。
6.根据权利要求5所述的医疗否定术语的检出方法,其特征在于,
所述医疗特征模版由多个所述医疗特征模版特征元组成;
所述医疗特征模版特征元至少包括:所述医疗特征模版特征元的特征值、所述医疗特征模版特征元在所述电子病历文本中的首字位置或在所述关键词词典中的位置。
7.根据权利要求6所述的医疗否定术语的检出方法,其特征在于,
所述医疗否定术语的所述匹配规则由所有具有所述医疗否定术语的所述医疗特征模板的正则表达式集合来表示。
8.根据权利要求7中任一项所述的医疗否定术语的检出方法,其特征在于,在所述新索引分词序列中提取医疗否定术语,具体为:
根据所述医疗特征模板的所述正则表达式集合,在所述医疗特征模版中提取出所述医疗否定术语的特征模板;
提取所述医疗否定术语在所述电子病历文本中的首字位置;
根据所述医疗否定术语在所述电子病历文本中的首字位置,在所述新索引分词序列中提取所述医疗否定术语。
9.根据权利要求8所述的医疗否定术语的检出方法,其特征在于,对所医疗否定术语进行标记,以还原并输出所述新索引分词结果,具体为:
去掉所述医疗否定术语中的否定词,在每个所述医疗否定术语之前增加预设否定词,以转换得到所述新索引分词结果。
10.一种医疗否定术语的检出系统,其特征在于,所述系统包括:
获取单元,用于获取电子病历文本以及搜索引擎对其进行索引得出的索引分词结果;
处理单元,用于根据所述电子病例文本,对所述索引分词结果进行处理,以得到新索引分词序列;
提取单元,用于在所述新索引分词序列中提取医疗否定术语;
输出单元,用于对所述医疗否定术语进行标记,以还原并输出新索引分词结果。
11.根据权利要求10所述的医疗否定术语的检出系统,其特征在于,还包括:
整理单元,用于将所述电子病例文本中的关键词整理为关键词词典;
创建单元,用于根据所述新索引分词序列及所述关键词词典创建医疗特征模板;
分析单元,用于分析所述索引分词结果中所述医疗否定术语表述特点,以归纳出所述索引分词结果中所述医疗否定术语的匹配规则。
12.根据权利要求10所述的医疗否定术语的检出系统,其特征在于,所述处理单元具体为:
添加单元,用于在所述索引分词结果的基础上,将所述电子病历文本中被过滤掉的过滤词按照在所述电子病历文本中的顺序添加到所述新索引分词序列中。
13.根据权利要求12所述的医疗否定术语的检出系统,其特征在于,
所述新索引分词序列由多个序列元组成;
每个所述序列元至少包括:所述索引分词结果或所述过滤词在所述电子病历文本中的首字位置、所述索引分词结果或所述过滤词的类型、所述索引分词结果或所述过滤词的分词种类。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。