(19)中华人民共和国国家知识产权局
正则匹配怎么匹配单词 | (12)发明专利说明书 | |
(10)申请公布号 CN 112764762 A (43)申请公布日 2021.05.07 | ||
(21)申请号 CN202110178180.2
(22)申请日 2021.02.09
(71)申请人 清华大学
地址 100084 北京市海淀区100084信箱82分箱清华大学专利办公室
(72)发明人 林佳瑞 周育丞 郑哲 陆新征
(74)专利代理机构 11245 北京纪凯知识产权代理有限公司
代理人 王胥慧
(51)Int.CI
G06F8/41(20180101)
G06F16/35(20190101)
G06F40/117(20200101)
G06F40/253(20200101)
G06F40/30(20200101)
G06K9/62(20060101)
G06N3/04(20060101)
G06N3/08(20060101)
权利要求说明书 说明书 幅图 |
(54)发明名称
一种将规范文本自动转为可计算逻辑规则的方法及系统 | |
(57)摘要
本发明涉及一种将规范文本自动转为可计算逻辑规则的方法及系统,其特征在于,包括以下内容:1)对规范文本进行语句分割,并对分割得到的若干语句进行预处理,筛选出可转换的规范语句;2)采用深度神经网络模型,通过BIO标注格式为可转换的规范语句中的单词或短语加上语义标签,得到带有标签的语句;3)采用上下文无关文法,基于对P‑R范式及其递归用法的识别,对带有标签的语句进行解析,将带有标签的语句转换为规则检查树;4)将规则检查树转换为特定格式的语言,本发明可以广泛应用于建筑业与信息技术交叉领域中。 | |
法律状态
法律状态公告日 | 法律状态信息 | 法律状态 |
2021-05-07 | 公开 | 公开 |
2021-05-25 | 实质审查的生效 | 实质审查的生效 |
权 利 要 求 说 明 书
1.一种将规范文本自动转为可计算逻辑规则的方法,其特征在于,包括以下内容:
1)对规范文本进行语句分割,并对分割得到的若干语句进行预处理,筛选出可转换的规范语句;
2)采用深度神经网络模型,通过BIO标注格式为可转换的规范语句中的单词或短语加上语义标签,得到带有标签的语句;
3)采用上下文无关文法,基于对P-R范式及其递归用法的识别,对带有标签的语句进行解析,将带有标签的语句转换为规则检查树;
4)将规则检查树转换为特定格式的语言。
2.如权利要求1所述的一种将规范文本自动转为可计算逻辑规则的方法,其特征在于,所述步骤2)的具体过程为:
2.1)将可转换的规范语句中的所有字符均通过词嵌入转化为向量;
2.2)采用DNN模型,将转化后的向量编码为具有上下文信息的向量表示方式;
2.3)将具有上下文信息的向量表示进行分类,并转换为BIO标注格式,得到带有标签的语句。
3.如权利要求2所述的一种将规范文本自动转为可计算逻辑规则的方法,其特征在于,所述步骤2.3)中的标签包括:
标签obj、sobj和prop,用于表示建筑信息模型中需检查的元素,其中,标签obj为规则检查树中唯一具有多个子节点的元素,否则,标签obj为倒数第二层的元素;标签sobj为规则检查树中比标签obj更高级别的元素;标签prop
为规则检查树中比标签obj更低级别的元素;
标签Rprop,为与标签prop连接的要求条件,比较结果为真则通过规则检查;
标签aRprop,为与标签prop连接的前提条件,比较结果为真则执行规则检查;
标签Robj,为标签Rprop的父元素或引用元素;
标签cmp,用于表示选中的标签prop和Rprop/aRprop之间的关系,且包含其义务类型;
标签aRobj,为标签aRprop的父元素或引用元素。
4.如权利要求3所述的一种将规范文本自动转为可计算逻辑规则的方法,其特征在于,所述步骤3)的具体过程为:
3.1)提取带有标签的语句中具有sobj标签和obj标签的元素添加至规则检查树中,并对带有标签的语句中其余元素的顺序进行标准化处理;
3.2)将P-R范式定义为基本语法单元,采用CFG规则,基于对P-R范式及其递归用法的识别,通过自下而上的方式解析标准化后的语句,得到解析语法树;
3.3)将解析语法树作为输入生成规则检查树。
5.如权利要求4所述的一种将规范文本自动转为可计算逻辑规则的方法,其特征在于,所述步骤3.1)的具体过程为:
3.1.1)提取带有标签的语句中具有sobj标签的元素,并根据具有sobj标签的元素在语句中出现的先后顺序,确定具有sobj标签的元素的层次结构;
3.1.2)提取带有标签的语句中具有obj标签的元素;
3.1.3)将提取的具有sobj标签和obj标签的元素添加至规则检查树中;
3.1.4)将带有标签的语句中其余元素的顺序进行标准化处理。
6.如权利要求5所述的一种将规范文本自动转为可计算逻辑规则的方法,其特征在于,所述步骤3.2)的具体过程为:
3.2.1)采用RPOP、CMP、RPROP、ROBJ四个大写词语分别表示语句中具有prop标签、cmp标签、Rprop标签或aRprop标签、Robj标签或aRobj标签的元素,得到采用大写词语表示的语句;
3.2.2)将P-R范式定义为基本语法单元,采用CFG规则,基于对P-R范式及其递归用法的识别,通过自下而上的方式解析采用大写词语表示的语句,得到解析语法树。
7.如权利要求6所述的一种将规范文本自动转为可计算逻辑规则的方法,其特征在于,所述步骤3.3)的具体过程为:
3.3.1)还原解析语法树中具有RPROP标签的元素中的“a”前缀,以区分语句中的前提和要求;
3.3.2)对解析语法树进行后处理;
3.3.3)递归访问解析语法树的所有子树并同时创建规则检查树,将解析语法树转换为规则检查树。
8.一种将规范文本自动转为可计算逻辑规则的系统,其特征在于,包括:
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论