(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 113297089 A
(43)申请公布日 2021.08.24
(21)申请号 CN202110642819.8
(22)申请日 2021.06.09
(71)申请人 南京大学
    地址 210023 江苏省南京市栖霞区仙林大道163号
(72)发明人 王崇骏 何强强 姚懿容 江娟 谢俊元
(74)专利代理机构 32249 南京瑞弘专利商标事务所(普通合伙)
    代理人 孙建朋
(51)Int.CI
      G06F11/36(20060101)
      G06F16/36(20190101)
      G06F40/289(20200101)
      G06F40/295(20200101)
      G06F40/30(20200101)
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      一种基于知识图谱的众测助理实现方法
(57)摘要
      本发明公开了一种基于知识图谱的众测助理实现方法。数据采集阶段,确定好与测试领域相关的关键词;数据预处理阶段,设计相应的规则提取内容中的三元组,同时将别名、外文名用于实体对齐,与通用知识图谱CN‑DBpedia合并;数据存储阶段,以图数据库Neo4j存储数据,利用Cypher查询语句将三元组嵌入图数据库中;问句解析阶段,从用户的输入中,利用模板匹配从中抽取出槽值对,槽对应实体,值对应关系或属性,用py2neo嵌入Cypher语句查询相应的结果,并以聊天格式返回给用户。本发明以图数据库作为存储结构,满足了智能助理所要求的最大延时,领域内的知识图谱能够使智能助理为测试人员提供更好的帮助。
法律状态
正则匹配关键词
法律状态公告日
法律状态信息
法律状态
2021-08-24
公开
公开
2021-09-10
实质审查的生效
实质审查的生效
2023-06-20
授权
发明专利权授予
权 利 要 求 说 明 书
1.一种基于知识图谱的众测助理实现方法,其特征在于,包括以下步骤:
步骤1、数据采集,获取与测试相关的关键词;
步骤2、数据预处理,利用正则表达式提取网页句式,并利用规则抽取其中的三元组,同时将别名,外文名用于实体对齐,与通用知识图谱DBpedia合并,得到测试领域知识图谱;
步骤3、数据存储,利用Cypher查询语句,将数据存储在图数据库Neo4j中;
步骤4、问句解析,解析用户问句中的槽值对,并查询图数据库,将结果按照固定句式返回给用户。
2.根据权利要求1所述的基于知识图谱的众测助理实现方法,其特征在于,步骤1中获取关键词,包括以下步骤:
步骤1.1、从书籍中查测试的概念和0方法;
步骤1.2、在开放答题网页,回答与测试相关的题目,补全关键词;
步骤1.3、爬取关键词,利用人工的方式对解析得到的三元组的实体判断是否属于测试领域,若是则添加到关键词库。
3.根据权利要求2所述的基于知识图谱的众测助理实现方法,其特征在于,所述步骤2具体包括以下步骤:
步骤2.1、获取三元组的规则包括:从结构化的信息栏提取三元组、从符合要求的特定句式提取三元组、人工补充三元组;
步骤2.2、实体对齐:将信息栏中的别名,英文名来对关键词进行对齐,在查询别名和英文名时自动对齐到本名;
步骤2.3、图谱合并,将测试领域的知识图谱与通用领域DBpedia知识图谱进行合并。
4.根据权利要求3所述的基于知识图谱的众测助理实现方法,其特征在于,所述步骤3中数据存储具体包括以下步骤:
步骤3.1、将Cypher语句添加到py2neo中,将三元组保存到图数据库Neo4j中;
步骤3.2、构建倒排索引表,将每一个实体的别名作为键,实体的本名作为值,保存在表中。
5.根据权利要求4所述的基于知识图谱的众测助理实现方法,其特征在于,所述步骤4中问句解析具体包括以下步骤:
步骤4.1、利用基于模板的方式,通过匹配查出槽值对,其中槽对应实体,值对应关系或属性;
步骤4.2、利用jieba对输入进行分词和获取词性,将关键词和关系作为专有词提交到jieba词库,并赋予置信度,确保jieba正确分词;
步骤4.3、分词后,获取每一个词的词性;
步骤4.4、对用户进行提问的形式,并匹配相应的模板,实体以名词,动名词的形式出现,关系/属性一般以名词,动词的形式出现,中间以一个连词连接,即使用第一类模板:\n|\vn+c+\v\n;
步骤4.5、第二类问题区别于第一类,即以疑问词代替具体的属性来进行提问;将疑问词转换为属性,再捕捉其中的实体,并建立相应的第二类模板,如下:
步骤4.5.1、将“什么”替换为“定义”或者“内容”;
步骤4.5.2、将“怎么\怎么样\”替换为“内容”或者“目的”;
步骤4.5.3、将“为什么”替换为“意义”或者“目的”;
步骤4.6、替换词具有顺序,放在前面的替换词更早被检索到,如果不存在该属性则依次后推;
步骤4.7、查图数据库并返回结果给前端。
说  明  书
<p>技术领域
本发明属于众包测试领域,尤其涉及一种基于知识图谱的众测助理实现方法。
背景技术
随着互联网技术的发展,使得雇佣不同平台,不同位置的测试人员成为可能。众包测试作为测试领域的新兴趋势,充分利用了众包和云平台的优势。它可以扩展测试池,避免了内部测试人员的偏见性,且产品公司只为报告的有效漏洞付费,降低了测试的成本。
在传统的测试领域,要求测试人员具有较为专业的能力素质,包括测试技术,领域知识,甚至是相关经验等。众测平台降低了测试准入门槛,却带来了更大的不确定性,由于众测成员能力参差不齐,这给众测任务的高质量完成带来了挑战。如何平衡测试人员的测试技能,发现更多有效的漏洞,提高软件的质量,面临着巨大的挑战。
当前的解决方法集中于为测试人员进行评分,绘制测试人员的能力记录,信用记录。根据用户历史完成情况判断其测试技术;同时,对每一个测试任务划分其测试难度,选择特定的调度算法,将合适的任务分配给合适的测试对象。然而这不能解决非专业测试人员经常提交无效、重复的漏洞。通过构建融合领域特征的自动化测试和众测人员测试模型,实现人机协同-反馈机制,形成兼具机器高效性和人工领域特性的人工协同测试技术,深层次泛化和延伸众包测试的内涵,从而为获得高质量测试结果提供全面支持。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。