(19)中华人民共和国国家知识产权局
(12)发明专利说明书 | ||
(10)申请公布号 CN 109754224 A (43)申请公布日 2019.05.14 | ||
(21)申请号 CN201811643559.0
(22)申请日 2018.12.29
(71)申请人 贵州小爱机器人科技有限公司
地址 550017 贵州省贵阳市白云区都拉营综保路349号海关大楼8楼801
(72)发明人 周星 梁志明 单若诚 张吉亮
(74)专利代理机构 北京集佳知识产权代理有限公司
代理人 李笑笑
(51)Int.CI
权利要求说明书 说明书 幅图 |
(54)发明名称
人事关系图谱构建方法、装置以及计算机存储介质 | |
(57)摘要
一种人事关系图谱构建方法、装置以及计算机存储介质,所述方法包括:获取文本数据,从文本数据中提取专有名词和主体名称;根据专有名词在所述文本数据中的位置,将所述专有名词与所述文本数据中的动词相匹配得到事件实体;在所述文本数据中,确定与所述事件实体相匹配的时间实体以及主体名称;根据所述事件实体以及与所述事件实体匹配的时间实体以及主体名称,构建人事关系图谱。采用上述方案,提升人事关系图谱的客观性以及准确性。 | |
法律状态
正则匹配快代理法律状态公告日 | 法律状态信息 | 法律状态 |
2019-06-07 | 实质审查的生效 | 实质审查的生效 |
2019-05-14 | 公开 | 公开 |
权 利 要 求 说 明 书
1.一种人事关系图谱构建方法,其特征在于,包括:
获取文本数据,从所述文本数据中提取专有名词和主体名称;
根据所述专有名词在所述文本数据中的位置,将所述专有名词与所述文本数据中的动词相匹配得到事件实体;
在所述文本数据中,确定与所述事件实体相匹配的时间实体以及所述主体名称;
根据所述事件实体以及与所述事件实体匹配的时间实体以及所述主体名称,构建人事关系图谱。
2.根据权利要求1所述的人事关系图谱构建方法,其特征在于,所述从所述文本数据中提取专有名词和主体名称,包括:
将所述文本数据转换为html文件格式;
通过爬虫方式,提取所述html文件格式的文本数据中的内容;
通过词义分析算法或词语数据库,提取所述文本数据的内容中的专有名词以及主体名称,所述主体名称包括人名和部门名称。
3.根据权利要求1所述的人事关系图谱构建方法,其特征在于,所述根据所述专有名词在所述文本数据中的位置,将所述专有名词与所述文本数据中的动词相匹配得到事件实体,包括:
确定所述专有名词在所述文本数据中的位置;
若在距离所述专有名词的预设词数范围内存在动词,则将所述专有名词与所述动词匹配得到事件实体。
4.根据权利要求1所述的人事关系图谱构建方法,其特征在于,所述在所述文本数据中,确定与所述事件实体相匹配的时间实体以及所述主体名称,包括:
在所述事件实体所在的语句中,通过正则表达式确定时间实体;
将所述时间实体与所述事件实体进行匹配。
5.根据权利要求4所述的人事关系图谱构建方法,其特征在于,所述将所述时间实体与所述事件实体进行匹配,包括:
当通过所述正则表达式确定多个时间实体时,根据各个时间实体在时间顺序上的关系,将最新的时间实体与所述事件实体进行匹配。
6.根据权利要求1所述的人事关系图谱构建方法,其特征在于,所述在所述文本数据中,确定与所述事件实体相匹配的的时间实体以及所述主体名称,包括:
在所述事件实体所在的语句中,确定所述主体名称;
将与所述事件实体间隔字数最少的所述主体名称,作为与所述事件实体匹配的主体名称。
7.根据权利要求1所述的人事关系图谱构建方法,其特征在于,所述根据所述事件实体以及与所述事件实体匹配的时间实体以及所述主体名称,构建人事关系图谱,包括:
将所述事件实体、与所述事件实体匹配的时间实体以及主体名称作为关系数据;
使用多条所述关系数据构建人事关系图谱。
8.一种人事关系图谱构建装置,其特征在于,包括:获取单元,第一匹配单元,第二匹配单元与构建单元,其中:
所述获取单元,用于获取文本数据,从所述文本数据中提取专有名词和主体名称;
所述第一匹配单元,用于根据所述专有名词在所述文本数据中的位置,将所述专有名词与所述文本数据中的动词相匹配得到事件实体;
所述第二匹配单元,用于在所述文本数据中,确定与所述事件实体相匹配的时间实体以及所述主体名称;
所述构建单元,用于根据所述事件实体以及与所述事件实体匹配的时间实体以及所述主体名称,构建人事关系图谱。
9.一种计算机可读存储介质,其上存储有计算机指令,所述计算机可读存储介质为非易失性存储介质或非瞬态存储介质,其特征在于,所述计算机指令运行时执行权利要求1~7任一项所述的人事关系图谱构建方法的步骤。
10.一种电子设备,包括存储器和处理器,所述存储器上存储有计算机指令,其特征在于,所述计算机指令运行时所述处理器执行权利要求1~7任一项所述的人事关系图谱构建方法的步骤。
说 明 书
<p>技术领域
本发明涉及数据处理领域,尤其涉及一种人事关系图谱构建方法、装置以及计算机存储介质。
背景技术
如今,由于各个企业的发展越来越迅速,事件、工作、时间和人员之间的关系越来越复杂,因此为了更好地进行企业管理,了解企业的人事关系日程显得十分重要。
现有技术中,企业的人事关系日程,通常由专门的人员从企业内部的往来邮件、公告以及其他各种文本数据中,人工提取相关的数据,构建人事关系图谱。
然而,仅仅依赖人为地从数据中提取信息,构建得到的人事关系图谱不够全面,客观性以及准确性较差,难以实现通过人事关系图谱进行企业管理,或对新事件中涉及的人员和部门的预测。
发明内容
本发明解决的技术问题是人事关系图谱的客观性以及准确性较差。
为解决上述技术问题,本发明实施例提供一种人事关系图谱构建方法,包括:获取文本数据,从所述文本数据中提取专有名词和主体名称;根据所述专有名词在所述文本数据中的位置,将所述专有名词与所述文本数据中的动词相匹配得到事件实体;在所述文本数据中,确定与所述事件实体相匹配的时间实体以及所述主体名称;根据所述事件实体以及与所述事件实体匹配的时间实体以及所述主体名称,构建人事关系图谱。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论