(19)中华人民共和国国家知识产权局
(12)发明专利说明书 | ||
(10)申请公布号 CN 103024027 A (43)申请公布日 2013.04.03 | ||
(21)申请号 CN201210525662.1
(22)申请日 2012.12.07
(71)申请人 中国电信股份有限公司云计算分公司
地址 100093 北京市海淀区杏石口路99号西山赢府E座4层
saas建站系统(72)发明人 郭常勇 谢朝阳
(74)专利代理机构 北京鸿德海业知识产权代理事务所(普通合伙)
代理人 倪志华
(51)Int.CI
权利要求说明书 说明书 幅图 |
(54)发明名称
一种基于云计算的数据挖掘实现方法和系统 | |
(57)摘要
本发明提供了一种基于云计算的数据挖掘实现系统和方法,服务平台功能模块接收用户的挖掘服务请求以及要分析的数据源;业务数据交互模块将所述数据源上传至挖掘计算模块的文件系统,并依据挖掘服务请求中的挖掘模型信息生成挖掘计算脚本文件;挖掘计算模块运行所述计算脚本文件对要分析的数据源进行数据挖掘,返回挖掘结果给业务交互系统;业务交互系统将所述挖掘结果返回给服务平台功能模块,由服务平台功能模块将所述挖掘结果提供给用户。本发明实现了软件即服务(SaaS)模式的数据挖掘服务,在云端为用户提供了统一的服务接口,一方面满足了多用的服务需求,另一方面也无需用户在本地安装和维护硬件和软件,降低了用户的成本。 | |
法律状态
法律状态公告日 | 法律状态信息 | 法律状态 |
2016-08-03 | 授权 | 授权 |
2014-09-10 | 专利申请权的转移 | 专利申请权的转移 |
2013-08-28 | 实质审查的生效 | 实质审查的生效 |
2013-04-03 | 公开 | 公开 |
2022-02-15 | 专利权的转移IPC(主分类):H04L29/08专利号:ZL2012105256621登记生效日:20220128变更事项:专利权人变更前权利人:中国电信股份有限公司变更后权利人:天翼云科技有限公司变更事项:地址变更前权利人:100033 北京市西城区金融大街31号变更后权利人:100007 北京市东城区青龙胡同甲1号、3号2幢2层205-32室 | 专利申请权、专利权的转移 |
权 利 要 求 说 明 书
1.一种基于云计算的数据挖掘实现系统,其特征在于,该系统包括:
服务平台功能模块,用于接收用户的挖掘服务请求以及要分析的数据源;将 业务数据交互模块返回的挖掘结果提供给用户;
业务数据交互模块,用于将所述数据源上传至挖掘计算模块的文件系统, 并依据所述挖掘服务请求中的挖掘模型信息生成挖掘计算脚本文件;将挖掘计 算模块返回的挖掘结果返回给服务平台功能模块;
挖掘计算模块,用于运行所述计算脚本文件对所述要分析的数据源进行数 据挖掘,返回挖掘结果给业务交互系统。
2.根据权利要求1所述的系统,其特征在于,所述服务平台功能模块,还 用于向用户提供注册平台,获取用户的注册信息,在接收到所述挖掘服务请求 后利用注册信息对用户进行鉴权。
3.根据权利要求1所述的系统,其特征在于,所述服务平台功能模块,还 用于向用户提供服务平台,该服务平台提供挖掘模型库中的挖掘模型信息供用 户选择,依据用户选择的挖掘模型信息得到所述用户的挖掘服务请求;或者, 获取用户通过所述服务平台上传的挖掘模型,存入挖掘模型库,依据用户上传 的挖掘模型信息得到所述用户的挖掘服务请求。
4.根据权利要求1所述的系统,其特征在于,所述业务数据交互模块,还 用于对所述用户上传数据源的权限进行鉴权,如果鉴权通过,则执行将所述数 据源上传至挖掘计算模块的文件系统的操作,否则通过所述服务平台功能模块 向用户回复拒绝响应。
5.根据权利要求1所述的系统,其特征在于,所述挖掘计算模块在进行所 述数据挖掘时,采用map-reduce的方式将所述数据挖掘的任务划分成多个子任 务分配给多个处理器执行,整合多个处理器的执行结果得到所述挖掘结果。
6.根据权利要求5所述的系统,其特征在于,所述挖掘计算模块采用Rhipe 技术,所述挖掘计算模块的文件系统为分布式文件系统HDFS;
所述挖掘计算模块在所述进行数据挖掘之前将所述要分析的数据源转换为 R对象,在所述进行数据挖掘时从安装的R共享库中调用对应的挖掘模型。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论