基于大数据的智能运维管理系统研究与实现
伴随着大数据时代的到来,企业IT架构的不断扩展,服务器、存储设备的数量越来越多,网络也变得更加复杂,为了保障良好的用户体验和数据时效性,运维工作变得越来越艰巨。其中,深入开展大数据技术应用创新以及积极推进智能新技术的应用研究为我们智能运维工作的研究指明了方向。
标签:智能运维;大数据;自动化运维
通过构建大数据分析平台,可以有效利用运维管理系统的既有数据,进行深度分析挖掘,达到提升客户感知、提高运维智能化、加速故障定位、支撑辅助决策的目的,从而保障信息系统的运营服务质量。
1、传统运维与大数据运维优缺点
运维管理的主要目的是保障基础设施的可用性及降低风险,提高资产的利用率,降低能耗消耗和运维成本,提高服务水平以及数据中心的效率和效益。
(1)传统运维存在的问题:日益增长的人力成本;运维标准的管理诉求;运维服务效率低下;故障发现不及时、处理不到位、事后无诊断。
(2)大数据运维系统特点。海量存储:可以高效地存储、检索、调用任一时间采集的IT资源数据和告警;关联分析:可以针对设备、指标、阈值等不同维度的数据进行关联性分析;阈值分析:可以指定对任意指标进行阈值分析,查看我们设置的管理策略是否合理,以及这些指标引起设备异常的概率;根源分析:可以针对不同资源进行异常状态的根源分析,查看引起异常的指标类型及概率;健康评分:可以对海量数据进行综合分析,给出每个资源的任一指标对于我们业务影响大小的量化参考值,并对资源进行健康度评分。
(3)运维管理发展趋势。经济性:资源如何有效利用,包括网络、空间、动环资源;如何缩减运行费用,包括能源、维护人员。灵活性:如何识别及降低过度部署和冗余;如何灵活扩展容量(空间、制冷和供电);如何更快响应业务。可用性:如何实现精细化管理;如何及时排除隐患,处理复杂故障;如何实现动态资源管理和电子流管理。管理性:需要有效的数据分析支撑决策和规划;如何实现系统一体化,统一协作、快速响应;如何满足大客户服务等级协议和自服务管理。建设“集中化运维、一体化管理、智能化分析、流程化控制”的it支
撑系统,才能实现智能化运维的管理目标,减少运维人员和维护成本,优化资源管理,提升运维效率。
2、系统组织架构数据库管理系统的优点和缺点
一体化智能运维管理系统能够实现对数据中心IT基础设施进行集中监控,包括存储、主机系统、网络服务、数据库、应用服务器、中间件以及应用软件等。系统监控软件可采用分布式结构部署,适用于大型网络环境下的系统监控。系统监控软件简单易用,通过该系统可以监控数据中心各种资源的使用情况,提供资源的性能数据,有效地帮助企业解决各种基础设施的监视与管理难题。不但提供了丰富灵活的报表功能,帮助企业分析资源运行状况,预测系统性能瓶颈;同时提供多种通知方式,当被监控资源出现异常,保证管理人员能随时、随地了解整个系统的运行状况;确保企业信息系统高效稳定的运行,从而保证了信息系统对业务的支撑,使企业良好运转。系统架构:
系统实现了对客户IT系统的使用状况进行统一综合的管控和分析,将复杂化的运维管理工作变得简单化、人性化,规范化、自动化。其强大的技术实力和严格的开发管理机制保证了系统运行的稳定性、功能的全面性和扩展性,真正打造了满足客户需求的IT运维管理平台。对
客户的IT系统进行7*24小时的全面监控,提供了IT系统的性能监控、性能分析、故障监控、故障分析及定位、资产及配置文件的管理、强大的报表分析等功能,保证了客户日常运维工作的顺利开展,提升了运维工程师的网络管控水平,降低了管理层的日常工作量,为决策层提供了可靠的数据依据。
3、系统功能架构
系统采用多层架构、模块化的设计模式,系统功能全面,模块功能独立,可根据不同客户需求自由组合,同时服务运营支撑系统具备良好的扩展性,通过第三方数据整合接口和数据总线以及门户Protal,与第三方产品可进行无缝集成。
4、系统技术架构
采用J2EE架构,全图形化B/S模式,可移植性强,可运行于不同操作系统(Windows、RedHatLinux等),真正实现了跨平台部署。统一开放的监控管理平台支持多数据库(MySql、Oracle等)、多操作系统,为第三方系统提供多种集成接口。2017(Sum.No179)信息通信INFORMATION&COMMUNICATIONS5
5、系统部署方案
系统的门户层服务、数据处理层服务、数据采集层服务可以根据客户IT环境的实际情况部署在相同或不同的主机上,同时可能根据客户的管理对象规模,采用单个或多个数据采集层的进行管理容量规划,这样就实现集中或分布式两种不同需要的部署方式,对企业内、外网、总部/分支等不同结构的IT资源实现了灵活管理。系统分为三层:数据采集层:由一个或多个数据采集服务构成,内置20多种标准采集协议,通过SNMP/SNMPTrap、Telnet、SSH、WMI、JMX、HTTP、JDBC、CORBA、ODBC、Syslog、开放API等远程监控方式,采集IT基础设施和应用的各种指标数据,单个DCS最高支持XXX个管理对象。数据处理层:由一个或多个数据处理服务构成,用于接收各数据采集层采集到的数据,并对各种采集数据通过分析和挖掘处理,为前端的展现提供性能数据依据;超過指标阈值的告警数据,通过告警策略压缩、过滤、业务相关性分析等处理,产生故障告警给数据展现层。门户层:运用了先进的Web技术,为客户提供分角、可视化的数据展现和管理功能。
6、结语
随着大数据概念的提出,IT的运维管理已经从系统化、集约化、数据化向智能化发展。基于
大数据的一体化智能运维平台提供了从基础设施、数据库中间件、系统应用进程到业务交易系统的一整套运维管理解决方案。为客户提供标准化、自动化、智能化运维体验,帮助客户提升数据中心的管理水平和效率;提升运维数据的应用价值,盘活数据资产;提高运维管理精细化和智能化水平;科技管理创新,提升IT服务价值;精准分析,未来IT发展决策支持。
参考文献:
[1]刘春华,苏富宝,云丛天,等.互联网思维在网络运维管理中的应用[J].信息通信,2015(8):248.
[2]王自亮,单俊明,姜良军,等.运维日志分析在网络运维管理中的应用[J].山东通信技术,2015(2):24.

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。