运营探讨
全链路算法对云数据库中省市政务数据的优化
邱晓康
(华信咨询设计研究院有限公司,浙江
目前,各地政府已建立自身的信息系统,初步实现了政务信息的数字化。但是,政务数字化的深入及智能信息设备的大量应用,使得政务信息呈现大数据特征,信息处理准确率大幅下降,处理时间不断延长。如何对数
成为亟待解决的问题。因此提出一种全链路的计算方法,
仿真结果显示,全链路方法可以简化初始数据量,平均负荷率为
95%以上,平均丢失率为6%
全链路算法;云数据中心;省市政务;数据优化
The Optimization of Provincial and Municipal Government Data in Cloud Data Center Based
on Full Link Algorithm
QIU Xiaokang
(Huaxin Consulting Design & Research Institute Co., Ltd., Hangzhou
地政府的处理终端会对数据进行识别。依据《2014年中国城市电子政务发展水平调查报告》和《联合国2014年电子政务调查报告》中的要求,将政务数据分为3类属性,即数据的来源、唯一标签属性以及历史日志,其数学内容如下。
假设U 代表省政府云数据中心的数据集合,u 1
代表数据的来源,
u 2代表标签属性、u 3代表历史日志,那么u 1i 代表各市的数据来源,
u 2i 代表标签的各个属性,u 3i 代表不同系统的日志。各市与省政府云数据中心之间关系的数学描述为:
()()(
,
,n
i 1
U u u u =←
→∑∑∫ 1i 2i 3i 对等通信
(1)
式中,i 为自然数。假设V 代表各个市政务系统或数据库集合,v j
为每个具体数据库的编号,即V =(v 1,v 2,…,v j )。其中,j 为自然数[5]。
假设P (x , y , z |U , V )为各市政府与省政府之间政务数据处理的结果函数,x 代表数据的共享性,y 代表硬件的利用率,z 为系统的负荷程度,其数学描述为:
(
)
()()()()()||||i 1
x y z U V x U V y U V z U V P P P P ==∑∑∑∑∫∫∫∑∫
x y z ++,,,,,,
(2)
式中,()()||x y z U V x U V P P =∑∑
∫ x ,,,,代表各市数据共享的结果,()()
(
)||x U V y U V P P ∑∫∑∫∑ y
,,代表各市硬件的利用率,
()
()||y U V z U V P P ∑∫∑∫ z
,,代表各市系统的负荷程度
[6]
。
云数据库服务为了进一步提高P (x , y , z |U , V )的准确性,需要对
各数据之间增加调节系数,式(2)可以表示为:
()()()()(
)()(
)
||||P αP βP λP x y z U V x U V y U V z U V =∑∑∑∫∫∫∑∑ x y z ,,,,,,++
(3)
式中,α、β、λ分别代表共享性、利用率以及负荷程度的调节系数。系数的确定由日常工作统计得出,α=0.032,β=0.063,λ=0.017。
假设Q 代表政务数据的重要程度,那么对收集到的信息进行剔除,其数学公式描述为: ()()()()()||P αP βQ U u x y z U V x U V w V v w U V ξ==∑∑∫∑∑ x i i j j ,,,,+++,
(4)
式中,
w i 是各市政务数据在云中心数据集合中的权重,w j 为各市政务数据在市系统中的权重,ξ为各数据重要性的调节系数[7]。1.2 全链路的处理过程1.2.1 政务数据的处理
第一步,对各市政务数据进行识别,将其纳入到U 中。确定数据中的数据来源u 1i ,属性u 2i ,系统的日志u 3i ,判断数据是否符合政务数据的要求,即数据是否合法[8]。
第二步,依据省政府云中心的数据,对各市数据进行确定,即确定数据库v j 编号,并得到相应数据的确认。相关数据库发挥反馈信息以后,省政府云中心接受数据集合U 。
第三步,省政府云中心依据数据库编号,对接收的数据和数据集合进行判断,判断相应数据库是否存在负荷程度低、共享性差以及软硬件利用程度不够的问题。如果出现此类问题则增加该数据库信息的调用,减少其他数据库中相同信息的调用,以保证政
务数据的共享性与负荷满足要求,避免出现硬件资源
浪费[9,10]。
第四步,剔除无关的数据。依据不同数据库和不同市政府数据的权重进行数据判断。如果数据不符合要求,则剔除数据,否则纳入数据。
第五步,用全链路方法对各个市和数据库结点进行遍历。如果数据库节点为最终节点,则终止遍历,否则进行下一个遍历。每遍历一个节点,则重复以上4个步骤。
1.2.2 建立关联规则
在政务数据传输、剔除以及反馈过程中,要遵循以下处理流程。首先要监测各市数据库V 中的v j ,判断其反馈信息是否符合要求,并监测各个数据库共享下的负荷程度等,同时依据α=0.032,β=0.063,λ=0.017进行相关的调节[11]。其次要对省云中心数据
进行监测,判断各个数据u 1、
u 2、u 3以及u 1i 是否合法。最后要对省云中心数据进行冗余判断,剔除不符合要求的数据。
2 全链路算法对云数据库中省市政务数据的优化
2.1 相关数据的初始化
以A 省市云计算中心为例,进行政务数据优化分析。A 省涵盖5个市,16个数据库。其中包括22条光纤、129个WiFi 点、10个ADSL 、35个服务器以
,系统为
(无服务
x395型,
,硬盘为1T。
为了验证全链路算法对于省市政务数据的优化效果,从其数据的共享性、硬件的利用率、、数据传输的准确性以及传输时间的角度出发,进行分析和
共享性、平均负荷以及硬件利用率是政务数据处理中的关键性指标,也是减少云中心数据处理压力
通过对各地市政府数据库共享性的分析,调整不同数据库的负荷,提高相关硬件的利用率,可以有效减少云中心政务数据的处理强度。下面对全面的算法进行分析,判断该算法对云数据库中省市政务
图1 传统算法与全链路算法的平均负荷、共享率、
硬件利用率比较
由上图可知,1所代表的全链路算法,其平均负荷率为68.3%,共享率为85.7%,硬件利用率为54.5%。2代表的是多线程政务处理技术,其平均负荷率为56.4%,共享率为52.1%,硬件利用率为40.5%。说明全链路算法的平均负荷、共享率以及硬件利用率均高于多线程政务处理技术。与传统政务数据传输技术比较,发现全链路算法可以将各市服务器的负荷、共享性、硬件利用率提高到65%以上。同时,避免出现相关设备利用率的陡升、陡降现象,各个资源的利用率比较平稳。
2.2.2算法计算时间
全链路算法的计算时间是其重要的标准,直接关系到云中心省市政务数据的优化效果,通过MATLAB 仿真分析,得出结果如图2所示。
通过上图分析可知,传统算法以前列入算法的数据处理量(注释:M代表兆字节)相同,但全链路算法的处理时间、平均耗时均小于传统算法。
表1 传统算法与全链路算法的耗时对比
分组处理时间范围/s平均耗时/s处理数据量/M 全链路算法2~22398±12.341123
传统算法2~453102±9.111123
由图2和表1可知,在处理数据总量为1123 M 不变时,全链路算法的计算时间和平均耗时均优于传统算法,说明全链路算法的处理的有效。
2.2.3算法计算准确度
计算准确度是云数据库中省市政务数据处理的重要指标,直接关系到地方与省政府在数据传输时的准确性以及数据的丢失率。
图3 传统算法与全链路算法的处理准确度、数据丢失率比较由上图可知,全链路算法的平均准确率可以达到95%以上,传统算法处理平均准确率为92%以上。由此说明,全链路算法的准确率相对较高。数据丢失率也是准确率的一个评价指标,代表着省市政务数据传输过程中,数据是否受到干扰,数据是否完整。全链路数据平均丢失率为6%左右,传统算法数据平均丢失率在12%左右。由此可知,全链路数据丢失率相对较低,可能与其剔除无关数据有关。全列入算法中的冗余数据处理,可以减少网络通道的占有率,提高数据传输的准确率,进而减少无关数据的丢失。
图2 传统算法与全链路算法的计算时间比较
3 结 论
政务数据是省市云数据中心处理的主要数据,其具有数据量大和数据价值量高等特点。同时,省政府
与各地市政府分别建立了自己的数据库和网络中心,产生大量的政务数据,增加了云数据中心的处理压力。另外,各地数据库和网络中心的纷纷建立,致使数据库和网络的闲置率较高,造成相关资源的浪费。在云数据库处压力加大,各地网络闲置率高的双重背景下,增强数据共享性、降低云中心的负荷压力以及提高省政府云中心与各地市政府质监政务数据传输准确成为目前亟待解决的问题。在此背景下,本文提出一种全链路算法,对云中心数据处理步骤进行简化,剔除各地政府传输的冗余数据信息,提高数据传输的整体准确率,缩短数据传输的时间。以A云数据库中省市政务数据为研究对象,进行全链路算法的仿真分析,结果显示全链路算法的平均负荷率为68.3%,共享率为85.7%,硬件利用率为54.5%。多线程政务处理技术的平均负荷率为56.4%,共享率为52.1%,硬件利用率为40.5%。在处理数据总量为1123M不变时,全链路算法的计算时间和平均耗时均优于传统算法,说明全链路算法的处理有效。全链路算法的平均准确率可以达到95%以上,平均丢失率为6%左右,传统算法处理平均准确率为92%以上,平均丢失率在12%左右。由此说明,全链路算法的平均负荷、共享率和硬件利用率均高于多线程政务处理技术,准确率和数据丢失率也优于多线程政务处理技术。参考文献:
[1]金华.区块链架构下的廉政建设:技术逻辑,风险
管控与权力制约[J].领导科学,2020(18):16-19.
[2]Golub K,Lund A.Why Open Government Data? The
Case of a Swedish Municipality[J].Journal of Data and Information Science,2021,6(1):120.
[3]Wilson B,Cong C.Beyond the supply side: Use and
impact of municipal open data in the U.S[J].Telematics
and Informatics,2021,58(4):101526.
[4]Gonzálvezgallego N,Nietotorrejón L.Government Data
Openness and Coverage. How do They Affect Trust in European Countries?[J].Journal of Data and Information Science,2021,6(1):139-153.
[5]Nikiforova A,Mcbride K.Open government data portal
usability: A user-centred usability analysis of 41 open government data portals[J].Telematics and Informatics,2020,58(4):101539.
[6]Enayat R.Towards linked open government data in
Canada[J].International Journal of Metadata Semantics and Ontologies,2020,14(3):209.
[7]周耀林,赵跃.档案安全体系理论框架的构建研
究[J].档案学研究,2016(4):107-112.
[8]朱之伟.基于大数据的线上快贷业务应用实例研
究[J].金融发展研究,2021(1):90-92.
[9]苗地.黑龙江省政府数据开放存在的问题与对策研
究[J].商业经济,2018(11):6-7.
[10]江锡强.人工智能技术在政府数据治理中的应用[J].
计算机产品与流通,2020(6):128.
[11]赵震,任永昌.大数据时代基于云计算的电子政务
平台研究[J].计算机技术与发展,2015(10):145-
148.
流预警系统[J].农村电气化,2012(9):39-40. [6]王伏亮,李澄,李春鹏,等.基于边缘计算的中低
压配电网多类型传感器接入技术[J].自动化与仪表,2020,35(7):11-15.
[7]陈辉,王支奎.基于多源监控数据的配电网故障定
位技术研究[J].电工技术,2019(22):57-59.
[8]宋惠忠,顾华忠,顾韬,等.基于多源数据挖掘的
低压配电网线损智能诊断模型[J].浙江电力,2017,36(12):57-62.
[9]王伏亮,李澄,李春鹏,等.基于边缘计算的中低
压配电网多类型传感器接入技术[J].自动化与仪表,2020,35(7):11-15.
[10]祖莹.基于用电信息采集数据的电能质量分析方
法[D].西安:西安理工大学,2020.
(上接第241页)
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论