DOI:10.19694/jki.issn2095-2457.2022.29.05
城市法人综合库构建及管理方法研究
杨琳刘佼朱雪雅李雪凝
(上海计算机软件技术开发中心,上海200040)
【摘要】法人数据库作为四大基础信息库之一,对我国电子政务发展有重要的支撑作用。本文基于上海市法人综合库的实践经验,探讨法人综合库建设策略和管理机制,构建了以服务社会为目标、以应用需求为导向、以逐步拓展为策略的法人综合库建设思路,提出法人综合库建设的总体架构,并从建设、管理和应用闭环管理视角提出法人综合库的建设路径。通过建设城市法人综合库,可以强化法人数据的整合汇聚和关联分析能力,深化法人数据应用,有效推动数字政府建设。
【关键词】法人综合库;法人数据;数据治理;数据应用
0引言
法人基础数据库作为四大基础信息库之一,是加强与社会大数据的汇聚整合和关联分析、推动国民经济大数据应用的关键一环。2017年,政府在《国家发展改革委关于印<;野十三五”国家政务信息化工程建
设规划>的通知》中,便提出要建设完善法人单位基础信息库,促进各相关部门法人信息数据汇聚,努力实现法人数据政务部门实时共享,为电子政务服务提供有力支撑。
但随着法人数据体量的快速增长、数据应用的业务场景不断延伸,税务、金融、社保、海关、工商等政务服务领域对法人信息提出更高的资源整合、业务协同需求。因此,在法人基础库之上,需进一步建设法人综合库,提升法人数据质量,强化法人信息的整合归纳,形成更高价值的融合数据,推动建立竞争有序的市场经济体系和社会信用体系。上海市作为数字化转型的领跑城市在法人基础信息库建设具有较为丰富的经验。本文结合城市数字化转型建设需求和法人综合库发展需求,基于上海市法人综合库的建设实践经验,探讨法人综合库建设总体架构、建设路径以及管理机制,以期为法人综合库建设提供思路与指导。
1法人综合库概述
1.1法人综合库相关概念
法人基础数据库是以法人单位组织机构代码为统一标识,采集具有民事行为能力、依法独立享有民事权利和承担民事义务的组织及分支机构信息的数据库,实现法人单位基础信息采集的标准化和动态维护[1-2]。
法人综合库是在法人基础数据库的基础上进一步建设。法人综合库综合归纳了各级政府部门、各行业、各地区关于法人的信息,并形成了体系完整、结构可拓展、能够满足各类专业、部门应用需求的综合数据体系。法人综合库建设的范围包括基础数据库重构、综合库与专题库建设以及数据服务。
作者简介:杨琳,硕士,高级工程师,副所长,研究方向为大数据治理、数据安全与数据标准。
刘佼,硕士,数据治理咨询工程师,研究方向为大数据治理与数据标准。
朱雪雅,硕士,数据治理咨询工程师,研究方向为数据标准。
李雪凝,本科,中级工程师,研究方向为公共数据治理与数据标准化等。
014
专题是指面向具体某个业务领域的细分应用场景。由于法人数据库数据体系非常庞大,为了保障迭代建设推进,可根据数据的主题分类,将数据体系划分成若干相对独立的业务域,以业务域为单位进行分阶段建设。业务域的数据体系与其支撑的专题应用共同建设的方式,就称为法人专题库。
1.2法人综合库的建设思路
法人综合库建设是一个循序渐进的过程,不能一蹴而就。在建设阶段,应从人民众最关心的领域做起,重点建设需求迫切、效果明显的法人专题库,从经济社会效益潜力较大的领域着力,打好基础,摸索出实践经验,再递进拓展法人库的广度和深度,以点带面逐步推动法人数据资源的共享应用,进而服务整个社会。法人综合库的建设思路可围绕以下五点展开,最终形成成熟完善的建设平台架构。
(1)战略指导。以服务社会为核心目标[3],法人综合库的设计、建设、管理和服务,应遵循公共数据管理的战略规划和重点工作任务,以服务“一网通办”“一网统管”为指引。(2)全局规划。以统一规范为抓手,推导数据标准的建设路径,围绕法人主体,促进跨部门共建、共治、共享,制定统一的数据标准、规范体系和评估机制。(3)需求导向。以应用需求为导向,优先满足紧迫需求或需亟待解决的问题场景,短期实时见效,按需建设数据标准和质量体系,实现高精准集成、高效率融合、高可信共享。建设颗粒度可以“法人一件事”为参考,逐步构建法人与法人、自然人、空间、时间在统一平台的全面关联。(4)迭代扩展。以逐步拓展为策略,分步建设,充分考虑后续数据扩展需求,适应数据范围、更新机制、加工层次等需求的动态变化,逐步形成数据价值化的能力版图。(5)安全可控。以安全运行为要旨,在数据库的设计、建立系统运行和管理等方面都应有严格的安全和保密措施,实时监测数据质量,确保整个数据库系统的安全、正常和有效的运行使用[3]。
3法人综合库总体架构
法人综合库中的数据主要分为业务数据、融合数据和数据服务三个形态,三者相互关联、彼此支撑。汇聚的业务数据通过一定的业务分析模型和整合逻辑,加工衍生出高价值的融合数据,形成支撑各类场景化的数据服务形态,再通过数据应用服务反哺来源数据。法人综合库的数据组成及其之间的衍生关系如图1
所示。
图1
法人综合库数据模型
3.1法人综合库模型
3.1.1数据汇聚模型法人综合库的数据汇聚在基础库进行。基础库应以“一数一源、权威集中”为核心原则,归集各级行政机关
015
以及履行公共管理和服务职能的事业单位中的业务数据、社会数据、互联网数据等,并从数据湖中抽取、加工清洗后,进行分类,形成权威、一致、准确的法人数据,实现基础信息一次采集、多部门使用[3]。
数据源的选择方法则主要有以下几种:(1)按责任清单的数据源选择方法。各级行政机关以及履行公共管理和服务职能的事业单位基于法律法规、三定方案、行政权力和公共服务事项提供相关法人数据。(2)按需驱动的数据源选择方法。在目标模式和数据源模式之间匹配关联信息,反向构建出包含
多个模式集成处理路径的候选集合,从而出满足集成需求的数据源模式结构与集成方式。(3)基于多质量维度的数据源选择方法。以数据质量为选择策略,管理参与数据集成的数据源,保证集成结果在完整性、精确性和时效性等维度上的质量需求,满足多源校核。
法人库的数据汇聚也可以根据实际管理需求,从法人全生命周期角度、从主题角度、从数据来源角度进行分类分析。
3.1.2数据分析模型
数据分析模型主要针对法人专题库。专题库的信息模型体现为数据组成和数据之间的衍生关系。某一专题的数据包含业务数据,以及通过业务分析模型加工衍生出高价值的分析数据,以支撑各类场景化的服务。分析模型的计算逻辑则决定数据之间的衍生关系。
其中,描述分析模型的元数据包括:模型名称、数据输入、数据输出、算法说明、样例数据等[6]。
3.2法人专题库
依据“总体规划、分步实施”的建设方式,以“业务需求导向、跨部门协同、急用先行”为建库原则,从小场景切入,逐个突破来分步治理,同时倒逼基础库和主题库等支撑性专业库的扎实建设,实施成果的表现形式就是“法人专题库”。
表1描述分析模型的元数据示例
本文对上海市法人库建设情况进行了走访调研,以涉及多个委办局的代表性专题作为切入点,选取了九个业务需求量大的专题,可作为法人专题库建设架构的参考方向,分别是法人核心标识专题库、属地关系管理专题库、法人联系信息专题库、优质企业专题库、中小微企业信息库、企业消亡专题库、企业活跃度专题库、政策扶持专题库、经营困难企业专题库。
4法人综合库建设路径
4.1构建法人综合库标准建立综合库数据标准规范,是基础库数据规范的重要根基[4]。《法人库数据规范编制指南》的定位是建设具备指导性的综合库顶层设计方法论的标准化文件,既是数据规范,又是建设规范;既支撑综合库建设,又提供综合库建设的共性方法论。因此编制《法人库数据规范编制指南》,能有效推进全市各部门建立完善各行业各领域的法人数据标准,打造法人数据标准管理体系,解决数据收集指导标准缺少、法人数据元的属性标准缺失、数据标准指导其他数据标准缺失等问题,规范数据元的格式和类型,明确数据元的数据质量要求。
4.2归集法人基础数据
依据公共数据资源“需求清单”“责任清单”“负面清单”汇聚各类法人公共数据,实现法人数据向大数据中心数据湖的数据归集,并通过互联网、社会企业获取部分其他法人数据,充实到数据湖中。编号
模型名称数据输入数据输出算法说明样例数据1本市当年累计注销或撤销企业数注销企业单值数据注册所在地为本市本年度注销企业总数/2历年小微企业占比小微企业比率数值列表历年来本市企业总数中小微企业占比/3各区年存量企业数各区企业单值数据截止历年年底的各区的企业数/016
从数据质量管理维度强化法人数据基础治理。确定质量管理的策略和范围,明确业务数据结构及其质量要求,部署稽核规则。稽核规则内容主要包括规则类型、规则算法、算法描述、算法说明等,以有效规范、监督法人数据采集、融合、分析等操作环节。
同时应制定数据质量规则,考察维度包括完整性、一致性、准确性、唯一性、时效性等。通过数据巡检定期对数据质量进行检测,输出检测报告,反馈给相关委办局,并协助委办局根据检测报告进行数据清洗、加工、多源数据比对、安全隐患处理。数据检测报告的输出在一定程度上反映数据系统的应用使用情况,能在一定程度上对上层决策规划起到辅助作用[5],并能督促各级单位提高数据质量,保障数据安全,为法人数据的高效整合、深化应用奠定良好基础。下表是法人库数据质量规则的示例。
表2法人数据质量规则示例
4.4提供多样化数据服务
以应用场景为驱动,对数据精加工,以业务化的模式进行服务编排,满足“一网通办”“一网统管”等法人
数据应用场景需求,积极向数据使用者提供多样化数据服务,包括数据查询、联机分析、实时在线处理等数据服务[3]。其中,共享功能作为法人综合库数据最主要的数据服务[6],可针对不同类型的数据共享需求,考虑采用接口调用、库表订阅、文件订阅、数据沙箱四种数据共享模式。
(1)接口调用。由大数据中心根据相应业务类型提供所需数据,并把目标数据封装、发布业务统一API 接口供数据需求方使用,避免接口的重复建设,并确保数据获取的及时性和高效性。(2)库表订阅。大数据中心以数据库表结构化方式存储,需求方通过订阅,以库表方式进行全量或增量数据的交换。(3)文件订阅。文件订阅是实现不同业务系统下文件同步的方式,由数据提供方发布所需文件,数据需求方通过订阅方式实现不同系统的数据同步与信息共享,使业务数据保持完整性和统一性。(4)数据沙箱。针对《公共数据安全分级指南》三级或四级的数据共享,确保敏感数据的安全。
特别需要注意的是,数据共享应遵循合法、正当、必要、最小化使用的准则[7]。通过管理规范和技术手段强化对隐私数据、敏感数据的保护,遵循分类共享原则、按需共享原则、安全可控原则,实现数据保护与数据共享的双赢数据。
此外,应积极建设专题库。根据委办局和社会的重点使用需求,建设法人专题模型,输出法人专题数据资源目录标准、法人专题数据元标准、法人专题数据分析模型,进行法人专题分析。并以独立的实体为单位构建信息完整、一致展现的信息视图,为不同部门、企业提供统一的法人信息,增强业务人员的理解程度,推动法人数据的融合应用。规则算法名称
规则类型算法描述(举例)算法说明及时性检查
时效性(当前时间-基准时间)数据到达时间检查均值波动检查准确性(当日指标数值/上N 日指标平均数值-1)×100%
当前周期值与前多个周期值均值的波动
影视资源站采集api接口数据
检查主键唯一性检查唯一性业务键是否存在唯一检查
对具有业务唯一意义的字段进行唯一性检查数值重复检查
唯一性数值是否存在不符合业务定义的重复检查检查数据记录与其所表示的真实实体或事件是否一一对应关键属性空值检查
完整性关键值是否存在空值检查实体关键属性需要填充信息,不可为空存在一致性检查一致性法人单位名称一致性检查检查同一实体或者属性值在关联数据集
中是否一致
017
5.1法人库建设组织管理
法人库建设是一项复杂的、持续的、长期的建设任务,要分步实施、稳步推进。要在统一领导下,由市场监
管、编办、民政等相关部门共同牵头组织,本着“共建、共治、共享”建设原则,建立由各相关政府部门参与的协同共建机制,共同完成法人库共享应用平台建设、省政务信息交换共享平台建设、各相关部门负责信息交换对接和本部门相关信息化建设,实现法人信息在各级各部门间和各大综合平台间的自动归集、共享、调用和有序流
动,并支撑跨部门、跨领域业务协同以及大数据分析等应用。
5.2法人库建设组织架构
为保障法人库有序建设,应由负责全市数据统筹的大数据中心牵头建立法人库工作小组。以基础库建设领导小组为主,建立法人综合库建设专班,进行跨部门数据合并建设。专班可实行双组长制,由业务组长和技术组长组成,业务组长由相关数据提供方或需求方部门推荐,技术组长由基础库建设领导小组推荐,确保建设是以需求为导向。专班由标准建设、数据建设和应用建设三个小组组成,相互配合,有序开展法人数据建设工作。
图2上海市法人综合库建设的组织架构
6结语
法人综合库的建设可加强全市各政务部门之间数据的业务关联和工作协同,有效提升管理智能和政务效率。本文结合上海实践经验,对法人综合库的建设思路和总体架构进行研究,提出法人综合库的建设路径和管理机制。法人综合库是一个循序渐进、各方支撑的过程,应始终坚持以需求为导向,以最
迫切场景为切入点,以统一规范为标尺,分步建设,逐步拓展,最终形成满足各专业、各部门应用需求的综合数据体系。
【参考文献】
[1]苗青.智慧城市法人基础数据库构建的若干问题研究[J].创新科技,2015(3):74-76.
[2]朱志伟,赵雪玲,袁飙.苏州工业园区法人库及法人公共服务体系框架与应用[J].电子政务,2015(8):85-91.
[3]祁志伟.数字政府建设的价值意蕴、治理机制与发展理路[J].理论月刊,2021(10):68-77.
[4]谢欣宁.加强法人库建设,促进部门数据共享和业务协同[J].现代经济信息,2019(21):34-35.
[5]童楠楠.我国政府开放数据的质量控制机制研究[J].情报杂志,2019,38(1):135-141.
[6]宋毅.组织机构代码生产企业扩展信息库应用模式研究[J].大众标准化,2018(10):32-33.
[7]余兆力,王华飞,赵二红,徐毅南.法人基础信息库的典型实践与标准化建议[J].信息技术与标准化,2012(11):40-43.
018

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。