数据中台=大数据平台+数据资产管理平台+数据服平台
数据中台到底是什么?几年过去了,也一直众说纷纭。
笔者认为数据中台不应该是一个单纯的系或者是一个件工具,而应该是一套架构、一套数据流模式。数据中台需要采集数据作原材料行数据加工、数据建模,然后分门别类存,再根据实际 务场景,打造各数据服(含数据用平台)从而实现对业务能加速。但以上流程的实现,需要有对应的系品作支撑,那么基的数据中台到底应该由哪些系或者成?里我可以先来看一下几个企的数据中台架构。
可以看出,然每个企由于自身业务的不同,衍生出来的数据中台体系都有所不同,但大的架构方面是基本一的,都需要通一个数据采集接入”-“加工存”-“统一管理”-“
段。
这里笔者认为《数据中台产品经理:从数据体系到数据平台实战》一书中总结的数据中台架构是比较具有普适性的, 是互网行传统,都可以在架构上行改造,设计自己的中台架构。详见首个数据中台元数据标准(附下载)总体来说数据中台的功能架构由大数据平台、数据资产管理平台与数据服平台三大部分,其中在数据服平台中自助分析平台与标签管理系景最广泛。
1、大数据平台
大数据平台是数据中台的基座,我也可以把大数据平台称大数据开平台,它需要具与大数据相关的开能力,提供数据存、数据清洗/计算、数据查询展示及权限管理等功能。那么,应该如何建设上述功能与服务?是不是拥有了上述能力就等同于成功打造大数据平台了呢?可以发现各公司的大数据平台系架构其大同小异,各架构都包含了数据采集件、数据存储组件、数据算引擎、数据限与安全件,以及集管理与件等。除了少数像阿里这样倾力打造自研飞天的企,其他企在底层组用上,是以 Hadoop 构建的技体系主,依托各开源化改与二次开。例如,数据存储组件可以选择HBaseHive件,数据算引擎可以选择SparkFlink等分布式算引擎。详见:大数据平台总体架构方案(PPT)既然大家用的件相同或者相似,那什么最各企大数据平台的服能力是存在差距呢?有些似于购买零件装台式电脑,零件不需要的,而是要根据实际需求来选择最适合的。好用的大数据平台需要解决问题的能力。因此,数据中台的大数据平台建不是比拼引用了多少新技、覆盖了多少技术组件,而是要看它能否解决数据中台建中所面的复数据状,能否成大数据etl工具有哪些数据中台打破数据壁的技保障,能否提供简洁
效的数据理工具,如提供自助配置式的数据采集与数据清洗工具等,以及能否提供更多的附加价。数据中台的大数据平台建,可以避免各事部技术团队各自搭建大数据集所来的源浪一的、成熟的大数据平台,不能一蹴而就,需要循序渐进、分步施,在持迭代中构建企的大数据平台生
2、数据资产管理平台
数据资产管理平台主要解决数据源的管理, 数据资产遍布在各个大数据件中, hive 的表, hbase 的表, druid datasource, kafka 中的流, 各个件的管控系互相打通, 所以需要一个一的数据资产管理服, 筹大数据源的管理。随着大数据平台的建,构建数据中台的数据体系成可能,通过对业务线数据的归类整合,我们可以构建出各个数据主题域,完成数据的规范存储,形成数据资产,进而完成数据资产管理。
在数据中台体系中,数据资产管理平台主要由元数据管理与数据模型管理成,下面了解一下。 1、元数据管理讲述元数据管理,我们需要先弄清楚什么是元数据。元数据(MetaData)通常被定义为:关于数据的数据(Metadata),或者描述数据的数据(data about data),数据及信息源的描述性信息。元数据是所有数据中最重要的数
据。详见:指标管理与元数据管理平台这里举一个最通俗的例子。当我们去图书馆借书时,直接面对数以万图书,自然,但是你通图书馆查询本的名、作者、出版社等信息,取就能准确的图书位置。那么名、作者等信息,就可以理解元数据,而图书的存放位置、借阅历记录等,是我中的普通数据。在数据中,每一数据表的表名、建信息(建人、时间、所属部)、修改信息、表字段(字段名、字段型、字段度等),以及表与其他表之的关系等信息都属于这张数据表的元数据。其,元数据有多种分方式,笔者更向于按照元数据的用途来区分,共分业务元数据、技元数据和管理元数据。
业务元数据:描述数据的业务含义、业务规则等,包括业务规则、数据字典以及安全标准等多项内容。通过明确业务元数据,让人们产生统一的数据认知,消除数据歧义,让不懂数据库的业务方读懂数据表的内容。 

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。