编辑导语:在如今这个数据化时代,数据对于个人和企业来说,其重要性都不可小觑。因此,有不少企业强化了数据工作,加强企业数据建设。接下来,本文作者整理了一份超全面的企业数据产品的选型对比,希望对大家有所帮助。
前言:
这个从上至下都在强调数字化转型的时代,越来越多公司重视数据,也越来越多的企业有数据建设的需求。
企业无论做任何数据工作,必然要有一定的信息化基础,也要有数据化建设的基础,少不了数据平台、数据应用工具,数据管理工具等。
关于企业数据建设这块,本人从事了近7年,从技术到项目管理,做过乙方也做过甲方,也有多年和各乙方厂商打交道的经验,遂来分享选型“内幕”。
涉及到的产品有:数仓、大数据平台、报表、BI、数据中台、数据治理等。
数据仓库算是一个解决方案,视企业需求有不同架构(传统数仓、数据集市、大数据平台等),架构下有很多分层和组件,比起工具更需要架构师能力,具体原理就不讲了。
关于数仓的选型主要涉及:数据存储方案、ETL、还有前端应用。
底层的数据仓库服务器通常是一个关系数据库系统,常用的方案有Oracle、db2、还有greenplum、teredata等数据仓库专业解决方案。
Teradata老江湖了,银行业使用较多,但成本也是真的贵,目前我们做项目较多的是用Greenplum,算是业界最快和最高性价比的高端数据仓库解决方案,Greenplum是基于PostgreSQL的,于2015年开源。
我知道的国内四大行有3家在用,5大物流公司有4家在用,不少公司在从Teradata迁移到GP。
大数据平台主流的是:Hadoop+Hive。这套方案有多通用不用多说了,后面说到的大数据平台厂商也大多基于这个来设计平台产品。
ETL工具,kettle、Tablend和Penthao用的较多。
Talend:基于Eclipse,具有很好的扩展性、稳定性以及可定制化(可以自己开发eclipse插件),并且服从Eclipse标准(如文件目录结构都是程序员熟悉的结构)。
Talend具有很好的嵌入性,因为它生成的是Java代码,这些代码可以很好的和其他系统结合在一起,这就要求使用者会java。
Penthao是一个老牌工具,2001年就发布了第一个版本,Kettle是Penthao 整个解决方案的一个组件,用来进行数据集成。
它也是基于java开发的,但是它不要求用户会java,将底层实现细节都隐藏了。主要的缺点是和talend相比,它的扩展性较差。由于它很难扩展,所以在社区中可用的组件就比较少。
前端应用工具主要就是报表、BI和数据挖掘,前两者的选型后面会细讲。
2013年左右,Hadoop体系的不断完善,标志着大数据应用场景可以被满足了。这时候就有前沿的一些企业开始做大数据平台,厂商特别多,主流的就说3个吧,华为、星环还有新华三。
这几年这些厂商也开始往“数据中台”的概念上走。但是毕竟是传统软件厂商,有点搞不太懂互联网公司提的“数据中台”到底是啥,貌似跟他们做的大数据平台没啥区别。
其实所有大数据平台都已经具备了“数据中台”的基础能力,你拿大数据平台和数据中台的产品对一下,其实各种底层架构和功能大体都一样。
对于大部分企业来讲,中台那一套还是适合互联网运营商银行的“有钱主”、“数据巨无霸”,真的中台更强调数据服务化,但普通企业有几家真的达到这个痛点,还是老老实实做好数据化管理吧。
如果你的公司有庞杂的业务系统,数据量达到PB级,海量数据的存储、计算的需求,三个里面选型吧,对比下方案。
现在还在做报表的厂商已经很少了,国内主流的就帆软finereport和润乾,起初很火的水晶报表最近也见的少了,还有开源的工具jaspereport也用的挺多。
选型方面,普通小公司,1~2个数据工作者,建议采购一个报表平台就行了,不用急着上BI。
帆软finereport功能齐全,生态和服务很好,招报表工程师也比较好招,价格比其他厂商略贵,品牌和服务溢价也能理解,毕竟国内top1。
润乾已被帆软打压的走低价,号称一套万把块钱,应该还会按并发抬价,还不算服务和项目实施,乙方可以考虑。
BI在零几年的时候都是国外市场的天下,BO、Brio、Cognos、MSTR等,都是老牌BI厂商,我做纯技术的时候就大量使用他们的产品。东西都不便宜,而且是按产品+用户双重收费,不太划算。
架构也是真的复杂,上手难度对比现在互联网时代产品的使用风格,也是确实难。
早期国内市场只有报表,但凡BI相关的大单都被国外厂商垄断,但是后面BI的需求越来越明显,就和当初信息化产业发展类似,中小型企业的需求逐渐显露。
于是国内也就开始发展BI了,比如帆软BI、BDP等。东西也不差,价格比国外的美丽多了,而且基本都只是限定服务器,不限定用户数,怎么用都OK。
再到后来,tableau、powerBI这俩工具型产品火了起来,有很多拥护的个人使用者,上手确实好用,但是在企业级应用场景,要看性能和并发成本,就见仁见智了。
不过用BI,就不是2、3个人的事情了,必须得建数仓,然后再做各种可视化、多维分析等。所以就得有数仓工程师、ETL工程师、BI工程师等岗位。
当然,你要是牛,一个人全兼了也没问题,很多单位招人也确实要兼做。
中大型公司,有好几个业务系统的,建议采购BI系统,什么数仓、指标体系、固定报表、多维分析、数据可视化就都有了。建设期得多几个人,建好之后就很舒服了,业务固定的话,留两个人维护就OK了。
“中台”的概念就是阿里推广开的。
阿里从SuperCell学过来这一套,然后化为阿里内功后,再向外推广。“数据中台”也是那时候一起推广出来的,所以主要的厂商都是阿里系的人出来创业的公司。
袋鼠云、数澜、奇点云都是阿里的P9出来创办的公司,技术都差不多。
>银行为什么用db2数据库
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论