主流开源BI产品对⽐---------2020开源BI⼯具都有哪些,哪个好
现在市场上开源 BI 产品⽐较多,各个产品的侧重点不同,有的以报表为主、有的以可视化为主、有的以查询分析为主。这⾥我们选取了⼀些主流的开源 BI 产品,从产品功能、可视化能⼒、数据源⽀持以及使⽤⽂档等⽅⾯进⾏对⽐,希望对你有帮助。
Superset
由Airbnb贡献的轻量级BI产品,⽬前在GitHub上有3万多颗星,其受欢迎程度可见⼀斑。Superset提供了Dashboard和多维分析两⼤类功能,后者可以将制作的结果发布到Dashboard上也可以单独使⽤。
数据源⽅⾯,Superset⽀持CSV、MySQL、Oracle、Redshift、Drill、Hive、Impala、Elasticsearch等27种数据源,并深度⽀持Druid。
Superset语义层建模(被称为Table)时只能基于单表,多表关联要事先逻辑化成视图再使⽤,这点有点别扭。在Table⾥要显⽰地将字段标记成可分组、可过滤,指定聚合⽅式(计数、求和等),页⾯在使⽤时需要选择Group by(并没有叫做维度)、Metrics和Filter进⾏查询。
Superset可以在多个时间维度上观察,商业分析中的很多问题都是与时间密切相关的。Superset 有 4 种专门针对时间序列的图表,使⽤这些图表时,你需要指定⼀个字段为时间维度,之后就可以对时间维度做丰富的操作。
Ø  从不同时间粒度去查看你关⼼的指标(⼩时/⽇/周/⽉/季度/年)
Ø  对时间序列做移动平均,⽐如看⼀个指标的 7 ⽇平均线
Ø  可以对时间序列做偏移,再做对⽐,⽐如把本周的销售业绩与上周同期放在⼀张图表中对⽐
Ø  不在图表上显⽰指标的绝对值,⽽是显⽰它随着时间变化的增长速度
Superset还提供了直接使⽤SQL查询⽣成图表的⽅式(SQL Lab)来强化临时分析,⽅便数据分析师编写SQL查询数据。
Superset的可视化效果⾮常好,直接⽀持了⼏⼗种图形,从前⾯的截图中可以看到可视化效果很棒。重要的是,它还提供了图形扩展⽀持,通过开发插件还可以对接任意可视化库,如ECharts、AntV、HighCharts、VX和D3,这点对⽤户⾮常实⽤。
⽂档⽅⾯,Superset表现⽐较糟糕,写的过于简单,虽然在安装与快速⼊门⽅⾯提供了很完整的⽂档,但在具体功能的介绍⽅⾯⽂档严重缺失。就算有些功能有⽂档,⽂档的结构也很混乱,所以⼤部分功能只能⾃⼰去尝试。
Superset作为⼀个完整的BI系统,除了Dashboard和多维分析还包括调度和邮件报表,以及系统管理和权限控制等平台管理功能。综合来看,Superset作为⼤⼚开源的BI产品还是⾮常值得⼀⽤。
Grafana
GitHub 上的星星数⽐ Superset 还多,之所以把它放在第⼆个来说是因为它的适⽤范围跟⼤多数 BI 产品不太⼀样,Grafana 主要⽤于对接时序数据库,分析展⽰监控数据。⽬前⽀持的数据源包括 InfluxDB、Elasticsearch、Graphite、Prometheus 等,同时也⽀持MySQL、MSSQL、PG 等关系数据库。
每种数据源的查询语⾔和功能明显不同,Grafana 可以将来⾃多个数据源的数据组合到⼀个仪表板上,但每个⾯板都要绑定到属于特定组织的特定数据源。
话不多说,上张效果图感受⼀下可视化效果。eclipse哪个版本好
Grafana 为不同数据源提供了不同的编辑器,这样可以⽅便使⽤特定数据源的查询语法,很⽜叉。有时经常拿 Grafana 跟 Kibana 对⽐,在数据源种类和查询⽀持上 Grafana 要丰富得多。
在可视化构建过程中,⾯板(Panel)是可视化基本模块。每个⾯板都提供⼀个查询编辑器(取决于⾯板中选择的数据源),通过使⽤查询编辑器,可以提取显⽰在⾯板上的完美可视化效果。有各种各样的样式和格式选项,⾯板可以在仪表板上拖放和重新排列,也可以调整⼤⼩。
Dashboard 是 Grafana 可视化最终展现形式,Dashboard(或特定⾯板)可以通过多种⽅式轻松共享。可以向登录的 Grafana 的⼈发送链接。可以使⽤快照功能将当前查看的所有数据编码为静态和交互式 JSON ⽂档。这⽐通过电⼦邮件发送屏幕截图要好得多。
值得⼀提的是,Grafana 的⽂档写的很棒,除了很详细外很多操作步骤都录成 GIF 放到⽂档中让⼈⼀⽬了然。
在实际业务中,什么情况下选择 Superset,什么情况下选择 Grafana 呢?
时间序列,⽇志与设备运⾏数据分析选 Grafana;企业⽣产经营数据分析则可以选 Superset。
Metabase
Metabase ⽬前在 GitHub 上受欢迎程度仅次于 Superset,Metabase 也是⼀个完整的 BI 平台,但在设计理念上与 Superset ⼤不相同。Metabase ⾮常注重⾮技术⼈员(如产品经理、市场运营⼈员)在使⽤这个⼯具时的体验,让他们能⾃由地探索数据,回答⾃⼰的问
题。⽽在 Superset ⾥,⾮技术⼈员基本上只能看预先建好的 Dashboard,不懂 SQL 或是数据库结构的他们,很难⾃⼰去摸索。
Metabase 采⽤“问问题”的⽅式实现⼀步步数据探索,探索的结果可以保存并发布为 Dashboard。对于复杂问题还提供了 Native query 允许⽤户编写 SQL 或 native query。
数据源⽅⾯,Metabase ⽀持 Redshift、Druid、Google BigQuery、MongoDB、MySQL、PG 等 15 种数据源。
Metabase 社区版的⽂档写的简单到让你不知所措的地步,表现⼗分糟糕。好在这个产品使⽤起来不难(本⾝定位就是给业务⽤户使⽤的)。
Redash
如果说 Superset 和 Metabase 是构建⼀个 BI 平台,那 Redash ⽬标就是更纯粹地做好数据查询结果的可视化。Redash ⽀持很多种数据源,除了最常⽤的 SQL 数据库,也⽀持 MongoDB, Elasticsearch, Google Spreadsheet 甚⾄是⼀个 JSON ⽂件。⽬前 Redash ⽀持超过 35 种 SQL 和 NoSQL 数据源。
它不需要像 Superset 那样在创建图表前先定义表和指标,⽽是可以⾮常直观地将⼀个 SQL 查询的结果可视化,这使得它上⼿很简易。或者说 Redash 仅仅实现了 Superset 中 SQL Lab 的功能,但却把这个功能做到了极致。
Redash 有两个⾮常实⽤的功能,Query Snippet 与 Query Parameters。
Query Snippet 很好地解决了查询⽚段的复⽤问题。做数据报表时经常要⽤到⼗分复杂的 SQL 语句,这些语句中肯定有⼀些⽚段是可以在多个查询中复⽤的。在 Redash 中我们可以将这些⽚段定义成 Snippet,之后⽅便地复⽤。
Query Parameters 可以为查询添加可定制参数,让这个图表变得更灵活。⽐如⼀个移动应⽤的⽇活指标,我可能有时要按 iOS/Android 切分,有时要按地域切分,或是按新⽼⽤户切分。在 Superset 的 Dashboard 上要做三个表图。Redash ⾥我可以把查询的 groupby 做为⼀个参数,这样就可以在⼀张图上搞定。⽤的时候,运营⼈员可以在图表上⽅的⼀个下拉框⾥选择切分的⽅式,⾮常直观好⽤。
Redash 的 Dashboard 可以通过命名来进⾏分组,Dashboard 的名字可以有⼀个前缀并以冒号结尾,前缀相同的 Dashboard 就会⾃动被分为⼀组。例如“ Growth: Daily ”,“ Growth: Weekly ”这两个 Dashboard 都会被分到“ Growth ”组下。
Redash 在⽂档⽅⾯做得很好,除了快速⼊门教程以外,每⼀个功能模块都有⽂档且条理清晰。
当然 Redash 也有⾃⼰的不⾜之处,它的可视化种类⽐ Superset 逊⾊不少(不过其实也够⽤了)。另外,由于它只是纯粹地把数据查询结果可视化,所以也没有 Superset ⾥那些对时间维度上的聚合与对⽐的操作。
CBoard
国内由楚果主导的开源 BI 产品,分社区版和商业版。CBoard 提供了⼀个 BI 系统,包括 Dashboard、多维分析、任务调度等⽅⾯。
数据源⽅⾯⽀持 JDBC 数据源、ElasticSearch、⽂本⽂件(⽂本需要存放于 CBoard 应⽤服务器上⾯,读取本地⽂件)、Saiku2.x 等。
图形⽅⾯直接使⽤了 ECharts,多维分析和 Dashboard 功能中规中矩,可以满⾜⼤部分 BI 需求。
⽂档⽅⾯由于是国内开源的产品,中⽂⽂档对国内⽤户友好,但⽂档质量⼀般在使⽤过程中还需要不断摸索。
值得注意的是,CBoard 社区版和商业版功能差异较⼤,社区版有很多功能都不⽀持,使⽤前要认真评估。
BIRT

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。