三、面向数仓的数据集管理
平台支持对数据模型进行面向数仓的数据集管理,将一批具有相关的主题表放在同一个主题集下,用户只需要创建主题域、主题集,将主题表进行归类,给用户对数据集的管理带来了极大的便利。
1、多类型创建主题表
(1)引用库表创建主题表
当数据库表已存在时,平台提供根据数据库表或视图创建主题表,通过选择数据源中已接入的连接池,再选择连接池下的数据库表、视图、同义词创建主题表。
(2)SQL 创建主题表
ABI 平台提供用户自定义 sql 语句查询结果生成主题表,给熟悉 SQL 的用户带来了极大的方便,能够直接将查询结果生成一张主题表,直接用来分析。输入的 sql 语句支持美化工作,让 sql 语句更加规整,同时支持 sql 语句测试,查看 sql 计算结果。
(3)虚拟主题表
当某个指标是通过多个指标经过复杂的运算得到时,平台提供了根据多张主题表创建新的主题表。
(4)自定义创建主题表
支持主题表全部字段手动定义,用户可自行新建节点、修改节点或删除节点,也可以自行对节点进行上下移动,调整节点的位置,也可以在已有的库表中拾取库表字段。
(5)批量复制创建主题表
用户可根据已经创建好的库表进行批量复制库表创建主题表,新生成的库表名称可由用户自定义,用户可选择是否将选择的库表数据导入到新库表中,并且支持对新生成库表统一新增字段。
(6)支持文件创建主题表
平台除了通过数据库创建主题表外,还支持通过 Excel 文件、TXT 文件、CSV 文件、xmxxx
xl 文件、DB 文件生成主题表。本白皮书以 Excle 文件生成主题表为例,其他文件创建方式及步骤与以 Excle 文件生成主题表方式类似。
(7)通过 ETL 创建主题表
(7.1)聚合创建主题表
在建模的同时完成数据的分组聚合功能,将输入的数据进行分组,利用聚合函数对其他字段数据进行处理,最后将数据写入目标表,类似于数据库的 group by 操作。
聚合函数支持:最大值、最小值、平均值、计数、求和。
(7.2)表连接创建主题表
多个数据库表通过关联字段进行连接后,得到的结果集创建为新的模型;支持的连接方式有内连接、左连接、右连接、全连接,交叉连接。
(7.3)行转列创建主题表
行转列创建主题表顾名思义就是将表中的记录行,按照某种规则转换到列上,更好的提切业务存储的要求。
(7.4)列转行创建主题表
列转行与行转列是一个反向的操作,即将列上的值转换为行。
(8)通过接口创建主题表
用户可根据接口数据源创建主题表,先选择接口数据源,然后新建接口主题,最后设置特殊的属性,保存即可创建成功。

2、便捷的数据预处理
帕累托图制作步骤excel点选、拖拉即可实现用户 80%以上的数据预处理需求,包括:序列填充、增加计算列、双击修改数据、数据筛选、查替换、删除、复制粘贴、当前数据导入导出、一键排序、修改数据类型、双击修改字段标题,并且支持对主题表地筛选结果另存生成新的主题表。
3、多表关联生成新表
平台提供根据已生成的多张主题表通过关联关系生成新主题表,通过数据预处理界面生成关联数据,设置关联关系对话框中支持对已打开的 sheet 页进行表关联关系设置,并支持添加其他已有主题表进来。
4、智能的主题表字段统计
在进行数据预处理的时候,可以对主题表的字段进行统计,统计信息包括:唯一值,缺失值,合计值,均值,方差,最大值,最小值,方差,分布等。
5、易用的主题表导出
主题表提供导出功能,能快速实现主题表的迁移工作,当需要导出主题表时,可以选择需要导出的主题表点击导出按钮即可导出,导出时需要选择导出方式以及映射方案。
6、主题表订阅收藏
平台提供主题表订阅与收藏功能,用户可以对自己关心以及常用的主题表进行订阅和收藏。
7、维表管理
维表是对数据进行分析的角度,可以从不同角度与层次对数据进行分析。根据维的数据结构可以把维分成三种类型:单级维、多级维以及通用维。单级维同级次呈线形,自动根据数据生成树形结构;多级维多级次呈树形,各段 id 相同的数据位于相同节点;通用维,多级次呈树形,数据有多个属性,钻取路径就是级次。另外,维表支持螺旋维,目前建立层级维度时有两种方式,一种:层级维必须指定层级关系,并且维度的 id 必须有一定的规律(长度一至,符合分段规律);另一种:通用维度,通过辅串来指定上下级关系。但是这两种建立维度的方法对于用户来说都比较麻烦,用户业务库中使用的是螺旋式的维度方式建的维,能够直接用。螺旋式维度只需要 3 个字段,分别为维项的 id,维项的名称,维项的上级 id用户指定这三个字段,允许用户添加辅串。

四、图文并茂的数据分析
数据分析使用户能够从大量的数据中发现有价值或者感兴趣的信息,这些功能可以简单的划分为六类:
(1)报表分析,用户通过系统提供的可视化设计工具,定义各种分析报表、查询模板、统计图模板等,在需要的时候再刷新分析结果。
(2)敏捷分析,系统提供灵活方便的操作界面,允许用户任意选择指标、维度和过滤条件等,快速生成多维分析表、查询结果、统计图形等。
(3)报告分析,通过将用户关心的图表结果汇集在报告中,便于用户演示汇报。
(4)酷屏分析,可灵活自由地制作和展现酷炫的图表,方便开发和实施人员快捷地完成页面需求,支持在线编辑 html/js/css 代码完成页面效果制作。
(5)数据挖掘,采用一些比较高级的数理统计以及人工智能等领域的分析方法对数据仓库中的数据进行分析,以直观的统计图和其它分析结果来帮助用户了解数据的特性从而进行决策。
(6)移动分析,分别可通过浏览器、手机、平板电脑等多途径,通过在线和离线的方式对自己权限范围内的报表进行浏览访问。 (正在开发中)
ABI 提供了大量的功能,可以很好的实现这四类数据分析展现需求,并且操作简洁。

1、强大的报表模板
(1)齐全的模板组件
(1.1)组件式多表体报表设计
ABI 提供简单易用的报表设计工具,实现组件式、多表体设计,支持选项卡切换展现,可以设计任意复杂的报表,所有报表模板的编辑可以在线完成,报表排板类似于网页设计支持工字型、田字型、上下型、左右型,并可嵌套展现。
WEB 方式的设计器不仅可以减小项目实施的部署工作量,而且便于用户随时随地编辑报表。设计器采用所见即所得的方式,操作界面类似 EXCEL,支持合并拆分单元格、任意表头、画删表格线、字体设置、序列填充、格式刷、多级斜线以及无限Undo&Redo 等功能。报表模板拥有我公司独创的分析区、浮动维单元格、固定维单元格等技术,支持横向浮动、纵向浮动、交叉浮动、嵌套浮动、并列浮动等功能,使用户通过报表设计器可以定义出任意复杂的报表样式,而且定义界面非常简单。
(1.2)齐全的绘图功能
很多人都在办公软件如 MS Office 中用过绘图功能,但是将绘图功能集成进报表作为一种数据的展现形式却是 ABI 的首创。ABI 中的绘图功能的使用方式和 Office 一致,支持多种形状和连接线,支持在文本框中输入富文本和图片,支持和表格、统计图等其它报表模板元素混排展示。
(1.3)强大的表单组件
为了方便用户更加方便的制作表单,ABI 提供了强大的表单组件,极大的方便了用户设计表单时的需求。
(1.4)各式各样的统计图组件
平台内置了丰富的 fushionchart、anychart、html 统计图控件,并且提供了各种各样的统计图类型和样式,除了常用的柱状图、线状图、条形图、面积图、饼图、点图、仪表盘、走势图外更支持非主流的流向图、词云图、和弦图、圈饼图、瀑布图、金字塔、漏斗图、K 线图、关系图、网络图、玫瑰图、帕累托图、数学公式图、预测曲线图,正态分布图等等;样
式包括:2d、3d、excel、web、Autumn、flash 风格等。丰富的统计图类型和样式可以让用户定义出各种美观的报表和领导驾驶舱
(1.5)丰富的扩展组件
ABI 除了提供常规的组件外,还提供了一些特殊的扩展组件,如轮换图片,满足用户轮播图片的需求,播放组件,满足用户播放视频音频的需求等。
(1.6)参数组件
按照报表内容的可变性,报表分为静态报表和动态报表(参数化报表)。ABI 的所有报表内容都可以作为参数,用户可以根据实际需求设置报表内外的可变量作为参数。ABI 参数面板有按钮、滑块、输入框、日期、勾选框、下拉列表等多种参数组件,如果是下拉列表组件,该类型参数的下拉列表内容可以是静态手工输入的,也可以来自于第三方数据源,其内容可以随第三方数据源数据动态变化。参数面板中提供了参数类型对应参数内容变化的行为响应事件(参数联动),极大的方便了用户使用参数化报表时对参数的选择或输入,减少了用户重复定制参数条件生成报表的工作量。
(1.7)面向对象的表达式
报表模板支持定义单元格间的运算关系,例如要定义单元格 A1 等于 A2+A3,那么只需要在 A1 中输入“=A2+A3”即可,输入过程也可以象 excel 那样拾取,当定义了大量的单元格间的任意运算关系后,系统会自动分析出运算表达式中的依赖顺序,自动的按顺序计算表达式。除了简单的四则运算,报表模板还支持更多其它复杂分析方法,如:取前期数据、增幅、排名、标准差、相关系数等等。
报表模板中的表达式还是面向对象的,例如对表达式 A2+A3,我们一般的理解就是 A2 的值+A3 的值,在 ABI 中还可以等价的写成 A2.value+A3,这里我们就可以将 A2 看成一个单元格对象了,value 是它的一个属性值,将 A2+A3 写成 A2.value+A3并不能体现面向对象的表达式的优势,但当我们要获取 A2 的其它的信息的时候就能发挥面向对象的表达式的优势了,例如获取 A2 的左上边的单元格的值:
A2.leftcell.upcell,这种写法在处理报表分析中取相对单元格的值时特别方便。除了单元格对象,ABI 内部还提供了其它大量的对象,利用面向对象的表达式可以使报表定义用户能够更加容易理解表达式语法,更容易的定义出想要达到的运算效果。
(1.8)数量统计
除了求和、求均值、求最大值、求最小值等普通的统计方法外,ABI 还提供了更丰富的统计方法,如:TopN/Top%、80/20、取前期数据、增幅、增减额、环比增幅等,但这还不能满足所有的需求,因此,ABI 还实现了自定义统计方法的功能。以标准差为例,标准差反映相对于平均值的离散程度。其计算公式如下,其中 x 为样本平均值,n 为样本大小:
在 ABI 中进行定义如下:
myStdev(N x) = sqrt(_S(power(x - _A(x)2))/(_N(x)-1)) 那么现在一个新的统计方法 myStdev 就可以使用了,用户可以象使用 sum 一样使用它。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。