“数据可视化”设计的视觉原理
【转载说明】
“可视化”是⾮常有效的知识表征⽅法(肯定⽐你想得要更加有效)。它可以使得晦涩难⾔的数据、信息、知识更容易被⼈所理解,因⽽是各种视觉载体(包括微课、PPT、甚⾄是板书)的核⼼思想。
王珏⽼师认为:“可视化”分为三个⽅⾯(不同的⼈界定不同),包括:
•数据可视化:对⼤量数据背后蕴藏规律的可视化,⽐如条形图、柱状图
•知识可视化:对需要表达、传递的知识的场景、关系的可视化,⽐如知识图表
•思维可视化:侧重于表达个⼈的思维结构中对知识的理解与认识,⽐如思维导图
数据可视化设计案例
如果⼤家对以上各类“可视化”感兴趣的话,欢迎扫码观看王珏⽼师整理的移动码书:
作为⽼师和知识⼯作者,最关注的当然是“知识可视化”,但是在“可视化三兄弟”中,数据可视化出现得最早,是“⼤表哥”(详见《“知识可视化”的⼤表哥——“数据可视化”的经典案例》),研究也最为深刻。
所以,我们通过了解数据可视化的研究成果,也可以成为研究知识可视化的有⼒借鉴。
今天特转发⼀篇iSlide对PPT数据可视化的研究⽂章,有删节,欢迎请点击⽂末“阅读原⽂”。
什么是数据可视化
数据的可视化其实是在⽤数据讲故事
数据可视化由真实数据、富有美感的设计和完整的故事化逻辑组成:
这三个项⽬既是数据可视化的构件,也是可视化流程必不可少的环节:
•数据分析将错综复杂、看起来没法解释和关联的数据,建⽴起联系和关联,获得更有商业价值的洞见和价值。•视觉设计作为数据分析的末端整合和图形化处理环节,将不可见的数据现象转化为可见的图形符号,⽤⼤众能理解的图形语⾔来描述数据的内涵。
•讲故事另外可视化需要⼀个讲故事的逻辑,从⼀个宏观的问题,深⼊、细化到问题内部的⽅⽅⾯⾯,最终得出令⼈信服的结果。
数据的可视化和其他信息的可视化有很⼤区别,数据可视化的⼯具性更突出,逻辑层次的要求更强。其制作要点在于图表,但⼜在图表之外。很多时候不是画个简单的图表就是可视化了,通过图表⼯具去描述状态发现问题和并解决问题才是数据可视化的真正核⼼。
视觉设计
⽤图形讲数据
在数据分析后我们得到了数据和初步的结论,但是这戏信息太过原始和复杂,不便于传达给其他⼈,所以还需要对数据做可视化处理形成可视化报告。
1. 数据视觉设计原理
数据的视觉设计是⽤图形讲数据的过程,基本的原理如下表所⽰:
/ 数据可视化的基本原理模型 /
1) 数据转换
⾸先通过excel等⼯具将原始数据整理转换为数据表格,原始数据通常都会有冗余或者残缺,含有噪⾳和误差同时数据模式和特征往往被隐藏。通过去噪、数据清洗、提取特征等数据处理操作将数据变换为可处理模式。
2) 视觉映射
简单来说就是给既有数据选择合适的图表,⽤图形语⾔来展现数据关系的过程。通过视觉元素的有序组合体现数据的特征,这⾥视觉元素可以称为视觉通道。听起来可能会抽象,但其实内涵很简单,⽐如:
•折线图把数据特征映射到『⽅向』
•柱状图把数据特征映射到『长度』
•饼形图把数据特征映射到『⾓度』
•环形图把数据特征映射到『弧长』
•⾯积图把数据特征映射到多边形的『⾯积』
除了这些基础的图形外,其他的视觉元素也可以表⽰数据的特征:
/ 图表原理:图表⾥的视觉元素 /
a. 位置
观察散点图的时候是通过观察⼀个点的x坐标和y坐标以及与其他点的空间关系来确认数据点的分布和趋势。散点图⾥数据的规律主要以下列四种为主:
/ 散点图⾥的数据规律 /
b. 长度
以图形长度值来衡量数据⼤⼩,⽐如条形图(柱状图)在制作条形图时需要注意保持图形长度的真实性,⽐如下⾯两个条形图,左边的图形以3000作为纵坐标轴起点,导致蓝⾊矩形长度变短,看上去蓝⾊矩形长度只是红⾊的1/4,扭曲了两个矩形的长度关系。
这显然违背了图形图表追求真实准确的可视化表达本意。需要特别提醒的是,有些⽂章认为修改坐标轴是⼀种美化数据的⼿段,这是错误的理念。
c. ⾓度
饼图和环形图都是⾓度元素在图表⾥的应⽤类型,但⼆者⼜有所不同。圆环图和饼图⼀样能表现部分和整体的关系,除此之外圆环图还可以通过弧长的⼤⼩直接⽽明确地看出部分之间的⼤⼩⽐较关系,从功能性看上圆环图要优于饼图。
d.⽅向
⽅向是指⽰动态的概念,是对⼀种趋势的描述,⽅向在图表中应⽤以折线图最为典型,如下图:
但是⽅向其实是⼀个不够准确的度量元素,就像指针,⾃⾝只能表⽰上下左右的倾向,想要准确表⽰具体指向则需借助标尺或者参考线。
标尺或者参考线。
相同的数值,如果标尺有差别,那么致使⽅向的斜率也会出现显著差异,所以在处理多组数据的⽅向性时最好统⼀横、纵轴。
e. 形状
形状主要⽤于在多组数据分析时区别组别,我们在⽇常使⽤时⼜称之为标记,⽐如散点图和折线图中的形状:
/ 散点图⾥的形状 /
在散点图⾥使⽤三种形状来表现三个各⾃离散的数据。
形状也可以表⽰数值的类型、系列和组别,⽐如折线图中各系列⽤多种不同的形状标记。
/ 折线图⾥的形状 /
f.⾯积和体积
⼤的图形代表⼤的数值。长度、⾯积、体积都可以表⽰数值的⼤⼩。⼆维平⾯通常⽤圆形和矩形,三维空间⼀般⽤⽴⽅体或球体。
但是在确定⾯积和体积要注意和边长或半径的数值换算问题,避免出现错误的暗⽰,⽐如:
g.饱和度和⾊调
颜⾊的两个要素,在图表中可以⽤表⽰组别,也可以⽤于表⽰等级和数值的⾼低。颜⾊要素在图表⾥最典型的类型是热⼒图,通过填⾊,热⼒图能⽤颜⾊的饱和度或者⾊调差别来展⽰数值在特定地理区域(或者页⾯区域)的分布。
/ 热⼒图:美国每10万⼈死亡⼈数变化百分⽐(1980-2014) /
/ 热⼒图:串串⾹在成都的分布 /
下图被认定为是世界上最早的热⼒图,由法国⼈Charles Dupin 在1826年发表在⿊⽩地图上,以从⽩到⿊不同深度,标⽰了法国⽂盲的分布情况。
3) 视觉元素的识别精确性
贝尔实验室在1985年发布了视觉元素的暗⽰排序清单:
在很多可视化规范都沿⽤这份清单,清单显⽰在可视化设计中,位置是最为精确的元素,长度其次。柱形图对数据的表现更为准确,⼈也更容易理解柱形图,⽽热⼒图表现相对要差得多。
这些数据的视觉化映射原理也是设计师和数据分析师们跳出传统图表的类型框架,创造各式各样的新颖可视化作品的理论基础。
落实到在图表制作上,就是合理⽽准确地选择图表类型。•

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。