1 研究背景
近年来,城市轨道交通以其大运量、快捷、准时、安全、环保的特点,在我国乃至世界范围内极速发展。客流作为城市轨道交通最基础和最重要的因素,对客流的分布特征及变化规律进行系统分析,掌握客流现状与变化规律,对日常行车组织、运营管理工作以及轨道交通规划等都具有重要意义[1]。传统上对于城市轨道交通客流的分析,在借助模型计算之后,轨道交通运营管理部门往往以Excel、Word等通用工具对相关数据进行分析与整理,对数据进行处理中也仅仅是采用柱状图、饼状图、折线图等简单图示辅助分析[2]。但是,伴随城市轨道交通网络的持续运行和不断发展,其网络客流数据迅速膨胀且日益复杂。若仍沿用现有方法进行简单的数据处理和图示分析,则难以很好地挖掘数据中的潜在规律,更不利于数据的有效展示与分析,进而影响运营管理人员的相关决策[3]。
2 客流大数据分析及其可视化技术
对于城市轨道交通网络而言,客流是指单位时间内轨道交通线路上乘客流动人数和流动方向的综合,城市轨道交通网络客流是一种动态流,分布与变化随时间和空间的不同而不同,其分布及变化具有一定的规律性。
2.1 网络客流分析现状
根据客流的时间分布特点,轨道交通客流可以分为日小时客流、日客流、周期性客流等。客流的空间分布主要可以分为各条线路车站客流、换乘客流、断面客流、站间OD客流、线路和网络客流等。另外,客流特征分析上又可以分为网络线路可达性、周转量、平均运距、平均旅行时间、满载率等众多指标。但是,随着城市轨道交通网络客流规模的持续、快速增长,上述客流分析越来越有难度,主要体现在:网络结构变得复杂,线
轨道交通网络客流
大数据可视化研究
李 伟: 同济大学道路与交通工程教育部重点实验室,博士研究生,上海,201804
周 峰: 同济大学交通运输工程学院,助理研究员,上海,201804
朱 炜: 同济大学交通运输工程学院,助理教授,上海,201804
徐瑞华: 同济大学交通运输工程学院,教授,上海,201804
摘 要:从网络、线路、断面、车站等城市轨道交
通客流分析工作涉及的各主要层面进行基于数据可
视化的网络客流大数据分析研究与实践。在传统的
简单图表展示基础上,将海量数据和统计结果高度
图形化,在更短时间内呈现更多信息和规律,方便
对数据作进一步的分析研究与信息挖掘。研究成果
可为城市轨道交通运营管理部门的客流分析及运营
管理辅助决策工作提供新的手段。
关键词:城市轨道交通;网络客流分析;大数据;
数据分析;可视化技术;图形
中图分类号:U293.1 +3 文献标识码:A
文章编号:1001-683X(2015)02-0094-05
路、车站和断面数量的增加,需要从宏观上和整体上观测数据以获得数据之间的联系;客流数据量增加,较难从局部和细部解读数据,要着重从趋势规律上进行分析与把握;网络OD客流的多样性利用目前的展示手段(如一些低可视化的图示等)不能很好地分析数据等。2.2 大数据分析及可视化技术
大数据时代一个显著特征就是数据可视化(最初起源于1 960 s计算机图形学)的崛起。其基本思想是将数据的各个属性值以多维数据的形式表示,可以借助图形化手段从不同的维度观察数据,从而对数据进行更深入的观察和分析[4-5]。具体来说,通过数据可视化是为了从海量的数据中获得3个数据特征(见图1)。自提出以来,数据可视化在各工程和计算领域得到了广泛的应用和发展[6-10]。
可视化作为一种统计学工具特别是伴随大数据分析而崛起的技术分支,用于创建一条快速认识数据集的捷径,正逐步成为一种令人信服的表现与沟通手段[11]。目前采用较多的低可视化工具如JReport、Excel、水晶报表、FineReport等;新型大数据广泛采用的高可视化工具有MatLab、CartoDB、Mapbox、Tableau、D3.js(Data Driven Documents)等。本研究中主要采用MatLab和D3.js作为工具。其中D3.js是支持SVG渲染的另一种JavaScript库,但是能够提供大量线性图和条形图之外的复杂图表样式,例如Voronoi图、树形图、圆形集和单词云等。此外,D3.js能够在简洁的同时,提供生动活泼的互动图表。
3 网络客流大数据可视化分析的应用
svg实例从轨道交通空间分布特性着手,分别从网络客流、
线路客流、断面客流、车站客流、换乘客流和网络特征等方面,辅以时间特性讨论轨道交通网络客流大数据可视化分析的应用及实例。3.1 网络客流分析
为了充分展示轨道交通网络客流(或线路客流等)并揭示其中潜在周期规律,有时需要将一段日期内的网络客流进行对比分析。目前的常规方法是通过绘制折线图,以折线图中线段的走势来表现网络客流的变化情况。但是城市轨道交通网络客流具有高度周期性,其客流规律随着周一至周日的周期发生改变,工作日客流量较大,周末客流量较小。这种情况符合同比(与前一相同特征日)特性,而折线图中的环比(与前一天对比)相对而言就不具有实际意义。
为了弥补这一缺陷,将一段日期内的城市轨道交通的网络客流放于D3.js中“日历图”中进行展示(以上海为例)。日历图中的日期颜代表当天客流量较同期客流(上星期同天)的变化率,其中,绿表示增长率为负数,红表示增长率为正数,颜随着增长率连续变化(见图2)。可以看出,平常日期客流较上周同比变化幅度不大,但是对比节假日分布可知网络总客流普遍在节假日下降幅度大,且节假日越“重大”,客流下降幅度越大(例如春节),而节假日后一周增加幅度大。同时也表现出特殊日期的网络客流的变化特征,即为数据特征1——模式。
3.2 线路OD客流分析
城市轨道交通线路客流计划是编制其他计划的基础
图1 数据可视化
图2 网络客流日特征分析
2013
January
February
March
April
May
June
July
August
September
October
November
December
元旦节 春节
清明节
端午节
中秋节
国庆节
客流 数据
计算机存储
数据可视化
模式 数据中的某种规律 关系 各因素之间的相关性
异常 问题数据
和依据。客流计划编制的主要依据是站间客流资料,分为站间OD和区域OD数据,该数据可通过对原始自动售检票(Automatic Fare Collection,AFC)刷卡数据分析获得,最基本的站间客流资料为线路间OD客流量。传统的线路间OD客流量主要体现为交换量矩阵,用一个二维矩阵表格来表示,表现形式枯燥单一,难以揭示其中数据规律。而“弦图”可弥补这一缺陷,通过将数据和统计结果的高度图形化,复杂的概念和信息可以在更短时间内呈现更多含义。
弦图以各条线路为圆弧,线路颜为圆弧颜,各圆弧之间连线为弦,弦的大小和颜取决于客流量的大小,便于直观看出线路主要输出客流方向等。图3中展示了上海城市轨道交通各线路间全天的客流量,弦的颜取决于线路的输入/出量,输出量大于输入量取本线自身颜,反之取输入端线路颜。2号线(绿)的圆弧段最长,故2号线输出到各线路的总客流量最大,其中输出的客流端中以客流量大小依次排序,最大为2号线的本线进出客流量;其次为与1号线(红)的交换客流量,由于1号线到2号
线的客流要大于2号线到1号线的客流,故弦为1号线红;再次是2号线和10号线客流交换量,但由于2号线输出到10号线的客流大于其输入客流,因而弦为2号线绿。图3尝试揭示OD客流之间隐藏的线路与线路之间客流的交换关系,即为数据特征2——关系。3.3 断面客流分析
以断面客流为例,全线断面客流不仅具有空间上的分布特点,还具有时间上的分布特点,目前采用的传统客流分析方法都是将空间和时间区分单独展示,无法体现断面客流的总体客流特点,难以给运营管理人员带来有效决策依据。因此,可以考虑将空间和时间引入同一展示区域,Matlab具有强大的数据处理能力及三维绘图功能,以时间为x轴,空间为y轴,客流量为z轴,通过Matlab构建断面客流时空三维分布(见图4a)直观获取线路断面的客流特征,从不同角度观察断面的时空特性:俯瞰x-y平面,辅以颜图对比可得断面客流时空分布(见图4b),该线路在早高峰时间段编号12—21的断面客流较为拥挤,晚高峰编号3—5的断面客流较为拥挤;取x-z平面图(见图4c),查看该线路全天各时段最大断面客流量;取y-z平面图(见图4d),查看全天各区间最大断面客流量,便于运营管理人员进行相应的客运组织作业。此外,大量数据在空间和时间上分布,可以有助于观察和检测异常和问题数据,剔除明显不合理的客流数据,例如超过末班车运营时刻的断面客流。该类展示分析图融合了空间和时间特性,避免了因局部分析客流而得出错误的结论,可以突出问题数据带来的明显不合理的数据异常,此为数据特征3——异常。
值得说明的是,断面客流分析中常以断面满载率判断该断面区间的拥挤度及列车服务水平,满载率相对
于客流量来说有时更加具有说明性,因此又可以以断面满载率代替断面客流作为z轴构建断面时空分布图。
3.4 车站客流分析
车站客流对行车调度指挥、车站运营组织具有重要指导意义。由于城市轨道交通网络中的线路多、车站多,脱离网络中的其他车站单一研究某个车站的客流量并不具有实际意义,因此,考虑将网络上的所有线路、车站放置于同一层面进行对比分析(见图5、图6),获得指定时间段内的网络车站客流图(2种方式),车站名称用代码表示。在车站客流展示图中,以线路客流大小进行排序,线路以颜划分,线路中的车站客流也以大小进行排序,展示出车站在线路中乃至网络中的客流量大小及排序。全局地将车站数据和线路上乃至网路上其他的车站数据相联系,从而给出一个更全面的观察与判断视角。
3.5 换乘客流分析
换乘客流乘客流类别细,分析起来复杂,例如换乘客图3 线路间客流交换分析
流细化可分为换乘站内衔接的线路之间相互换乘量(2线8个方向、3线24个方向、4线则48个方向)。因此需要将换乘站、客流种类和时间综合考虑,构成多维数据展示,从而能够多角度多侧面观察数据,更加清晰简洁地传达信息。
“泡沫图”是一种新起的图形可视化方法,能够概要展示路网所有换乘站的全天候换乘客流,并按客流数
值赋予泡沫大小并排序。图7(以上海为例)能够清晰看出路网中换乘站的日客流量大小,所有换乘站中SJDD站(4线换乘站)换乘量最大,PS站(3线换乘站)换乘量其次。各泡沫中还包含了时间这一维度,即全天候分时段的客流量,图中左上部分显示PS站8点时间段客流量最大。时间段泡沫还包括客流种类这一维度,再从8点段的泡沫(图7左下部分)中可知还包含各具体换乘方向的客流量及大小排序,
便于分析查看不同时间段的换乘客流
组成,有利于换乘站工作人员掌握换乘客流分布及分析,进行换乘客流组织作业。该泡沫图还可提供人机交互功能,便于自行选择换乘客流进行查看。
4 结束语
数据可视化技术是大数据时代的重要应用技术之
一,可以大大提高对数据的分析挖掘能力,结合当前城
图4 断面客流时空分布
图5 车站客流分析(方式1)
客流量
(a)
客流量
5 000 4 000 3 000 2 000 1 000
0 -1 000
时间 24 20
16
12 8 4 0 断面 0
12345678910 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
(b)
(c)
(d)
时间
20 16 12 8 4 0
断面 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
5 000
4 000 3 000 2 000 1 000 0 -1 000
时间 0 4 8 12 16 20
客流量
5 000 4 000 3 000 2 000 1 000
-1 000
断面
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
参考文献
[1] 沈丽萍,马莹,高世廉. 城市轨道交通客流 分析[J]. 城市交通,2007,5(3): 14-19.[2] 王静,刘剑锋,马毅林,等. 北京市轨道交
通车站客流时空分布特征[J]. 城市交通, 2013,11(6): 18-27.
[3] Steele J,Iliinsky N. Beautiful Visualization[M]. sebastopol,CA,USA:O'Reilly Media,2010.[4] Frankel F. Data Visualization: Drawing Out The
Meaning[J]. Nature,2013,497(7448):186- 186.
[5] S t e e l e J ,I l i i n s k y N . B e a u t i f u l V i s u a l i z a t i o n : L o o k i n g
at Data through the Eyes of Experts[M]. O'Reilly Media, Inc,2010.
[6] Fayyad,Usama M. Information Visualization in Data
Mining and Knowledge Discovery[M]. Morgan Kaufmann,2002.
[7] Segel E,Heer J. Narrative visualization: Telling
stories with data[J]. Visualization and Computer Graphics,IEEE Transactions on,2010,16(6): 1 139-1 148.
[8] Itoh M,Yokoyama D,Toyoda M,et al.
Visualization of Passenger Flows on Metro[C]//IEEE onference on Visual Analytics Science and Technology,VAST. 2013.
[9] Post F H. Data Visualization: Featuring Interactive
Visual Analysis[C]//Computer Graphics Forum.
Blackwell Publishing Ltd,2011.
[10] Staff C. Visualizations Make Big Data Meaningful [J]. Communications of the ACM,2014,57(6): 19-21.
[11] Bostock M,Ogievetsky V,Heer J.D ³ Data-Driven
D o c u m e n t s [J ]. V i s u a l i z a t i o n a n d C o m p u t e r G r a p h i c s , IEE
E Transactions on,2011,17(12): 2 301-
2 309.
责任编辑 杨环收稿日期 2014-12-08
市轨道交通网络客流分析工作的实际需要,对基于数据可视化技术的城市轨道交通网络客流大数据分析问题进行了探索性研究并取得了初步的效果。需要说明的是,研究提出的从断面、换乘、线路等角度的轨道交通客流数据可视化技术只是数据可视化技术中的一部分,数据可视化的方式因人而异、因技术而异。目前数据可视化中更多新的方法和技术,如3D技术、基于图形技术、人机交互能力、与数据挖掘联系等也正在被研究和开发,在城市轨道交通网络客流数据可视化应用中仍需要作进
一步研究与探讨。
图6 车站客流分析(方式2)
图7 换乘客流分析
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论