第33卷第6期计算机辅助设计与图形学学报Vol.33No.6 2021年6月Journal of Computer-Aided Design & Computer Graphics Jun. 2021结合知识图谱的篮球赛事新闻可视化
吉娜烨1,2), 高勇1,3), 赵友兵1,2)*, 俞定国1,2), 褚少微1,2)
1) (浙江传媒学院智能媒体技术研究院杭州 310018)
2) (浙江省影视媒体技术研究重点实验室杭州 310018)
3) (浙江大学软件学院杭州 310058)
(***********)
摘要: 体育赛事新闻的可视分析涉及体育赛事分析和新闻可视化, 对快速生成赛事新闻报道、增强赛事新闻表现力、辅助赛事分析有重要作用. 针对篮球比赛的重要赛事数据, 如篮球比赛球员数据、球队数据和比赛的时间、空间数据, 辅以知识图谱丰富背景知识, 设计了交互式可视化工具. 设计的交互可视工具面向数据新闻的制作, 以体育赛事新闻的自动报道为需求, 除了包括基础数据的概览和统计视图外, 还包括赛事背景数据的知识图谱可视设计、赛事时空数据可视视图, 让篮球爱好者和普通大众读者拥有多维度的视角去了解篮球赛事的各种信息. 实现的可视化系统, 通过篮球爱好者、普通大众读者和专业体育新闻记者等用户的评测, 在5分制的量化评分下, 各可视模块的均分基本在4分以上, 证明了知识图谱用于篮球赛事可视化兼具
生动性和知识性, 可以增强篮球赛事新闻的表现力.
关键词: 篮球赛事; 知识图谱; 数据新闻
中图法分类号: TP391.41 DOI: 10.3724/SP.J.1089.2021.18590
Knowledge Graph Assisted Basketball Sport News Visualization
Ji Naye1,2), Gao Yong1,3), Zhao Youbing1,2)*, Yu Dingguo1,2), and Chu Shaowei1,2)
1) (Intelligent Media Institute,Communication University of Zhejiang, Hangzhou 310018)
2) (Key Lab of Film and TV Media Technology of Zhejiang Province, Hangzhou 310018)
3) (School of Software Technology, Zhejiang University, Hangzhou 310058)
Abstract: Visual analysis of sports event news involves sports event analysis and news visualization, which plays an important role in quick generating of event news reports, enhancing the expression of event news, and assisting event analysis. A knowledge graph based visual analytics method is proposed for basketball data news generation. The interactive visualization tools are designed for basi
c matches and team data of basketball games, such as basketball player data, team data and spatio-temporal data, supplemented by knowledge graph, which enriches background knowledge. Besides the overview and statistical view of basic data, it also includes the visual design of knowledge map of the background data for the game and the visual view for the spatio-temporal data of the game, so that basketball fans and ordinary readers could benefit from a multi-dimensional perspective to enjoy the various aspects of the basketball game. Therefore, the visualization system can increase the richness of sports event news, and serve basketball fans and ordinary readers better. Through the evaluation by basketball fans, general readers, and professional sports journalists, most of the average scores of each visual module are above 4 points basically under a 5-point quantitative
收稿日期: 2020-08-18; 修回日期: 2020-10-29. 基金项目: 浙江省重点研发计划(2019C03131); 浙江省基础公益研究计划(LGF20F-020001). 吉娜烨(1987—), 女, 博士, 讲师, CCF会员, 主要研究方向为人工智能、可视化、计算机视觉、计算机图形学; 高勇(1996—), 男, 硕士研究生, 主要研究方向为数据可视化; 赵友兵(1976—), 男, 博士, 讲师, 论文通讯作者, 主要研究方向为信息可视化和可视分析; 俞定国(1976—), 男, 博士, 教授, 硕士生导师, CCF会员, 主要研究方向为媒体人工智能应用、媒体融合; 褚少微(1982—), 男, 博士, 副教授, CCF 会员, 主要研究方向为人机交互.
838 计算机辅助设计与图形学学报第33卷
scoring system. It is proved that the knowledge graph used in basketball event visualization has both vivid-ness and knowledge, which enhances the expressiveness of basketball event news.
Key words: basketball games; knowledge graph; data journalism
随着计算力和互联网的发展, 当今社会已经进入大规模生产数据、消费数据和传播数据的“大数据”时代. 在传媒行业, 大数据是2012年以来国内新闻传播学界所热议的话题. 相较于传统的新闻报道, 现在的新闻从业者不仅专注于新闻事件和现场内容报道, 同样也可以利用数据挖掘分析等技术发现新闻背后的关系, 并在报道新闻中采用数据可视化和可视分析技术[1-2].
在众多数据新闻类别中, 体育新闻是受众量较多的新闻类别之一. 得益于数据采集技术的提升, 不论是奥运会、世界杯和世锦赛等国际重大体育比赛, 还是中超和CBA等国内联赛, 每时每刻都有大量的赛事数据产生. 结合赛事数据挖掘分析与数据可视化技术驱动生成数据新闻, 已经成为世界各大媒体常用的体育赛事新闻报道手段. 本文旨在研究数据新闻中的体育领域, 以美国职业篮球联盟(national basketball association, NBA)赛事为例, 对如何结合赛事数据获取和相关可视化技术进行研究和探索, 以服务于新闻可视化的数据视觉分析. 本文设计的NBA赛事数据可视化分析系统①可作为赛事数据新闻的辅助报道手段. 该系统将收集的大量赛事数据以二维或三维图表进行视觉呈现, 为普通受众和篮球爱好者提供兼具知识性和生动性的赛事数据分析, 在一定程度上也可以辅助篮球专业人员赛事决策.
1 相关工作
由于体育比赛中产生的赛事时刻数据具有易收集和数据量大的特点, 对体育数据进行可视分析以辅助新闻呈现是目前数据新闻的热点研究方向之一. 对体育赛事数据的可视化分析通常有2个基本方向, 分别是面向比赛结果的统计型数据和面向比赛过程的时空数据[3].
其中, 统计数据的可视化相对较为直观, 既能直观反映比赛方的技术特点与风格, 又具备易记录和易判断的特点. 而时序数据和空间数据的可视化较为复杂和多样化, 一直是新闻可视化和可视分析的热点[4]. 已有不少从各类体育赛事数据和球员运动轨迹中获取信息来设计可视方案和工具的研究工作. 代表性的工作有: 针对网球比赛的数据可视化系统TenniVis[5], 将摄像机捕获的数据通过扇形的可视化编码展现一场网球比赛过程; 为冰球射门坐标创建了一个径向热图方法[6], 使用环坐标分析NHL(北美冰球联盟)球队最常用于射门的距离; 通过弧线图描述美式橄榄球比赛的运动序列[7]; 对乒乓球的对阵模式进行了可视分析[8]. 上述体育赛事可视化工具引入时空数据后, 可以帮助体育专家进行更深入的赛事分析.
此外, 足球运动可视化更重视时空数据背后的关系分析. SoccerStories[9]通过使用热力图和关系图展示球员传球的联系. 针对足球运动模式的视觉分析系统[10]将可视化技术与数据挖掘技术相结合, 实现了足球运动模式的交互式识别; 结合足球比赛的视频和运动数据, 该系统还对比赛中的球员运动轨迹和进攻防守状态进行可视分析, 以辅助团队的运动决策[11-12]. Bialkowski等[13]将足球的空间数据进行算法再分析, 发现球员角和球队信息. 足球赛场可视化工具ForVizor[14]可对足球阵型的时空变化进行可视分析.
而在本文重点关注的NBA篮球赛事数据可视化方面, Beshai设计了一个交互网站buckets②, 方便用户查看近年来NBA各球员的投篮热点等投篮信息. NBA可视化工具GameFlow[15]从赛季、比赛和节3个层次对NBA比赛进行可视分析. BKViz[16]对源自Basketball-Reference的时序数据进行可视分析, 提供了2015—2017年的单场NBA比赛的详细数据分析和可视化展示. BasketView[17]使用了流状图和时间线等对NBA篮球比赛的赛季、单场比赛和重要事件进行了可视化.
综上所述, 现有的对体育赛事特别是NBA篮球可视化更多面向专家分析工具, 以新闻报道面向的普通受众为目标的篮球赛事可视化仍值得深入研究, 特别是如何能帮助用户快速、深入地获得
① github/siniangy/425_frontEnd/
② buckets.peterbeshai
第6期吉娜烨, 等: 结合知识图谱的篮球赛事新闻可视化 839
球赛信息, 这正是本文的工作.
除了传统的可视化技术之外, 本文还采用一种新兴且热门的技术——知识图谱, 以辅助体育赛事数据分析. 知识图谱由Google公司于2012年提出①, 其数据的可视表达一般有节点链接图、热图和邻接矩阵等形式. 目前常见的知识图谱可视化的研究有大规模知识图谱可视方法和异质网络可视分析等[18].
结合知识图谱中强大的背景知识, 并以合适的可视化形式呈现用户感兴趣的球员、球队背景及历史比赛信息等, 可有力地支持篮球赛事新闻的深度阅读. 而当前还未有针对体育赛事的专用知识图谱, 且并未有知识图谱在体育赛事可视化中的应用.
2 数据描述
本文篮球赛事新闻可视化使用了常规统计数据和比赛时空数据. 数据来源于stat-nba和Basketball-Reference网站.
2.1常规统计数据
篮球赛事的常规统计数据包括球员统计数据、球队统计数据和比赛统计数据.
球员的常规统计数据具体包括球员姓名、是否首发、出场时间、投篮命中率、投篮命中个数、投篮出手次数、3分投篮命中率、3分投篮命中个数、3分投篮出手次数、罚球命中率、罚球命中个数、罚球出手次数、真实命中率、篮板总数、前场篮板数、后场篮板数、助攻个数、抢断个数、盖帽个数、失误个数、犯规个数以及本场得分共22个字段属性.
对阵双方的关键信息数据具体包括球队标志地址、球队名称、球队赛前战绩、球队总得分、球队主客场所属、球队第1节得分、球队第2节得分、球队第3节得分、球队第4节得分共9个字段属性.
球队的常规统计数据具体包括球队出场人数、总投篮命中率、总投篮命中数、总投篮出手次数、总3分命中率、总3分命中数、总3分出手次数、总罚球命中率、总罚球命中个数、总罚球出手次数、真实命中率、总篮板总数、总前场篮板数、总后场篮板数、总助攻个数、总抢断个数、总盖帽个数、总失误个数、总犯规个数以及本场总得分共20个字段属性. 2.2球队知识图谱信息
体育赛事新闻报道除了传达常规赛事统计信息, 还需要充分结合体育背景知识传达新闻要素. 因此, 除赛事数据外, 本文还使用知识图谱获得球队和球员的背景知识. 具体地, 将球队名称作为关键词传入CN-DBPedia百科知识图谱接口或自建的篮球专有知识图谱. 关键词传入后会返回球队的拓展词条信息, 具体包括中文队名、英文队名、所属运动项目、所属赛事、所属地区、球队成立时间、球队主场馆、主场馆容纳人数、球队现任主教练、球队知名球星、球队所获荣誉、球队加入NBA联盟时间、球队所在城市、球队所在部区、球队所在分区和球衣颜共16个属性字段.
2.3比赛时序数据
除常规统计数据以外, 篮球比赛还有更为重要的时空数据, 记录了球赛的动态时空进程. 本文所使用的时序性数据来源于stat-nba, 空间投篮坐标位置来源于Basketball-Reference网站.
比赛时序性数据(play-by-play data)记录了本场比赛中球员的有效操作事件(如投篮、犯规、失误等)以及事件的发生时刻. 源网页中时序数据的格式包括事件发生时刻、球队A发生事件描述内容、比分变化、球
队B发生事件描述内容共4个字段内容, 如表1所示.
表1时序数据字段属性
时序数据字段属性
时间11:27:00
球队A事件详情
T·Mozoov makes 2 pt layup from 1 pt
(assist by W.Chandler)
比分变化2-0
球队B事件详情
2.4比赛空间数据
本文中比赛空间数据指投篮事件坐标数据. 通过分析Basketball-Reference的shot-chart页面中相关比赛
的超文本标记语言(hyper text markup language, HTML)结构信息, 再爬取并处理投篮位置数据. 具体地, 包括投篮发生事件序号、投篮相对位置坐标、投篮发生事件描述、投篮命中或投失共4个字段内容. 以2015-01-02骑士队对阵黄蜂队的比赛中, 骑士队在比赛第3节9:15:00这一时刻发生的事件为例, 其空间数据各字段如表2所示.
① blog.csdn/eli00001/article/details/64905724
840 计算机辅助设计与图形学学报第33卷
表2空间数据字段属性
空间数据字段属性
投篮事件序号75
投篮相对位置坐标top: 209px; left: 60px
投篮发生事件描述Kevin Love made 3-pointer from 25 ft 投篮状态·(表示命中)
3 可视化任务
篮球赛事不仅具有统计信息和时间进程, 还具有空间属性. 由于各个球员的在场位置通过语言描述不易表述清楚, 要在短时间内获得对篮球赛事的直观了解, 篮球球场的可视化不可缺少. 因本文的可视化工作服务于篮球赛事新闻, 经需求分析设计了以下任务.
(1) T1. 篮球比赛统计数据可视呈现
该任务针对第2.1节获得的各项统计数据, 如一场比赛各阶段的得分数据、比赛的总体各项指标等统计数据, 采用适合新闻可视呈现的方式进行可视化.
用户可以在首页了解到本场比赛对阵双方的概况, 包括主客场信息、赛前战绩、本场比赛节比分等宏观信息, 使用户首先判断本场比赛是否含有自己感兴趣的主队和球员, 然后再决定是否进一步了解本场赛事的相关可视化分析和数据新闻.
表格式的统计数据可视化模块可方便用户查看本场比赛球员和球队常规统计数据和进阶数据. 此外, 另有设计可视化组件呈现比赛球队之间关键数据项的对比, 可使用户对球员、球队的当场比赛表现有宏观了解.
(2) T2. 球员赛事数据和背景数据可视呈现
在篮球新闻中, 球员的在场信息和背景资料是新闻报道的重点. 基于此, 篮球赛事新闻可视化中, 球员信息
数据可视化分析工具可视化是不可缺少的部分, 包括查看球员的贡献、通过知识图谱获取球员资料等.
通过球员本场比赛与生涯平均表现的数据对比, 可以反映球员本场比赛的表现是否积极. 本文根据获取到的球员本场比赛的统计数据以及生涯统计数据, 设计了球员表现对比可视化组件, 可以帮助用户从新颖角度了解球员——其对球队胜负的作用是正反馈还是负反馈.
此外, 用户在阅读球赛新闻时往往对本场比赛中表现最佳的球员数据比较关心. 可视化模块应该对于比赛中的关键数据(得分、篮板、助攻)表现最好的球员提供相关的可视化展示. 分析球员之间的助攻关系可以让用户从不同角度了解本场比赛中对战双方球队的比赛风格. 基于时序数据特点, 系统应设计对应的可视化组件展示本场比赛球员之间的助攻关系, 从而以不同视角辅助用户了解球员之间的化学反应.
(3) T3. 篮球赛事比赛进程绘制
该任务对篮球赛事进程实现可视化, 包括各场比赛的分数变化、得分动作等. 当今, 各大体育门户网站对于NBA赛事时序数据的处理一般都以简单的文字形式呈现, 没有对时序数据进行深入挖掘. 为了让用户更直观、更详细地了解比赛实况, 可视化系统应设计基于时序数据挖掘分析的可视化组件, 方便用户以交互动态图表的方式了解本场比赛的时序事件详情和事件发生流程.
(4) T4. 篮球赛事球场可视化
将赛事时空数据中的空间坐标数据与时序数据事件相结合可以为用户了解比赛提供空间加时间的高维融合视角. 基于时序数据和空间坐标数据格式特点, 系统应设计相应的可视化组件展示本场比赛球员的投篮位置, 并结合时序事件的投篮坐标、投篮时间进行可视化尝试.
4 篮球赛事新闻统计数据可视化设计
基于统计数据设计的可视化视图主要包括概览视图和统计视图. 概览视图布局主要展示了球队的基本信息以及单节比分差异; 统计视图布局主要包括以表格形式展示的球队和球员的比赛统计数据以及基于统计数据设计的对比可视化组件.
4.1概览视图布局设计
概览视图以可视化形式呈现新闻表达所不可或缺的文本和图像信息, 分为位于中间的球队比分以及位于两边的球队信息概览2部分. 球队信息概览包括球队名称、球队主客场信息、球队赛前战绩以及球队标志共4个字段. 在概览视图中球队在比赛各节的比分差异除了以表格方式呈现之外, 还以柱状图形式呈现. 图1所示为柱状图形式显示的比分比较, 其中, 柱高表示每节的比分, 不同颜代表不同球队.
4.2统计视图布局设计
统计数据可视化视图如图2所示. 针对可视化任务T1和T2, 本系统还分别设计了球员统计数据表格可视化
组件(如图2a所示)、球队统计数据柱状图可视化对比组件(如图2b所示)以及关键数据表现最佳球员表格可视化组件(如图2c所示). 球
第6期
吉娜烨, 等: 结合知识图谱的篮球赛事新闻可视化 841
图1 球队比分概览视图
图2 统计数据可视化
员统计数据可视化组件以表格形式展示了球员本场比赛的常规数据和进阶统计数据. 常规统计数据源自stat-nba 数据分析网站, 包括球员姓名、得分数、助攻数等共22个为新闻报道所关注的字段属性. 进阶统计数据源自Basketball-Reference 数据分析网站, 包括球员姓名、出场时间、有效投篮命中率(effective field goal, eFG)等共16个新闻报道所关注的字段属性.
5 篮球赛事知识图谱数据可视化设计
5.1 球队知识图谱可视化
在上述直观可视化的基础上, 本文结合知识
图谱对球队信息进行背景知识的载入与可视化. 可视化组件渲染数据来源之一CN-DBPedia 是由复旦大学知识工厂实验室研发并维护的大规模通用领域结构化百科图谱[19]. 该知识图谱是从百科纯文本HTML 页面中提取的目标实体、实体属性以及实体关系, 经数据过滤、数据清洗和数据融合推断等操作后, 最终形成实体-关系-实体的三元结构化数据. 数据以资源描述框架(resource description framework, RDF)的规范存储格式存入数据库.
图谱数据可视化的整体流程如图3所示. 用户查询的实体作为关键词输入, 通过调用开源应用程序接口(application programming interface, API)获得三元组数据, 经过过滤以及格式处理之后, 处
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论