知识可视化的理论与方法
赵国庆黄荣怀陆志坚
北京师范大学知识工程研究中心,北京 100875
摘要:知识可视化是在科学计算可视化、数据可视化和信息可视化基础上发展起来的新兴研究领域,是指应用视觉表征手段,促进体知识的传播和创新(Eppler, M.J. & Burkard, R.A., 2004)。本文首先介绍知识可视化的由来,分析知识可视化与数据可视化、信息可视化的联系与区别;紧接着论述知识可视化的理论基础——双重编码理论,并从知识制品的角度分析知识可视化的本质;然后分析知识可视化与教育技术、知识工程之间的关系;最后介绍知识可视化的研究框架和几种已有的知识可视化方法,并分析知识可视化的发展趋势。
关键词:知识可视化数据可视化信息可视化知识制品
一、知识可视化的由来
人类80%以上的信息是通过视觉获得的,常言道:“百闻不如一见”、“一图胜过千言”就是这个意思。可视化技术是指将抽象的事物或过程变成图形图像的表示方法。“可视化”一词,来源于英文的“visualization”,原意是“可看得见的、清楚的呈现”,也可译为“图示化”,如计算机编程的可视化界面(VB、VC等)。
“可视化”作为专业术语出现始于1987年2月,当时美国国家自然科学基金会(National Science Foundation,简称NSF)召开的一个专题研讨会,给出了科学计算可视化的定义、覆盖的领域以及近期、长期发展的方向。这标志着科学计算可视化作为一个学科在国际范围内已经成熟(潘云鹤,2001)。
按照潘云鹤(2001)的观点,科学计算可视化(Visualization in Scientific Computing)的基本含义是运用计算机图形学或者一般图形学的原理和方法,将科学与工程计算等产生的大规模数据转换为图形、图像,以直观的形式表示出来。数据可视化(Data Visualization)概念首先来自科学计算可视化,科学家们不仅需要通过图形图像来分析由计算机算出的数据,而且需要了解在计算过程中数据的变化。随着计算机技术的发展,数据可视化概念已大大扩展,它不仅包括科学计算数据的可视化,而且包括工程数据和测量数据的可视化。现代的数据可视化技术指的是运用计算机图形学和图像处理技术,将数据换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。它涉及到计算机图形学、图像处理、计算机辅助设计、计算机视觉及人机交互技术等多个领域。
一般说来,科学计算可视化是指空间数据场的可视化,而信息可视化(Information Visualization)则是指非空间数据的可视化(黄志澄,1999)。随着社会信息化的推进和网络应用的日益广泛,信息源越来越庞大。除了需要对海量数据进行存储、传输、检索及分类等以外,更迫切需要了解数据之间的相互关系及发展趋势。实际上,在激增的数据背后,隐藏着许多重要的信息,人们希望能够对其进行更高层次
的分析,以便更好地利用这些数据。Card et al. (1999) 将信息可视化定义为:“使用计算机支持的、交互性的视觉表示法,对抽象数据进行表示,以增强认知。”
Eppler, M.J. & Burkard, R.A.(2004)认为:知识可视化(Knowledge Visualization)是在科学计算可视化、数据可视化、信息可视化基础上发展起来的新兴研究领域,应用视觉表征手段,促进体知识的传播和创新。一般来讲,知识可视化领域研究的是视觉表征在提高两个或两个以上人之间的知识传播和创新中的作用。这样一来,知识可视化指的是所有可以用来建构和传达复杂知识的图解手段。除了传达事实信息之外,知识可视化的目标在于传输见解(insights)、经验(experiences)、态度(attitudes)、价值观(Values)、期望(expectations)、观点(perspectives)、意见(opinions)和预测(predictions)等,并以这种方式帮助他人正确地重构、记忆和应用这些知识。
知识可视化与信息可视化有着本质差别,Eppler, M.J. & Burkard, R.A.(2004)认为:信息可视化的目标在于从大量的抽象数据中发现一些新的见解,或者简单地使存储的数据更容易被访问;而知识可视化则是通过提供更丰富的表达他们所知道内容的方式,以提高人们之间的知识传播和创新。
这里从可视化对象、可视化目的、可视化方式和交互类型四个方面对数据可视化、信息可视化与知识可视化进行比较,如下表表示:
数据可视化信息可视化知识可视化
可视化对象空间数据非空间数据人类的知识
可视化目的将抽象数据以直观的
方式表示出来
从大量抽象数据中发
现一些新的信息
促进体知识的传播
和创新
可视化方式计算机图形、图像计算机图形、图像绘制的草图、知识图表、视觉隐喻等
交互类型人-机交互人-机交互人-人交互
图表 1 数据可视化、信息可视化与知识可视化的比较
二、知识可视化的理论基础——双重编码理论
双重编码理论(Paivio,1986)的一个重要原则是:同时以视觉形式和语言形式呈现信息能够增强记忆和识别。双重编码理论为知识可视化提供了很好的理论基础。该理论于1986年由Paivio提出,试图把语言和非语言放在同等重要的位置上。Paivio(1986)声明:人类认知是独特的,它在同时处理语言和非语言对象时非常特别。该理论认为,语言系统直接处理语言的输入和输出(以演讲和书写的形式),同时充当非语言对象、事件和行为的符号功能,任何的表征理论都必须符合这一二重性。
该理论设想有两个认知子系统,一个专门用于表征和处理非语言对象(如表象),另一个则专门用于处理语言对象。Paivio还假定有两个不同类型的表征单元:imagens 和logogens,imagens用于表征心理图像,logogens用于表征语言实体。logogens是以关联和层次的形式组织的,而imagens是以部分-整体关系组织的。双重编码理论定义了三种类型的加工:(1)表征性的,语言和非语言表征的直接激活;(2)调用性的,通过非语言系统激活语言系统或反过来通过语言系统激活非语言系统;(3)联合加工,在语言系统内部或非语言系统内部的表征的激活。一个任务可能需要三种加工中的一种或全部(Paivio,1986)。
从双重编码理论可以看出,知识可视化将知识以图解的方式表示出来,为基于语言的理解提供了很好的辅助和补充,大大降低了语言通道的认知负荷,加速了思维的发生。
三、知识可视化的实质——认知知识“制品”到显性的物理知识制品的转化
知识制品(Knowledge Artifacts)的概念在越来越多的文献中提及。知识制品是我们日常处理的对象,如我们写的报告、发送的邮件和阅读的书刊等。按照Newman, B. (2003)在《知识管理手册》一书中的观点,知识制品被谈及时,实际上同时具有双重含义:认知知识制品(cognitive knowledge artifact)和物理知识制品(physical knowledge artifact)。认知知识制品是指对真实物理世界的了解和理解,通常被简化为“知识”;物理知识制品则是指认知知识制品的表示法。认知知识制品侧重于内容,物理知识制品侧重于表现形式。另外,知识制品会因其编码方式、呈现方式和抽象程度的不同而各不相同。从个人的角度来看,知识制品可以是外显的(explicit)、内隐的(implicit)和隐性的(tacit)。然而,大多数知识制品都是这三种类型的组合。我们最熟悉的是显性知识制品,它们以一定的方式进行编码,使得人们能够触摸到、看到、听到或操作。显性知识制品可以在人们之间进行传播,但不同的制品形式,其传播的效果会完全不一样。为了使用上的方便,一些学者也往往将知识制品限定为
显性的物理知识制品——能够直接作用人的感官的知识制品,即知识的外在表现形式。
因此,知识可视化的实质是将人们的个体知识(暂且称为认知知识“制品”)以图解的手段表示出来,形成能够直接作用于人的感官的知识的外在表现形式(显性的物理知识制品),从而促进知识的传播和创新。
另外,知识表征(Knowledge Representation)在认知心理学、人工智能以及这里谈到的知识可视化领
域有着不同含义。在认知心理学中,知识表征是指知识在人脑中的存储和组织形式或者说是知识在人脑中的呈现方式,与此相对应的是人脑的各种记忆模型;在人工智能领域,知识表征更多被称为知识表示,是指知识在计算机中的存储形式和运算机制,因此与其对应的是数据结构和相应的算法;而在教育技术领域(知识可视化)领域,知识表征则是指知识的外在表现形式,与此相对应的是承载知识的图解手段,也是直接作用于人的感官的刺激材料。由此可见,知识可视化是连接认知心理学和人工智能研究的新的桥梁,为计算机的知识表征作用于人脑提供了可依赖的方法和手段。
图表 2 知识表征在知识可视化、认知心理学、人工智能等领域的比较与联系
四、知识可视化与教育技术、知识工程
知识可视化是指应用视觉表征手段促进体知识的传播和创新,其实质是将人们的个体知识(认知知识制品)以图解的手段表示出来,形成能够直接作用于人的感官的知识外在表现形式(物理知识制品),从而促进知识的传播和创新。教育技术是为了促进学习而对过程和资源进行设计、开发、应用、管理与评价的理论与实践,其目的是改善教学过程,使教学效果最优化。从两者的目的来看,两者是相当一致的。知识可视化无疑将成为教育技术达成教学效果最优化的利器之一,因此是教育技术的一个重要的研究领域。
另外,知识可视化是在数据可视化、信息可视化的基础上发展起来的,因此有着更多的技术背景。从表面看,知识可视化只是知识的一种图解式表示手段,但若往深层次发展,却需要更多的人工智能、知识科学、计算语言学和认知语言学等的强力支持。例如知识可视化的一个研究方向是通过计算机自动发掘文本信息中隐含的概念体系(如小说中的人物及其关系,科普文章中的概念及其关系),并自动生成图表(概念图等),为教师备课提供原材料,或为学生进一步加工(校对、细节修补等)提供原始框架。这种研究将为教学设计自动化打下良好的基础,而这一目标的达成需要借助知识工程和语言学的研究成果,甚至是与知识工程以及语言学的同行一道,攻克一些难题。从这个角度来看,知识可视化是知识工程的应用领域。
综合以上分析,我们可以认为:知识可视化是知识工程在教育技术领域的应用方向之一,也是在教育技术领域应用知识工程的突破口之一,它对知识工程提出了要求,为教育技术提供了机遇。
五、知识可视化的研究框架
(一)知识可视化研究的三个角度
为了通过可视化来促进知识的有效传输和创新,至少需要从三个角度来考虑,它们回答了知识可视化的三个关键问题,分别是:
数据可视化的概念1.将对什么类型的知识可视化?
2.为什么要对这些知识进行可视化?
3.如何对这些知识进行可视化?
图3是对从这三个角度出发,列出的一些可能答案。
图表 3 知识可视化研究的三个角度(译自(Eppler, M.J. & Burkard, R.A., 2004))
“知识类型”在于区分需要进行传输的知识的类型。不同的文献对知识分类的结果不同,至今还没有一个能够将可视化形式与知识类型相对应的知识分类法,因此还没有能够为特殊知识类型提供特殊表示方法的框架;“可视化动机”对使用可视化表示的动机进行了区分,可以包括:通过视觉手段进行共享、知识创新、学习、把过去的经验编成文件供别人使用和知识构图等;“可视化形式”给出了可视化的几种方法,如启发式草图、概念图表、视觉隐喻、知识地图和科学图表等。当然,这个图表中的知识类型、可视化目的以及可视化形式等的列举只是一个示意,更没有一个对应关系,需要研究者们根据自己的需要去确定(Eppler, M.J. & Burkard, R.A., 2004)。
(二)知识可视化研究的一般思路
知识可视化研究可以借鉴传统的四步实验法:(1)构建理论上的形式化模型和相应的算法;(2)开发实现该理论的软件;(3)应用理论和工具,构建实际问题的解决方案;(4)评估建构的系统,重复这四步,直到得到满意的效果(Knowledge Representation and Reasoning with Graphs,2004)。
在实施时,这四大步骤需要进行进一步的分解。第一步大致可以分解为:(1)明确知识可视化的目的,即解决研究的动机问题;(2)选取一种切实有效的知识分类法;(3)分析该分类法下的各种知识类型,哪些适合进行可视化,哪些不适合进行可视化;(4)为各种知识类型选择合适的知识可视化方
法,即图解手段;(5)为各种图解形式寻求对应的计算机知识表示法,即建立相应的数据结构(含逻辑结构和物理结构)和算法。第二步则可以依据软件工程的思想将其分解为需求分析、设计、编码、测试等步骤。第三步是实验环境的创设。第四步则是实验效果的分析和评估,从而为进入下一个迭代做准备。
六、几种已有的知识可视化工具
(一)概念图(Concept Map)
概念图是康乃尔大学的诺瓦克(J.D. Novak)博士(Novak, J. D. & Gowin, D. B,1984)
根据奥苏贝尔(David P. Ausubel)的有意义学习理论提出的一种教学技术。根据诺瓦克(J.D. Novak)博士的定义,概念图是用来组织和表征知识的工具。它通常将某一主题的有关概念置于圆圈或方框之中,然后用连线将相关的概念和命题连接,连线上标明两个概念之间的意义关系。
概念图是使用节点代表概念、连线表示概念间关系,由包含一个概念的节点及连接组成。连接被贴上标签并用箭头符号指示方向,被贴上标签的连接解释节点之间的关系,箭头描绘关系的方向,“概念-连接词-概念”这样一个三元组形成了一个命题。另外,概念图是具有层次结构的,最高级的概念处在顶端。人们可以用适合的关联词来说明不同层次的概念之间的关系,并确定不同分支之间的横向联系。
概念图这种知识可视化方法最大的优点在于对知识的体系结构(概念及其概念之间的关系)一目了然的表达出来,还突出表现了知识体系的层次结构。
概念图还是很好的结构化知识评估工具。为了方便使用计算机辅助创建和评估概念图,美国评估、标准和学生测试中心(Center for Research on Evaluation, Standards, and Student Testing,简称CRESST)对概念图的概念和连接词进行了预定义,提出了知识地图(Knowledge Maps)。
(二)思维导图(Mind Map)
思维导图最初是20世纪60年代英国人托尼·巴赞(Tony Buzan)(1999)创造的一种笔记方法。托尼·巴赞(1999)认为:传统的草拟和笔记方法有埋没关键词、不易记忆、浪费时间和不能有效的刺激大脑四大不利之处,而简洁、效率和积极的个人参与对成功的笔记有至关重要的作用。在草拟和笔记的办法成效越来越小的情况下,需要一种可以不断增多回报的办法,这种办法就是思维导图。尽管思维导图的初始目的只是为了改进笔记方法,它的作用和威力还是在日后的研究和应用中不断显现了出来,被广泛应用于个人、家庭、教育和企业。
托尼•巴赞认为思维导图是对发散性思维的表达,因此也是人类思维的自然功能。他认为思维导图是一种非常有用的图形技术,是打开大脑潜能的,可以应用于生活的各个方面,其改进后的学习能力和清晰的思维方式会改善人的行为表现。
(三)认知地图(Cognitive Maps)
认知地图也被称为因果图(Causal Maps),是由Ackerman & Eden(2001)提出的,它将“想法”(ideas)作为节点,并将其相互连接起来。想法不同于概念(concepts),它们大多是句子或段落。认知地图(Eden, 1988;Eden,1992)是以个体建构理论(Personal Construct Theory)为基础提出的,其中的“想法”都是通过带箭头的连接线连起来,但连接上没有连接词,连接线的隐含意思是“因果关系”或“导致”,且没有层次的限制。Cognitive Maps 用来帮助人们规划工作,促进小组的决策。
(四)语义网络(Semantic Networks)
在心理学中,语义网络被定义为词语或概念的语义相似性或相关程度。然而,Fisher(1990)将其定义为节点和连接组成的网络,有连接词但不严格限制在层次结构上。这样,语义网络更像概念图,而不像主流心理学和计算机科学中定义的那样。与概念图一样,语义网络以概念和有意义的、不受限的连接词为基础,形成基本的实例或命题。Fisher(2000)认为语义网络可以被看成多维的,而非二维的。语义网络可以非常大,包含成百上千的相互关联的概念。由于它非常大,使用者在某一时刻只能看到其中的一个部分,也就是与中心概念直接关联的概念。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。