基于知识图谱分阶模型的知识工程技术与应用
□文/史晓凌,谭培波
(北京智通云联科技有限公司,北京 100012)
北京智通云联科技有限公司执行总裁。国际TRIZ 三级专家。拥有近20年的创新方法与知识工程理论研究与实践经验,擅长业务体系及方法论构建,形成企业技术创新实施方法论DAOV,企业知识工程实施方法论DAPOSI,多年为企业提供数字化转型及智能业务构建的总体解决方案和落地实施。出版专著10部,拥有发明专利6项,获得省级科技进步二等奖。史晓凌
北京智通云联科技有限公司首席科学家。高级工程师、6sigma 黑带大师、MATRIZ 三级发明专家。长期从事卫星通信和移动通信技术研究和产品开发,近年来致力于知识工程、知识图谱、自然语言处理等技术的研究和实现,建立了独到的技术视角,并取得了良好的应用效果。谭培波
摘要:本文根据知识工程的工程逻辑和耗散结构理论的特征对比,确定了知识工程背后的理论基础——耗
散结构理论。通过对知识图谱的“图”和“谱”进行内涵解析,提出了知识图谱作为耗散结构理论落地工具的观点,并给出了知识图谱阶的定义,扩大了知识图谱
关于“谱”的内涵;最后,通过知识图谱阶在自然语言处理(NLP)领域和制造业领域的应用,
为知识图谱阶的深度应用展示了一个广阔的前景。关键词:知识工程;耗散结构理论;知识图谱;知识图谱阶
中图分类号:TP391 文献标志码:A 文章编号:2096-5036(2021)02-0089-11
DOI:10.16453/jki.ISSN2096-5036.2021.02.010
1 耗散结构理论是知识工程的理论基础
osi模型图片1.1 知识工程理论简介
传统的知识工程的概念是由美国斯坦福大学爱德华·费根鲍姆教授在1977年提出的,起初是人工智能的重要分支之一,通常也被叫做“专家系统”。费根鲍姆期待在机器智能与人类智慧(专家的知识经验)之间构建桥梁,搭建某种“专家系统”(一个已被赋予知识和才能的计算机程序),从而使这种程序所起到的作用达到专家的水平。简言之,专家系统是一种模拟人类专家解决领域问题的计算机程序系统。这个“
被赋予才能的计算机程序”在理解和翻译上有两个版本,推崇科学的英国人将其命名为“专家系统”,推崇技术的日本人将其翻译成“知识工程”。由此可知,传统的“知识工程”=“专家系统”=“知识+计算机程序”。
新一代的知识工程[1]被定义为:依托IT(信息技术),最大限度地实现信息关联和知识关联,并把关联的知识和信息作为企业智力资产,以人机交互的方式进行管理和利用,在使用中提升其价值,以此促进技术创新和管理创新,提升企业的核心竞争力,推动企业可持续发展的全部相关活动。
提到知识工程,还有一个经常被提及的概念,即知识管理(Knowledge Management,KM)。知识管理关注的是企业知识管理平台的搭建、知识体系的构建、知识的全生命周期管理,为各业务系统提供知识相关的服务;而知识工程(Knowledge Engineering,KE)是针对具体业务流程,识别需要的知识及时机,与知识管理平台建立获取和反哺知识的服务关系,提高业务绩效。
在实践中,知识工程强调在运营业务流程的过程中,如何获取知识、创造知识、积累知识,如图1所示,并在业务绩效中体现应用知识达到的效果。因此,知识工程是针对具体业务场景、目标性很强的知识辅助业务的活动;知识管理关注企业整体知识平台的搭建,包括知识的采集、存储、挖掘、模式提炼、共享交流,企业级知识的管理效率与效果评测,以及制度与文化的变革等。由
此可见,相比于知识管理,知识工程聚焦在
业务流程中一个个具体的创造价值的环节,
从知识管理平台中获取精准的所需的知识,
在运用过程中创造出新的知识,并将这些知
识返回到知识库中,纳入全生命周期的管理。
横纵叠加,使知识有效地支撑各阶段业务应
用,才能全面覆盖企业对于“知识资本”的
管理、应用、增值的需求。图1 知识管理与知识工程的关系
从企业的长远发展和总体协同角度看,知识管理和知识工程其实是不可分的。知识管理重在知识积累基础建设;知识工程重在联系业务实践提供知识支撑,这本身也是知识管理的最终目标。因此,也有人说,知识工程是知识管理的新阶段,或者知识管理是知识工程的初级阶段。
1.2 耗散结构理论简介
耗散结构理论[2,3]强调在远离平衡态的开放系统条件下,外部与内部系统不断进行能量交换,实现系统从无序向有序的发展。耗散结构理论是一个自然科学复杂系统理论,但是对个人与组织、内部与外部、守旧与创新之间的关系和互动具有很强的解释力。耗散结构理论最初由比利时科学家普利高津(Pirgogine)提出。在不违背热力学第二定律的基础上,耗散结构理论证明了系统在一定条件下可以实现从无序到有序的发展,强调了不可逆性是能量在自然发展变化中的重要建设性因素,耗散结构是一种物质结构形态,是一种普遍现象。形成耗散结构的基本条件包括四个方面。(1)系统必须是开放的。系统能够与外界自由地进行能量交换。开放的系统还具有自组织、等稳性等特点。
(2)远离平衡态。耗散结构没有固定形式。非平衡状态下,系统能量不断运动,才能形成有序的耗散结构。
(3)涨落。涨落是有序结构形成的内部诱因,能使系统离开原来的状态或轨道,类似于量变引起质变。在临界点的巨大涨落导致系统从不稳定状态跃迁到一个新的有序状态,也就是说,系统总体呈现高能量,当能量高到一定程度时,系统会呈现出新的状态,即耗散结构形成。
(4)非线性作用机制。它是形成耗散结构的充分条件。只有系统内部与外部相互作用,系统能量有效运行,才能实现系统的正常运转。
在远离平衡态的开放系统中,系统内部不断产生熵减。系统内部与外界能量不断进行交互作用,引入新
的负熵流。当系统内部的变化达到一定值域时发生涨落,内部能量有序运行,产生自组织现象,能量从原来无序的状态转变为有规律的周期性变化的状态,这种非平衡有序结构被称为耗散结构。耗散结构理论广泛应用于各个领域中。任何生物都是一种远离平衡态的高度开放系统,需要不断与周围环境进行物质和能量的交换,只有新陈代谢才能维持其生命。也就是说,生命本身就是一种耗散结构。
1.3 基于耗散结构的知识工程
对于企业而言,其数字系统的发展演化路径如图2所示。最早是以数据库查询为基础的数据平台,查询效率低,需要选择字段并且精确匹配;之后,数字系统进化为信
息系统,其中最大的改变是用搜索取代了查询;经过多年建设,企业基本上都已经建立企业内部的各种信息系统。现在企业要建立的数字系统本质上都是知识系统,因为它的起点是信息系统。知识系统的典型使用方法是推荐,其基本特点是通过对象在时间和空间域的轨迹,挖掘对象知识,给对象进行画像,即多维度描述,然后向对象进行精确的知识推荐,以克服类似搜索要通过大量浏览才能获得想要的知识的弊病,解决信息过载的问题。知识系统往往会和自动系统混淆。二者的区别在于,自动系统描述的是物的规律,而知识系统描述的是人的认识,因为只有人才有知识。既然知识与人相关,人工智能技术必然是构建知识系统的必备的核心技术,而且由于人对世界的认知是不断深入和发展的,一个知识系统也会与人一样,有一个不断学习进步的环节。按照“数据-信息-知识-智慧”模型,智慧层主要是一些决策系
统。它研究问题的层次和范围会超越系统本身,对比在软件领域的层次模型,属于第5级引领级。图3给出了典型知识推荐系统和耗散结构4个特征之间的对比。可以看出,构建知识系统的过程就是实现复杂系统远离平衡态耗散结构的过程。从热力学物质层面看,就是将热力学参数PVTn(压力、体积、温度、物质成分)中的n 改变了,加入了系统以外的超系统物质,因此将改变系统的相态,形成新的有序的相态结构,即耗散结构。知识工程或者构建知识平台的过程就是一个耗散结构理论实践的过程,即将系统外部因素纳入系统内部,并深刻改变系统内部各部分之间的结构和强度,从而形成一个新的稳定结构的过程。2 知识图谱是耗散结构理论在知识工程中的落地工具2.1 对知识图谱的认识知识图谱是谷歌2012年确定的关于用图的方式对知识进行组织的一种形式,但知
图
2 数字系统演化路径图
3 典型推荐系统与耗散结构的对比
识图谱的前身有一个漫长的发展演化历史,最早可以追溯到公元前的本体论。中文语境里讲的“知识图谱”和谷歌的“Knowledge Graph”是不同的。谷歌无论从它应用的方面或者文字解释,主要讲的是实体之间的关联关系,目的是从一个实体带出另外一个实体。中文知识图谱中的“图”和
“谱”是分开的,如图4所示。
其中,“图”是人们对现实事物的描述,而“谱”是对现实描述
之外的意义的探索。比如,人们看见的散射光是杂乱无章的,但是用棱镜看它的光谱,却呈现出标准的正态分布。所以,知识图谱体现了从无序到有序的变换,这和复杂系统的思想是完全一致的。
中文的知识图谱中,“图”是对实体关系的描述,更倾向于实体世界;而“谱”是对整体性能的探求,完全属于抽象世界,是人们认识世界的知识。因此,知识图谱也表达了人们认识世界的过程。例如,手机摔坏的方式各式各样,但是分布模式只有几种,这种无序当中的有序,就是“谱”的现实体现。在中国人的话语中,“谱”本身就被赋予了可靠、秩序等内涵,比如“靠谱”“有谱”“曲谱”等词语。所以,追求“图”背后的“谱”是一种中国人独有的思维定势。
2.2 知识图谱与耗散结构理论
知识图谱是耗散结构理论在实际中落地的工具,知识图谱中的“图”表示了系统的构成,“谱”即是系统的不同相态。类比于有限元分析,知识图谱中的“图”是一块横梁的剖分,可以根据需要在边界和中心加细;而模态分析就是知识图谱中的“谱”的意义,也是耗散结构中的结构特点。耗散结构主要是从可见的形状视角描述系统的“谱”分布,或者系统的相态分布。还是类比于有限元,在静态的图结构模态分析中,连接剖分单元之间关系的是一个2阶偏微分方程。从整体上看,结构分析是一个2阶数学物理方程,而其模态分析就是2阶偏微分方程的定态分析。将知识图谱类比于有限元的耗散结构分析,其思维要点在于,
任何知识图谱中的图网络都等效为一个有限元的剖分,我们所看见的各种关系都有可能对应着2阶关系或者n 阶关系,因此,任何知识图谱的背后都对应着一个耗散结构。我们要突破的是线性思维,即把知识图谱中的图网络看成单纯的实体相连。我们要看到图谱背后可能不仅是单纯的线性关系,更有可能是复杂的2阶关系,甚至高阶非线性关系。例如,互联网将世界
图
4 对中文知识图谱的理解示意图
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论