•业务研究
第39卷第4期2024年4月
非物质文化遗产知识本体构建
----以赫哲族非遗资源为例
何春雨',滕春娥2
(1.牡丹江师范学院历史与文化学院,黑龙江牡丹江157011;
2.牡丹江师范学院图书馆,黑龙江牡丹江157011)
摘要:【目的/意义】数字化是重要的保护方法和手段,在非遗数字化保护工作中,通过引入知识本体和数据关联技术,使非遗资源形成结构化的语义知识单元,最终可以实现非遗资源的检索、可视化与知识概念共享」方法/过程】应用知识本体的理论与技术方法,构建非遗领域概念模型,确定这一领域的概念集合和关系,结合元数据的信息组织形式,对各种形态的非遗数字资源对象进行规范描述,并釆用语义网技术,建立非遗资源知识间的关联。为非遗资源的有序组织与揭示提供参考。【结果/结论]建立赫哲族非物质文化遗产资源本体库,通过实例添加,实现赫哲族非遗资源数字化存储,有利于文化的传播和传承,也为其
他非遗资源的数字化保护提供参考和借鉴。【创新/局限】本文创造性地将本体理论以语义网的手段应用于非物质文化遗产资源研究,并构建了知识本体库模型;不足之处在于该本体库模型尚未得到实践运用和推广。
关键词:非物质文化遗产;本体技术;数据关联;语义网;赫哲族
中图分类号:G254DOI:10」3833/j.issn.1007-7634.2021.04.019
1引言
文化是人类生活的反映,是社会性的历史传承,是人类活动的记录和沉淀,科学技术为文化的创造和发展提供了物质基础。非物质文化遗产是优秀的传统文化,近些年来国内外学者不断地探索新的保护方法,同时更多的研究者也逐渐认识到,除了保护非遗文化,它的利用与传播也应该得到重视。在保护与传承非遗文化过程中,不断加强与科技的融合,运用现代化的技术和手段,知识本体技术就是在这样的情况下,不断地被移植与应用到非物质文化遗产保护与传播中。上世纪90年代,本体概念被引入图情与人工智能等领域,通过本体构建,可以更有效地组织并精确地提供给利用者所需的信息,并且基于特定领域的知识本体具有重用性,这为研究者极大地节省了时间,同时还可以根据资源的变化,以及构建的需要随时更新、调整本体的对象、属性和关系。本文在综述国内外非物质文化遗产知识本体研究现状基础上,以赫哲族非物质文化遗产为例,通过构建非遗领域知识本体,进行非遗资源数字化保护与传承研
究。
2国内外文献回顾
近年来,非物质文化遗产(以下简称“非遗”)的研究开始逐渐转移到非遗信息资源的分类、组织、检索等多种层面.利用本体技术及相关理论对非遗资源进行组织和语义揭示成为国内外学者共同关注的焦点“。国外学者对非遗资源本体的研究早期多关注利用本体技术构建非遗资源存储亠”、基于本体的非遗资源可视化等。近年来自然语言处理(NLP)、Web语义技术等跨学科领域的技术也开始应用在非遗资源本体构建研究中。例如,Dou等根据非遗资源的特征,基于非遗领域本体模型和自然语言处理技术从大量非遗文本资源中提取领域知识,建立了非遗资源本体库,为非遗知识管理和知识服务提供了帮助3。Chantas等提出了基于多实体贝叶斯网络(MEBN)的概率本体论框架,通过示例数据和训练来获取显式知识表示,并进行实验证明了所提出框架的有效性切。Stapleton等研究了自动化系统在文化遗产保护中的应用,并提出了一项机器可读的本体模型,将XML 的伪像属性进行编码以链接到本体中,用于对非遗资源进行描述161o Isa等使用访谈和观察技术进行知识获取.通过本体对非遗资源进行知识表示,促进了非遗资源的数字保存和分享E。Nafis等在比较分析非遗主要本体的基础上,提出了一套用于管理摩洛哥非遗数据的系统,使用Web语义技术对非遗资源进行描述、处理和利用曲。
蔡璐等从系统论的角度出发,分析了非遗资源5大基本因素(主体、客体、过程、成果和环境)所涉及的资源对象,应用本体论构建了非遗本体概念模型,并结合元数据对各种形
收稿日期:2020-07-05
基金项目:黑龙江省社哲项目“基于非物质文化遗产建档保护的赫哲族文化传承研究"(19TQB072)
作者简介:何春雨(1975-),男,副教授,博士,主要从事少数民嗾文化产业研究;滕春娥(1982-),女,副研究馆员,博士,主要从事非遗档案保护、档案文化研究.
140-
第39卷第4期2024年4月
态的非遗数字资源对象进行了规范描述切。黄永等对非遗知识本体构建的关键问题如领域数据集构建、本体标注、本体关联、可视化等进行了研究,构建了面向文本和多媒体数据的非遗知识本体库临。滕春娥等基于本体理论构建了非遗资源本体构建模型,对赫哲族非物质文化遗产资源进行了知识组织和整合问。侯西龙等构建了非遗视频语音标注的本体模型,以民俗类非遗项目“那西七夕”中的视频资源为研究对象进行了实例研究3。除了利用本体技术和理论构建非遗资源本体模型外,随着关联数据技术的发展和关联开放数据集的逐年增长,将本体与关联数据技术结合进行非遗资源组织与管理的研究也得到了学界的关注。董坤提岀了一个基于关联数据的非遗资源语义组织框架,实现了非遗资源知识元及其关联关系的语义化描述"“。翟姗姗等从信息空间理论出发,通过知识本体进行数字资源内容的语义表达,并利
用关联数据技术实现知识单元间的有效链接,最终实现非遗知识的可视化表达问。谈国新等将本体模型与我国非遗资源的特征相结合,构建了非遗多媒体资源本体模型及资源语义描述层级,并对瑶族非遗项目“度戒”进行了语义组织和关联数据发布的实例研究匈。侯西龙等在梳理非遗领域知识要素和语义关系的基础上,基于本体和关联数据技术设计了非遗知识本体模型,探究了非遗知识组织与关联数据集构建的过程,最后结合湖北省的非遗项目数据资源,构建了非遗知识关联数据集与知识服务平台⑴。
国外关于非遗资源本体的研究除了基于本体论和相关技术构建模型对非遗资源进行组织和管理外,还结合自然语言处理、自动化系统、Web语义技术等对非遗资源本体构建提供了新的研究视角和理论基础。国内关于非遗资源本体的研究主要是对非遗资源进行本体构建和语义表达的研究,将本体和关联数据技术融合到模型构建中,进行非遗资源的组织、聚合和语义描述等,并通过某一非遗项目数据进行实例研究。国内外研究的共同点是均针对某一特定领域或特定非遗项目进行本体模型的设计和构建,并最终通过实例来证明所提出模型的有效性和实用性。相比之下,国外在跨领域技术融合方面的研究要领先于国内,研究内容也较为多样。虽然目前国内外学界在研究成果方面提出了许多具有实际应用价值的模型,但是研究者多从某一具体应用角度或范畴岀发进行本体模型的设计和构建,并未充分考虑到非遗资源的内外关系以及建立相互关联的非遗资源网络,进而未能形成适用于非遗资源本体研究的系统性规范和标准化模型。
3非遗资源领域本体构建
3.1非遗本体构建流程
(1)确立非遗资源领域知识概念集。首先对该领域专家进行访谈,对该领域知识进行搜集整理,根据专家的建议确定该领域的元概念,概念应不仅仅局限于领域内的知识,更应将其内涵与外延相关概念融入其中。对收集的概念进行结构化分析,使得知识信息具有结构化特征,可实现后续的本体快速建模和管理。
(2)实现概念间的知识再组织并将其结构可视化。在概念确定并进行结构化分析后,用图表的方式将概念和关系表示出来,概念和关系主要包括事物、属性和规则,构建领域知识关系模型,此模型已改传统的树型数据结构转而成为交叉渗透的网状结构,网状的知识模型体系具有更强的可视化性,以便于关系的查询和表达。
(3)用计算机软件实现知识关联模型构建。据文献了解,国外已经出现很多较为成熟的软件,但由于protege可免费获取,操作简单易于上手,因此目前被广泛地作为本体开发工具。用此软件将本体论模型通过元数据对知识进行描述,便于机器识别和处理,形成可用于检索的资源系统。将本体论系统地应用于非遗信息资源组织,建立基于本体的多源异构信息资源组织体系,形成事件、时间、机构、人物、事物、非遗项目等要素组成的多维度的有机整体,改变当前非遗资源知识组织体系单一直线性的弊端。本文构建了非物质文化遗产资源本体构建模型(见图1),以供其他特资源数字化共建和共享。
翔域知讲______________________
樂建模~~~-I I知识備进知识收集知识存储•知处理1
本体构建-i
栋定女]「水稠打[水祥矣谈| I
I倔应可|及桂宙文[(■玄尿注|Wi註||关皿协矗]「斤祖薙)I 集铳女現-----------------------------------'------------—
—一一
I町视化
!"閱
;资源共字
图1非遗本体建构功能模型
Figure1Functional model of intangible cultural heritage ontology construction
目前本体构建还没有形成一致的标准和原则,但现有的研究者提出的标准和原则也起到一定的借鉴意义。Gruber 提出5项标准:明确性:它要求本体能够充分表达概念的内在含义。可以使用人类自然语言来描述,能够客观、完整,并且独立存在于特定的环境。一致性:本体是一个知识库框架,由某个领域内的核心概念所组织起来,并且这些核心概念之间存在特定的关联关系,以便在本体推理中保证推理结果的正确性。而且还要与本体概念本身具有一致性。可扩展性是指本体构建要能够具有不断修正和逐步改进的特点,在本体知识库设计之初,就应该考虑系统可以在保持原来概念稳定的基础上,扩展现有概念体系,保证知识的同步更新。最小编码性是不同类型的编码用于描述特定领域的知识,最终实现知识概念的共享。因此本体构建时应该独立于编码语言。最小承诺:在构建某一领域本体时,要尽量减少约束设置。简而言之.遵循上述五项原则将有利于构建规范
141
INFORMATION SCIENCE
Vol.39,No.4
April,2021
• Profession Research •
的领域本体。
由于领域本体的构建标准还没有统一,因此本体构建方
法也各不相同,较为成熟的本体构建方法有IDEF -5法、 TO V E 企业建模法、Methodolody 法、循环获取法、七步法和
Skeletal Methodolody 骨架法。上述方法很大程度上为本体
的构建奠定了坚实的基础,综合以上方法的优势,鉴于七步 法具有最强的本体建模表达能力,并被广泛应用于本体建模
中,具有较强的成熟性和普适性,确定了本文所要建构的非 遗领域本体知识组织方法为七步法。本文在七步法的基础 上将本体构建的步骤总结归纳为三个方面,具体见图2。
第•阶段第:阶段第[阶段
确宦慨念
建工模熨软件建模
《确定领域元r
(领城知识的A (图形化模堂的计
知识)
图形化表示)據机谱育表达)
图2本体构建具体步骤
Figure 2 Specific steps of ontology construction
本文根据非遗档案资源的特点,以及自身学科的特点, 选择比较易用、相对操作简单的本体构建工具protGgG 作为非 遗资源本体构建工具。protggg 是由斯坦福大学研究中心基 于java 语言开发的软件,它能够免费下载和使用,支持多种 文件输出格式,如XML.RDF (S ) .OWL,等。protGgG 作为一
个拥有友好人机界面和友好插件的本体建模工具,操作者可
无需掌握本体的描述语言,只需要在概念层面构建领域本体 就可以。它提供了领域本体中的概念类、属性、实例和规则
的构建,特点如下:它是开放源代码,并且采用图形化的界 面,功能分区也比较明确.具有较好的可扩展性,还可以执行 一系列特殊的功能,如推理、提问等。因此本文利用protege
来构建非物质文化遗产领域本体。 3.2非遗资源核心概念体系的确定
本文进行非遗资源领域本体建模时,在选择需要建立的
本体领域和范畴后,分析了该领域本体构建的可行性,通过
领域专家的把关,再对该领域本体中的重要概念术语进行定
义,并列出中心类及其子类,并定义类的属性。本文在非遗
领域本体构建、概念、类、属性及其关系等各方面参考了国际
博物馆理事会所开发的概念参考模型(CIDOC Conceptual
Reference Model ,简称CICOC CRM )0
领域本体是兼具开放性、多服务集成的系统,它将某一 领域的概念通过语义描述,转化为机器可以识别的概念规范
和说明,做到了基于语义层次上知识级别的信息描述。在非
物质文化遗产资源数字化过程中,领域本体技术的应用能够
实现基于语义层面的非遗资源核心概念集的描述,以及实体
和概念间关系的表达,并且能够描述非遗资源中实体以及相
免费资源网站源码下载关的信息,最终建立非遗知识本体库,实现跨领域的概念模
型共享,消除语义差异,使多元异构的非遗资源提供更好的 方法和标准用以开展资源整合、组织、检索工作。根据非遗
资源的特点,其核心类包括:非物质文化遗产项目及人物、机 构、事件、文献、事物等,实例之间关联关系通过类属性来揭
示(如图3所示)。非物质文化遗产项目:由国际及国家、省
(市)级认定,具有非物质文化遗产知识特征的项目都可列人
其中叫
非遗资源本体构建过程中仅仅定义类还不能真正描述 专业领域,需要进一步对类的内部结构进行描述,即类的属
性,它分为对象属性和数据属性。对象属性是类间的关系的
描述,类内的实例遵从类的对象属性。数据属性是对类的个
体数值特征的描述,每个属性都有不同的类型,通常包括文
crinrhasTitlc
rdf •hanBordrrTcrm
「nrhodole
gn :
eveni :p!arp
foaf
era:isi dent ificdBy
cr® isIdentificdBy gn:n1t<?rnnt • vr-ria»<rvrm • t !
tim1: cr •:fftl Hit rhin r«1f • t yp<>
event : suhi'venT tUaf :depict
<
.
if' cdBy
cr®
gn:p»»pulat ion
event :factor foaf :organizat £ on
rr ■: endlstjuai if
cm label
go :(><►» ttt 1( \»dc
I thi f r»h«*ri t F ro*gn :nefRhbour
ich:inhcritTo
图3非遗资源核心概念体系图阳
Figure 3 Core Conceptual System Map of Intangible Cultural Heritage Resources 1181
142
一
第39卷第4期2024年4月
表1赫哲族非物质文化遗产分类
Table1Classification of Intangible Cultural Heritage of Hezhen Nationality
分类内容举例
口头传说特仑固(历史传说、神话)《七兄弟》《赫哲人与老虎》说胡力(故事)《一双鱼皮靴子》《叉鱼能手莫尔髙》伊玛堪(说唱文学)《满格木莫日根》《什尔达鲁莫日根》
表演艺术
嫁令阔(民歌)《迁徙歌》《开江渔歌》阿康布勒(舞蹈)天鹅舞、萨满舞乐器手鼓、腰铃
风俗捉雀求子意识、跳神治病
社会风俗、礼仪、节
庆
礼仪婚礼、葬礼
节庆乌日贡大会、温吉尼跳鹿神、河灯节游艺、体育、竞技叉鱼赛、角力、玩嘎啦哈、叉草球、摔跤食鱼杀生鱼、烤鱼片
传统手工技艺
鱼皮制作技艺自皮衣、鱼皮画桦树皮制作技艺船、箱子
本值、数值、布尔值等多种类型,类内的实例也要遵从类的数据属性。
构建非遗信息资源的重要组成是非遗信息资源的规范化和标准化的语义描述,而客观精确的语义分析与元数据描述是保证非遗资源科学有序和检索利用的关键步骤。非遗资源的语义描述就是对非遗资源核心概念和属性的客观呈现,它根据本体描述的语言与设置的规则转化和存储非遗数据,最终建立一定的形式结构。由于OWL描述语言具有丰富的语义表达和良好的逻辑推理能力,它能够描述资源之间更多的语义关系,并成为许多可用本体表述语言中使用最广泛的本体描述语言。本文中使用作为子语言的0WL-DL,本体主要由三个元素组成:类、属性和个体,对应于描述逻辑中的实体、属性和实例.OWL-DL的关系描述如图4所示。
|口对象属性|
|口数据属性|
|◊牛体B|
图4OWL-DL本体模型架构
Figure4OWL—DL ontology model architecture
3.3非遗资源的语义化组织框架
本研究提出非遗资源语义整合框架,从静态、动态、时空等多个方面将非遗表现形式与其所处的文化空间知识内容进行整合,并利用关联数据发布技术来实现对非遗丰富知识元及其关联关系的发布与展示。该框架从下至上分为四个层次:源数据层、语义层、数据关联层与应用层。
源数据层是非遗信息资源涵盖的包括知识在内的各种信息.源数据的知识数据是最原始的信息表达形式,其所处的形态包括:档案资料在内的文档文件、网页信息、口头语言等。这一阶段为上层信息处理层提供了基础的数据支持,是本体等相关技术对非遗资源进行知识提取的基础,有利于知识检索和知识的传承工作。语义层将源数据层数据进行本体资源的RI)F化,根据非遗概念本体模型对异构源数据进行知
识和关系的提炼,并将其转换为RDF格式的语义元数据。数据关联层利用关联数据发布技术,将基于语义本体构建的RDF元数据关联到语义层,并将非遗相关资源作为一个有机整体进行发布。沿着RDF链接访问其他资源可提供上层语义的统一视图。应用层基于数据关联层的知识组织结构,开发实现上层的各项语义应用服务功能,如语义检索、可视化语义知识地图、知识推理与发现等应用服务阿。
3.4实例添加与信息发布
它可以通过一定的实例添加,基于上面提出的非遗资源语义组织框架及非遗元数据本体.对应于非遗资源Tbox创建非遗资源实例库,即Abox构建。具体实例内容包含非遗内容介绍、地理位置信息、传承人信息、事物信息等,实例构建的方法主要是利用在线映射来实现非遗数据的RDF及OWL化,借助于关系数据库存储非遗信息,基于D2RQ平台实现关联数据库和RDF关联数据的语义映射,最终将关联数据库作为关联数据发布并提供语义査询检索接口。
4赫哲族非物质文化遗产资源知识本体构建
4.1赫哲族非物质文化遗产项目
在中国国家级别的非遗名录中,非物质文化遗产分为民间文学、民间音乐、民间舞蹈、传统戏剧、间艺术、杂技和竞赛、民间艺术、传统手工艺、传统医学、民俗风情等"%赫哲族非物质文化遗产主要体现在以下几个方面:口头传说,表演艺术,社会风俗、礼仪、节庆,传统手工技艺等(参见表
143
-
INFORMATION SCIENCE
Vol.39,No.4April,2021
・Profession Research•
表2赫哲族非遗资源知识组织概念属性及核心元素表
Table2Concept attributes and core elements of knowledge organization of intangible cultural heritage resources of the Hezhen people
非遗知识概念核心元素
非遗项目项目名称、项目负责人、遗产级别、遗产类别、分布区域、基本内容、濒危状况
人物人物名称、人物基本信息、人物描述、人物类型、归属机构
机构机构名称、机构责任者、机构描述、机构类型、机构关系
事物名称、责任者、主题、现状描述、形式描述、保存历史、创作日期、时空范围
事件事件发生的时间、起因、经过、结果文献以(数字化的文本音视频、图像)参见《中国数字图书馆标准规范专门数字化对象描述元数据规范》
Do赫哲族非物质文化遗产项目分为世界级、国家级、省级三个层级。
本研究基于本体理论和方法,以黑龙江地区赫哲族非遗资源为例,对其非遗资源知识和属性进行定义,通过元数据的语义描述,最终通过添加实例,从而全方位地揭示出非遗资源知识内容及其相互关系。通过计算机识别语言更好地实现赫哲族非物质文化遗产组成要素间关系的描述和揭示,达到资源的有序组织和整合,实现资源保护和共享。
4.2赫哲族非遗领域本体元数据及核心元素的确定
赫哲族文化独具特,其非物质文化遗产本体构建借鉴国内外文化遗产比较成熟的本体方案,根据赫哲族非遗资源的特点确定以下几大中心类:赫哲族非物质文化遗产项目及人物、机构、事件、文献、事物等核心概念类,类与类之间的关系以及类与数据之间的关系通过对象属性和数据属性来确定,并由隶属于类的实例无条件继承(见表2)。
:_____________________________________________________________、-―[■----------------舷-----------.1 I1!!
rtitl:M阿Bt::itt|
-------------—V I
:.........…
…保护,传駄研克、传播----------I I被使用、展现I
I保护、传承、研凡传播-「------产出-I
I--一」「1
邢霸W化《釦讯二△觀」応构:
___J F一I I1——牛:产创作-
(—锡干一-«f-...........
,I―■]I I凶超」[OJC;|
二二D
图5赫哲族非物质文化遗产概念属性
Figure5Conceptual attributes of the intangible cultural heritage of the Hezhen nationality
赫哲非物质文化遗产项目由国际及国家、省(市)级认定的,并且该民族中具有非物质文化遗产知识特
征的项目均列入其中,构成了赫哲族非物质文化遗产领域本体。本文没有将时间段、位置类作为赫哲族非遗知识组织的核心要素,而是假定如果将核心概念类视为纬度,那么这两类将作为经度贯穿于其他类中,对实例起到限定和约束的作用何(见图5)。4.3赫哲族非遗档案知识概念属性关系的建立
确定了赫哲族非遗组织本体概念后,需要确定每一概念属性的核心元素,核心元素的确立有利于更好地描述和揭示概念间相互的联系以及诸多非遗知识间的关联。根据非遗领域相关资源类型确立采用的元数据标准并结合核心元数据(简称DC)确定每个概念属性的核心元素集,这些元素集往往是其父类的关键词集合,是赫哲族非遗本体中心类下的关键子类(参见表3)。
4.4赫哲族非遗档案资源实例添加
对赫哲族非物质文化遗产信息资源进行组织的过程,不仅仅是建立一个知识资源存贮的数据结构,更重要的是,它揭示了非遗信息资源的内在联系和丰富知识关联,有助于知识的保护、传播和共享。在定义了类和属性之后,需要根据具体的赫哲族非物质文化遗产档案资源实例进行实例分析,并将其分类使其归属于适合的类,并且无条件继承类的各种属性。如此,实例与实例之间,实例与数据之间即添加了对应的语义关系来形成实例之间的语义网络。本文构建了一个赫哲非物质文化遗产资源的一个实例。基于以上赫哲族非物质文化遗产资源的概念确定及关系属性、数据属性的确定,建立起各类层级结构关系模型,利用计算机知识本体开发工具protege,利用元数据标准和规范进行语义描述,以可视化界面的形式将其展现并进行人机交互,最终实现赫哲族非物质文化遗产领域本体构建(如图7所示)。
4.5赫哲族非遗档案资源本体protege实现
对赫哲族非物质文化遗产进行了分类分析,确定了事件、事物、人物(包括子类传承人和民间艺人)、位置、文献、时间段、机构和项目八大中心类,在protggG的建模如图6所示,几乎所有赫哲族非物质文化遗产的知识条目,均可以从中抽离出以上关键词对应于以上八大中心类,因此本文认为这八大中心类可以完整地描述赫哲族非物质文化遗产的相关知识。
赫哲族非物质文化遗产本体对象属性如图7左边所示,产出、传播、保护、参与、展现、生产创作、研究、管理、被利用和限定为赫哲族非物质文化遗产本体中主要的几大关系属
144一
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论