基于语料库的同义词持续连续的辨析
作者:伊淑娟
来源:《青年文学家》2015年第17
        要:文章以同义词持续连续为例,通过使用语料库,运用搭配理论和语义韵理论,展示了语料库技术在同义词辨析方面的重要作用。
        关键词:语料库;同义词辨析;持续;连续
        作者简介:伊淑娟,1987年生,山东菏泽人,扬州大学文学院,硕士研究生。
        [中图分类号]H136 [文献标识码]A
        [文章编号]1002-21392015-17--01
        关于同义词辨析,传统方法是借助于同义词辨析词典等参考书,这一方法的缺点在于:举例不充分,阐述难理解。随着计算机技术的突飞猛进,大型语料库的建立为同义词辨析提供了新的方法和途径。
        一、语料库在词汇研究中的运用
        (一)语料库的运用
        语料库就是一定规模的真实语言样本的集合,有三个特性:一是收入语料库的语言材料应当取自真实文本;二是语料库应是机器可识别和读取的;三是语言材料经过适当标注和加工处理。通过对语料库检索统计,可以发现同义词在不同语域中的词频分布差异,计算出词语搭配的相互信息值,通过观察检索行中所呈现的同义词搭配特征,就能揭示出它们不同的类联结、搭配关系和语义韵等语言特征。
        (二)相关理论
        1.搭配理论
        “所谓搭配关系,就是指词与词之间的横组合关系,即什么词经常与什么词组合在一起。词的意义在特定的搭配关系中常常具有特定的意义。搭配指个别词项之间习惯性的同现。例如作名词时与搭配,作动词时与搭配。搭配通常分为词汇搭配和语法搭配。词汇搭配存在于名词、动词、形容词和副词之间的搭配关系中,如我们常说
,而不说喝面,因为根据的词义,与特征比较匹配。
        2.语义韵理论
        一定的词项会习惯性地吸引某一类具有相同语义特点的词项,构成搭配。由于这些具有相同语义特点的词项与关键词项在文本中高频共现,后者就被传染上了有关的语义特点,整个语境内就因此弥漫了某种语义氛围,这就是语义韵。
        二、持续在语料库中的搭配考察
        选定国家语委现代汉语语料库作为考察数据,因为它语料规模很大,时间跨度大,语料收录广泛,是一个大型通用的现代汉语平衡语料库;同时在数据处理功能上,完成了词语切分和词性标注。
        (一)持续的搭配情况
        在语料库中收集并整理得到有效语料700例,持续后面的搭配词语可分为三类:形容词、动词和名词,另有个别词项为副词和助词以及零搭配等。这样得到持续的搭配情况:持续+VP”持续+NP”持续+AP”
        1.持续+VP
        在这一情况中,“VP”主要有性状动词、动作动词、趋向动词和关系动词。其中性状动词所占比例最高,出现频率最高的是发展一词,其他如增长、不降、不退、振兴、好转、贬值等表事物变化或消失义的动词。其次是动作动词,如及物动词开发、保护等,不及物动词循环、创新等。
        2.持续+NP
        在这一情况中,持续与表时间的名词的搭配占绝对比例,高达77%。如持续(一定/很长//一段)时间持续时间+(为/可达)+数量时间名词持续时间+(比较///也)+/等等。
        3.持续+AP
        在这一情况中,持续借助其他成分限制或修饰后面的词语,如持续(偏/走)+,这类词语大多是性质形容词,如高涨、异常等。字符常量与字符串常量的区别
        (二)持续搭配词的语义彩倾向
        通过研究发现,持续的语义韵呈现中性倾向。其搭配词语多表示中性彩和积极彩。在VP类词语中,语义韵呈现积极倾向,如振兴、发展等;在NP类词语中,语义韵呈现中性倾向,因为NP中占绝对比例的表示时间类的词都是中性词,属于客观反映。
        三、连续的语料库考察
        (一)连续的搭配情况
        在语料库中收集并经过整理得到有效语料771例。连续的搭配词语主要是动词和名词,形容词只有4例。另有个别搭配词项为助词、零搭配和后接成分等。这样得到连续的搭配情况:连续+VP”连续+NP”
        1.连续+VP
        在这一搭配中,“VP”主要有性状动词、动作动词和关系动词等几类。其中动作动词所占比例最高,以及物动词为主,如观测、出现等。
        2.连续+NP
        在这一搭配中,名词性成分可以分为三类:时间类、专名类、普通类。时间类NP可做状语、定语或谓语,如连续几天、连续多年等。专名类主要是指连续后接名词属于专业术语,如~函数、~点属于数学术语,~介质属于物理术语等。普通类NP以抽象名词为典型搭配,如低温、生活等。
        (二)连续搭配词的语义彩倾向
        经研究,在VP类词语中,语义韵呈现中性倾向,如观测、出现;在NP类词语中,语义韵亦然,因为NP中占绝大多数的时间类和专名类词全部为中性词,属于客观反映。总的看来,在连续的搭配情况中,近绝大部分的词都呈中性彩。
        四、结语
        用语料库进行搭配分析提供了一种新颖直观的同义词辨析方法,经研究,持续连续在搭配形式和语义韵特征上都存在差异。持续可以搭配动词性、名词性和形容词性成分,而连续后面却不能搭配形容词性成分;与持续搭配的词语有中性倾向和积极倾向,而与连续搭配的词语只有中性倾向。
        参考文献:
        [1] 杨节之.语料库搭配检索与英语同义词辨析[J].外语电化教学,2007116
        [2] 翟红华,方红秀.国内语义韵研究综述[J].山东外语教学,20092
        [3] 杨岩勇.基于语料库的同义词辨析[D].广州:暨南大学硕士学位论文,20075
        [4] 王文斌.英语词汇语义学[M].杭州:浙江教育出版社,2001
        [5] 卫乃兴.语料库数据驱动的专业文本语义韵研究[J].现代外语,20022

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。