基于语料库的同义词组辨析r——以adhere to,cling to,hold to为例
赵杭飞
【摘 要】作为新的语言研究方法,语料库语言学对于语言研究影响重大,基于语料库的研究也已在多个领域得到广泛应用,然而对同义词组的研究甚少.本文借助美国当代英语语料库(COCA)从词频、语域、搭配以及语义韵四方面比较区分同义词组adhere to,cling to,hold to的用法,旨在帮助英语学习者区分这三个词组的含义及用法,以期对教学及词典编纂提供有益借鉴.
【期刊名称】《湖州师范学院学报》
【年(卷),期】2016(038)003
【总页数】6页(P102-107)
【关键词】COCA语料库;同义词组;词频;语域;搭配;语义韵
【作 者】赵杭飞
【作者单位】杭州师范大学 外国语学院,浙江 杭州 311200
【正文语种】represent的用法中 文
【中图分类】H315
《现代汉语词典》[1](P1265)里的同义词释义为“意义相同或相近的词,如‘教室’和‘课堂’,‘保护’和‘保卫’,‘巨大’和‘宏大’”,近义词[2](P121)则属于“广义上的同义词”,两者均可译为synonym。因此,本文在此不深究这两个词的含义,且根据国内现有研究,统一为“同义词”加以讨论。在知网上以“近/同义词”为关键词,我们可以发现2009-2014年的各类期刊上已出现大量有关基于语料库的同义词辨析研究,国内研究语种主要涉及汉语和英语[3][4][5],研究词性涉及动词(suspect/doubt,adapt/adjust,confused/puzzled 等)、副词(specially/particularly/especially,rather/quite等)、形容词(great/large/huge,mall/little等)、名词(event/affair,convention/regulation等),国外研究情况大致相同,但涉及语种更多,如俄语、西班牙语等[6][7]。然而,由于现代英语同义词组复杂多变,学术界对于phrase的界定仍存有分歧,对英语词组的研究还未形成一定规模[8](P60),因此,国内外少有对同义词组的辨析研究。虽然国内已出现对同义词组辨析的初步探索[9],但其分析不够全面。
计算机的普及和语料库语言学的快速发展,为辨析同义词组提供了新的研究方法。语料库语言
学的重要任务之一为如何在此基础上,结合描写与实证分析,定性研究与定量研究来充分解释语言现象[10](P8)。美国当代英语语料库(Corpus of Contemporary of American English,简称COCA)是当今世界上最大的在线免费英语平衡语料库。由于定期更新,目前其语料年限为1990-2012年,单词容量已超4.5亿,适合观察美国英语使用和变化。它具备了一个好语料库的三项最基本条件:规模(size)、速度(speed)、词性标注(annotation)[11](P27)。总之,该语料库检索功能强大,有助于语言学习者和语言学家了解单词、短语及句子结构等相关信息。基于语料库的同义词组分析对于发现同义词组的具体用法意义重大。本文旨在分析英语中三个常见的同义词组adhere to,cling to和hold to。这三个词组可用中文译为“坚持”,但是在用法上却有细微的差别。该文利用COCA检索工具分析三个同义词组的不同用法,对比词典释义,从而对英语教学和语言学习甚至词典编纂有所启发。
国内现有的相对权威的英语词典或同义词辨析词典虽有给出较详细的辨析,并提供相应的例句,但限于篇幅原因,有些会以词组形式简单代替同义词的辨析,同义词组的全方面辨析则更少。如英语教辅书对三者的区分为“hold to后接名词或从句作宾语,不接不定式,意为‘(使)遵循’,‘坚持’,‘忠于’,与adhere to,cling to差异很小,一般可通用。hold to更常用。”[12]作为权威的英语学习工具书,《新牛津英汉双解大词典》[13]给出如下定义:
adhere to:stick fast to/believe in and follow the practices of/represent truthfully and in detail.
cling to:(of a person or animal)hold on tightly to/adhere or stick firmly or closely to/remain very close to…
hold to:refuse to abandon or change对于英语学习者来说,他们很难从教辅书上获取这三个词组的明显差异,而词典上的释义又存在循环释义的现象,特别是adhere to和cling to。显然,这些释义在很大程度上不能解决学习者的困惑,不利于英语的学习。本文将从词频、语域、搭配和语义韵四方面对这三个同义词组进行对比分析。
(一)词频
为准确把握语料库的数据,首先需要区分“频率”和“频数”,前者指语料库中某一词汇、短语每百万词(per million)出现的频数,而标准化前的频数译为“频数”(occurrences)[5]。由于动词在不同语境中存在多种形态,因而三个词组的输入形式为[adhere]to,[cling]to,[hold]to。在用户注册登录后,分别将这些词组输入SEARCHING STRING一栏中,点击搜索SEARCH后,得到这三个词组的总体出现频率,分别为3053、5337、2334。
由上述数据可知,以上同义词组中出现频率最高的是cling to,出现频率最低的为hold to。根据以上数据,这三个同义词组的频率排序依次为:cling to,adhere to,hold to。依据该结果,在表达“坚持”的含义时,cling to在英语中最常使用,而hold to使用频率最低。尽管总体频率不能给出更多信息,比如如何使用,在何种情况下使用等,但对于英语学习者而言,为了使用语更加地道,在表达“坚持”时可更多选择cling to和adhere to这两个高频词组。
(二)语域
语域(register)是指在语言活动中,因为存在不同因素的差异,如交际双方的性格、兴趣、说话的地点等,新的言语变体在交际中产生,体现为不同的语体风格、用语习惯等[14]。许多同义词组所表达的基本概或意义相同,但使用的场合或使用对象不同。语域常有正式、非正式、正式语体、口语语体之间的变化。本文使用COCA中的图表显示(CHART)进行搜索,返回的结果清晰显示了三个词组在各子语料库中的总词数、各个子语料库词总数、各个子语料库中按每百万词数的呈现比率以及词频分布矩形图,根据研究需要,现只呈现每百万词数的呈现比率。(表1)
为了更直观地比较出三个词组的分布差别,本文将所得图表中出现的总频数及五类语域的频数
绘制为图1,并且进行比较说明。
通过图1,可以直观观察到adhere to在学术文章的所占频数最高,因而语体最为正式。根据五大子语料库中的词频分布矩形图和按每百万词数的呈现比率数字,三者在口语中的频数相差无几,cling to在小说和杂志中出现的频率较高。此外,hold to在学术语域中出现的频率为7.49,远高于cling to,后者的学术比率为5.41。综上所述,这三个同义词组的正式程度为:less formal,adhere to,hold to,cling to,more formal。对于这三个词组如果单从概念意义出发,很难说出它们之间的细微差异,但根据它们在不同语域中的不同频率,学习者便能对它们的语体辨析产生较为直接的感性认识。
另外,根据COCA的CHART功能,还可以得到这三个词组在使用上的历时变化情况。同样,为了更加直观地比较出三个词组在不同年度区间的分布差异,将三张图表中出现的五个年度区间的频数绘制为图2,并且进行比较说明(注:鉴于2010-2012只有三年,本文不作考虑)。
上图显示adhere to,cling to,hold to在COCA中不同年度区间的“频数”,从1990-2009年间三个词的使用频数一直以cling to为最多,其余依次为adhere to和hold to,这与词组的总频数结论一致,hold to的使用在未来可能存在消失状况。此外,hold to的使用总体上呈下降趋势,adhere to
和cling to保持基本平稳态势。这在一定程度上反映了这三个词组在使用上的历时变化状况,对学习者有一定的指导意义。
(三)搭配
“搭配”一词首先由Firth从技术术语的角度提出,意指“词项的习惯性结伴使用”,它是从横组合的角度看待词汇[15](P14)。后来新Firth学派的代表人物Halliday和Sinclair发展了Firth的词项“结伴”说,并认为通过语料库的统计手段如节点词、跨距、搭配词等可以测量“线性共现”,即节点词和搭配词间的相互吸引力[16](P46)。在语料库中,MI值即相互信息值(Mutual Information Value),体现词汇间的搭配强度和具体搭配的显著程度[11](P29)。搭配在英语学习中尤为重要,它是区分同义词组的有效依据之一。本文采用常见的计量方法MI值来进行统计研究。通常来说,MI值大于3的搭配可视为显著搭配。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。