228
2018年12期总第400期
语言文化研究
ENGLISH ON CAMPUS
基于COCA 语料库辨析同义词Divide 和Separate
文/雷文慧
【摘要】语料库索引是辨析英语同义词的有效方法,该方法对英语教学有一定的启示作用,尤其是以语料库为基础的英语同义词教学。本文基于美国当代英语语料库(COCA),采取语料库研究方法,以同义词divide和separate为例,主要就这组词的词频、搭配、类联接等方面进行对比分析。【关键词】COCA;语料库;同义词;词频;搭配;类联接
【作者简介】雷文慧(1981.9- ),女,甘肃玉门人,酒泉职业技术学院,讲师,硕士,研究方向:英语语言学、英语教学法。
【基金项目】兰州理工大学新能源学院教学研究项目 (LUT-XNY-2017013)。
英语是世界上同义词最丰富的语言之一。据统计英语语言
中同义词和近义词的数量约占总词汇量的60%以上。由于英语同义词拥有相似的意义,用法也极其相似,但是又不完全等同,在EFL(English as a Foreign Language)学习中,对于非英语本族语者来说,在某一特定语境下,在一组同义词中选取一个合适的词汇并非易事,因此对同义词的学习和掌握是英语学习者和教学者面临的一个艰巨任务。随着现代语料库语言学的发展,英语同义词辨析有了新的途径。很多大容量的网络在线语料库为英语学习者带来便捷。基于语料库的同义词辨析也成为传统同义词辨析方法的有益补充。利用语料库的检索功能通过语境共现,可以得到更加直观更加可靠的辨析结果。笔者结合教学实践,以divide和separate为例,探讨COCA语料库在英语同义词辨析方面的独特
优势。
一、同义词的界定和分类
“Synonym”(同义词)一词来源于希腊单词“Synonymon”,
意为“意思基本相似名字相似”。同义词可以分为两大类:完全同义词(perfect synonym)和部分同义词(partial synonym),前者指意义上毫无区别,可以在任何上下文中毫无区别的互相替代的词,然而任何
语言里真正意义、用法完全相同的词很少,绝大多数同义词尽管基本意义相同,但在某些方面,如方言地域,文体风格,用法搭配,和语义韵等方面存在差别。因此,绝大多数的同义词是相对同义词,
二、基于COCA 的divide 和separate 对比分析
COCA(Corpus of Contemporary American English)—美国当
代英语语料库的语料具有“新”和“全”的特点,由于语料库每年都会更新,且语料选取全面,使COCA成为目前世界上最大的网络在线平衡语料库。
1.divide和separate在不同语域的词频分布。语域就是人们
在实际的语言活动中,出于交际的需要,或因其从事的职业和兴趣相异,亦因其话语发生的情景、说话的对象、地点和话题的不同而产生的一种语言变体,体现为语言中的不同语体风格、用语格调。同义词在不同的语域中出现的频率会有不同,即使在同一
语域,也会出现优先选择的差异。因此,基于不同语域、词频分布差异而建立起来的对同义词的取舍原则对于英语学习者能有一定的指导意义。
根据COCA的“chart”功能,可以很清楚明了地得到divide
和separate在这五个语域中词频分布情况(这里的词频是指在每百万词中出现的次数)。
表1 divide和separate在不同语域的词频分布统计
Total
Spoken
Fiction
Magazine
Newspaper
Academic
Freq.Per million Freq.Per million Freq.Per million Freq.Per million Freq.
Per
million
divide 8183126613.25520  5.75276928.98171218.67191621.04separate 29052423944.36295732.70659068.96542059.099846108.12
总频数上来看,separate是divide的3.5倍多(29052/8183),
在五个不同的语域中separate也都比divide出现频率高,可以判断在美国英语中,separate比divide更常用。在五种语域中,separate和divide存在明显差异,特别是小说和学术期刊这两种
语料中,separate都是divide5倍还多(32.70 vs. 5.75; 108.12 vs. 21.04),可以肯定separate更适用于正式文体。这两个词各自的使用也各有不同。Divide在小说中用的最少,畅销杂志中用的最多,在口语、报纸、学术期刊中出现的频率差异不是很大,语体特征并不是很明显。而separate在小说中用的最少(32.70),其他
依次是畅销杂志(68.96)、报纸(59.09)、口语(44.36),在学术期刊中出现的频率最高(108.12),这使得它具有明显的正式语体倾向。
根据COCA的“Chart”功能,还可以得到这两个词在使用上的历时变化。
表2 divide和separate在不同语域的词频分布统计
truncate的区别1990-19941995-19992000-20042005-20092010-2012Freq.Per million Freq.Per million Freq.Per million Freq.Per million Freq.
Per
million
divide 144913.93169616.39201319.55196819.29105720.36separate 686365.99704268.07653963.52583557.18277353.42
表2显示了divide和separate在COCA中不同年度区间的词频
分布统计,结果显示divide一词从1990年到2012年使用的频率并
没有明显的变化,基本是持平状态。Separate一词从2000年以后有下降的趋势。这在一定程度上反应出divide比separate在历时
2018年12期总第400期
语言文化研究
ENGLISH ON CAMPUS
使用上状态较为稳定。
2.divide和separate类联接的差异。同义词、近义词不仅在不同的语域中会有词频分布的差异,在搭配上也会有各自的特点。通过分析词语搭配是掌握同义词辨析的重要方法之一。在语料库的帮助下,作为词汇研究重点的词语搭配,可以为词汇研究提供真实丰富的语料资源。搭配研究之父Firth提出“由词的结伴可知其词”和类联接概念为基于语料库的词语搭配研究提供了坚实的理论基础。
类联接(Colligation)是词语搭配研究中的一个重要概念,是指“由和词的使用直接相关的语法范畴(主要指词类)或语法词(即功能词,特别是介词)建立起来的语法型式”。人们常说的N+V、V+N、V+N+PREP等都是类联接。
表3 divide和separate类联接搭配对比
DIVIDE SEPARATE
V + n频数频率频数频率
34125.05%10411.68% V + n + prep102074.95%78688.32% Total1361100%890100%在《牛津高阶英汉双解词典(第7版)》中,divide和separate 的类联接都包括V+ n和V+ n + prep两种类型。在COCA中分别对这组同义词的两种类联接类型进行检索。如上表所示,在美语中divide的使用频数远大于separate的使用频数,而在这组同义词的两种类联接中,divide的两种类联接使用频率分别为25.05%和74.95%,separate的两种类联接使用频率分别为11.68%和88.32%,说明divide和separate这两个词用于表示“把……分开”时多用V+ n + prep的形式。
3.divide和separate显著搭配词的差异。根据Sinclair在语料库研究基础上提出的定义,搭配是指“两个或多个词在文本中短距内的共现”。在COCA语料库中查询divide和separate的显著搭配名词的情况时,左右都设定为4,得到表4;查询显著搭配介词时,左设定为0,右设定为1,得到表5。
表4 divide和separate搭配的名词
DIVIDE SEPARATE
WORD FREQUENCY WORD FREQUENCY 1GROUPS608PEOPLE241
2TIME470TIME234
3NUMBER449PARENTS214
4COUNTRY374CHILDREN195
5PEOPLE334REST186
6WORLD321YEARS186
7OIL312WALL174
8CATEGORIES308FAMILY164
9TSP304WIFE161
10SECTIONS291MEN148
TOTAL3771TOYAL1903从表4可以看出,divide和separate有共有的搭配的名词有time和people但这些词与divide搭配使用的频率却远远高于separate。通过观察,笔者还发现能与separate搭配的名词多是表示人或与人有关的,如people,parents,children,family,wife和men等。Divide除了能和人搭配外,多与像time,number,country,world这样的集体名词和oil, categories, TSP, sections这样的具体名词搭配。
表5 divide和separate搭配的名词
DIVIDE SEPARATE
WORD FREQUENCY WORD FREQUENCY 1INTO5751FROM8627
2BY2037BY1788 30F1499OF1438
4BETWEEN1286IN716
5AMONG1086INTO678
TOTAL11659TOYAL13247由表5可知,divide和separate都常常与介词搭配使用,且与介词搭配使用的频率差别不是很明显。此表显示:divide常与into搭配,而separate常与from搭配;部分与之搭配的介词,如by, of使用频率比较接近。通过对语料库中具体的例句的分析,笔者发现,与divide搭配的介词后常常跟的是一些表示速度、宽度、时间和数量有关的数字,而与separate搭配的介词后常常跟的是如a door, channels, a creek, curtains等的具体的事物。
三、结论与启示
基于COCA当代美语语料库,从语域分布、类联接、显著搭配词三个方面,对英语中表示“分开”的一组同义词divide 和separate进行的辨析研究表明这组同义词有以下异同:(1) separate在五种语域中出现频
率都比divide高,说明separate 使用更广泛;separate在学术期刊中用的最多,更适用于正式文体,而divide的语体特征相比separate不是很明显;divide比separate在历时使用上状态较为稳定。(2)最常用的类联接类型相同,包括V+ n和V+ n + prep两种类型,在美语中divide类联接的使用频数远大于separate的类联接使用频数,这两个词用于表示“把……分开”时多用V+ n + prep的形式。(3)与separate搭配的名词多是表示人或与人有关的名词,divide除了能和人搭配外,多与集体名词和具体名词搭配。(4) divide常与into搭配,而separate常与from搭配。与divide搭配的介词后常常跟的是一些表示速度、宽度、时间和数量有关的数字,而与separate搭配的介词后常常跟的是具体的事物。
基于语料库进行词汇研究和教学有很多优势。语料库语言学研究方法以基于大量真实语言数据的定量分析为主,所得出的研究结论更具有说服力,基于语料库的真实语料和数据的教学能使同义词的差异更直观、全面和准确。基于语料库的数据驱动学习强调以“学生为中心”,主张在学习过程中学生自我探究,有利于培养学生的自主学习能力。
参考文献:
[1]贺晓东.英汉双解英语同义词词典[M].北京:商务印书馆,2003:前言.
[2]张继东,刘萍.基于语料库同义词辨析的一般方法[J].解放军外国语学院学报,2005(6):49-53.
[3]梁茂成,李文中,许加金.语料库应用教程[M].北京:外语教学与研究出版社,2010:10.
[4]卫乃兴,李文中,濮建忠.语料库应用探究[M].上海:上海外语教育出版社,2005:44.
229

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。