语言输入中的语符频率与语类频率
——认知语言学视角*
盖淑华
(北京外国语大学中国外语教育研究中心,北京 100089,北京)
提要:以语言使用为基础的认知语言学派非常重视频率效应。近年来国外研究者对语符频率、语类频率及二者间的交互效应做了很多探讨并取得一定成果。研究发现充分利用语符频率与语类频率偏态输入的交互效应有助于语言习得,但是目前国内对这些成果鲜有介绍,实证研究更少。本文旨在综述该领域的最新研究理论和成果,为二语习得研究和课堂教学带来启示。
关键词:语符频率、语类频率、交互效应、语言偏态输入、语言习得
中图分类号:H319  文献标识码:A
1. 引言
对于频率效应(frequency effects),大多数人并不陌生。中国古语“熟能生巧”、“温故而知新”等讲的都是
频率效应,常用来解释人类的技能练习和知识学习。在西方也不例外,无论是上个世纪Skinner的行为主义理论,还是本世纪初发展迅猛的认知心理学理论,都在二语习得中给予频率效应以重要位置,频率效应甚至曾一度被认为是决定语言学习成败的关键因素。随着二语习得理论的不断发展,频率效应已经从最初简单的“刺激——反应”次数的重复,发展到将语言输入中的频率细分为语符频率效应(token frequency effects)和语类频率效应(type frequency effects)及二者间的交互作用(interaction effects),而且吸引了国外研究者越来越多关注的目光,同时国外一些实证研究也给我们带来了颇具启发意义的新发现。
目前国内关于频率效应的实证研究较为匮乏,现有的实证研究多侧重于口语中任务型练习的输入和输出次数,即练习频率(law of practice),对学习效果的影响(如周爱洁 2002;周丹丹 2004,2006;谢谜 2009);而关于频率效应的前沿理论和研究成果几近空白。有鉴于此,本文从理论和实证研究两方面进行述评,首先是频率效应的理论渊源及其相关派别,然后分别阐述认知语言学理论中语符频率效应、语类频率效应及二者间的交互效应,并重点介绍相关的实证研究和发现。
2. 频率效应的理论渊源
二十世纪20年代兴起的行为主义,在研究婴儿行为和动物学习的过程中,将行为的基础视为刺激与反应之间的联结。Skinner(1969)在行为主义心理学领域对频率效应做过非常详尽的调查,发现了频率的
重要作用。50年代美国的结构主义语言学理论及相关研究也认为频率是一个非常关键的概念。Lado(1964)在行为主义学习原则之上建立了二语习得理论,主张语言的语法结构是一个习惯系统,即学习者习得语法是一个习惯的培养过程。Lado将其理论应用到具体的教学中,创立了听说法(Audio-lingual Method),认为某一语
*本文受益于北京外国语大学文秋芳教授于2010年春季课程“第二语言习得理论”,特致谢忱!
言项目的反复接触会强化大脑中的联系,进而加深该项目的习得深度,促进自动化使用。但是听说法遭到了质疑,因为语言学习并不是纯粹的不动脑筋的重复练习,而是在交际环境里的有意义的重复(Ellis 2002)。60年代随着Chomsky的“语言天赋论”的兴盛,行为主义理论逐渐趋于沉寂,频率效应在语言习得中的作用也似乎被人淡忘。
进入二十一世纪,心理语言学如火如荼地发展,联通论的出现以及儿童语言习得研究的深入,为二语习得研究奠定了坚实的理论基础,关于频率效应的研究又重新受到研究者的重视(Ellis 2002)。剑桥大学的《第二语言习得研究》杂志(Studies of Second Language Acquisition)于2002年6月专门出版了年度特刊,集中讨论频率效应及其对二语习得理论的启示。特刊的主题论文的撰写者Nick Ellis(2002)认为,学习语言与学习其他认知技能相同,因为人们在处理与加工不同层次的语言现象时依赖于语言分布的频率知识,语言表征是形式和功能相匹配的概率在大脑中的反映,学习语言就是在这些语言表征之间
建立联系。学习语法不是学习规则,而是掌握结构,掌握了足够的结构之后再以频率为导向,如输入类型高频率(type frequency)和练习频率,从中抽象出语言规律,因此频率是语言习得的关键。这就是Ellis的以频率为中心的二语习得理论(Ellis 2002)。
然而,该理论遭到了许多专家的批评。他们认为二语习得过程非常复杂,受到多种内外因素的影响,频率只是“输入”所需具备的诸多特性之一,其它因素,如输入强度、凸现度、时间分布、新颖度等,也决定着输入效果(文秋芳 2003),因此作出“频率效应是二语习得的关键因素”的结论未免有些草率。
认知语言学派吸收了前人的精华,摒弃了Chomsky的能力(competence)与运用(performance)的对立划分,重视语言在使用中的建构,认为“语法即用法、用法即语法”(Bybee 2005),后来修正为“用法影响语法”(usage impacts grammar)(Bybee 2008),提出了基于用法的语言体验学习论。认知语言学派的领军人物之一Joan Bybee认为语法是通过对语言的体验产生的认知组织,形式与功能的匹配(即construction)就是语法分析的基本单位(Bybee 2006)。人类的一般认知能力可以对事物的特性和异同进行分类和检索,那么,这种能力是如何作用于人们对语言的体验呢?人们在使用语言时,体验着语言使用中的语符,然后将它们以不同的抽象程度来范畴化,这种范畴化的过程创建了一张包含语音、语义、语用等相互联系的庞大网络。语法建立于对构式的具体范例(examples)的体验之上,对这些范例的异同点进行分类匹配后,储存于记忆中,语言体验经历经过反复累积,抽象化为认知表征,但是,具体范例知识在抽象化的过程中并未完全消失,而是通过频率效应保留了记忆表征,因此,使用频率在决
定认知结构时起着重要作用(Bybee 2008)。
3. 频率效应的分类
认知语言学理论认为语言单位的重复影响着认知表征。为了充分展示频率是如何影响认知表征的,Bybee(2008)将频率分为语符频率和语类频率。下面就在Bybee对三种效应的定义的基础上,联系相关的语言习得研究和最新发现,以求对频率效应有一个生动具体的理解。
首先说明一下语符频率和语类频率的计算方式,这是相关实证研究经常遇到的问题。认知语言学中,语符(token)指的是语言使用中的具体单位,包括音符、词汇、短语、句子等,比如专门的辅音[s]、音节[ba]、单词“dog”或者“the”、短语“take a break”、甚至句子“You know what I mean”,都可以计算其语符频率。其计算方式较为简单,计算相同单位(unit)的出现次数即可。但是,语类频率的统计方法略有不同。所谓语类(type),指的是语言结构模式(pattern),在语言结构模式中存在着开放性的空位(slot),空位上可以填充不同的项目(item),代表了同一语言结构模式。所以语类频率的统计方式是计算相同的结构模式(pattern)的出现次数。比如,短语give me an apple 的NP可以有不同的名词短
语来替换,如果文本中还同时有give me a book和give me a hand,那么“give + me + NP”这一结构的语类频率为3次,当然,give me an apple中其他位置也很开放,如VP位置,也可以根据相同的位置计算其语类频率。
3.1 语符频率效应
语符频率主要有三大效应:保护效应(conserving effect)、自治效应(autonomy)、省音效应(reducing effect)。
所谓保护效应,是指语言单位的反复出现加强了记忆表征,使大脑更易获取记忆。比如,有实验表明,受试者在判断某个字母串或语音串是否是词时,对高频词的反应速度比低频词快得多。从语言发展的角度来说,保护效应解释了为什么语言使用中很多高频词抵制类比革新(analogical reformation)带来的规则化(regularization),高频的语符在形态和句法结构上会发生固化,不随着抽象模式的变化而变化。从二语习得的角度来说,这给加重了学习者的记忆负担。保护效应解释了为什么高频词中的不规则变化多,也就是外语初学者常常抱怨的不规则词表很长,却又很常用,如come(came)、go(went);反之,也解释了为什么不规则词大都是常用的这一现象,正所谓:因为常用,所以不规则;因为不规则,说明常用。
自治效应可以视为保护效应的极端反映,指某一语言序列由于重复地、机械地记忆,最后在使用时与其构成单位脱离联系,达到高度自治化,脱离词源成为独立的语言单位。这样,语言使用者就不会再注意它的组成部分。从语言发展来说,这种现象在派生词的形成上很常见。某些派生词经过高频的使用,会逐渐丧失和词根的联系。即便在意义上仍然有关,但该派生词在使用上已经独立于词根,成为了一个新
的语言单位。从语言习得来看,隐形学习(implicit learning)比显性学习(explicit learning)更容易产生自治频率效应,比如,孩子在学说gimme时,往往意识不到这是由两个词(give + me)组成的;对成年的二语学习者来讲,如果没有显性的知识,是不会加以拆分的,而是作为整体学习。
自治效应在实证研究中得到了证实。Moder(1992)研究了频率效应对学习者学习英语动词过去式词形变化的影响。研究者根据英语中一些不规则动词的原形(如string/strung,fling/flung,以及write/wrote,ride/rode,steal/stole)造出一些假动词原形(nonce verb),这些不规则动词过去式按照频率分为两种:高频词,例如write/wrote,ride/rode,steal/stole;中频词,如string/strung,fling/flung。在实验中,先让受试者看该类型的真词及其过去式,然后看假词,最后要求受试者说出假词的过去式。实验发现:如果受试者一开始看到的是中频词及其过去式,那么他们很容易受其影响,把假词进行对应变化。但是,如果受试者最初看到的是高频词及其过去式,那么,他们受的影响就小很多,一般不会将假词过去式进行对应变化。
无独有偶,Bailey & Hahn(2001)对本族语者的测试也有类似发现。该研究测试的是假词在英语中的接受度,这些假词具有一定的语音结构模式。受试者是英语本族语者,那些语音结构模式与大多数词类似的假词更易被接受,但是高频词和低频词均不受此类效应影响,说明这些词都有自治频率效应,内外部都不太受影响。
省音效应指某些单词和短语因使用频繁导致其发音上的减缩。例如,日常问候语Hi是由How are you缩减而来的,同样Goodbye是由God be with you缩减发音而来的。这其实也是经济省力原则的表现,人的发音器官由于频繁发出这些语符,练得越来越流畅而高效,不免产生了音位同化和缩减。我们在生活中也有这种体会,喊身边某个熟悉的人的名字喊久了,本来三个字的名字可能被(外人)听成了两个字甚至一个字的发音。省音效应给母语使用者带来了经济实惠,却给二语学习者的口语和理解带来极大的挑战,本族语式的地道发音很难达到,应该说与频率效应不无关系。
3.2 语类频率效应
不同的语言单位可以出现在同一结构模式的开放的空位中,被视为同一结构。语类效应是决定语言结构模式的能产性和创造性的关键因素(Bybee 1985;Goldberg 1995)。语类效应之所以能提升结构的能产性,是因为人们在使用语言时,若发现一个结构的某个位置可以由不同的语符填充,累积到一定程度,就能够分析该结构,因此,只有语类频率达到一定数量,语言学习者才能创造性地发挥使用。
Tomko(2008)对日本的初中EFL学习者的研究证实了语类频率对于语言能产性的作用。为了区分语符频率与语类频率的不同作用,研究者将学生分为两组(Type Group vs. Token Group),分别通过强化语类频率与语符频率来学习be动词的用法。最后,不但对比两组学习效果,而且采用刺激回忆法收集数据,采访学生在实验中使用的认知策略,结果发现两组学生使用的策略迥然不同,其中语类组的学生(
Type Group)在进行语义——形式匹配联系时,使用推理(If-Then strategy)和类比较多(analogy strategy),能够有意识地进行类比分析,因而他们不但能区分be动词的不同用法(如系动词be,一般现在时be,现在进行时be),而且能够自己创造性地使用新的个性化的范例;相反,语符组(Token Group)无论是对分析性结构的范例,还是对不可分析性结构的范例,都很少进行推理分析,主要是回忆检索记住的范例,在没有相关的显性知识时,强化语符频率只让他们记住了例子,却没有花心思去对语义——形式关系进行推理类比,因此也就没法推广运用产出新的范例。
上述研究证实了语类频率对语言能产性的作用,但是就二语习得而言,是不是强化语类频率、弱化语符频率就能提高学习效果呢?我们下节细述。
3.3 语符与语类频率交互效应
虽然语类频率对语言的能产性和创造性起着重要作用,但是语符频率有助于巩固记忆表征,稳固的记忆表征是类比推理的基础。因此,语符频率与语类频率的交互作用对于学习、活用语言结构很重要,但是如何科学合理地搭配使用语符频率与语类频率效应,使其配比适当,产生良好的交互作用呢?
Casenhiser & Goldenberg(2005)的研究为语言学习带来了启示。他们在实验中研究了人工语言学习的情况,51名受试者是英语为母语的儿童,均从美国伊利诺伊州当地的两所小学招募而来,年龄5-7岁不等,随机分为三组,其中两组是实验组,一组作为控制组。研究者教这些孩子学习新结构(人造的)
中的新动词(假词)。该结构由主语、动词、宾语三部分组成,但词序不符合英语特点,动词位于句子末尾,如下:
English word order: S + V + O.
Non-English word order: S + O + V. (实验中使用的新结构)
实验组的儿童听到句子时,同时看着电视里的画面,画面表现了句子的意思,在画面的最开始和结束时会听到两个句子,只有时态不同(一般现在时和过去时),句子的主语和宾语是孩子们已知的英语词汇,只有动词是假词。比如,电视画面里有一只兔子出现在帽子里(The rabbit appears on a hat.),孩子们在开始和结束时听到的声音描述分别是:The rabbit the hat moopo-s . . . The rabbit the hat moopo-ed.。研究者根据语类频率和语符频率的不同配比设计了两种实验情况,由两个实验组分别完成。第一种情况下,先强化语类频率效应:儿童听两个句子(一遍),每个句子有一新词(同一空位),然后又听到三个句子(两遍),各有一个新词。由此孩子们总共听了8个句子,包含5个新动词,但其语符频率不高,1次或者2次(1-1-2-2-2),可以说基本均衡,但是该结构SOV的语类频率总数为5 次(先2后3)。第二种情况下,研究者有意地先强化语符频率效应,儿童先听一个句子(四遍),然后听另外四个句子,各一遍(4-1-1-1-1)。在这种情况下,虽然新结构SOV的语类频率总数仍然为5次(先1后4),但是语符频率一开始就很高,先4次后1次。三组儿童都按照各自实验要求的步骤进行了两
遍,因此实验组共听到了该结构的16个句子。最后研究者对比分析孩子们在两种不同情况下学习新结构的效果,结果发现:第二种情况下儿童的学习成
绩更好。
此外,为了排除随意因素对学习新结构的影响,Casenhiser & Goldberg还特意设定了控制组,他们也看了电视画面,只是没有听到语言表述,结果发现,控制组的学习效果最差,无异于随机效果,因此说明实验组的学习效果并不是偶得的。
由此可见,只需很少的接触,同时配比适当的语符频率与语类频率,儿童在很短的时间内就能掌握一个新结构,这种推理分析能力是不是孩子所特有的呢?为了验证这一点,Goldberg(2007)等人邀请普林斯顿大学126名英语为母语的本科生参加了同样的实验(受试者每人得到6美金作为回报),结果发现成人也是一样。
虽然上述研究的受试者为英语本族语者,但由于研究的是人造的新结构和新动词,所以对二语习得同样具有启发意义。语言学习中语言输入不是均衡的,而需要偏态输入(skewed input),范畴化需要同类别中出现高频成员,对那些典型范例“偏向些”,频率高些,巩固其记忆表征,有助于学习者运用类比而产生联系。
最新的研究(Kidd et al. 2010;Dabrowska et al. 2009)也揭示出语言输入中存在着语符与语类的偏态分布的交互影响。Kidd、Elena、Tomasello(2010)的研究显示:儿童复述主从复合句结构时,非常喜欢用高频动词;更有趣的是,88%的孩子复述句子时,甚至把主句的动词换成了“think”,而这个词根本没有在描述中出现(六个主从复合句包含三对高低频动词:say – claim;know – believe;hope – feel;bet – wager)。那么,是什么让儿童对“think”情有独钟呢?研究者认为“think”就是儿童在习得这种finite sentential complement construction结构时的范例(exemplar),NP-think-S,并在使用中得到固化。Dabrowska et al.(2009)的实验也印证了这一点,该实验还观察到了成人学习者同样存在着这种范例语符-语类效应。Goldberg(2009)认为语符频率的巩固统一,有助于学习者归纳概括出相应语类,而且便于推广使用,能产性高,高频范例就相当于“归纳之船的锚”(anchor),是进行归纳的固定支点。
综上所述,语符频率与语类频率对语言学习的作用不同,二者偏态输入的交互效应影响着语言学习。
4. 结语
语言学习是一个相当复杂的过程,如何从有限的语言输入中归纳总结出相应的结构,这其中的语符频率与语类频率又是如何交互作用,促进结构的分析构建,这些问题在认知语言学派中得到了适当的解释。本文以探究语言输入中的语符频率和语类频率效应为主线,梳理了该领域理论成果和最新的研究发现。字符常量合法
不过应当承认,当前二语习得中的相关实证研究还几乎是个空白,但很多问题逐渐引起了研究者的注意。如何认识语符频率与语类频率对二语学习的作用?无论是母语学习还是二语习得,纯粹的语符频率效应或者语类频率效应是不存在的,往往是二者的交互作用影响着语言学习效果。例如,在英语教学课堂上,教师让学生单纯机械地重复某个语符多遍,即便学生没有厌倦,当时记住了,忘得也很快,更不用说语言运用的能产性和创造性了;反之,如果只注重语类频率,教师在介绍某个结构时,只一味地用不同的语言单位来填充结构中的空位,提高语类频率,但由于典型范例的记忆表征没有巩固加强,那么学生在结构运用中也往往容易一头雾水。在EFL课堂教学中,如何提高语符频率效应?既然范例式语符有利于进行概括归纳,而二语学习又不同于母语,母语环境下有自然的典型的范例,那么在二语课堂上范例的真实性和典型性就很重要。经典范例式语符辅以适量的语类结构输入,才能使学生走出机械记忆的误区,充分利用分析、归纳等认知技能促进学习。此外,何种语符——语类频率配比有利于何种层次的学习者?儿童、成人、初学者、中低水平者等各种层次有没有各自最合适的语符-语类频率配比?输入中的语符-语类配比与输出的正确性、能产性、创

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。