心理科学进展  2004,12(1):1~ 9
Advances in Psychological Science
语篇中指代词的分布规律与心理机制*
李晓庆杨玉芳
(中国科学院心理研究所,北京 100101)
摘要语篇理解加工过程的一个重要环节就是对不同类型的指代词进行解释。首先介绍了指代词在语篇中的分布规律和对局部语篇连贯性的影响;其次,分析了话语信息结构和韵律特征在指代词加工中的作用;然后,揭示了语篇当中不同类型的指代词分布规律的心理机制;最后。对以前指代词研究的贡献和有待解决的问题进行了评述,并指出了几个可行的研究方法。
关键词指代词,语篇实体,突显度,加工代价。
分类号 B842
在语篇理解过程中,一个中心问题就是建立局部或整体连贯性。连续的话语往往是围绕一系列的语篇实体(
discourse entity)而展开的。用来指代语篇实体的指代词形式是影响语篇连贯性和可理解度的一个重要因素。于是,一些心理语言学家专门从指代词的角度来探索语篇理解的加工机制。
1 中心理论(centering theory)
语篇连贯性包括整体和局部连贯性。Grosz, Sinder等人提出的“中心理论”,详细地论述了语篇中指代词(尤其是代词)的分布规律,以及指代词的不同形式对语篇理解加工的影响[1,2]。
“中心理论”本质上是一种“注意驱动理论”,“中心”是指注意的中心,是当前注意状态中激活程度最高的信息。“中心理论”指出,在语篇中每一句话都有两类中心,“前向中心”(forward-looking center, C f)和“后向中心”(back-looking center, C b),前者指相邻语句中,前一句话中的实体;后者指相邻语句中,后一句话中的实体。C b只包含一个实体,它与前行语句建立联系;C f包括一系列的实体,它提供了与后继语句联系的纽带。C f中的不同实体按照在注意中的突显度,形成一定的等级排列。Grosz认为突显度主要是由句法角决定的,即突显度由高到低分别为:主语、直接宾语、间接宾语、补语、修饰语。
“中心理论”认为,前一句话C f中突显度最高的一个实体会作为本句话的C b,并且必须以代词的形式来表示。如用以名词来表示就会使阅读时间的增加,这被称为“重复名词不利”效应(repeated-name penalty)。原因在于代词表示本句话与前一句话存在联系,而名词表示新的话题的开始。Grosz, Sinder等人用自控速阅读法进行的一系列的实验发现,与代词
收稿日期:2003-04-20
* 国家自然科学基金资助项目(39970254)。
通讯作者:杨玉芳,E-mail: yangyf@psych.ac
1
-2-                                          心理科学进展                                          2004年
相比,当用名词来指代前一语句中突显度最高的实体时,阅读时间显著增加。例如,在“Susan decided to give Fred a hamster. She/Susan told him exactly what to feed it.”前后两句话中,第一句话中有两个人物Susan和Fred,处于主语位置上的Susan突显度较高。与用代词She来指代Susan相比,当后一句话直接运用名词Susan时对这句话的阅读时间显著增加。可见,出现了“重复名词不利”效应。随后的实验进一步证实这一效应只出现在主语位置上,即C b 必须实现为主语(当主语是与先前语境无任何联系的全新的实体时,C b也可出现在宾语的位置);并且他们又用同样的实验范式研究表明,句法位置和出现的先后次序是影响C f中实体突显度的重要因素。
“中心理论”从交流功能的角度,立足于句法分析,探索了指代词在语篇中的分布规律及其影响指代词实现的各种条件。这为言语工程中算法的实现提供了简单易行的操作方法。但它主要分析了指代词的分布
规律,而没有具体探索其内在心理机制;没有系统研究影响“前向中心”中实体突显度的各种因素;主要以书面语篇为材料,而没有探索这一理论是否同样适用于口语加工,以及口语所特有的韵律特征在其中的作用。
2 从信息结构和口语韵律特征看“中心理论’
在言语交流中,交际双方都把自己所要传达的信息编码成一个个信息单位,形成一定的信息结构(Information Structure),如主题-述题、主题-焦点、旧-新之分。一般新信息与焦点相对应,旧信息与主题相对应。
在口语中信息结构往往通过重读等韵律特征表现出来。一般焦点信息被重读,而非焦点信息不被重读。听者会从重读中产生预设,即推论出哪是新信息、哪是旧信息,或在对哪些信息进行强调对比,从而缩短理解加工的时间。
信息结构和韵律特征与指代词的解释具有密切联系。“中心理论”在分析指代词的分布规律时,重视语法因素对Cf中实体的突显度及Cb的实现方式的影响,但没有考虑信息结构和口语韵律特征的作用。
2.1韵律特征对指代词解释的影响
与“中心理论”不同,一些研究开始探索口语中重读对指代词加工的影响。较早的研究主要运用事后判断
等“延时”法,结果表明:重音会阻止协同参照(co-reference),即一般情况下人们会依照启发式策略把代词解释为某一实体,而重读意味着代词指代的是另一实体。但他们未指出代词具体指代的是什么信息。以后逐渐出现了一些专门的理论来分析重读对指代词解释的影响,其中较为典型的是“注意驱动理论”。
“注意驱动”理论可以说是“中心理论”和“重读预设”观点两方面结合的产物。Cahn 和Kameyama等指出,一方面,“中心理论”认为代词会被解释为前行语句中突显度最高的实体。另一方面,“重读预设”观点认为重读预设了对比意义的存在,说话人出于对比目的才着意强调这个被重读的成分。如“外婆经常跟到公园去散步。”这句话中,“”重读就隐含了说话人在强调“外婆常跟,而不是跟妈妈、妹妹等其他人,去公园散步。”代词被重读同样意味着在语境中存在着与代词所指代的实体相对比的其它候选项。这一系列
第12卷第1期语篇中指代词的分布规律与心理机制                                -3-
的候选项在功能上相当于处于局部注意状态中的“突显亚系列”(与“中心理论”中C f的一系列实体相对应)。重读和非重读代词的“突显亚系列”是一样的,不同之处仅表现在“突显亚系列”中实体的等级排序方式,它们的排序正好是互补的。即非重读代词被解释为前行语句中突显度最高的实体;而重读代词被解释为前行语句中突显度最低的实体。
可见依照“注意驱动”理论,代词的重读主要是引起注意焦点的转移,即把当前话语中心转移到了前一语
境中突显较低的实体上去 [3, 4]。
Jennifer J. V. 等用眼动技术探索了重读对代词解释的影响。在实验中,向被试听觉呈现话语的同时呈现与话语内容相对应的图画(如,猴子和山羊想一起擦洗汽车。猴子把一桶水放在了车前面。然后,他拿来一块海绵。接着两人一块儿擦起了车轮和窗户)。让被试一边听并理解话语,一边用眼睛追随所描述的对象。结果发现随着语境和句子结构的不同,重读的效果也不完全一致:在平行结构中重读引起了注意焦点的转移,即把重读的代词解释为突显度较低的先行实体;而对于非平行结构,在有的语境下,听者在重读代词的临场解释中出现了迷惑,在有的语境下,听者仍把重读的代词解释为突显度较高的先行实体。Vinditti从而认为重读单独的作用并不足引起注意焦点的转移。
Delphine Ddhan等则用眼动技术研究了重读对名词性指代词解释的影响[5]。一个名词(如,candy)的声音信号还未完全呈现时,它的部分信号会激活多个候选项(如,candy, candle 等),并且听者接收到词汇的全部声音信号之前就早已知觉到词汇所蕴涵的韵律信息(如重读)。Dephine Dahan等就探索了一个名词的声音信号还未完全呈现时,“重读与信息状态的匹配”对名词性指代词解岐的影响。实验中,被试在听话语描述的同时进行相应的操作任务(如,Put the candy below the triangle。Then put the candy on the circle.)。通过观察分析被试的眼动情况发现:听者倾向于把非重读的名词解释为旧信息,而把重读的名词解释为旧的但突显度较低的信息,而不是全新的信息。可见,当指代词是名词时重读会引起注意焦点的转移,即把重读的名词解释为突显度较低的先行实体。
“注意驱动”理论主要用于对重读代词的解释,然而Vinditti的研究表明,除了在特殊的平行结构中,重读并没有引起了注意焦点的转移;反而在Dephine Dahan 的眼动实验中,对名词的重读引起了注意焦点的转移。通过分析他们对眼动技术的运用发现,一般口语研究中利用眼动法时,都让听者从事一定的操作任务 [5~7];而Vinditti只是让被试在听的同时追随所呈现的图画。可能是眼动研究中,简单的追随活动不能敏感的反应听者的认知加工过程。但到底是由于测量任务的不敏感而导致没有检测到重读的注意转移,还是在一定语境中重读本身就不会引起注意焦点的转移,这有待于进一步的探索。
2.2 信息结构对指代词解释的影响
“中心理论”非常关键的一点就是“前向中心”中不同实体的突显度排列问题。Grosz 等对此没有详细探索,只是基于对固定词序的英语的研究,提出按句法角进行突显度排列,即依据在注意中的突显度由高到低分别为:主语>直接宾语>间接宾语>补语>修饰语。
Strube等对自由词序的德语进行了研究并提出了“功能中心观”,认为是语句的功能信
-4-                                          心理科学进展                                          2004年
息结构而不是句法角决定了“前向中心”中实体的突显度。信息结构指句子所传达的信息的“新、旧”或“主题、述题”之分。一般“主题”与“旧信息”相对应,“述题”与“新信息”相对应。Halliday认为“旧信息”
与“主题”虽都是语境中出现过的信息或双方背景知识中共有的信息,但确实有不同之处,“旧信息指你正谈论的事情(或我以前谈论的事情),而主题指我现在正谈论的事情”。“新信息”与“述题”都是语境中未出现过的信息,没有本质的区别。于是Strube按照信息状态的不同把语句中的实体分为“旧信息”、“主题”和“新信息” [8]。其中“旧信息”和“主题”的突显度高于“新信息”;如果都属于同一信息状态,不同类型的指代词按照突显度由高到低分别为,代词>物主代词>省略语;对于同一信息状态的同一类型的指代词,其突显度按出现的先后次序决定。
Strube随后用用大规模语料库标注法、以不同类型的自然语篇为材料,对影响实体突显度的因素进行了对比研究。结果发现,对于“中心理论”的句法角标准、“功能中心观”的信息结构标准以及位于二者之间的“标准模型”,按照信息结构标准对指代词的指代对象进行预测时,能达到与自然语篇中指代词的实际指代对象最佳的匹配。同时,“功能中心观”更具普遍性,不仅能解释代词和名词性回指词,而且能说明各种类型的指代现象;不仅适用于词序自由的德语而且也能很好的预测词序固定的英语 [8]。
Strube等的功能信息结构观点不再局限于静态文本的句法分析,而是考虑到了动态交流中信息结构的作用。这为指代词加工的研究提供了一条新的思路。可是他们只是通过文本分析来进行研究,对于实体的信息状态在实际言语理解加工中的作用则未进行探索。
然而其它一些有关言语理解加工的实验结果与“功能中心观”的观点一致。例如,缪小春的研究表明,在
没有语义偏向的语境中,前一分句是主动句时,后一分句中的代词被解释为主语和宾语的可能性无显著性差异;而当前一分句是被动句时,后一分句中的代词倾向于被解释为前一分句中的形式主语[9]。Chin Lung Yang等人以汉语为材料的研究也发现,对于一般的“主-谓-宾”句式结构,后面的代词指代主语时阅读速度更快;当用“把”字把宾语置于谓语之前时,后面的代词指代宾语时阅读速度更快[10]。原因在于在汉语中通过句式结构的变化,“被”字之前和“把”字之后的成分被置于了语句信息结构的焦点位置,即成了句子中被特别强调和突出的信息。从而说明信息结构确实会影响到代词的理解加工。
以上无论是文本分析还是实验研究都表明,不仅仅是语句表层的句法结构,而且深层的信息结构也会影响到先行实体的突显度和代词的解释。以后的代词加工模型也应考虑到信息结构的作用。
3 指代词加工的心理机制
“中心理论”和“功能中心观”探索了指代词的分布规律,但他们没有详细说明在语篇理解中,指代词加工的心理机制。
与之不同,有一些研究则从心理机制的角度来研究指代词加工:如Choitre等认为代词通达语篇的概念表征,而定指的名词通达语篇的音系表征[11];Sanford等指出,代词通达明示焦点中的语篇表征,而定指的名词通达隐含焦点中的语篇表征[12];Greene, McKoon等认
第12卷第1期语篇中指代词的分布规律与心理机制                                -5-
为对定指的名词进行“在线”加工,而对代词的解释要延迟到句末[13]等。其中论述最详细、最具特的是Garrod在Sanford等的“焦点记忆框架”理论基础上所做的解释[14]。
3.1“焦点记忆框架”理论(focus memory framework)
Garrod在眼动研究的基础上,结合Sanford等的焦点记忆框架理论对指代词的加工过程进行了详细的论述。
工作记忆被划分为明示焦点和隐含焦点两种空间:前者存储当前已被激活的语篇实体;后者存储与实体相关的背景知识。激活明示焦点中的一个实体之后,可迅速激活隐含焦点中与之相关的大量背景信息。其中处于明示焦点位置的实体与背景信息存在着最为丰富的联系。
代词以非常简单的方式起作用:它直接迅速激活处于明示焦点中的实体。当代词被解释为明示焦点中处于焦点状态的实体时,会同时激活隐含焦点中的大量的相关信息,随后接收到的语用信息就会立即发生所用;但当代词被解释为明示焦点中处于非焦点状态的实体时,它不能在隐含焦点中提取丰富的背景信息,从而不能使随后的语用信息快速地发挥作用。而当代词不含具有解歧作用的信息时,它会同时激活处于焦点和非焦点状态的实体,只有当随后接收到进一步的信息时,才能对代词做出解释。
而名称性指代词(如,Mary)直接激活的是隐含焦点中的相应实体和部分背景信息,到后期阶段才激活
所有的背景信息、进行信息的整合。非定指的全称名词(如,a girl)只在语篇中引入一个新的实体,而不把它与先行的实体进行匹配。这两种指代词都不直接激活明示焦点中的实体,因而慢于代词的加工加工速度。
centering
以上研究把对代词和名词的加工归为不同的机制。与之不同,Almor则试图寻求能对所有的指代词进行解释的普遍的心理机制,提出了“信息负担假设”。
3.2“信息负担假设”(informational load hypothesis,ILH)
有关指代词分布的一个普遍规则是:先行词在语篇中的突显度与回指词的具体程度呈负相关[15]。Ariel的“可通达性”(accessibility)理论对此的解释是,一方面先行词的突显度与可通达性相关,突显度越高它就越容易被通达。另一方面,不同形式的指代词所含的信息量不同,所造成的认知负担也不同:定指的名词能激活丰富的语义表征,从而会对加工者造成较高的认知负担;而代词只激活少量的概括性的表征,于是产生较低的认知负担。与高通达性的先行词建立联系只需要一个低认知负担的指代词;而与低通达性的先行词建立联系则需要一个高认知负担的指代词[15]。
以后,Almor的“信息负担假设”又对“可通达性”理论进行了深化和补充。首先,他不仅仅是从指代词的表面形式(如,代词、名词之分)、而是从先行词和指代词的“概念表征”之间的语义距离来界定加工代价(cost),语义距离越近、指代词的加工代价就越高。其次,他提出了“语篇功能”这一概念,包括识别已存
在的信息、增加新的信息、以及引起语篇焦点的转移。Almor把加工代价和语篇功能相结合来解释对指代词加工,指出一定的加工代价必须产生一定的语篇功能,否则就会造成认知加工的困难。例如,重复性的定指名词

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。