[收稿日期]2021-09-28
[作者简介]高思畅,女,上海外国语大学国际文化交流学院讲师,博士,主要从事二语习得、二语测试研究。:******************。邹申,女,上海外国语大学英语学院教授,博士生导师,主要从事二语测试研究。:*************。
[基金项目]上海市哲学社会科学规划青年课题“汉语作为第二语言学习者口语韵律发展研究”(2020EYY002);上海外国语大学青年教师科研创新团队“人工智能发展中的语言习得与语言测试前沿研究”(2020114050);汉考国际科研基金重点项目“汉语水平考试认知效度研究”(CTI2021A01)
①感谢《华文教学与研究》编辑部匿名审稿专家的宝贵意见。
2023年第4期
No.4
2023
record是什么意思中文华文教学与研究
TCSOL Studies
总第92期
Sum No.92
汉语二语口语韵律能力评估维度的任务类型效应①
高思畅1,邹
申2
(1.上海外国语大学国际文化交流学院,上海200083;2.上海外国语大学英语学院,上海200083)[关键词]二语韵律评估;汉语作为第二语言;任务效应[摘
要]本研究考察汉语学习者在朗读篇章、听后复述和回答问题这三种口语任务上是否会体现
出韵律能力的差异。共有38名汉语二语学习者参与实验,16名评分员对这些参与者在3种口语题型上的韵律表现进行评估打分,评估维度包括韵律策略能力、自然度和流利度。方差分析的结果显示学习者在回答问题上体现出更好的韵律策略能力和自然度,回答问题的流利度也优于听后复述任务,但与朗读任务并无差异;朗读与听后复述任务在三个韵律维度上的表现均无差异。同时,通过相关性分析发现评分员在评估时对三个韵律维度的感知具有高相关性,且这三个维度均对韵律能力总分有较强的解释力,因此,在实际的口语能力评估中,不建议对韵律能力评估标准进行三个维度的细分。
[中图分类号]H014;H195.3
[文献标识码]A
[文章编号]1674-8174(2023)04-0059-09
1.引言
第二语言的发音准确性需要掌握音段特征(辅音和元音)和超音段特征(韵律特征,包括语调、声调、重音和节奏等),其中,韵律与言语的可理解性(comprehensibility )和可懂性(intelligibility )息息相关(Anderson-Hsieh 、Johnson 、Koehler ,1992;Kang ,2012;Kang 、Ru⁃bin 、Pickering ,2010;Munro &Derwing ,1995a 、1995b ;Kang 、Rubin 、Pickering ,2010;Trofimov⁃ich &Isaacs ,2012;Trofimovich &Baker ,2006、2007)。韵律在传递交际信息方面的作用非常重要,例如,恰当的韵律切分可以提高信息传递的效率,也具有解歧的作用(如Kjelgaard &Speer ,1999;Watson &Gibson ,2004),重音可以凸显沟通中的新信息和重点信息,语调的起伏变化则传递着说话人的语气和态度(Selkirk ,1995)。因此,二语韵律能
力可以帮助学习者进行有效、高效的沟通,
但是,汉语作为第二语言的教师和学习者往往不太重视韵律问题,口语交际产生问题时也大多忽略韵
律层面,即便意识到韵律层面的问题,也往往不能定位是韵律的哪个层面出现了问题。本研究利用汉语学习者口语韵律能力的评估标准(Gao &Pan ,2022),探索学习者的韵律维度是否更容易被特定类型的口语任务检测出来。
关于汉语二语韵律的研究大部分集中在声调的发展模式上(如冯丽萍、胡秀梅,2005;张林军,2010;陈默,2012;陈默、王建勤,2010)。少量研究关注了汉语语调的习得问题(张静,2018;桂明超、杨吉春,2000;王萍等,2017),关于汉语重音、汉语节奏习得的相关研究则较为匮乏(Ding et al.,2020;Gu &Hirose ,2014;张劲松等,2020;王蓓等,2020)。在汉语二语口语课堂里,
华文教学与研究2023年第4期
除了声调教学,韵律维度较少融入教学,其他的韵律维度(如句重音、语调)是否该在课堂中加强、该如何加强则鲜有关注。韵律评估量表(rating scale)可以为教师和学习者提供一个可实操的、专门针对韵律能力的标准(Davis et al.,1999),评估量表的开发和运用也体现了通过评估来探索、衡量韵律能力构念的过程。本研究以口语任务类型特征为切入点,采用已研制的汉语韵律评估标准(Gao
&Pan,2022),将声调、语调、节奏、重音等韵律组成全部纳入考虑,以此为基础考察汉语二语者在不同类型的任务中的韵律表现差异,并对汉语二语韵律评估标准提出改进建议。
2.二语口语韵律能力评估标准的开发
口语韵律能力逐渐成为二语口语韵律能力评估与测试关注的焦点。《欧洲语言教学与评估的共同参考框架》(CEFR,Common Europe⁃an Framework of Reference for Languages)的发音量表最新版的开发报告中提供了详细的英语作为二语的韵律特征的描述(Piccardo,2016)。中国英语能力等级量表(CSE,China s Standards of English Language Ability,教育部,2019)也对英语二语韵律能力从1到9级进行了细致的描述。然而,汉语能力量表对韵律能力的讨论则几乎是空白。对外汉语教学领域最早的能力标准是1988年出版的《汉语水平等级标准和等级大纲》,这个标准把汉语水平分成三等五级,对口语韵律能力几乎没有涉及。在汉语水平口语考试(HSKK)的相关标准中也未对初、中、高三个能力水平的学习者的口语韵律能力进行描述。新近颁布的《国际中文教育中文水平等级标准》(教育部&国家语言文字工作委员会,2021,以下简称“标准”)对口语韵律方面的描述鲜有提及。
CEFR的发音评估量表详细描述了语调、节奏、韵律组块、重音(包括词重音和句重音)以及语速,从A1(水平最低)到C2(水平最高)都对这些韵律特征进行了描述(Piccardo2016:42)。如:“能够表达流利的、易懂的口语,只在控制重音、节奏和语调方面偶尔出现失误,但这些不影响言语的可懂性和有效性(Can produce smooth,intelligible spo⁃ken discourse with only occasional lapses in control of stress,rhythm and/or intonation,which do not affect intelligibility or effectiveness)”“能为了完成交际目的而改变语调和使用正确的句重音(Can vary intonation and place sentence stress corr
ectly in order to express precisely what he/she means to say)”。
CSE是专门针对中国的英语学习者所开发的量表,该标准对韵律能力从1级到9级均进行了描述,主要体现在量表“语音系统和书写形式知识运用能力”中:
“能运用升调和降调表达疑问或陈述语气(1级)”
“能用正确的重音和语调朗读单词、简短句子或提出简单问题(2级)”
“能根据时态(-s/-ed)、词性(如record)、单复数(-s/-es)、比较级/最高级(-er/-est)等语法形式的变化正确发音(3级)”
“能通过句子重音强调特定意义(4级)”
“能在日常交流中恰当使用重读、连读、弱化和失去爆破(5级)”
“能利用音调和音高表达诧异、愤怒和惊喜等情绪(5级)”
“能使用重音、调型、音高、音量等方法吸引和保持听者的注意力(5级)”
“能使用升调、降调表明开始说话或者结束说话(5级)”
“能在表达观点和态度时,运用重音和节奏(6级)”
“能有效使用重音、语调、节奏、连读等,准确表达意义和强调观点(7级)”
“能得体地使用各种重音、调型、音高和音量表达语义和态度(8级)”
“能恰当运用语音、语调和节奏变化以增强学术交流或职场交际的表达效果(9级)”
从CSE的语音系统知识运用能力的量表中可以看出语调、重音、节奏、连读是主要衡量的韵律维度,级别的差异主要体现在不同的交际目的上。
已有的韵律能力评估标准的开发、研制均遵从这一核心原则:对韵律特征的衡量建立在是否能提高说话人的言语可理解度(compre⁃hensibility)和可懂性(intelligibility)上。例如,CEFR的量表中关于韵律能力的描述语主
要围绕语音的可理解性和交际目的展开。CSE 的受众主要为中国的英语学习者,比CEFR更加强调具体语境下韵律能力的体现,如“能在表达观点和态度时,运用重音和节奏”,强调学习者是否能使用韵律来完成具体的语言任务——这是韵律策略能力的体现。Bachman和
Palmer(1996)的交际语言能力框架就强调了以交际为主要目的的语言知识和策略能力的运用。在口
语交际中,通过不同程度的抑扬顿挫、轻重缓急可以表现出说话人的情感、目的和重点。在日常交际中,学习者也常常不仅需要明白对方说了什么,更需要通过对方说话的方式、语气来了解他对某一事件的态度、看法等,对情感态度的正确识别在社会交往中具有重要的价值(傅小兰,2016)。
基于CEFR和CSE等英语能力量表的讨论可见,英语能力量表密切关注学习者韵律能力的重要性,对韵律能力展开了详实、细致的讨论。新近颁布的《标准》将学习者语言能力分为三等九级,从四级开始对韵律方面有零星的描述(标准,2021:2-8):
“发音基本准确,语调比较自然…表达比较流利…(四级)”
“发音基本准确,语调比较自然…(五级)”
“发音基本准确,语调比较自然…表达流畅(六级)”
“发音准确,语调自然…(七级)”
“发音准确,语调自然,表达流畅…(八级)”
“发音准确,语调自然…(九级)”
但《标准》也只在语调层面进行了简单描述,对语调的要求基本表述为“自然”,并未对语调所携带的功能进行阐述。探究如何评估汉语韵律和制定相应的评估标准是具有重要意义的工作(Gao&Pan,2022)。通过专家访谈、教师问卷调查的方法开发了汉语学习者口语韵律能力的评估标准。该研究将编辑和筛选出来的描述语通过因子分析进行分类,确定了汉语口语韵律能力的三个维度:韵律策略能力、自然度和流利度。三项维度包含了15条
描述语,具体分为:
韵律策略能力:(1)能运用重音强调目的;(2)能运用不同的语调表达语气;(3)能运用重音表达情感和态度;(4)声调准确;
自然度:(5)节奏自然;(6)重音自然;(7)语调自然;(8)语调准确①;(9)语气自然;(10)连读自然;
流利度:(11)语速合适;(12)断句准确;(13)有节奏感;(14)无频繁的断词断句;(15)无过长的停顿(Gao&Pan,2022:
820)。
该研究发现汉语口语韵律能力由三个维度构成,然而,该研究在验证其评估标准的效度时,只考察了4
名评分员对29名考生的自由表达任务的韵律评估,效度验证过程中,评分员人数较少,口语任务类型单一。要验证评估标准的效度,需要综合考察评估实施的场景、任务特点、评估过程等等。
以往对评估标准的效度验证往往从定量和定性两个方向入手。部分研究者通过定量的方法,大规模运用研制好的评估量表并结合统计分析来验证量表的可靠性(East,2009;Knoch,2009),另一部分研究者则通过定性的方式,针对评分员的访谈、小组讨论来调整评估量表的内容(Harsch&Martin,2012)。Harsch&Martin(2012)认为定量和定性的结合是验证评估量表效度的必要方式。以上研究对量表的验证多为评估二语写作,关于二语口音评估的研究则较少(Isaacs&Harding,2017;Isaacs&Thomson,2013;Yates et al.,2011)。Isaacs&Thomson(2013)考察了评分员的经验和量表的分数类别长度(5分量表和9分量表)对二语发音评估的影响,Yates等(2011)通过对评分员进行评估前和评估后的问卷调查来获得针对雅思口语发音量表的修正部分的看法,该研究认为尽管理论上来说发音和流利度是两个构念,但是评分员在实际的评分操作中很难将二者很好地区分开来,这说明理论上的两个构念在人的感知中不一定容易区分,这也是人工评估中不可忽略的影响因素。
①在本研究中,5名评分员在实际运用该量表的过程中提出“语调自然”和“语调准确”不易从主观判断上区分,故本研究将二者合并为:“语调准确自然”。
高思畅,邹申:汉语二语口语韵律能力评估维度的任务类型效应
华文教学与研究2023年第4期
除了评分员的背景、评估标准的特点,对口语任务的特点和类型的考察也是对评估标准进行效度验证的重要方面。二语者在不同类型的任务上会有不同的语言表现(In nami&Koizumi,2016;Pae,2018;Tavakoli,
2009),Tavakoli(2009)发现学习者在半结构式的口语任务上的流利度优于非结构化的口语任务,学习者的口语语法复杂度也受到任务复杂度本身的影响,情节线较为复杂的任务会引发学习者更复杂的口语表达。In nami &Koizumi(2016)也表明,任务类型会对二语口语和写作评估的分数差异带来影响,任务效应所带来的影响超过评分员背景的影响。由此可见,学习者所参与的任务类型影响其语言表现的维度。在具体的评估过程中,韵律的某一维度可能会在不同口语任务上体现出敏感性,即该维度在某特定任务类型上会占有较高的比重,例如,韵律策略能力在自由表达任务上的重要性可能会超过流利度。或者,在某一口语任务上流利度较难体现,例如,参与朗读任务的学习者的流利度水平可能相差不大。此外,不同的评估维度彼此之间也具有交互影响作用,对于本研究来说,是否需要对韵律能力的评估细化为三个维度也需要探讨,因为在实际运用中需要考虑评估标准的可操作性和运用的便捷性,过细的分类也会为评分员带来不必要的工作量。因此,本研究将从口语任务类型的角度入手,通过16名评分员对三项口语任务的评估来考察:
(1)学习者在不同口语任务类型(朗读篇章、听后复述、回答问题)上的韵律表现是否有差异?通过对这个问题的探索来验证某种任务类型是否更倾向于检测出某韵律能力维度的优劣,以期为HSKK的题型设计提供参考;
(2)口语韵律能力标准的三项维度的贡献权重在不同任务类型上是否有差异?通过该问题探讨汉语学习者的口语韵律能力评估量表是否有必要进一步细化和分类。
3.口语韵律能力标准在不同口语任务类型上的使用
本研究采用单因素被试内的实验设计考察不同口语任务对三项评估维度的影响,自变量为口语任务类型,为被试内变量,包括三个水平:朗读篇章、听后复述、回答问题。因变量有四个,包括:韵律能力总分、韵律策略能力、流利度和韵律自然度。16名评分员对38名学习者在3项口语任务的表现进行打分。其中,韵律策略能力、流利度和韵律自然度由11名评分员根据Gao&Pan(2022)所研制的汉语韵律评估标准来评分,韵律能力总分的数据来自另外5名评分员,评分员对114份(38x3)语料的韵律给出整体印象分。
3.1被试
本实验的被试为来自上海外国语大学大二、大三和大四的本科留学生,一共38名,其中男性20人,女
性18人。参与者来中国的平均时长是3年6个月,其中来中国时间最短的是1年6个月,最长的是5年6个月。参与者的母语背景包括Igbo(非洲方言)、乌尔都语、日语、亚美尼亚语、韩国语、塞尔维亚语、土库曼语、白俄罗斯语、泰语、乌兹别克语和吉尔吉斯语等11种语言。
3.2评分员
16名汉语教师,均为女性,其中13名为汉语国际教育专业的在读研究生,平均教学时长为6个月,另外3名为汉语老师,平均教学时长为4年,每名评分员获得100元的报酬。3.3实验任务
三个实验任务分别为朗读篇章、听后复述和回答问题。实验任务在隔音效果较好的教室完成,通过Praat软件进行录音。朗读任务是一段未注音文本,共计151字,选取的语段并非学习者课本上的内容,朗读之前,给每位被试一分钟的时间浏览文本,然后再进行录音。听后复述任务要求被试听取录音后立即复述听到的内容,听力材料为母语者的一段录音,谈论话题为“选择不是越早越好”,听力材料时长为36秒,共计129字。播放听力材料时,被试不可以使用任何工具记下录音样本里的内容。播放结束之后,被试需要立即复述听到的内容。回答问题任务要求被试根据问题自由表达,问题是“留学生活中印象深刻的事”,符合被试的生活经验。回答问题之前,给每位被试3分钟时间组织语言,任务为不限时的自由表达,回答问题的录音样本仅截取一分钟语段,截取的语段从被试的第一个连贯表达开始,以第60秒时最后一个句子结束。
3.4评估任务
11名评分员根据Gao&Pan(2022)的汉语二语韵律能力评分量表对38名学习者口语语料进行评分,评分包括三个维度(韵律策略能力、自然度、流利度)的分数,评估任务开始前,对评分员做了15分钟左右的一对一培训,先由评分员解释他们对评估标准中的描述语的理解,主试根据评分员的理解进一步解释量表中各项指标的具体含义,培训的目的是让评分员对各条描述语有一致的理解,以便评分员准确地评估语料,评分员明确评分标准之后主试播放语料,评分员为每一段语料确定各个维度的分数(满分100分),11名评分员在三个维度(韵律策略能力、自然度、流利度)的评分者间信度ICC (Intraclass correlation coefficients)指标分别为.90、.91和.91,均在.90之上,信度良好。
同时,另外有5名评分员不参考上述标准,对学习者的语料进行口语韵律能力总体印象评分(满分100分),虽然不为5名评分员提供评分参照,但是主试在组织评分前也会和五位评分员明确对汉语学习者韵律能力的具体要求。5名评分员的评分者间信度ICC指标为.82,信度良好。
3.5单因素被试内重复测量的方差分析结果
统计分析通过R(4.2.1)(R core team2022)中的bruceR(Bao,2022)包进行方差分析和多重比较,三项口语任务对韵律能力的影响结果显示(见表1),口语任务类型对韵律能力总分、韵律策略能力、流利度和自然度的影响效应均显著。
韵律能力总分韵律策略能力
自然度
流利度
朗读篇章
M(SD)
78.33(9.43)
78.34(7.48)
79.20(7.57)
80.54(8.33)
听后复述
M(SD)
79.32(7.57)
78.92(5.19)
80.08(5.67)
79.75(6.68)
回答问题
M(SD)
81.58(9.81)
80.97(6.30)
81.64(6.27)
82.40(7.04)
F(2,74)
4.65
10.40
8.122
4.44
p
.012*
<.001***
<.001***
.015*
η2p
0.112
0.219
0.180
0.107
表1:三项口语任务对韵律能力的影响-重复测量的方差分析(M:平均数;SD:标准差)注:*表明显著性水平为p<.05,**表明显著性水平为p<.01,***表明显著性水平为p<.001
三项口语任务对韵律能力总分的影响结果
显示(见表1),口语任务的影响效应显著
(F(2,74)=4.65,p=.012<.05,η2p=.112),说明这三个口语任务之间存在韵律能力总分的差
异,继续进行事后多重比较。事后多重比较采
用配对样本t检验,t检验结果表明回答问题与
朗读篇章之间的韵律能力总分差异不显著
(t(37)=2.95,p=.017,多重比较需要调整p值水
平,三组比较的显著水平为0.05/3=0.0166),学习者在听后复述、朗读篇章、回答问题上的韵律能力总分并无显著的差异。
三项口语任务中韵律策略能力差异显示(表1),口语任务的影响效应显著(F(2,74)=
10.4,p<.001,η2p=.219),说明这三个口语任务之间存在韵律策略能力之间的差异。事后多重比较结果表明回答问题与朗读篇章之间的韵
表2:多重比较-韵律能力总分
听后复述-朗读篇章回答问题-朗读篇章回答问题-听后复述平均值
0.99
3.25
2.26
标准误
1.17
1.10
.99
t
0.85
2.95
2.27
df
37
37
37
Sig.
(2-tailed)
1.00
.017
.088
Cohen s d
.15
.48
.34
95%置信区间(Cohen s d)
下限
.29
2.70
-0.03
上限
.58
2.10
.71高思畅,邹申:汉语二语口语韵律能力评估维度的任务类型效应
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论