第22卷现代教育技术V ol. 22 2012年第8期Modern Educational Technology No.8 2012
基于Web的多媒体新闻语料库的建设与实施*
——以听力教学与研究为目的的设计模型
杨林伟1 伍忠杰2
(1.烟台大学 外国语学院,山东烟台 264005;2.电子科技大学 外国语学院,四川成都 610045)
【摘要】Web多媒体或多模态语料库作为第四代语料库,其建设与研究已成为研究热点。多媒体语料库具有文本、声音、视频等多种媒体共存、关联、互动的特点和优势,非常适合应用于英语听力教学实践。建立为听力教学服务的Web多媒体语料库除需要有丰富的多媒体数据库,确定语料库结构,并按照一定的标准进行格式化入库等常规建库操作之外,还需设计适于听力教学的辅助功能,如在线练习自动生成,词汇难度列表,语料可读性分析、听力新闻专有名词提取等。具备教学功能的Web 多媒体语料库,使语料库教学实施更具灵活性、广适性和可操作性,有利于学习者利用语料库进行移动学习、自主学习和研究性学习,提高英语听力教学效率和效果。
【关键词】多媒体语料库;听力教学;Web;方法;实施
【中图分类号】G40-057 【文献标识码】A 【论文编号】1009—8097(2012)08—0072—05
一 英语听力教学现状及其面临的问题
听力是最重要的四种语言技能之一,也是在日常交际中最常用的语言技能。Morley[1]使用数字量化说明听力的重要性“我们听到的是说的两倍,是阅读的四倍,是写作的五倍”。此外,听力理解是其他语言技能不断发展的基础。[2]因此,听力理解,不仅在第一语言沟通起着至关重要的作用,也是外语学习的核心。鉴于听力的重要性及其课程特殊性,我国英语专业听力教学最早引进了多媒体语音室设备,较早地实现了多媒体外语教学,教育技术在英语专业听力教学中起到了关键的推动作用。
随着网络与多媒体技术的不断发展与进步,目前大学听力课堂教学电化设备发生了巨大变化,由原来的“教师主机+卡座/显示器终端”,升级为“教师服务器+学生电脑终端”。加之移动学习设备如MP3、MP4、智能手机、平板电脑的广泛普及,听力教学硬件设备及其多媒体学习条件处在前所未有的大好时期。然而与之形成对比的是英语专业听力教学“软件”上存在不足,主要有以下三个方面。首先,纸质教材从编写到出版发行需要一定的过程,信息的实时性不足。即使是英语专业最新的听力教材,其信息也会滞后,导致教学过程中存在学生对内容不熟悉,兴趣不足的问题。其次,课外听力材料,尤其是新闻材料选取的难度及其适应性缺乏客观标准。从教师方面而言,向学生提供的单一围绕专业四级
考试的材料在难度方面可以较好地适应学生水平。但是,在新闻材料的选取方面带有盲目性,无法客观地确定其难度,不能很好地顺应学生的实际水平。最后,从学生方面来讲,英语专业学生听力学习动机强,利用自己的移动设备提高听力的积极性也很高,但是缺乏真实而有针对性的听力材料以及教师的有效指导,导致无法有效地利用移动学习来提高听力水平。
另外,听力教学及其教学改革的研究多以理论为主,譬如图式理论、认知理论等在听力教学中的应用。虽然上述的研究对教师遵循科学规律进行听力教学起到了重要的指导作用,但是其理论研究的抽象性和概括性以及听力教师自身科研水平的差异性,导致在教学中的实际操作与应用效果存在较大不同。
二 多媒体新闻资源库、语料库与听力教学
多媒体资源库与语料库在听力教学中都有着十分重要的作用。多媒体资源库是包含多媒体素材、课件、案例、习题、视频点播等多个子库的资源检索系统,其多媒体素材字库可看作为未加标注的“生”多媒体语料库。而多媒体语料库是语料库经由文本语料库、口语语料库发展到目前的新型语料库。多媒体、多模态语料库的提法由来已久,但目前学界对其还缺乏一个统一的定义,国内外系统论述多媒体语料库的文献也尚不多见。[3]多模态语料库是经过对声音、图像、动作、手势、面部表情等多种模态形式进行人工标注后的语料库,其特点是以“言语理论”基础,以言语活动为研究对象,以从原始数据中
抽取信息和知识为手段,以语境模型为驱动的囊括整个言语活动的语言、声音、图像和动作。[4]多媒体语料库可以认为是含有文本媒体标注,但未加模态标注的“生多模态语料库”。
从功能角度来讲,未经深加工的多媒体语料库主要用于
72
满足语言教学研究的需要,而多模态语料库主要用于语言基础研究如多模态话语分析。由于建立多媒体语料库,不仅需要文本还需要声音、视频、字幕、图片等多媒体形式,其与传统语料库相比更加费时、费力、成本更高。在多媒体语料库的研究多以理论研究为主,如刘芹潘[5]、李学宁[6]、曾庆敏[7]、孙志楠[8]等在理论框架、应用前景等方面进行的基础研究。目前国内建成并应用于教学的多媒体语料库在开发形式、应用范围、教学衔接等方面都存在不足之处。比如,由教育部语言文字信息管理司、国家广播电影电视总局宣传管理司和中国传媒大学共建的有声媒体语言资源网提供基于Web的音视频语料检索系统,是国内大型的汉语新闻多媒体语料库,仅提供简单的文本语料库检索,基本功能为音视频数据型网站。某高校语料库研究中心以语料驱动学习为指导思想,整合了多媒体技术,实现了语料检索与音视频定位同步播放的多媒体语料库开发系统。[9]基于Windows系统单机运行,在应用范围、跨平台、教学衔接方面尚存在薄弱点。
多媒体新闻语料库的语料一般包括动态更新的官方电台和电视台真实的新闻报道。学习者使用语料库
是既能分析索引行文本,又能听新闻或者看新闻,还可以看到随时间变化的滚动字幕。梁红梅等[10]提出“把语料库索引与文本、音频、视频有机地结合起来, 建立多功能的多媒体语料库更能满足我国大学英语学习者的实际需求”。笔者在烟台大学外国语学院英语专业二年级学生中使用自行开发的教学用Web多媒体新闻语料库的教学实验证明,多媒体语料库的建立与应用能有效地解决目前英语专业听力教学中存在主要问题,有利于帮助学生克服新闻听力这一难以攻克的难关。
鉴于上述对英语专业听力教学现状以及多媒体语料库与听力教学的分析,本文提出建立与“教师服务器+学生电脑终端”的多媒体课堂以及与移动学习相匹配的Web多媒体新闻语料库,探索建库方式,研究与之相适应的听力课堂可操作性教学方法。本研究提出的建立多媒体语料库的方法与业已建立并投入使用的新闻语料库,以完全服务英语教学、迎合英语学习者自主学习需求与期望为目的[11],克服前人研究与实践的缺点,以移动教育技术发展方向为指导,与听力教学紧密结合,具有网络化、开放性、教学性、易于移动学习等显著特点。
三 自建多媒体新闻语料库的方法与实施
本文所用到的多媒体语料库是作者自建的为听力教学服务的小型多媒体新闻语料库,其主要来源为VOA、BBC、ABC 和NBS。语料来源全部来自美国和英国主流媒体的英语新闻材料。该语料库是经过Treetagger赋码后的熟语料,其检索工具并非传统的单击运行的软件,而是基于Web的检索平台。基
于Web的优势在于大大拓展语料库的使用范围,既可以在局域网又可以在互联网上使用。学习者和教师不需要单机安装和学习软件的使用,而是直接通过浏览器浏览网页程序即可。语料库要让全校学生使用,较理想的模式是采用B/S(浏览器/服务器)架构的语料库。[12]作者在建立、使用该语料库进行听力教学过程中,研究和总结了一套自建小型多媒体语料库的方法以及其应用于教学的实施方案,以期对听力教师能起到积极的指导作用。
第一,语料的选取。听力课程的特殊性以及围绕听力教学建立的语料库的教学特性决定了语料选取与加工的方法。教师在选取语料时,应以热点新闻、突发事件为主。学习者对上述两种新闻的内容一般会比较熟悉,并且关注度较高,学习兴趣较浓。此外,新闻主题应避免单一,涵盖政治、经济、科技、农业、教育等常见领域,力求语料库的平衡性。
新闻网站设计第二,语料的加工。多媒体新闻语料的加工与传统的纯文本语料不同。除对新闻文本(脚本)进行赋码加工处理外,还要对体现多媒体概念的主要三大元素包括图片、声音和视频进行规范化和格式化。作者推荐对图片采用Web上通用的png格式,声音采用HTML5支持的Mp3格式,视频则使用H.264进行编码处理。在HTML5技术流行的趋势下,使用上述格式对教学实施过程的兼容性,对后期扩展到移动学习中有重要的意义。对于文本的加工推荐使用梁茂成教授开发界面的Treetagger进行赋码,其准确率达96%。文本加工更重要的一点在于对文本添加时间标签,制作成字幕文本,实现文本、声音、视频的相互关联检索,这也是多媒体语料库的重要特点之一。对于听力教学而言,建议授课教师自行进
行有针对性的对语料进行深度多模态标注加工,标准语料库平台提供开放的在线加工和上传接口,供教学使用。多模态标注加工加工后的文件结构,建议采用规范的结构管理,如图1。
图1 多媒体语料库的文件结构
第三,语料检索。技术上采用BS模式,即浏览器加服务器的方式。BS模式的语料库检索方式方便、易用、扩展性强。使用者不需要安装软件,只需浏览器即可使用检索工具。其
73
74
易用性还体现在支持教师独立建库,教师只要按照图1所示的文件结构收集、加工语料,上传至服务器后,不需要做任何技术处理,即可在线使用。学习者既可以使用电脑,有可以使用手持设备如平板电脑、智能手机、PDA ,智能MP5等检索语料库。扩展性还体现在很好地支持多教师基于Web 进行合作建库。语料检索方式采用经典的索引行(KWIC )方式,既可以检索纯文本,实现文本行索引并提供检索词搭配索引,又可以显示检索音视频多媒体语料,做到文本、声音、视频三维度检索。
第四,教学功能。自建多媒体新闻语料库要服务听力教学,除具备检索功能外,须体现完整、易用的教学功能。结合听力教学实际,提出以下五种功能。
(1)单句点读。该功能包括两部分,第一是语料库检索结果的索引行,可以点读;第二是具体到语料库中每一篇脚本中,可以实现逐句点读。如图2所示。
图2 单句点读
(2)可读性分析。采用Flesch–Kincaid 可读性计算公式(图3和图4),利用PHP 文本处理类分别准确计算出文章的易读性值和年级水平值。学习者可以根据这两个参考值,选择适合自己阅读水平的材料进行拓展学习(如图5)。
图
3 易读性值计算公式
图4 年级水平值计算公式
(3)词汇难度统计。利用专业四、八级词库,大学英语四、六级词库与语料脚本进行对比,计算出脚本的词汇难度分布情况,并利用PHP 文本分析类提取多音节词的词频以及长度大于7个字符的单词频数供教学参考(图6)。
图
5 文章可读性分析工具
图6 词汇难度分析
(4)词表生成。采用PHP 脚本程序生成两种词表,包括语料库最常用的按频数生成的word list 和利用专有名词识别技术生成的专有名词词表(图7)。旨在为学习者提供直观的词汇数据信息,尤其是专有名词的提取,对于新闻英语听力材料中新闻词汇的记忆以及新闻听力水平的提高有重要意义。
图7 专有名词词表和高频词表
(5)练习功能。学习者可以自行设置并生成填空题的数目,程序会按照一定规则随机生成听力练习。由于语料库词性赋码的优势,程序还可以提供专项听力练习生成的功能。学习者可以按照词性、短语结构等自行设置练习类型(图8)。
尤其是对于英语听力中容易出现弱读、连读等现象而造成理解困难的小品词,学习者可以进行专项训练,对提高英语听力水平有重要的帮助作用。所有练习都可以打包为网页格式供学习者下载,以便于离线学习。
上述功能是具体到每篇语料的教学功能,可为教师和学生提供详细的文本统计数据,能很好地解决材料给谁用、怎么用、用得如何等听力教学中的关键问题。详细功能的实现将在下一节教学实施中介绍。
75
图8 练习生成
四 多媒体新闻语料库在英语专业听力教学中的实施
语料库研究成果丰硕,涉及词典编纂、大纲设计、教材开发、课堂检索练习和语言测试等诸多方面。[13]语料库研究与听力教学的结合,并将语料库应用于听力课堂教学的研究尚不多见。本文从英语专业听力教学过程出发,在多媒体语料库与自主学习相结合的基础上,将听力教学实施分为三个步骤,即课前准备(学生预习或教师备课),课堂辅助和课后扩展。三个步骤与语料库紧密结合,既能促进课堂教学效率,又能发挥学生的自主学习期望,拓展专业研究性学习(图9)。
图9 多媒体语料库应用于听力教学的基本模式
首先,要求学生将课文中将要学习的关键词在多媒体语料库中检索,泛听、泛读文本,欣赏相关音视频材料(图10和图11),起到很好的课前热身作用。教师亦可利用该多媒体新闻语料库进行课前材料的准备。
图10 关键字NASA
的检索界面
图11 关键字NASA 的检索结果
其次,语料库辅助课堂教学实施。课堂Warm-up 阶段,教师可以精选适合教学、并与课堂内容相关度高的材料,学习词汇、表达,通过泛听了解与课堂主题相关的内容。授课过程中,将课文内容与精选内容进行对比,比较其不同的表达方式、话语特点等,掌握不同说话者的不同发音方式和听力技巧。课文结束后,补充课外内容,进行随堂小测验。测验部分既可以由教师统一组织,又可以由学生自主测试,选择感兴趣、适合自己的材料进行。
最后,课外自主学习和拓展研究性学习。学习者可以围绕某一热点新闻或话题,通过关键字检索比如“Syria ”,将与Syria 相关的音视频材料索引列表,试听(看),既可以解读、听、看索引行,进行词汇、表达方面的多文本比较学习,又可以精听某一篇语料,并通过自编练习,测试学习效果。如果学习效果不理想。或者学习者需要离线重复学习时,系统可以打包所有材料为离线使用的压缩包,供多次、重复练习。
五 结论
本文以多媒体语料库应用于英语听力课堂为切入点,分
析了听力教学中的问题与不足,结合多媒体语料库的自身优势,提出了听力教学用多媒体语料库建设及其课堂实施的可操作性模型。文章提及的Web 多媒体语料库已初步建成,程序设计亦处于完善阶段,并提供网络用户免费体验。希望对语料库辅助英语听力教学实践及研究有一定的启示意义。 ———
—————
参考文献
[1] Morley, J. Listening comprehension in second foreign language instruction. In Marianne Celce-Murcia (Ed.), Teaching English as a second language[C]. New York: Newbury House, 1991:81-105.
[2] Feyten, C. M.. The Power of Listening Ability: An Overlooked Dimension in Language Acquisition[J]. The Modern Language Journal, 1991,(75):173-80.
[3] 焦彬凯.基于多媒体语料库的数据驱动学习模式研究[J].中国电化教育,2010,279:71-74.
[4] 张霄军.多模态语料库:抢救濒危语言的有效途径[A].民族
76 语言文字信息技术研究—第十一届全国民族语言文字信息学术研讨会论文集[C].云南:西苑出版社, 2007:35-41.
[5] 刘芹潘,鸣威.理工科大学生英语口语多模态语料库构建研
究[J].现代教育技术,2010,20(4):69-72.
[6] 李学宁,马利霞.MCA检索方法及其在外语电化教学中的
应用[J].现代教育技术,2010,20(11):83-87.
[7] 曾庆敏.多模态视听说教学模式对听说能力发展的有效性
研究[J].解放军外国语学院学报,2011,34(6):74-78.
[8] 孙志楠.多模态话语理论在大学英语教学中的应用[J].教育
探索,2011,(8):45-46. [9] 李文中.Multimedia Corpus Positioning Concordancing[R].
语料库语言学发展战略研讨会,上海,2009.
[10] 梁红梅,尹晓霞等.语料库驱动下的外语在线自主学习模
式[J].外语电化教学,2005,(12):29-32.
[11] 杨林伟,伍忠杰.网络英语课程与英语学习者自主期望[J].
北京邮电大学学报(社会科学版),2005,7(4):56-59.
[12] 张济华.语料库与大学英语教学改革[J].山东外语教
学,2008,(5):64-68.
[13] 肖忠华,许家金.语料库与语言教育[J].中国外语教
育,2008,(5):51-52.
Web-based Multimedia News Corpus Construction Methods and Its Application in Listening Class
YANG Lin-wei1 WU Zhong-jie2
(1.School of Foreign Languages, Yantai University, Yantai, Shandong 264005, China; 2. School of Foreign Languages, University of
Electronic Science and Technology, Chengdu, Sichuan 610054, China)
Abstract: The 4th generation multimedia corpus consists of the following major elements such as text, audio, and video, which fits English listening class well and provides great potentials for improving listening skills. The construction of web-based multimedia corpus for teaching listening pur
pose contains not only the common rules of text corpus but also the new educational functions. Web-based corpus should provide more teaching and learning functions such as automatically generating quiz, readability analysis, vocabulary difficulty lists and proper nouns extraction. The features of good flexibility, wide feasibility and high interactivity of web-based multimedia corpus make it a powerful tool for learners’ autonomous learning, mobile learning and research learning. Keywords: Web; multimedia corpus; teaching listening; implementation
————————
*基金项目:本文为山东省高校人文社会科学研究计划项目“基于语料库的多模态电视新闻英语话语分析”(编号:J10WD59)的研究成果。
作者简介:杨林伟,烟台大学外国语学院,讲师,硕士。研究方向:教育技术学,语料库语言学。
收稿日期:2012年3月28日
编辑:李原
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论