语料库
基于语料库的tend和intend的对比研究
基于语料库的tend和intend的对比研究张艳妍 (中国科学院研究生院 外语系,北京,100049)摘要:通过在COCA语料库和CLEC语料库比较近义词tend和intend的用法,结果发现中国英语学习者有混用及语义韵含糊的现象。本文以tend和intend为例,通过比较二词的类连接、搭配词及语义韵,对我国英语学习者的近义词习得提出探讨。关键词:近义词;语料库;语义韵;词汇习得作者简介:张艳妍,...
基于COCA语料库的英语近义词辨析——以confine, restrict和restrain为...
基于COCA语料库的英语近义词辨析——以confine, restrict和restrain为例作者:卢明远来源:《校园英语》 2021年第12期 文/卢明远truncate的区别 【摘要】作为世界上词汇量最大的语言之一,英语中存在着大量的近义词,传统的词汇辨析一般依赖于权威的英语大词典,如牛津,朗文,柯林斯等,但学习者并不能通过词典来寻到他们...
基于COCA语料库辨析同义词Divide和Separate
2282018年12期总第400期语言文化研究ENGLISH ON CAMPUS基于COCA 语料库辨析同义词Divide 和Separate文/雷文慧【摘要】语料库索引是辨析英语同义词的有效方法,该方法对英语教学有一定的启示作用,尤其是以语料库为基础的英语同义词教学。本文基于美国当代英语语料库(COCA),采取语料库研究方法,以同义词divide和separate为例,主要就这组词的词频、搭配、...
基于语料库的同义词“持续”、“连续”的辨析
基于语料库的同义词“持续”、“连续”的辨析作者:伊淑娟来源:《青年文学家》2015年第17期 摘 要:文章以同义词“持续”和“连续”为例,通过使用语料库,运用搭配理论和语义韵理论,展示了语料库技术在同义词辨析方面的重要作用。 关键词:语料库;同义词辨析;持续;连续 ...
“四月天”可否翻译成“April
“四⽉天”可否翻译成“April day”?近⽇翻看赵彦春教授的博客,发现有⽹友质疑赵教授将《你是⼈间的四⽉天》⼀诗中的“四⽉天”译为“April day”,这位⽹友还将“April day”联想为四⽉的第⼀个节⽇愚⼈节(April Fool’s Day)。笔者原本打算对赵译《你是⼈间的四⽉天》做系统的鉴赏、评价,并且和黄新渠教授的英译版本进⾏对⽐分析,以探索诗歌翻译的技巧和策略。但觉得在做系统的...
“秋分”的英文表达方式
“秋分”的英文表达方式北半球的秋分大约在9月23日,这一天,南北半球的昼夜都一样长。自此以后,北半球的白天渐短夜晚渐长,寒气渐增暑气渐减,气温因而随之下降,南半球则恰恰相反。 根据《汉语大词典》所载,“秋分”一词,最早见诸2100年前西汉哲学家董仲舒的《春秋繁露·阴阳出入上下》:“至于中秋之月,阳在正西,阴在正东,谓之秋分。秋分者,阴阳相半也,故昼夜均而寒暑平。”意思是说,到了仲秋(秋季的第二个月...
中国学生英语写作中种类量词的研究
中国学生英语写作中种类量词的研究摘 要: 量词存在于任何语言里,它使人类的表达更精准、更生动,是表达数量的重要工具。和其他类型的量词相比,种类量词较为特殊,它表达的不是事物的数量而是类型。本文通过语料库对比的方式,考查了kind/sort/type在中国学生英语写作中的使用情况,发现了这三个量词有被中国学生过度使用、使用不足和过度泛化的倾向。关键词: 中国英语学习者 种类量词 使用情况1.量词数量...
陕西省旅游景区公示语翻译语料库系统的设计与实现
陕西省旅游景区公示语翻译语料库系统的设计与实现作者:董,高东怀,朱益平,张知元来源:《中国教育信息化·高教职教》2012年第12期 摘 要:根据语料库语言学的基本观点,结合陕西省旅游景区的文化特及多样性特点,对陕西省旅游景区公示语翻译语料库的主题栏目进行了规划,开发了一套基于PHP的陕西省旅游景区公示语翻译语料库系统。该系统...
数字化生态视域下影视作品文化素材语料库的建设探索
数字化生态视域下影视作品文化素材语料库的建设探索摘要:信息化时代对外语教学提出了数字转型的新要求。本文依据谢弗的文化理论,探讨影视作品文化素材语料库的素材发掘、框架设计及社会功用等内容,为外语学科的数字化改革做出新尝试,为课程思政提供新资源。关键词:语料库;数字化;影视作品;文化素材2017年麦肯锡公司在其报告中第一次提出 “数字化转型”的概念。这一理念随即被教育领域接受并获得广泛推广。建设高性能...
如何在ChatGPT中添加自定义语料库
如何在ChatGPT中添加自定义语料库ChatGPT是一个基于大规模预训练模型的对话生成系统,它使用世界各地各个领域的互联网数据进行预训练,以此来生成自然流畅的回复。然而,尽管其预训练数据庞大且多样化,但对于特定领域或个性化需求的对话场景,ChatGPT可能会显示出一些不完全准确或不理想的回复。为了改善这一点,我们可以通过添加自定义语料库来增强ChatGPT的知识和理解能力。本文将介绍如何在Cha...
中日对译语料库使用方法
中日对译语料库使用方法1.引言概述部分可以对中日对译语料库的使用方法进行简要介绍,包括介绍中日对译语料库的定义、特点和使用场景等。概述部分内容如下:1.1 概述中日对译语料库是一个用于中日互译的语料库资源,它包含了大量的中文和日文文本对照数据。这些数据可以帮助翻译人员准确理解中日两种语言之间的差异,提高翻译品质和效率。中日对译语料库的特点有以下几个方面:首先,中日对译语料库的数据来源广泛,涵盖了各...
语料库 !!!
如果你也搞语言,你会用到的语料库~~中央研究院现代汉语标记语料库(现代汉语平衡语料库):www.sinica.edu.tw/SinicaCorpus/这是首页。进入中文版,就是这个:www.sinica.edu.tw/ftms-bin/kiwi1/mkiwi.sh中央研究院近代汉语标记语料库:www.sinica.edu.tw/Early_Mandarin...
基于语料库的同义词组辨析r——以adhere to,cling to,hold to为例_百 ...
基于语料库的同义词组辨析r——以adhere to,cling to,hold to为例赵杭飞【摘 要】作为新的语言研究方法,语料库语言学对于语言研究影响重大,基于语料库的研究也已在多个领域得到广泛应用,然而对同义词组的研究甚少.本文借助美国当代英语语料库(COCA)从词频、语域、搭配以及语义韵四方面比较区分同义词组adhere to,cling to,hold to的用法,旨在帮助英语学习者区分...
语料库常用统计方法
frequency函数计算频数3.5语料库常用统计方法第3章前几节对语料库应用中的几种主要技术做了介绍。通过语料检索、词表和主题词表的生成,可以得到一定数量的句子、词汇或结构。为能更好说明所得到的结果的真正意义,常常需要对它们加以统计学分析。本章主要介绍语料分析中的一些常用统计方法。3.5.1 语料库与统计方法介绍相关统计方法之前,首先需要了解为什么语料库应用中需要运用统计方法。在2.1节讲到文本...
GENSIM官方文档(4.0.0beta最新版)-面向新手的核心教程
GENSIM官⽅⽂档(4.0.0beta最新版)-⾯向新⼿的核⼼教程GENSIM官⽅⽂档(4.0.0beta最新版)-⾯向新⼿的核⼼教程译⽂⽬录博主全天在线,欢迎评论或私信讨论NLP相关问题1. 核⼼概念本模块介绍Documents, Corpora, Vectors and Models:他们是理解和使⽤gensim所需的基本概念和术语。import pprintgensim的核⼼概念有:1....
Python自然语言处理中的Gensim技巧
Python自然语言处理中的Gensim技巧一、前言自然语言处理(Natural Language Processing, NLP),是人工智能(AI)和语言学领域的交叉学科,其目的是让计算机具备识别、理解、生成自然语言文字的能力。Python作为一个快速开发的高级编程语言,已经成为了NLP中最流行的语言之一。Gensim是Python中的一种自然语言处理库,提供了从原始文档中抽取和推断语义信息的...
python机器学习——NLTK及分析文本数据(自然语言处理基础)
python 机器学习——NLTK 及分析⽂本数据(⾃然语⾔处理基础)NLTKNLTK(Natural Language Toolkit),⾃然语⾔处理⼯具包,在NLP(⾃然语⾔处理)领域中,最常使⽤的⼀个Python库。⾃带语料库,词性分类库。⾃带分类,分词功能。NLTK安装 安装:pip install NLTK测试:import nltkAnaconda不⽤安装安装语料库:执⾏代码后,会出现...
python中文文本里的词的重复数_Python数据挖掘——文本分析
python中⽂⽂本⾥的词的重复数_Python数据挖掘——⽂本分析python中文文档作者 | zhouyue65来源 | 君泉计量原⽂ | Python数据挖掘——⽂本分析⽂本挖掘:从⼤量⽂本数据中抽取出有价值的知识,并且利⽤这些知识重新组织信息的过程。⼀、语料库(Corpus)语料库是我们要分析的所有⽂档的集合。⼆、中⽂分词2.1 概念:中⽂分词(Chinese Word Segmentat...
AGeneralserviceListofEnglishWords英语通用词表
A Genera l servic e List of Englis h Words英语通用词表Michae l West在1953年发表的经典著作 A Genera l servic e List of Englis h Words(英语通用词表)中的语义频率数据加以对照分析。后者是一部非常独特的著作,虽然其中的数据是根据电脑时代之前所建立的一个语料库...
python情感分析语料库_python中文情感分析Snownlp库的使用
python情感分析语料库_python中⽂情感分析Snownlp库的使⽤不⽢⼼的时候,就是在进步;痛苦的时候,就是在成长。⽂章⽬录⼀、Snownlp 简介SnowNLP是⼀个python写的类库,可以⽅便的处理中⽂⽂本内容,是受到了TextBlob的启发⽽写的,由于现在⼤部分的⾃然语⾔处理库基本都是针对英⽂的,于是写了⼀个⽅便处理中⽂的类库,并且和TextBlob不同的是,这⾥没有⽤NLTK,所...
pythontransform方法_我应该如何理解pythonsklearn中的.tran。。。_百...
pythontransform⽅法_我应该如何理解pythonsklearn中的.tran。。。向量器将语料库(例如⽂本⽂档)转换为向量Vector Space Model。有很多⽅法可以做到这⼀点,⽽结果将取决于所使⽤的技术。⽮量器是必要的,因为模型处理的是数字,⽽不是⽂字。具体来说,CountVectorizer的实现将⽣成⼀个数组,其中包含每个单词的出现次数。在这种特定情况下,CountVe...
语料库和应用翻译——以蚕学馆旧址纪念碑碑文的翻译为例
上海翻译2013ⅣD.1语料库和应用翻译——以蚕学馆旧址纪念碑碑文的翻译为例黄海军王昌米(浙江理工大学外国语学院,杭州310018)[摘要】语料库所提供的词频、索引、搭配及同义词等信息,可以帮助我们在应用英语翻译过程中更好地对词义进行推敲,准确地理解与表达。本文利用美国当代英语语料库(CO C A)的新界面w or dandphr ase.i nf o,对蚕学馆旧址纪念碑碑文翻译的文本语类特征以及...
高校英文网站专用英语语料库构建方案
高校英文网站专用英语语料库构建方案作者:姚爽 冯春园来源:《现代交际》2017年第05期 摘要:国内外翻译领域越来越多地应用以Trados为代表的辅助翻译软件和语料库技术手段,而大多数国内学者尚未将语料库应用于高校英文网站的开发和建设,此方面研究成果数量不多。本文将语料库引入高校英文网站建设,从语料收集及分类整理、语料描述、 &nb...
《计算机辅助翻译》课程教学大纲
《计算机辅助翻译》课程教学大纲Computer-assisted Translation适用专业:翻译课程学时:16课程学分:0.5一、课程性质与教学目标本课程是翻译专业高年级的一门选修课程。计算机辅助翻译课开设的前提是学生已具备较好的英汉双语语言技能,掌握了一定的英汉互译理论与技巧,并且有较好的计算机操作能力。该课程旨在向学生介绍计算机辅助翻译的基础知识,让他们熟悉几种常见的CAT软件,如Wor...
nltk数据集格式
nltk数据集格式 NLTK(Natural Language Toolkit)是一个用于自然语言处理的Python库,它提供了丰富的语言数据集和预训练模型。NLTK数据集通常以特定的格式存储,以下是几种常见的格式: 1. 文本格式(Plain Text),NLTK的一些数据集以纯文本格式存储,每个文本文件对应一个数据实例。这种格式适用于文本分类...
语料库在英语教学中的应用
语料库在英语教学中的应用作者:刘琳莉来源:《神州》2012年第11期 摘要:利用语料库的方法进行英语教学是语言教学研究领域中一门新兴的学科,在教学中可以为学生提供真实的语言材料并达到学习英语的目的。本文首先讨论了语料库的定义及发展历史,分析了英语语料库的作用及语料库对英语教学的影响,最后也阐述了英语语料库在独立院校英语教学中的应用。 ...
一个超大规模分类标注语料库的建立
一个超大规模分类标注语料库的建立刘华摘要:针对文本分类中训练(测试)集获得较难、分类系统不合理的问题,我们构建了一个超大规模层级网页分类语料库。该语料库字段信息丰富,分类系统科学,存储格式可扩展性强、语义结构化。适合构建文本分类、话题识别和信息检索的大型训练(测试)集。关键词:语料库内容解析字段信息分类体系 xmlConstruction of a Super Classed and...
DynamicTopicModels的Python实现
DynamicTopicModels的Python实现Dynamic Topic Models的Python实现Dynamic Topic Models(DTM)简介Dynamic Topic Models来源于Blei于2006发表在第23届机器学习国际会议上的论⽂ ,与先前的Latent Dirichlate Allocation(LDA)模型有所不同,DTM引⼊了时间因素,从⽽刻画语料库主题...
中文文本校对源码java_浅谈中文文本自动纠错在影视剧搜索中应用与Java实...
中⽂⽂本校对源码java_浅谈中⽂⽂本⾃动纠错在影视剧搜索中应⽤与Java实现1.背景:这周由于项⽬需要对搜索框中输⼊的错误影⽚名进⾏校正处理,以提升搜索命中率和⽤户体验,研究了⼀下中⽂⽂本⾃动纠错(专业点讲是校对,proofread),并初步实现了该功能,特此记录。2.简介:中⽂输⼊错误的校对与更正是指在输⼊不常见或者错误⽂字时系统提⽰⽂字有误,最简单的例⼦就是在word⾥打字时会有红⾊下划线提...
基于Web的多媒体新闻语料库的建设与实施_以听力教学与研究为目的的设计...
第22卷现代教育技术V ol. 22 2012年第8期Modern Educational Technology No.8 2012基于Web的多媒体新闻语料库的建...