2antconc3.2.1_chinese使用手册[1]--688IT编程网

使用手册中文译文（Chinese translated version for the readme）：

AntConc3.2.1使用手册（Windows， Macintosh OSX，and Linux操作系统）

>>>>>>>>>>>>###

Laurence Anthony, Ph.D.(哲学博士）

科学工程英语教育中心

科学工程学院

早稻田大学

3-4-1 大久保，新宿区，东京169-8555，Japan

3月10日，2007年

>>>>>>>>>>>>###

AntConc开始是作为相对简单的索引程序，不过慢慢地进步成一个相对有用的文本分析工具。它是在Activ

eState供应商的优良Komodo 跨平台支持多种程序软件的开发环境下用Perl5.8程序语言写成的。这个程序只要双击可执行文件就可以打开，这个文件可以从Laurence Anthony实验室网站下载。这个程序可以在任何窗口环境下运行，包括Win 98/Me/2000/NT and XP, and also Macintosh OSX and Linux的电脑。如果用户发现任何这个程序在一个特定的操作系统下的使用问题，请让我知道。

AntConc包括以下工具：

索引**Concordance**

索引定位**Concordance Plot**

文件查看**File View**

词丛**Clusters**

N元模式（部分词丛）**N-Grams (part of Clusters)**

搭配**Collocates**

词单**Word List**

关键词单**Keyword List**

注意每个工具都可以点击工具窗口上各自的选项卡或者使用功能键F1至F7打开。

“索引”（Concordance）

索引工具生成用户选择的一个或多个目标文件的索引行（concordance lines或上下文关键词: key word in context)行。

concordance使用步骤

1）从file菜单的open file（打开文件）或open dir（打开目录）选择一个或多个要处理的文件，选出来的文件按顺序在主窗户的左边框里显示出来。

2）在左边的按钮条的输入框里输入一个检索词

3）使用右边"Search Window Size"（检索窗口大小）的按钮条的增加和减少按钮来选择在检索词两边显示的字符数。

4）按“Start”（开始）键开始产生索引行的检索结果。检索过程中可按“stop"(停止）键随时停止检索。5）

使用Kwic Sort（上下文关键词分类）下的按钮条选择一个目标词来重排索引行,0是检索词，1L， 2L 是检索词左边的第一，第二个单词，1R，2R是检索词右边第一，第二个单词。注意，三级分类均可，软件刚启动时，二三级未选择。

6）按“Sort”（分类）键开始分类处理。

7）将指针移到其中一行索引行的突出的检索词之上，系统默认为蓝。指针会转变成一个手形的图标。点击突出的检索词，可以使用户看到检索词在原文中出现的情况。见“File View"（文件查看）工具。

注意：索引行的总数在按钮栏中间的Concordance Hits（索引条数）下的输入框里显示出来，处理结束时，这个数字会闪一下“FINISHED”（结束），如果某个检索词没有产生索引行，则显示“NO HITS”（零条），如果是后面这种情况，索引行的窗户就不会更新，前面显示的索引行还会保留。

检索词可以通过选择检索词输入框（Search Term）上面的word（单词）选项设定为“词（默认）”或“词的片断”，也可以通过选择case来决定区不区分大小写，不区分为默认，也可以选择“Regex”使用完整的正则表达式，可以参考很多有关正则表达式的文章。可以通过网上的搜索引擎来查。也可以在网站ular-expressions.info/quickstart.html上信息。

按一下检索词输入框右边的Advanced键，可以进行更为复杂的搜索。第一个高级搜索项是定义一组检索词，既可以一行一个地输入，也可以直接载入文件中的一个检索词单。注意每一行都被认为是一个单独的检索词。这个特征允许用户使用一大组检索词但不用每次重复输入。第二个高级搜索选项是定义上下文词（Context Words)和一个上下文的范围，在这个范围中必须出现检索词。比如：要搜索"student"这个词，要求至少在它前三个或后三个单词中一定要出现"university", 就把检索词定为"student"，上下文词定为“university”，上下文范围定为‘From’3L‘to’3R

"索引定位"(Concordance Plot)

进行索引定位的步骤与索引工具的使用方法一样。但是索引定位工具提供了索引行另一个不同的视角。每一个文件的所有索引条数都在一个以条形码上定位出来，表示文中有检索词的索引行的位置所在。这个工具提供了一个容易的方法来看哪些文件包含目标检索词，也可以用来确定检索词在哪儿碰到词丛。一个例子是确定某个特定的实义词在科技文献的哪里出现，又或者一个字符什么时候出现在小说或剧本的发展过程中。

索引条数和每个文件的长度在条形码右边显示出来，定位本身的尺寸可以用左下角的Plot Zoom按钮来增大或缩小。

“文件查看”（File View）

任何时候目标文件都可以使用“文件查看”工具来查看原文。

要查看原文，用户需要进行以下操作：

1）在主窗口的左边框里选择一个要查看的文件

2）如果已经指定了一个检索词，检索词将会突出显示（默认蓝）。选定主窗口上的Flile View按钮，再按开始（Start），则得到检索词在原文出现的情况。

3）使用左下角的Hit Location下的按钮，可以跳到上一个或下一个检索词上。

4）改变检索词点击开始键查看其它的检索项。

5）点击在原文中突出显示的检索词，主窗口会出现一组KWIC lines(上下文关键词行或索引行）

以下是一个“File View”的快捷键

Ctrl-Click（单击）=跳到窗口中最近的检索项上

“词丛”（Clusters）

词丛工具是用来生成目标文件检索词周围排列成序的词丛列单的。

词丛既可以按照频率也可以按照词头或词尾排序，也可以按照词丛第一个单词的出现概率排序。所有的排列顺序可以反向。用户也可以选择每个词丛的最大或最小长度（单词数），以及列出词丛的最小频率。也可以选择检索词是否总出现在词丛左边或右边。（注意：在目前的版本中，如果超过一个单词指定为检索词，选择检索词在右，只有第一个单词出现在右边。）

生成词丛列单，需进行以下操作：

1）选定主窗口上的Clusters按钮，选择合适的排序选项。

2）按开始键，任何时候可以使用停止键（Stop）中止。

3）点击词丛会产生一组上下文关键词行或索引行。

“N元模式”（部分词丛）

“N元模式”工具是用来生成目标文件有序的N元列单的。N元模式是单词的N元，因此，大的文件将会产生大量的N元，比如，一个句子“This is a pen.”中的二元是‘this is', 'is a'和’a pen'。

就像和“词丛”工具一样，N元模式工具既可以按词频也可以按词头或词尾排列。也可以按词丛首单词的出现概率排列。所有的列单顺序都可以反向。同样，用户也可以选择每个N元的最大或最小尺寸（单词数），显示N元的最小词频。

想要列一个“N元模式”的单子，用户需进行以下操作：

1）选择Clusters窗口模式下Search Term右边的N-Grams选项

2）选择合适的排列选项

settings设置中文在哪里3）按开始键。任何时候都可以中止。

4）点击词汇束会产生一组上下文关键词行。

“搭配”（Collocates）

“搭配”工具是用来生成目标文件的一组有序的搭配列单的。

搭配既可以按词频，也可以按照检索词左边或右边的搭配频率，或者词头或词尾排列。也可以按照检索词和搭配间的统计量的值来排列。统计量的值测的是检索词与搭配度之间的相关程度。AntConc目前可行的统计量列在下面。所有的列单顺序可以反向。同样的，用户也可以选择检索词左右两边的单词跨度（单词数），显示的搭配的最小频率。比如：如果只要求一个单词跨度，要看哪些单词直接出现在检索词右边，选中右边Window Span（窗口跨度）的Same（相同）选项，使得单词跨度的最大值和最小值相同。

统计量（Statistical Measures）

交互信息（MI)：使用M. Stubbs在Collocations and Semantic Profiles, Functions of Language 2, 1 (1995)此文中描述的方程式。

T值（T-Score）：使用M. Stubbs在Collocations and Semantic Profiles, Functions of Language 2, 1 (1995)此文中描述的方程式。

要列一个搭配的列单，用户需要进行以下操作：

1）选择合适的排列选项

2）按开始键。任何时候都可以中止。

3）点击搭配会产生一组上下文关键词行。

“词单”（Word List）

词单是用来生成目标文件的有序的词单（单词表）的。

词单既可以按词频，也可以按词头词尾的顺序排列，还可以反向。词单可以在大小写不敏感（case-inse

nsitive）模式下生成，即不区分大小写，大小写同等对待；也可以在大小写敏感case-sensitive模式下生成，即区分大小写，大小写分别处理。

要列一个单词表，用户需要进行以下操作：

1）选择合适的排列选项

2）按开始键。任何时候都可以中止。

3）点击单词会产生一组上下文关键词行。

“关键词单”（Keyword List)

除了生成普通词单，AntConc可以比较目标文件中的单词和“参照语料库”（Reference Corpus）中的单词来生成一个“关键词单”，关键词单列出的往往是目标文件中频率很高或频率很低的词。

要列一个关键词单，用户需要进行以下操作：

1）选择一组目标文件

2）到“Preferences”（预设）菜单中，选择“Keyword Preferences”（关键词预设）选项。

3）选择一个统计量估计目标文件单词的“关键性”（keyness），推荐默认设定的对数相似值（Loglikelihood）。4）选择显示的关键词数的极限值（threshold Value)。

5)选择是否显示“负关键词”（show negative keywords)，即与参照语料库相比目标语料库中不同寻常的低频词

6)选择一个文本文件的参照语料库（.txt)，步骤与选择目标文件相同。

7）参照语料库的地址目录将显示出来（如果适当的话），参照语料库的文件列单将在参照语料库选项（Reference Corpus Options）下的窗口中显示出来。

8）点击应用“Apply”(应用），返回主窗口。

9）选择生成关键词单的排列选项，方式同生成词单步骤1）

10）按开始键。任何时候都可以中止。

11）点击关键词会产生一组上下文关键词行。

“菜单选项”（Menu Options）

菜单选项分为三组，“文件”（File），“总体设置”（Global Settings）以及“工具预设”（Tool Preferences）。每组可用选项如下所述：

“文件”

这里的选项与将文件读取到AntConc以及将包含各种不同类型的文件写入硬盘有关。也有选项是把所有当前的设置输出到文件（Export Settings to File），或者引入文件上的用户设置（Import Settings from File）。如果用户设置文件由于某些原因损坏了，只要重启文件或使用“恢复默认设置”（Restore Default Settings)选项将程序还原到原始状态即可。

“总体设置”

这里的范畴影响AntConc的多重工具。

“文件设置”<File Settings>

文件设置范畴中，用户可以选择显示完整文件路径（Show full pathname)或只是文件名。有个问题是File Settings下面还有一个选择文件格式的项，Default file type to use with "OpenDir"然后下面有显示了.txt，右边有个小按钮，指的是你从File菜单选项里选择OpenDir（打开目录）这个选项，显示的是你可以导入的文件格式是txt形式，意思是可以从OpenDir选项中选择的是这个小按钮按下去之后选择的文

件格式。OpenDir选择的只有文件夹，所以必须建立一个文件夹之后再选。

“标注设置”<Tag Settings>

“标注设置”范畴中，用户可以选择显示或隐藏语料库文件中的任何标注。如果要隐藏标注，标注的开始标记Start Tag和结束标记End Tag必须确定，默认的是<>。

“通配符设置”<Wildcard Settings>

通配符设置范畴中，用户可以编辑默认的通配符字符这样就不会跟检索词条不符了。比如：“或”（Or）通配符的默认字符是（一个竖杠的字符| }，可以换成反斜线符号/。

“定义类符（词）”<Token (Word) Definition>

定义类符（词）范畴中，用户可以选择哪些字符，数字等等定义为“词”。比如，有些情况下，只有字母组合（Letters）被认为是词，但是其它时候，也许会有需要将数字（numbers），破折号等等包含在词的定义中。AntConc完全适用统一码（Unicode），也就是说它可以处理任何语言数据，包括所有的欧洲语言和

亚洲语言。因此，默认选项以广义设置字母组合。比如：如果使用日语编码，字母组合则包括所有的日语字符。用户也可以做他们自己的“词”定义。

有关统一码标准（Unicode standards），更多信息见：

www.cs.tut.fi/~jkorpela/unicode/guide.html

/Public/5.0.0/ucd/UCD.html

/Public/

/charts/

“颜设置”<Color Settings>

颜设置范畴中，用户能够编辑用于显示结果和其它信息的颜。

“字体设置”<Font Settings>

字体设置范畴中，用户能够编辑用于显示结果和其它信息的字体类型，大小，以及样式。

语言编码

AntConc完全适用统一码（Unicode），也就是说它可以处理任何语言数据，包括所有的欧洲语言和亚洲语言。

AntConc读取数据的语言（编码）在这里指定。比如：如果你工作的数据保存的是欧洲语言，通常编码为iso-8859-1（默认）。另一方面，日语文本则通常编码为Shiftjis。通过指定恰当的编码，所有语言数据都能在AntConc中得到正确处理。

“工具预设”

每个工具（除索引定位和文件察看）都有一个预设类别，可以对设置做精细修改。所有工具预设类别允许客户显示或隐藏不同的结果显示框。比如：

用户能够选择在索引工具显示窗口中隐藏文件名的显示框，所有的工具也可以选择将所有数据视为小写（Treat all data as lowercase）并按大小写分类（use case when sorting）。如果结果显示区分大小写，包括大写字母在内的单词在列单中将会居前显示。

“索引预设”<Concordance Preferences>

除了以上这些，可以进行以下设置：

可以不根据检索词左右的单词排列结果，而可以按照检索词左右的字母安排结果。这样就可以搜索拼写区别了。

检索词也可以选择在关键词行（或索引行KWIC lines)隐藏，使得教师可以测验学生选择可能的词来填空。注意：任何时候，显示结果的窗口正在出现结果时，按Ctrl-X键，检索词会隐藏或出现。

“词丛预设”<Clusters Preferences>

这个工具除了以上描述的没有另外的设置。

“搭配预设”<Collocates Preferences>

除了以上的设置，可以在这里选择统计量。当前，可以选择的有两种统计量：交互信息(MI) 和T值（T-Score），见上文。

“词单预设”<Word List Preferences>

除了以上所述，可以做以下设置：

可以从文件中加载一个“词目单”（Lemma List)，这个词目单可以用来生成词目单，而不是词单。使用词目

vscode如何打开settings.json设置

« 上一篇

Serv-U日志安全配置与实用技巧

688IT编程网

2antconc3.2.1_chinese使用手册[1]

发表评论

推荐文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

2antconc3.2.1_chinese使用手册[1]

发表评论

推荐文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

非零金额正则表达式

半小时正则表达式