ChineseEtymologyHomePage
为什么研究汉字词源学
当我1972年在台湾时,是个22岁的年轻人,努力地让自己掌握流利的中文的读写. 摆在我面前的挑战是:我需要学会书写大概5000种汉字符和60000种汉字符的组合. 这些汉字符非常复杂,有很多笔划,并且几乎没有明显的逻辑.机缘巧合之下,我发现: 当我能够知道某个汉字符是如何一步一步地从它的原始结构演化而来时, 知道它的原始含义以及其原始结构的诠释时,那一瞬间所有这些笔划为什么如此构成就非常明显了. 问题在于:市面上并没有英文书籍来充分地讲解词源学甚至于你查阅中文书籍也不到单独的一本书可以解释所有的一切. 简言之,理解所有的汉字符是一项研究性质的工程. 手头有这样的英文的资讯将会是一个巨大的帮助.
计算机化的词源说明的第一个优势是你可以做各种各样的分析而不必受限于书籍的线性本质. 第二个优势是词源学是一项不断前进发展中的研究项目.说到字符词源学, 我们无法解答所有问题.一旦在计算机化系统中发现任何错误或者不一致的地方, 它们可以很容易地被纠正.而对于已经出版发行的图书来说,这些错误就无法即刻被纠正了.
在词源学上真的有数以千计的参考资料,它们中的大多数是中文的.这些参考资料中的大多数都有些或新鲜,或独特,或有趣的地方值得一说,但是在这里我仅列出了我到的最好的参考资料,如下:
图形文字和表意文字 | 当代传统文字 |
原始和遗留 | 行书和草书 |
释义和翻译 | 当代简化文字 |
重要的抽象 | 篆體字 |
形声和形声变换 | 金文 |
中文衍生字符 | 甲骨文 |
象形文字和表意文字
在远古中国,当汉字符第一次被发明出来时,一个或者多个指示了含义或者读音的象形符号构成了这些汉字符.象形符号是指生动的图画符号.这样我们就有了一些字符,它们包含一个或多个或单独或联合起来的指示一个含义的象形字符.有时字符的一部分指示了某些含义而另一部分指示了发音.某些情况下很难组成一个表意符,表意符是指表达了想法的图像.因为仅凭象形
符无法容易地代表含义,表意符有时仅仅借用其他的有相同发音的符号.
Back
Primitives and Remnants
原型是图画的原始形式.理想中它们应当易辨识,尽管它们可能需要一些解释. 随着时间的流逝,这些字符的样子也在不断的变化,这样一来原始的象形文字不再容易辨识了. 发音也在不断的变化,最终,含义也产生了修改.遗留至今的就是当代的字符或者我称之为偏旁部首的字符的一部分.偏旁部首是图画般得当代结构形式.所有的字符和字符的一部分都是偏旁部首.一个很好的例子是字符'犬' quan dog.我们拥有字符指明了现代字符的偏旁部首'犬' 和'犭'起源于非常明显的狗的原始画像.甚至公元前500年的孔夫子也曾说"古代人一定 拥有过看起来非常奇怪的狗".这个例子有总比没有好,但是现如今,当代中文字符仅仅是一 堆与其意义没有明显关系的复杂笔划.所以现代的汉字符既不是图形字也不是表意字.
Back
释义和翻译
字源学的目的是为了探究这些偏旁部首的来源. 某字符有一个含义是 Dian 電 (electicity in English).它的现代的含义是 电 .它的原始含义是 闪电 (lightning in English).它的诠释是电闪雷鸣的雨云下落而来并且击中了地面.
Back
重要的抽象
我数了大概400个原型.如果这些原型提供了字符的含义,它们的现代遗留通常被称为Significs. 无论是含义改变了很多还是我们无法理解当时创造这个字符的人的想法,都导致了一个字符是一个signific常常不是那么清晰的.这称之为Signific的抽象.一个简单的例子是 字串原型 Mi 糸 "string". Sun 孫 "grand child" 将指示了一个字串和一个 Zi 子 "child",或者 the string of children,或者抽象说来,"grand child".这个抽象是简单的,有些却不是这样的.
Back
形声和形声变换
当代汉语大概有八百个字符被作为形声字.他们中的三分之一可以很容易地被识别出来. 另外的三分之一能被有文化的人辨识出来.最后的三分之一就有些困难了而只能加以分析. 自古代以来对形声变化的研究就非常有成效了.有些是自然而然的,有些是从其他方言来的.
参考书籍:
Analytic Dictionary of Chinese and Sino-Japanese by Bernard Karlgren
The classic English analysis of Chinese phonetics.
Back
中文衍生字符
字迹指的是一种语言所书写的符号.中国的书写体系被很多种语言和中国的方言所借鉴, 影响甚远,而不是当前被称之为普通话的官方语言.对于汉语和所有其他从汉字符衍生出来的其他字符,我使用词组汉字衍生符.这些语言包括了广东话,台湾话,上海话,日语,韩语,越南语, Jurchen以及其他方言.我们网站专注于现代汉字符的词源学,也包括关于汉语普通话,广东话, 台湾话和上海话的信息.
Back
当代常见汉字符
这指的是用来书写现代官方语言的字迹.在英语世界,我们有一个字母表并且使用总共62 个字母和数字来拼写.对于一般的本土人士来说,我们使用大概六万个现代英语词汇. 在现代汉语中,一个有文化的成年人使用了大概5000个字符,与之相应的是一个单音节的官方话词汇表.这些字符能够组成大概六万个多音的官方话词汇, 为现代本土人所使用.问题在于:汉字符的模糊数字性质.
在英语的打字机或者电脑上面,我们可以几乎不费力气的由准确的62个字母-数字符号组合出任意的单词.在汉语的世界,我们可以用手写或者有时我们可以创造出我们所想的任意新字符. 对于汉语的打字机或者电脑来说,我们不得不提前限制可以使用的字符.这就如同制造一台英语的打字机,但是这台打字机只能够打印固定数量的单词,对于新的词汇或者特别的词汇只能望洋兴叹了.老式的手动中文打字机拥有7000个字符,用于电脑的简体汉字 GB2312-80标准支持6763个字符.用于电脑的繁体字Big5标准支持13051个字符, 比大多数人使用量的2倍还多.Unicode“基本的多语言平台”尝试囊括所有的汉字符, 包括了简体和繁体汉字,日语,韩语,广
东话,这样一来,它总共包含了27484个字符. 至于什么是简化字什么是繁体字,这个问题非常复杂,我们会单独讨论.
参考书籍:
Chinese, Japanese, Korean and Vietnamese Computing - CJKV Information Processing by Ken Lunde
This is the best book on the computerization of CJKV languages.
The Unicode Standard Version 4.0 The Unicode standard.
常用國字標凖字體表
Published by the Ministry of Education of Taiwan listing the 4808 characters necessary for adult literacy.
Back
繁軆字 自公元200年以后的现代印刷的汉字
现代字符是由一系列的简单笔画所构成的,如同过去1800年那样被书写, 过去的主要的书写工具是毛笔.在此之前,人们使用完全不一样的另一种风格的字符, 这些字符是以芦苇笔写在竹板条上的.公元元年左右,发生了向简化的笔画为基础的转变, 以芦苇为书写工具.这种风格被称之为 LiZi 隷字 or LiShu 隷書 . 隷的意思是'粗糙的,未加工的',因为那个时候这种简化的形式被认为没有标准可循.我使用字眼 LiZi 隷字 来指示历史学上的准确无误的字符展现, 它们实际上存在于公元1年至公元200年,而不是被称之为 LiShu 隷書 的现代书法艺术形式. 截止到当前的研究, LiZi 隷字 被认为是 seal characters 和现代字符之间的中间过渡. 在发明毛笔作为书写工具的大约公元200年,书写形式开始变为了称之为KaiZi 楷字 or KaiShu 楷書的形式.毛笔所带来的改变远远不止形式结构上的小改动, 这些字符被当作了标准.字眼 Kai楷的意思是'标准'.到公元200年,它们已经成为了标准字符. 许多公元200年时期的常用字已经消亡不见了,新的字符又被发明创造出来. 有一些字符的书写发生了小小的改变,有一些字符的含义发生了变化.HanYuDaZiDian 漢語大字典 是 Kai楷 类别字符的最大的字典.它包括了超过56,000 个现代的印刷的汉字符,囊括了过去2000年使用的简体和繁体字符.我称它们是现代的, 因为它们都是现代形式.它们中的大部分是很少见的字符或者很少见的变体,并不是有用的现代汉语的一部分.大约25%的现代字符在公元200年时还没有出现.大多数那时使用的字符现在仍然可以被辨识出来,尽管它们的含义可能发生了变化.
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论