第22卷 第2期 吉 林 工 学 院 学 报 Vol.22 No.2 2001年6月 JOURNAL OF JILIN INS TITUTE OF TECHNOLOGY Jun.2001 文章编号:1006 2939(2001)02 0039 03
汉语点字(盲文)的计算机处理
y
ascii文字是啥王红梅, 应红霞, 石 晶
(吉林工学院计算机科学与工程学院,吉林长春 130012)
摘 要:介绍了计算机处理盲文的方法,包括汉语点字方案、点字编码方案、点字机内码的形成及点字的计算机输入方法。
关键词:盲文点字;点字编码;点字输入
中图分类号:TP317 2 文献标识码:A
0 引 言
近年来,随着计算机技术,特别是Internet网
络的高速发展,计算机应用已经深入到人类社会
的各个行业、各个领域,甚至千家万户。然而,盲
人这一特殊体离计算机这一高科技产品还很遥
远。美国、白俄罗斯等国已研制出可供本国盲人
使用的计算机,而我国目前还没有达到实用阶段
的盲文文字处理机,因此盲文文字处理系统的研
究对填补该领域的空白将起到一定的作用,并为
盲人参与现代社会的发展提供一个科学、高效的
手段。文中介绍的是盲文文字处理系统中的一个
关键问题:如何使计算机能处理盲文。
1 汉语点字方案
1 1 点字方案
法国盲人路易 布莱尔在1829年发明用6个
点作为一个符号单位的盲文符号。6个点有的凸
起,有的不凸起,例如:
(用 !表示凸出点;用
∀!表示不凸出点),每个组合元素在盲文中称作一个点字或一个方字。点字符号是利用触觉的摸读文字,可以进行摸读和书写,是目前全世界一致采用的盲文符号,但在不同的国家盲文符号代表的含义不同。
中国盲文文字实际上是一种拼音文字,由字母、声调、标点三个主要部分组成,音节的拼写规则与汉语拼音规则相同,由声、韵、调组成,标点符号的用法与汉语的用法完全相同,标准点字方案有声母(18个)、韵母(34个)、声调(4个)、标点符号(16个)组成,详细的点字方案参见文献[1]。
1 2 点字方案的特点
中国盲文的音节构成遵循汉语拼音的构成,要求分词连写,用空格作为词的切分符号,但有些音节的形式与汉语拼音有些差异,具体如下:
(1)声母zh,ch,sh,z,c,s,r可以单独构成音节。
(2)点字方案中没有辅音y和w,韵母本身构成一个完整的音节。
(3)声母j和g,q和k,x和h分别共用一个方字,当与以i, 打头的韵母相拼时分别为j,q,x,否则为g,k,h。
(4)韵母o和e共用一个方字,当与b,p,m,f 相拼时为o,否则为e。
(5)一般情况下,音节不标调,只是在区分同音词和生僻词时才使用少量的声调符号。
由此可见,盲文点字方案比汉语拼音方案更简便,便于盲人快速摸读,但这却给计算机处理带来一定的难度。
1 3 点字方案的修改
现针对第五点修改点字方案。规定每个音节都以声调结束。修改原因主要是为了在进行机器翻译时能够识别一个音节的结束。
前四点差异可以通过机器翻译来实现,算法如下:
CASE点字OF
zh,ch,sh,z,c,s,r:在该点字后加上i;
y收稿日期:2001 02 06
作者简介:王红梅(1968-),女,吉林长春人,吉林工学院讲师,工学硕士,主要从事计算机应用研究
韵母:在该点字前加上y或w;
g,k,h:接收下一方字X,若X为以i, 打头的韵母,则修改前一方字为j,q,x,否则前一方字不变;
b,p,m,f:接收下一方字X,若为o或e,则确定X为o,否则X不变;
ENDCASE
2 计算机处理盲文的基本方法
2 1 编码方案
由于盲文点字符号没有编入ASCII和GB2312 80字符集内,因此,计算机系统内不能表示出点字字母,我们必须制定点字字母的编码方案,使之能被计算机接收、转换、存储、加工、输出。 点字共有63种,因此其码值自然限定在1~ 63范围内,根据六点方字的特点,将每个点位赋以相应的权,各点位的权值之和就是该点字的码值。
定义1 六点方字位号按列成序,即左列3位依次为1,2,3,各位的权分别为20,21,22;右列3位依次为4,5,6,各位的权分别为23,24,25。如图1所示。
14
25
36
图1 六点方字点位顺序示意图
定义2 点字码值M
M=#6i=1k i∃2i-1
k i=1:该位凸起0:该位不凸起
定理1 每个点字码值唯一。
证明:用反证法。
设方字X有两个不同的码值Y1和Y2,根据定义2有:
Y1=m0*20+m1*21+m2*22+m3*23+m4*24+m5*25 Y2=n0*20+n1*21+n2*22+n3*23+n4*24+n5*25 因为对同一方字其凸的点位是确定的,所以有m i=n i(i=1,2,3,4,5,6),即Y1=Y2与假设矛盾。
证毕。 定理2 点字码值的值域为[1,63]。
证明:码值的最小值是只有点位1凸起,其它点位均不凸起的方字,其码值等于M=1*20+0 *21+0*22+0*23+0*24+0*25=1;码值的最大值是所有点位均凸起的方字,其码值等于M= 1*20+1*21+1*22+1*23+1*24+1*25=63。 证毕。
依据以上定义和定理,我们就完成了对点字字母的编码,且确定了每一点字的码值。
例:符号的码值为0*20+1*21+0*22+1* 23+1*24+0*25=26
2 2 机内码的形成
我们将63个点字加到GB2312 80字符集内[2],考虑到要保留其它字符的完整性,占用GB2312 80的第十区(原为空白区)来依次存入点字。这样,所有点字符号的区号就确定为10,而位号恰好与其码值一致。根据汉字操作系统的设计,区位码到机内码转换公式:
机内码=区位码两字节分别换成16进制后+A0H 2 3 输入方案
点字字母的输入方案是根据盲人的书写习惯和6点方字的排列来设计的。利用普通计算机键盘,重新设计了键盘管理程序定义w,s,x,q,a, z这6个键依次对应1,2,3,4,5,6点位,另外定义空格键为一个字母输入的结束标志,也称跳方键!,有凸点的点位按下相应的键,对应位的权值就确定了,当跳方键按下后,点字的码值就唯一确定可对其进行机内处理,从而完成了一个字母的输入。
由于盲人书写时是反扎(写)正摸(读),所以键盘6个键定义形式对盲人使用非常方便,并且不一定要按位序依次击键,只要正确敲下凸的点位即可确定其码值。
3 输入校对
在一个音节输入结束后,需要将盲文音节翻译成汉语拼音的形式,以便到该字的语音信息,进行语音提示和输入校对。为了节省存储空间和查的方便,该拼音文本是双拼双音形式。本系统使用了数字化语音库,包括全部汉字发音的1282个汉语有调音节的量化数据。当要发出某字的音时,查询语音库得到该字的量化数据,转换成模拟信号输出。
40吉 林 工 学 院 学 报 第22卷
4 结 语
综上所述,通过较少的修改点字方案以适应盲人的书写习惯,设计点字编码以形成汉字机内码,重新定义键盘管理程序以接收点字输入,使计算机方便地接收点字并进行处理,为盲人使用计
算机提供了一个科学、高效的手段。参考文献:
[1] 黄加尼,张克敏 点字符号用法[M] 北京:中国盲
文出版社,1985
[2] 赵连江 计算机应用基础[M] 哈尔滨:哈尔滨工业
大学出版社,1997
Computer Processing of Chinese Braille
WANG Hong mei, YING Hong xia, S HI Jing
(School of Computer Science &Technology,Jilin Inst.of Technol.,Changchun 130012,China)
Abstract :A method of processing braille in computer is presented with the braille scheme,the braille code scheme,the formation of braille c ode in computer and the input method of braille.Key words:braille;braille c ode;braille input
41
第2期 王红梅等:汉语点字(盲文)的计算机处理
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论