项目九 多媒体技术基础
计算机应用其实质就是使用计算机进行信息处理。数值、文字、声音、图像等都是人们用以表达和传递信息的媒体,了解它们在计算机中怎么表示、处理、存储和传输,对于掌握计算机的操作与应用有重要的作用。
单元1图形图像技术基础
学习目标
(1) 了解字符的编码;
(2) 掌握文本的制作和编辑的方法,熟悉常用文本处理软件;
(3) 了解数字图像的获取、表示及常用图像文件格式;
(4) 了解数字图像的编辑处理和应用;
(5) 了解计算机图形的概念和应用。
学习知识
1、 字符编码
文字信息在计算机中称为文本,组成文本的基本元素是字符,字符与数值信息一样,在计算机中也采用二进位编码表示。
1)西文字符
计算机用于表示字符的二进制编码称为字符编码。目前,国际上使用最多、最普遍的字符编码是ASC字符编码。ASC码的全称是American Standard Code for Information Interchange,译为美国国家信息交换标准字符码
标准的ASC码是7位的编码,可以表示27=128个不同的字符,每个字符都有其不同的ASC码值,他们的编码范围是0000000B-1111111B00H—7FH)。并且,这128个字符共分为字符串长度和字节3类,分别如下。
数字0-9
26个大写英文字母和26个小写英文字母。
各种运算符号、标点符号和控制符号等。
其中,数字、大写字母、小写字母都是按照它们的自然顺序进行排列,且小写字母的ASC码值比其相应的大写字母的ASC码值大32。例如,大写字母DASC码值是68,小写字母dASC码值等于68+32=100
2)汉字
中文文本的基本组成单位是汉字。汉字数量大,字形复杂,同音字多,异体字多,因而汉字在计算机内部的表示与处理、传输与交换以及汉字的输入、输出等都比西文复杂一些。
GB2312-1980汉字编码
国标码
为了适应计算机处理汉字信息的需要,1981年我国颁布了《信息交换用汉字编码字符集·基本集》(GB2312-1980),简称国际码,又称汉字交换码。该标准选出6763个常用汉字和6
82个非汉字字符,为每个字符规定了标准编码,以便在不同计算机系统中间进行汉字文本的交换。
    GB2312国际字符集由以下三部分组成:
    第一部分是字母、数学和各种符号,包括拉丁字母、俄文、日文平假名、希腊字母、汉语拼音等共682个(统称为GB2312图形符号)。
    第二部分为一级常用汉字,共3755个,按汉语拼音排列。
第三部分为二级常用字,共3008个,因不太常用,所以按偏旁部首排列。
区位码
在国际码中,所有的常用汉字和图形符号组成了一个94行、94列的矩阵。每一行的行号称为区号,每一列的列号称为位号。区号和位号都由两个十进制数表示,区号编号是01-94,位号的编号也是01-94。由区号和位号组成的四位十进制编码被称为该汉字的区位码其中区号在前,位号在后,并且每一个区位码对应唯一的汉字。例如,汉字的区位码是1601”,表示汉字位于16区的01位。
将区位码转换GB2312国际字符集的方法:首先将十进制的区号和位号分别转换成十六进制;然后将转换成十六进制的区号和位号分别加上20H,最后将分别加上20H的区号和位号组合得到GB2312国际字符集。
机内码
区位码中,区号和位号各需要7个二进位才能表示。每个汉字的区号和位号分别使用1个字节来表示,且都从33开始编号(33-126),字节的最高归为均为1。如图9-1所示。这种高位均为1个双字节(16位)汉字编码就称GB2312汉字的机内码,又称内码。目前PCGB2312汉字的表示都是这种方式。
机内码是汉字国标码的两个字节的最高位分别加1,也就是汉字国标码的两个字节分别加80H得到对应的机内码,即汉字机内码=国际码+8080H
9-1 区位码
GBK汉字内码扩充规范
    GBK是我国1995年发布的又一个汉字编码标准,全称为《汉字内码扩展规范》。它一共有21003个汉字和883个图形符号,收录了繁体字和很多生僻的汉字。
GBK字符集中的每一个汉字和图形符号也都采用双字节表示。与GB2312的内码保持向下兼容,因此所有与GB2312相同的字符,其编码也保持相同。
GBK不仅仅支持简体字,还支持繁体字和很多生僻的汉字。GBK是我国1995年发布的又一个汉字编码标准,全称为《汉字内码扩展规范》。它一共有21003个汉字和883个图形符号,收录了繁体字和很多生僻的汉字。GBK字符集中的每一个汉字和图形符号也都采用双字节表示。GBK的第一个字节最高位是1,第2个字节的最高位可以是1,也可以是0。如图9-2所示。
9-2 机内码
③ UCS/Unicode与GB18030汉字编码
    GB2312和GBK都是在我国大陆使用。
    台湾地区的标准汉字字符集CNS11643BIG5,俗称大五码),其仅支持繁体字。  GB2312、GBK、BIG5都不兼容。
ISO制定了一个实现所有字符在同一字符集中统一编码,称为UCS。对应的工业标准称为Unicode,它的实现(如UTF-8,UTF-16)已经在Windows 和Unix、Linux操作系统中及许多因特网的应用中广泛使用。
由于GB2312和GBK与UCS/Unicode不兼容,为了既能与国际标准UCS/Unicode接轨,又能保护已有的大量中文信息资源(即与GB2312和GBK兼容),我国发不了GB18030-2000汉字编码国家标准,并在2001年就开始执行了。
GB18030-2000编码特点为:既与UCS/Unicode兼容,又和GB2312和GBK兼容;近3万汉字
(包括GBK汉字和CJK及其扩充中的汉字);部分双字节、部分4字节表示,双字节表示方案与GBK相同。
2、 文本的制作与编辑
文本在计算机中的处理过程包括文本准备、文本编辑、文本处理、文本存储与传输、文本展现等。如图9-3所示。
(1) 文本准备
① 汉字键盘输入
汉字的键盘输入编码方案有几百种之多,能够被广泛接受的编码方案应具有下列特点。易学习、易记忆、效率高(平均击键次数较少)、重码少、容量大(可输入的汉字字数多)等。
② 非击键方式的汉字输入方法
使用键盘输入并不适合所有用户,为此,人们研究开发了其他的汉字输入方法。如直接在触摸屏上或使用一种称之为书写笔的设备,通过书写的方式输入汉字,或使用话筒通过口述
的方式输入汉字,或者使用扫描仪把汉字成批输入计算机。
9-3 文本在计算机中的处理过程
(2)文本的分类
    根据文本是否具有编码排版格式来分,可分为简单文本(纯文本)和丰富格式文本两大类。
1 简单文本
呈现为一种线性结构,写作和阅读均按顺序进行,通用性好,没有字体字号变化,不能插入图片表格,不能建立超链接。计算机中的“文本文档”就是简单文本。
② 丰富格式文本
经过排版处理后,纯文本中就增加了许多格式控制和结构说明信息,称为丰富格式文本。丰富格式文本根据文本内容的组织方式来分,可以分为线性文本和超文本两大类。
传统的纸质文本其内容的组织是线性(顺序的)因而读者总是按顺序先读第1页(从第一行读到最后一行),再读第2页、第3页,这就是线性文本。
③ 超文本
超文本(hypertext)概念是对传统文本的一个扩展,除了传统的阅读方式之外,它还可以通过链接、跳转、导航、回溯等操作,实现对文本内容更为方便的访问。超文本采用网状结构来组织信息,一个超文本由若干文本块组成,每个文本块中包含了一些指向其他文本块的指针,用于实现文本阅读时的快速跳转。这些指针成为超链接(hyperlink)。文本块可以是文字,也可以是图形、图像甚至声音或视频,这就把超文本推广到了多媒体的形式,所以有时
称为超媒体Hypermedia)。如图9-4所示。
9-4 超文本结构
9-1 文本的分类
(3)文本编辑与处理
① 文本编辑
文本编辑的主要功能如下所述。
对字、词、句、段落进行添加、删除、修改等操作。
字的处理:设置字体、字号、字的排列方向、检举、颜、效果等。
段落的处理:设置行距、段间距、段缩进、对称方式等、
表格制作和绘图。
定义超链。
页面布局(排版):设置页边距、每页行列数、分栏、页眉、页脚、插图位置等。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。