课程基本信息
课题
《数据编码——字符编码》
教科书
书名:《信息技术必修1:数据与计算》                               
出版社:人民教育出版社、中国地图出版社    出版日期: 2019 年 6月
教学目标
教学目标:1.知道字符编码作用,了解常见字符编码方案ASCII、GB2312-1980、GBK、
GB18030-2005、unicode字符集及编码方案。【信息意识】【计算思维】
2.了解计算机处理字符的过程,知道中文汉字的输入码、机内码以及输出码。
【信息意识】【计算思维】
3.掌握常见字符处理问题(txt文档与网页乱码现象、Word中文字重叠)的
解决方法,能够根据需要选择合适的字符编码。【信息意识】【数字化学习
与创造】
教学重点:常见的字符编码方案
教学难点:常见字符处理问题的解决方法
教学过程
时间
教学环节
主要师生活动
2分钟
提出真实问题、确立探究主题
    在日常使用计算机的时候,同学们有没有遇到过这样的情况或问题呢:
打开文本文档、浏览网页时出现了乱码现象
Word文件中出现了文字重叠的情况
遇到这些情况时,我们该怎么办呢?若想解决问题,必要知其原理。今天,我们就和大家一起来探究计算机是如何处理字符的。
15分钟
辨析概念原理、理解字符编码
计算机作为数据处理的一种工具,只识别0和1的二进制。因此,在处理各种对象时需要将其转换成计算机可识别的二进制数据。那么字符是如何转变成二进制的呢?
(一) 探究一:字符如何变成二进制?
1. 字符编码的概念
  字符编码是按照预先确定的规则,将所需字符转换映射为计算机可以接受的二进制数字的过程。字符编码方案会为每个字符指定对应的数字编码,便于不同计算机系统间交换文件,产生的编码叫做交换码。
字符编码包括字符集(系统支持的所有抽象字符的集合)与字符编码(方案)(符号集合与数字系统间建立对应关系的法则)。
(1) 英文字符编码方案——ASCII
  在早期应用时,计算机只用处理英文字母、数字和常用的英文标点符号。为了处理英文字符,美国信息标准协会制定ASCII (American Standard Code for Information Interchange)美国信息交换标准代码。在ASCII编码方案中,制定了包含128个英文字符的字符集,包括英文大小写字、数字、常用符号等。
提问思考:至少需要几个字节可以表示128个字符呢?
1个字节为8位,可以表示256种情况。因此,ASCII采用1个字节对128个字符进行编码。
体验活动:利用编码输入字符
  在输入英文字符时,我们可以通过键入字符、插入符号等方式,也可以利用ALT+ASCII编码来输入。
(2) 中文字符编码方案
  当计算机引入中国后,我国的中文汉字多达10万多个,1个字节的ASCII编码已无法满足需求。因此,我国设计了GB系列字符编码用于将汉字转换为计算机可接受的数字。
GB2312-1980
1980年,我国颁布了GB2312-1980,即《信息交换用汉字编码字符集——基本集》。共收录了6763个汉字,以及包括数字、拉丁字母、希腊字母等在内的682个字符。GB2312-1980兼容ASCII编码,依然用单字节表示ASCII规定的英文字符,采用2个字节表示1个汉字以及其他字符。
GBK
GB2312基本满足了计算机处理汉字的需要,但未包含人名、古汉语等方面出现的罕用字。在GB2312的基础上我们又增加了2万多个字符1995年,形成了GBK《汉字内码扩展规范》,。
GB18030-2005
  在GBK的基础上,GB18030-2005又增加了少数民族的文字。采用单字节、双字节和4字节的变长编码,且能够向下兼容GBK、GB2312和ASCII。
(3) unicode字符集与编码方案
每个国家拥有自己的语言和文化,在使用计算机时也会建立自己的字符编码。随着互联网将世界连接起来,各个国家采用的字符编码不同,信息交流时就会产生问题。那么有没有一种编码方案能够容纳世界上的所有字符,实现集大成者呢?
面对这样的情况,国际标准化组织和Unicode组织制定了unicode字符集,致力于将世界上所有文字和符号都纳入,以满足使用不同语言的人利用计算机进行信息交流。对于unicode字符集,常见的编码方案有UTF-8、UTF-16、UTF-32等。
(4) 体验活动:txt中的联通
刚刚我们学习了常见的字符编码,下面我们通过实践体验一下不同的字符编码对字符处理会产生什么样的影响。
  体验实践
请同学们在自己的计算机中新建一个txt文档,输入“联通”两个汉字,保存后再打开看看会出现什么?
原理分析
经过实践,同学们发现“联通”两个字变成了乱码,那么这是为什么呢?让我们通过一段短片来看一下。
 
问题解决
  文本文档【另存为】-【编码】选项中选择合适的字符编码。
(二) 探究二:计算机处理字符时要经历哪些过程?
1. 计算机处理字符的基本工作过程
  通过键盘等方式输入字符,在计算机内部进行存储和处理,最后通过显示屏等输出。
(1) 输入字符
英文字符:利用键盘直接键入求一段乱七八糟的乱码符号
中文汉字:输入码(外码)
输入码是将汉字与键盘能建立对应关系,实现利用键盘将汉字输入到计算机中。
(2) 处理字符
  英文字符:ASCII编码
  中文汉字:机内码(由交换码计算而来)
  由于GB2312-1980等编码方案兼容ASCII编码,以3021(十六进制)为例,它在GB2312-1980和ASCII中表示不同,计算机就会产生歧义。因此,计算机在处理中文汉字时,要在交换码的基础上计算得出机内码。
(3) 输出字符
字型码用于字符在显示屏或打印机输出,又称输出码、字模码,通常有两种表示方式:点阵和矢量。不同的字体库拥有不同的字形码。
2. 小结计算机处理字符的过程
环节
英文
中文
输入
键盘直接键入
输入码
(拼音、五笔等)
处理
ASCII编码
机内码
输出
字型码(输出码):点阵&矢量
6分钟
解决常见问题、应用所学实践
1. 问题1:如何解决乱码的问题?
  解决方法:选择合适的字符编码方案
(1) txt文档——另存为选择编码方案
(2) 网页——右击选择编码方案
2. 问题2:如何解决Word中的文字重叠?
  解决方法:字间距设置,选择合适的字体库
3. 问题2拓展:Word能不能同时保存字体?
  解决方法:保存时嵌入字体库
  学生根据演示视频学习保存Word文件时嵌入字体库的方法并实践。
2分钟
回顾复习新知、自评学习效果
1. 回复复习所学知识
2. 利用小测自评学习效果
Q1. 在GB2312-1980中,一个汉字占用几个字节?(单选)(    )
A.1个  B.2个  C.4个
Q2. 以下哪些是常用汉字的编码方案?(多选)(    )
A.ASCII    B.GB2312-1980    C.GBK  D.GB18030-2005 
Q3.用计算机处理汉字,可能要经历哪些编码过程?(单选)(    )
A.输入码->ASCII码->字型码
B.字型码->机内码->输入码
C.输入码->机内码->字型码E.unicode字符集与UTF-8编码

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。