第一章 信息与信息技术
第二节 信息的编码(1)
信息可以用一定的方式表现出来,用来表示信息的符号组合叫做信息的代码。如身份证号码、超市商品条码、电话区号等。
著名科学家冯·诺依曼提出计算机内程序和数据都应采用二进制代码表示。
由于二进制代码中用到的只有“0”和“1”两个符号,从而可以方便地用电脉冲、电位、电路的状态磁化的极性方向来表示,而且信号清晰,不易失真。
所以计算机只能识别和处理“0”、“1”符号串组成的代码,因此使用计算机进行信息处理时,首先要对信息进行编码,把问题转化成二进制代码的计算问题。
l、字符编码:
计算机除了要处理数值类型的数据外,还要处理各种非数值类型的数据,如字母、汉字等,所以需要为每个字符规定一个二进制形式的代码。
目前普遍采用ASCII码(American Standard Code for Information Interchange 美国信息交换标准码),后又扩充了128个字符,成为扩展ASCII码。(用Alt+小键盘数字)
例如:“A”的ASCII码为65,也就是1000001B;“a” 的ASCII码为97,也就是1100001B。
标准ASCII码使用7位二进制数,27=128个代码,由94个图形字符码好34个控制符码组成。
任务一:在word中,用Alt+小键盘数字输出ASCII码。
(如:Alt+65为“A”、Alt+137为“‰”、Alt+169为“©”、 Alt+ 174为“®”)
思考:为什么7位ASCII码只能表示128个符号,那么8位呢?
ASCII字符编码表 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2、汉字编码
㈠汉字输入
汉字输入方法有两大类:一类是自动识别方式,包括字形和语音的自动识别;另一类是将汉字编码输入,这种编码称汉字输入码(又称外码)。
汉字输入码通常是利用汉字的音、形或其他特征信息,按照一定的规则,使用字母、数字
和符号来对汉字进行编码,使得我们能利用西文标准键盘来出汉字。有音码、形码、音形码、形音码。
汉字输入法的好坏主要考虑:击键率(简码、双拼)、重码率、方便记忆(易于掌握)。
提高拼音汉字输入速度的方法:①利用简码
②用双拼输入
③用词组输入
㈡交换码
为了方便各数字系统(不仅是计算机系统)之间的汉字信息的通信交换,国家颁布GB2312-80《信息交换用汉字编码及字符集》这种代码又称区位码(区码、位码)。
01 02 03 04 05 06 07 08 09………92 93 94
01 、 。 · ˉ ˇ ¨ 〃 々 ↑ ↓ 〓
…
……
16 啊 阿 埃 挨 哎 唉 哀 皑 癌…………包 褒 剥
17 薄 雹 保 堡 饱 宝 抱 报 暴…………秉 饼 炳
18 病 并 玻 菠 播 拨 钵 波 博…………颤 昌 猖
19 场 尝 常 长 偿 肠 厂 敞 畅…………滁 除 楚
………..
54 帧 症 郑 证 芝 枝 支 吱 蜘…………贮 铸 筑
55 住 注 祝 驻 抓 爪 拽 专 砖…………
56 亍 丌 兀 丐 廿 卅 丕 亘 丞…………攸 佚 佝
57 佟 佗 伲 伽 佶 佴 侑 侉 侃…………冱 冽 冼
58 凇 冖 冢 冥 讠 讦 讧 讪 讴…………邳 邶 邺
……….
94……..
㈢处理码
处理码是计算机内部用于信息处理的汉字代码,也称为汉字机内码。(把区位码的区、位分别加上160)
⑴GB2312编码(GB2312-1980、GB2312-80)
使用双字节编码(16位),共收录了6763个简体汉字,一级汉字3755(常用字),以拼音顺序排列;二级汉字3008个,以偏旁笔画顺序排列。
(BIG5繁体字编码,使用双字节编码,收录了13053个汉字)
⑵GBK编码
GBK全称为汉字内码扩展规范,使用双字节编码,收录了GB 2312 中的全部汉字、非汉字符号及GB 13000.1 中的其他 CJK 汉字,合计20902个汉字。
⑶GB18030编码
GB18030分别以单字节、双字节和四字节进行编码,是我国现时最新的內码字集,与GB 2312-80与GBK兼容。
(4字节编码:把字符集分为128个组,每个组256个平面,每个平面有256行,每行有256个字位,每个字符编码由组号、平面号、行号、字位号组成,汉字为0组0平面,所以4字节中前两个字节都是0)
任务二:在汉字编码表中能否到自己的名字,并把名字及编码(汉字内码,用十六进制)记在书上第7页右边空白处。
任务三:在word中输出汉字“亞”(ya)、“偲”(cai)、“赟”(yun)(利用全拼输入法,采用GBK字符集)
㈣字形码
为了汉字的输出显示和打印,需要描述汉字的字形,有点阵方式和矢量方式,这种对汉字字形的编码称为汉字的字形码。
可以试一试造字程序:
⑴单击“开始”→“所有程序”→“附件”→单击“TrueType 造字程序”
⑵造一个字或符号,保存字符后,再进行输入法链接。
⑶打开“Word”,输入刚才造好的字符。
3、掌握UltraEdit工具软件
任务四:用UltraEdit工具观察字符的内码
⑴单击“开始”→“所有程序”→“UltraEdit”→单击“UltraEdit”
⑵打开UltraEdit软件后,在编辑窗口内输入:
班级+学号+姓名+a+a+A+A+亞+偲+赟
⑶单击切换成16进制方式。
⑷仔细观察:a、把姓名的内码与任务二的记录结果进行比较
b、半角符号与ASCII字符编码表比较(注意16进制与10进制区别)。
c、全角符号与GB2312编码表比较。
⑸试着修改内码观察字符的变化,反过来修改字符后,观察内码的变化。
附录:
GB2312编码表
code 0 1 2 3 4 5 6 7 8 9 A B C D E F
A1A0 、 。 · ˉ ˇ ¨ 〃 々 — ~ ‖ … ‘ ’
A1B0 “ ” 〔 〕 〈 〉 《 》 「 」 『 』 〖 〗 【 】
A1C0 ± × ÷ ∶ ∧ ∨ ∑ ∏ ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠
A1D0 ⌒ ⊙ ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯ ≤ ≥ ∞ ∵
A1E0 ∴ ♂ ♀ ° ′ ″ ℃ $ ¤ ¢ £ ‰ § № ☆ ★
A1F0 ○ ● ◎ ◇ ◆ □ ■ △ ▲ ※ → ← ↑ ↓ 〓
A2A0 ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ
A2B0 ⒈ ⒉ ⒊ ⒋ ⒌ ⒍ ⒎ ⒏ ⒐ ⒑ ⒒ ⒓ ⒔ ⒕ ⒖
A2C0 ⒗ ⒘ ⒙ ⒚ ⒛ ⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾
A2D0 ⑿ ⒀ ⒁ ⒂ ⒃ ⒄ ⒅ ⒆ ⒇ ① ② ③ ④ ⑤ ⑥ ⑦
A2E0 ⑧ ⑨ ⑩ ㈠ ㈡ ㈢ ㈣ ㈤ ㈥ ㈦ ㈧ ㈨ ㈩
A2F0 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ Ⅺ Ⅻ
A3A0 ! " # ¥ % & ' ( ) * + , - . /
A3B0 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
A3C0 @ A B C D E F G H I J K L M N O
A3D0 P Q R S T U V W X Y Z [ \ ] ^ _
A3E0 ` a b c d e f g h i j k l m n o
A3F0 p q r s t u v w x y z { | }  ̄
A4A0 ぁ あ ぃ い ぅ う ぇ え ぉ お か が き ぎ く
A4B0 ぐ け げ こ ご さ ざ し じ す ず せ ぜ そ ぞ た
A4C0 だ ち ぢ っ つ づ て で と ど な に ぬ ね の は
A4D0 ば ぱ ひ び ぴ ふ ぶ ぷ へ べ ぺ ほ ぼ ぽ ま み
A4E0 む め も ゃ や ゅ ゆ ょ よ ら り る れ ろ ゎ わ
A4F0 ゐ ゑ を ん
A5A0 ァ ア ィ イ ゥ ウ ェ エ ォ オ カ ガ キ ギ ク
A5B0 グ ケ ゲ コ ゴ サ ザ シ ジ ス ズ セ ゼ ソ ゾ タ
A5C0 ダ チ ヂ ッ ツ ヅ テ デ ト ド ナ ニ ヌ ネ ノ ハ
A5D0 バ パ ヒ ビ ピ フ ブ プ ヘ ベ ペ ホ ボ ポ マ ミ
A5E0 ム メ モ ャ ヤ ュ ユ ョ ヨ ラ リ ル レ ロ ヮ ワ
A5F0 ヰ ヱ ヲ ン ヴ ヵ ヶ
A6A0 Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο
A6B0 Π Ρ Σ Τ Υ Φ Χ Ψ Ω
A6C0 α β γ δ ε ζ η θ ι κ λ μ ν ξ ο
A6D0 π ρ σ τ υ φ χ ψ ω
A6E0 ︵ ︶ ︹ ︺ ︿ ﹀ ︽ ︾ ﹁ ﹂ ﹃ ﹄ ︻ ︼
A6F0 ︷ ︸ ︱ ︳ ︴
A7A0 А Б В Г Д Е Ё Ж З И Й К Л М Н
A7B0 О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э
A7C0 Ю Я
A7D0 а б в г д е ё ж з и й к л м н
A7E0 о п р с т у ф х ц ч ш щ ъ ы ь э
A7F0 ю я
A8A0 ā á ǎ à ē é ě è ī í ǐ ì ō ó ǒ
A8B0 ò ū ú ǔ ù ǖ ǘ ǚ ǜ ü ê ɑ ń ň
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论