字符编码和汉字编码 ascii码和汉字编码

一、ASCII码
1、什么叫ASCII码?
计算机中用二进制数表示字母、数字、符号以及控制符号,目前主要用ASCII码(美国标准信息交换码的缩写)。
1)常用字符有128个,编码从0到127。
2)控制字符:0~31、127,共33个,不可显示;
3)普通字符:95个,包括10个阿拉伯数字、52个英文大小写字母、33个运算符。
4)每个字符占个字节,7位,最高位为0。

常见ASCII码的大小规则,0-9<A-Z<a-z:
  1)数字比字母要小。如“7”<“F”
 2)数字0比数字9要小,并按0到9顺序递增。如“3”<“8”
  3)字母A比字母Z要小,并按A到Z顺序递增。如“A”<“Z”
  4)同个字母的大写字母比小写字母要小32。如“A”<“a”
字符编码和汉字编码 ascii码和汉字编码
 记住几个常见字母的ASCII码大小:
  “A”为65;“a”为97;“0”为48;
 2、ASCII码表如下:

字符

范围

十六进制

十进制

空格

20H

32

0~9

30H~39H

48~57

A~Z

41H~5AH

65~90

a~z

61H~7AH

97~122

二、汉字编码
1、汉字编码分类汉字在不同的处理阶段有不同的编码。
(1)汉字的输入:输入码
(2)汉字的机内表示:机内码
(3)汉字的输出:字形码(字库 Font)
各种编码之间的关系:输入码-> 国标码->机内码-> 输出码

2、汉字的机内表示:机内码:
计算机在信息处理时表示汉字的编码,称作机内码。现在我国都用国标码(GB2312)作为机内码,GB2312-80规定了:
(1)一个汉字由两个字节组成,为了与ASCII码区别,最高位均为“1”。
(2)汉字6763个:一级汉字3755个,按汉字拼音字母顺序排列;二级汉字3008个,按部首 笔画汉字排列。
(3)汉字分区:94行(区),94列(位)(区位码)
3、汉字的输入:汉字输入码:
(1)数字码(或流水码)
如:电报码、区位码、纵横码
优点:无重码,不仅能对汉字编码,还能对各种字母、数字符号进行编码。

缺点:是人为规定的编码,属于无理码,只能作为专业人员使用。
(2)字音码
如:全拼、双拼、微软拼音
优点:简单易学。
缺点:汉字同音多,所以重码很多,输入汉字时要选字。
(3)字形码
如:五笔字型、表形码、大众码、四角码
优点:不考虑字的读音,见字识码,一般重码率较低,经强化训练后可实现盲打。
缺点:拆字法没有统一的国家标准,拆字难,编码规则繁,记忆量大。
(4)音形码
如:声形、自然码、钱码
优点:利用音码的易学性和形码可有效减少重码的优点。
缺点:既要考虑字音,又要考虑字形,比较麻烦。
4、汉字的输出:字形码(字库 Font)
(1)点阵字形:16×16、24×24、48×48
B)每一个点在存储器中用一个二进制位(bit)存储,所以一个16×16点阵汉字需要32(16×16/8=32)个字节存储空间。
(2)轮廓字形
字笔画的轮廓用一组直线和曲线勾画。记录的是这些几何形状之间的关系。
精度高。Windows的TrueType字库采用此法。
  5、区位码、国标码与机内码的转换关系
   方法:

(1)区位码先转换成十六进制数表示
  (2)(区位码的十六进制表示)+2020H=国标码;
  (3)国标码+8080H=机内码
  举例:以汉字“大”为例,“大”字的区内码为2083

解:1、区号为20,位号为83

2、将区位号2083转换为十六进制表示为1453H

3、1453H+2020H=3473H,得到国标码3473H

4、3473H+8080H=B4F3H,得到机内码为B4F3H
三、小结:
   字符编码的两种表示方式:ASCII(字符的表示);GB2312(国标码,汉字编码)
四、作业:
一、填空题:
  1、ASCII码是____位二进制字符编码,是__________的缩写,共有__个不同的字符编码,其中包括10个阿拉伯数字、___个英文大小写字母、___个符号和运算符以及___个控制符,____符是不能显示的,其余95个是可显示(打印)的ASCII码。
 2、GB2312,简称______,共收纳___个汉字,其中一级汉字有___个,二级汉字有____个,并且一级汉字按_______顺序排列,二级汉字按_______排列。根据GB2312的编码方法,把该码分成___个区,每个区分成___个码位。
 3、比较以下两个ASCII值的大小:
  “0”___“S”  “3”___“8”  “A”___“C” “A”___“a”
 4、每一个点在存储器中用____个二进制位(bit)存储,所以一个16×16点阵汉字需要____个字节存储空间。
二、计算题:
 1、“啊”汉字的区位码为1601,求这汉字的国标码和机内码。
 2、已知某汉字区号34,位号56,求某汉字的国标码和机内码。
 3、已知汉字“文”的机内码CEC4H,求“文”的国标码和区位码。
三、问答题:
 1、汉字编码可以分为几类?并说明四种常用的汉字输入码以及它们的优缺点。

  

爱华网本文地址 » http://www.413yy.cn/a/25101017/327930.html

更多阅读

UITextField和模拟键盘 uitextfield隐藏键盘

程序中常常要用到 输入 ,不只是UITextField ,只要需要运用到键盘输入就需要操作键盘。所以查找了一下有关键盘在输入中得操作。键盘类型 :1.UIKeyboardTypeDefault 默认键盘2.UIKeyboardTypeASCIICapable显示ASCII码值得键盘3.UIKeyboa

C语言在K叉哈夫曼编码教学中的应用 c语言哈夫曼编码译码

摘 要:字符编码与信息压缩是计算机应用的重要研究课题,许多学者对此作了很多非常有价值的研究。文章简单分析了二叉哈夫曼树的构造及编码,通过比较三种构造三叉哈夫曼树的算法,提出了构造任意K叉哈夫曼树及K进制的最优前缀编码的算法,并

ASCII码表及扩展ASCII码表 扩展ascii码表

ASCII码表及扩展ASCII码表ASCII码表可以看成由三部分组成:第一部分由00H到1FH共32个,一般用来通讯或作为控制之用,有些可以显示在屏幕上,有些则不能显示,但能看到其效果(如换行、退格).如下表:

声明:《字符编码和汉字编码 ascii码和汉字编码》为网友阿岩熟叔分享!如侵犯到您的合法权益请联系我们删除