汉字的区位码由一个汉字的区号和位号组成吗?

如下:

区位码属于汉字的码 汉字区位码和区码区位码属于汉字的码 汉字区位码和区码


区位码属于汉字的码 汉字区位码和区码


区位码属于汉字的码 汉字区位码和区码


汉字的区位码由一个汉字的区号和位号组成。

区位码与汉字是一一对应的编码,用四位数表示,前两位从01到94称为区码,后两位从01到94称为位码。一个汉字的前一半是ASCII码为“160+区码”的字符,后一半是ASCII码为“160+位码”的字符,每区256个字。

一个汉字所在的区号和位号简单地组合在一起就构成了该汉字的"区位码"。在汉字的区位码中,高两位为区号,低两位为位号。 在区位码中,01-09区为682个特殊字符,16~87区为汉字区,包含6763个汉字 。

汉字的区位码查询方法

1、用拼音链接查找汉字 :所有汉字已按拼音顺序排列,在下面的表格顶部已列出了所有汉字的所有拼音,你只要点击你要找的拼音,屏幕即显示这个拼音的全部汉字,汉字右侧的数字即为该汉字的区位码。点击每个拼音右面的“返回”链接,屏幕即快速回到顶部,可查找下一个拼音。

2.、按音序查 :所有汉字已按拼音顺序排列,你只要移动浏览器窗口右方的滚动条就可找到你要的汉字。

什么是汉字编码?

计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字编码。汉字信息在系统内传送的过程就是汉字编码转换的过程。

1、汉字信息处理系统之间或通信系统之间传输信息时,对每一个汉字所规定的统一编码,我国已指定汉字交换码的标准“信息交换用汉字编码字符集——基本集”,代号为GB 2312—80,又称为“国标码”。

2、国标码:所有汉字编码都应该遵循这一标准,汉字机内码的编码、汉字字库的设计、汉字输入码的转换、输出设备的汉字地址码等,都以此标准为基础。GB 2312—80就是国标码。该码规定:一个汉字用两个字节表示,每个字节只有7位,与ASCII码相似。

3、区位码:将GB 2312—80的全部字符集组成一个94×94的方阵,每一行称为一个“区”,编号为0l~94;每一列称为一个“位”,编号为0l~94,这样得到GB 2312—80的区位图,用区位图的位置来表示的汉字编码,称为区位码。

4、区位码(十进制)的两个字节分别转换为十六进制后加20H得到对应的国标码;机区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。

扩展资料:

ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是现今通用的系统,并等同于标准ISO/IEC 646。

区位码与国标码的转换关系 :

区位码先转换成十六进制数表示 ,(区位码的十六进制表示)+2020H=国标码。 区号为20,位号为83, 将区位号2083转换为十六进制表示为1453H ,1453H+2020H=3473H,得到国标码。

参考资料来源:

参考资料来源:

汉字区位码是为每个汉字编一个的代码,以便计算机辨认、接收和处理。

码=区位码+2020H,汉字机内码=码+8080H。首先将区位码转换成码,然后将码加上8080H,即得机内码。

汉字区位码在上世纪七八十年代起到了很大的作用,解决了六千多个汉字在DOS作系统的汉字输入问题。现在,特别是2013年8月19日颁布实施8105个通用规范汉字之后,便不再被人们使用。

相关信息

为了使每一个汉字有一个全国统一的代码,1980年,我国颁布了个汉字编码的标准:GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。由于国标码是四位十六进制,为了便于交流,大家常用的是四位十进制的区位码。

就是录入汉字时的对应关系,字库。

标准

为了使每一个汉字有一个全国统一的代码,1980年,我国颁布了个汉字编码的标准: GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。由于国标码是四位十六进制,为了便于交流,大家常用的是四位十进制的区位码。

所有的国标汉字与符号组成一个94×94的矩阵。在此方阵中,每一行称为一个"区",每一列称为一个"位",因此,这个方阵实际上组成了一个有94个区(区号分别为1到94)、每个区内有94个位(位号分别为1到94)的汉字字符集。一个汉字所在的区号和位号简单地组合在一起就构成了该汉字的"区位码"。

在汉字的区位码中,高两位为区号,低两位为位号。在区位码中,01-09区为682个特殊字符,16~87区为汉字区,包含6763个汉字。其中16-55区为一级汉字(3755个常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列)。

所以,当我们需要n个任意汉字时,我们不必建一个全部汉字表,而是利用区位码实现常用汉字的提取。

区位码是10进制的,而国标码和机内码是16进制的,先要把区位码转化成16进制。

然后把得到的数加2020是国标码 再加上8080是机内码

以江为例

1.区位码(十进制)转换成区位码(十六进制)。

这里要把前两个位换成十六进制,然后后两位换成十六进制。

江的区位码是23,这样把29转换为16进制数1D;再把位码13转换为16进制数为0D,得到十六进制数1D0D。

2.码=区位码(十六进制)+2020H

江的码是 1D0DH+2020H=3D2DH 得到国标码GB2312

3.汉字机内码=码+8080H

江的机内码就是3D2DH+8080H=BDADH

29+160=189,化成十六进制是BD,

13+160=173,化成十六进制是AD,

43+160=203,化成十六进制是CB,

53+160=213,化成十六进制是D5,

所以,江的机内码是BDAD,苏的机内码是CBD5

1.【国标码】指标准汉字编码。即《信息交换用汉字编码字符集(基本集)》,简称GB-2312。该字符集有汉字6763个。设有94个区,每个区94个位。每个汉字有一个固定的区位。因此,区位码也可认为是国标码。

2.【区位码】区位码与国标码的区别在于,在GB-2312中预留了一些空位,便于补充和扩展,经过扩展的区位码字符数量及范围就超过了GB-2312。而且、、及日韩也是用区位码的,但其区位号与大陆用的就完全不相同。

3.【机内码】为了避免ASCII码和国标码同时使用时产生两义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。