关于我国汉字编码字符集的标准,其第一个标准是1980年发布的国家标准GB/T 2312-1980《信息交换用汉字编码字符集 基本集》。该集对我国最常用的6763个汉字进行了编码,因此称为基本集。然而,该基本集所编码的汉字,仅为常用汉字,远远不能满足我国对于汉字信息交换的需要。为此,我国又相继发布了汉字编码字符集的辅助集的相关标准,以此扩充更多的编码汉字,或作为不同使用场景(如繁体字、地名用字等)的汉字。这些辅助集的标准大多为国家标准,仅有一个为电子行业标准。下述对汉字编码字符集的辅助集的相关标准做一介绍。
欲更多了解GB/T 2312-1980(基本集)介绍的请进入。
一、标准的基本情况
在1980年发布了GB/T 2312标准后,我国陆续发布了汉字编码字符集的辅助集的标准有7个,称为第一辅助集至第八辅助集,但没有第六辅助集。除第八辅助集为电子行业标准SJ/T 11239-2001外,其它均为国家标准,且这些标准目前都未被修订过,但个别标准已被废止了。下表1-1给出了这些标准的基本情况,包括标准的编号与名称、标准的发布时间与实施时间、标准的摘要与适用范围等情况,以及编码汉字的数量。下表1-2给出了这些标准的有效性及废止时间。
表 1-1:我国汉字编码字符集的辅助集标准的基本情况
表 1-2:目前汉字编码字符集的辅助集标准的有效性
注意,在表1-1的标准中,GB/T 7589-1987和GB/T 7590-1987在初始发布时,是一个强制性标准,但根据国家标准化委员会2017年第7号公告和强制性标准整合精简结论,自2017年3月23日起,它们转化为推荐性标准,不再强制执行。
欲具体了解汉字编码字符集的辅助集重点介绍的请进入。
二、标准的内容组成情况
1、第一辅助集
我国汉字编码字符集的第一辅助集标准是指GB/T 12345-1990《信息交换用汉字编码字符集·辅助集》。该标准是与GB/T 2312相对应的繁体字字符集,是将GB/T 2312的6763个简化字用相应的繁体字替换而成,它们具有相同的编码。该标准的主要内容是由5章和4个附录所构成,且其章、节和附录的名称详见下表2-1。若要具体了解该标准具体内容的请查阅下附件2-1。
表 2-1:GB/T 12345-1990的目录
附件 2-1:GB/T 12345-1990《信息交换用汉字编码字符集·辅助集》
2、第二辅助集
第二辅助集的标准是GB/T 7589-1987《信息交换用汉字编码字符集·第二辅助集》。该标准收录了基本集(GB/T 2312-80)未收录的汉字,其用途及使用率一般低于基本集的汉字,但是高于第四辅助集的汉字。该标准的主要内容是由4章和2个附录所构成,且其章、节和附录的名称详见下表2-2。若要具体了解该标准具体内容的请查阅下附件2-2。
表 2-2:GB/T 7589-1987的目录
附件 2-2:GB/T 7589-1987《信息交换用汉字编码字符集·第二辅助集》
3、第三辅助集
第三辅助集的标准是国家标准GB/T 13131-1991《信息交换用汉字编码字符集·第三辅助集》,其收录的汉字是GB/T 7589-1987对应的繁体字。该标准已废止不再做介绍。
4、第四辅助集
第四辅助集是国家标准GB/T 7590-1987《信息交换用汉字编码字符集·第四辅助集》,其收录了GB/T 2312-80和GB/T 7589-1987未收录的汉字,其用途和使用率一般低于基本集和第二辅助集的汉字。该标准的主要内容是由4章和1个附录所构成,且其章、节和附录的名称详见下表2-4。若要具体了解第四辅助集标准具体内容的请查阅下附件2-4。
表 2-4:GB/T 7590-1987的目录
附件 2-4:GB/T 7590-1987《信息交换用汉字编码字符集·第四辅助集》,
5、第五辅助集
第五辅助集是GB/T 13132-1991《信息交换用汉字编码字符集·第五辅助集》,其收录的汉字是GB/T 7590-1987对应的繁体字。该标准已废止不再做介绍。
6、第七辅助集
第七辅助集是GB/T 16500-1998《信息交换用汉字编码字符集·第七辅助集》,其所选的是GB 13000.1的G列未收录的汉字,是G列的扩充。该标准的主要内容是由5章和1个附录所构成,且其章、节和附录的名称详见下表2-6。该标准被GB 13000-2010所代替,也被废止了。
表 2-6:GB/T 16500-1998的目录
欲更多了解GB 13000.1标准介绍的请进入。
7、第八辅助集
第八辅助集是电子行业标准SJ/T 11239-2001《信息技术 信息交换用汉字编码字符集 第八辅助集》,其所选的是基本集(GB 3212)、第二辅助集(GB/T 7589)和第四辅助集(GB/T 7590)未收入的汉字,主要用于地名。该标准的主要内容是由5章和1个附录所构成,且其章、节和附录的名称详见下表2-7。若要具体了解第八辅助集标准具体内容的请查阅下附件2-7。
表 2-7:SJ/T 11239-2001的目录
附件 2-7:SJ/T 11239-2001《信息技术 信息交换用汉字编码字符集 第八辅助集》
三、说明
事实上,对于上述介绍的我国汉字编码字符集的辅助集标准,虽然有些仍然有效,但在我国,对于中文编码字符集应执行GB 18030《信息技术 中文编码字符集》。因为GB 18030中已支持GB 2312(基本集)和上述各辅助集中的所有汉字字汇。
欲进一步了解GB 18030标准情况的请进入。
1022.26KB