一、中文域名注册技术的因由
中文域名注册(CDNR,Chinese Domain Name Registration)技术是指:在中文域名(CDN)注册时,域名所采用的转码机制、生成机制和注册协议等技术的总称。中文域名注册(CDNR)技术是中文域名(CDN)系统的关键技术之一。CDN系统之所以要采用CDNR技术主要是因为CDN采用了更大的字符集。
我们知道,通常的域名系统(DNS)是采用的ASCII编码字符(包括英文字母、阿拉伯数字及连接符(-)等)以构成的域名字段,常称为LDH-DNS系统(LDH即字母(Letter)、数字(Digit)和连接符(Hyphen)的首字母)。若域名注册采用LDH-DNS时就简单很多。然而,当采用中文域名(CDN)注册时,由于使用了既包含LDH字符又包含了庞大的中文字符在内的通用字符集,关键是对于中文字符集,又存在多种变体(如简体、繁体、异体、古体等)字形,使得CDN注册时变得异常复杂,应采取相应的注册技术(域名的转码技术、生成技术和相应地注册协议等技术),以支撑CDN在互联网上的使用,包括储存、传输、显示等。
二、关于中文域名与应用(CDNA)
1、CDNA概述
中文域名注册技术是基于中文域名与应用(CDNA,Chinese Domain Name in Applications)协议的。CDNA是指如何在应用程序以及某些应用环境中使用或者实现中文域名的协议。这是我国专门为实现中文域名(CDN)而设计开发的一种框架协议,其最核心的内容是规范了如何在整个DNS解析体系中支持中文域名(CDN)。该协议具体是由我国国家标准GB/T 44278《中文域名解析技术要求》所规范,它参照了IETF的RFC 3490《国际化域名与应用(IDNA)》等国际标准,RFC 3490文档是针对中日韩的文字字符存在异体的问题而设计的。因此,中文域名与应用(CDNA)是实现CDN的基础框架,包括有CDN的注册机制、编码机制、解析机制等等。在下述CDNA介绍时要用到相关术语,如:区(ZONE)、解析器、ASCII编码兼容(ACE)前缀、中文域名字段(CDL)包、域名槽等,其含义详见下表表 2-1。
表 2-1:中文域名与应用(CDNA)的相关术语与定义
欲详细了解GB/T 44278标准具体内容的请进入。
2、CDNA内涵
下表2-2-1给出了CDNA的技术特征。依据CDNA的要求,只要某种应用(如DNS ZONE文件和解析器接口等)支持LDH字符,应可使用CDNA来支持CDN。需要使用域名解析时,应在应用和解析器之间使用CDNA;需要在域名写入DNS ZONE时,应在域名放入ZONE之前使用CDNA。
表 2-2-1:中文域名与应用(CDNA)技术特征
中文域名与应用(CDNA)允许使用某些LDH字符(以特殊前缀开始)来标识非LDH字符。非ASCII 形式的域名字段可用ASCII编码兼容(ACE,ASCII Compatible Encoding)前缀开始的ACE 形式表示。ASCII编码兼容(ACE)前缀也称LDH编码前缀。用于中文域名的ACE前缀是由两个LDH字符(xn)后跟着两个连字符(- -)来表示的前缀,即:“x n - -”(其中字母部区分大小写)。后缀是UNICODE 字串的Punycode 编码。Punycode 是一种为国际化多语种域名设计的一种简单高效的转换编码方法(由TETF RFC 3492规范)。下表2-2-2列出了Punycode 编码的特征。
表 2-2-2:Punycode 编码的特征
欲具体了解Punycode 编码介绍的请进入。
3、CDNA规定的转码机制
为了中文域名(CDN)在相关应用进行使用,中文域名与应用(CDNA)规定了两种转码机制,也称之为两种操作:LDH字符转换操作(也称A-label转换操作)和通用字符编码转换操作(也称U-label转换操作)。两者的用途可详见下表2-3。两种转换操作中,A-label转换操作可能会失败;如果对某个域名使用LDH字符转换操作失败,则此域名不应作为CDN使用,相应的有一些错误处理。在进行两种转换操作前,域名的编码格式应是通用字符编码,如果域名使用其它编码方式,应将转换成通用字符编码(LDH字符码位也属于通用字符编码码位)。所谓通用字符编码是指根据其位置或码位来识别字符,给每个字符提供的一个唯一的数字。CDNA要求,通用字符编码采用ISO 10646所规范的通用字符编码的字符集。
表 2-3:LDH字符转换操作和通用字符编码转换操作的用途
欲具体了解通用字符编码字符集介绍的请进入。
三、中文域名注册技术要求
在我国国家标准GB/T 44270《中文域名注册技术要求》中规定了中文域名(CDN)注册相关域名的转码机制、生成机制和注册协议等技术要求,以支持CDN注册时适应互联网域名系统(DNS)的相关要求。下述简要介绍之,若要详细了解该标准具体内容的请查阅下附件。
附件:GB/T 44270-2024《中文域名注册技术要求》
1、CDN的转码机制
之所以要实施转码,是因为为了使采用了更大字符集的中文域名字段(CDL)字符编码以适应互联网域名系统(DNS)的LDH字符编码。CDN的转码机制应满足中文域名与应用(CDNA)协议的要求,即采用两种转码机制:A-label转换操作和U-label转换操作。需要注意的是:一是中文域名与应用(CDNA)应支持国际化域名与应用(IDNA)的相关要求(即RFC 3490的要求)。二是任何确定的DNS字段的长度不能大于63个八位字节;中文域名转码机制中包含“x n - - ”在内字符的总长度不能大于63个ASCII字符。
关于转码后的中文域名的显示:支持CDNA的应用应支持LDH和非LDH两种形式显示中文域名。CDN用户可选择LDH形式的显示方式或者非LDH形式的显示方式,缺省配置是后者。LDH形式的CDN比较难理解,CDN应尽量减少这种形式的显示。
2、CDN的生成机制
在中文域名(CDN)中要用到中文字符。中文字符存在着“变体”也称“异体”,这样可能导致某些中文字符可能被认为是同一个字符,但在计算机使用的字符集中,同一个概念上的字符却通过几个不同的码位来识别(如“国”的码位是U+56FD;“國”的码位是U+570B)。外形相同的字符,或者是有相同或相似语义却被分配了不同码位的字符有可能使用户产生混淆。中文域名标准也会影响到一些互联网协议及其应用,增加了技术管理与服务方面的复杂性,在中文域名部署时有必要提高警惕来防止混淆与欺诈行为。为此,中文域名的具体生成机制,也即中文域名的注册管理机制应按照我国国家GB/T 44266中的相关要求。在GB/T 44266标准的第5章,给出了中文域名的注册管理算法框架的总体技术要求。
欲详细了解GB/T 44266标准具体内容的请进入。
3、CDN的注册协议
中文域名(CDN)注册协议是基于“可扩展的供应协议”(EPP,Extensible Provisioning Protocol)的。生成机制包括其注册管理算法的实现是通过EPP来具体实施的。EPP是一个由状态的XML协议(可扩展标记语言协议),它能够被部署在多层传输协议上。在底层安全协议的保护下,客户端交换标识、授权和选择信息,然后约束一系列客户发起“命令-响应”交换。所有的EPP 响应具有原子性(没有局部成功和局部失败),也因此具有幂等性(重复执行一个命令与成功执行一次对系统状态具有同样的效果)。关于EPP协议的具体内容请查阅GB/T 44270标准原文,即本文的附件。
欲进一步了解我国中文域名管理要求的请进入。
774.02KB