您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 国内外标准规范 > GBT183042001信息技术因特网中文规范电子邮件传送格式
中华人民共和国国家标准信息技术因特网中文规范电子邮件传送格式发布实施国家质量技术监督局发布前言本标准规定了以为基础在因特网电子邮件中传输中文字符和其他文种字符的消息格式本标准文本主要包括定义通用电子邮件传输格式电子邮件传输格式和附录几个部分由于目前因特网电子邮件只有规范没有相应的国际标准和国家标准因此在本文本中等同参考了与通用电子邮件传输格式相关的内容附录中收录了与相关的变体格式以及编码方式的内容同时给出了基于中文传输的实现参考模型本标准由中华人民共和国信息产业部提出本标准由全国信息技术标准化技术委员会归口本标准起草单位中国电子技术标准化研究所北京四通新世纪信息技术有限公司信息产业部数据通信技术研究所中国科学院软件研究所清华大学本标准主要起草人李韵琴胡万进陈淑仪吴健冯吉祥陶文星陈壮中华人民共和国国家标准信息技术因特网中文规范电子邮件传送格式国家质量技术监督局批准实施范围本标准规定了在因特网电子邮件中使用的中文字符信息和其他文种字符的信息传送格式本标准适用于因特网电子邮件系统以及相关的应用领域引用标准下列标准所包含的条文通过在本标准中引用而构成为本标准的条文本标准出版时所示版本均为有效所有标准都会被修订使用本标准的各方应探讨使用下列标准最新版本的可能性信息技术信息交换用七位编码字符集信息交换用汉字编码字符集基本集信息技术通用多八位编码字符集第一部分体系结构与基本多文种平面信息处理八位单字节编码图形字符集第一部分拉丁字母一因特网文本消息格式标准简单邮件传送协议多用途因特网邮件扩展第部分多用途因特网邮件扩展第部分多用途因特网邮件扩展第部分多用途因特网邮件扩展第部分多用途因特网邮件扩展第部分在多用途因特网邮件扩展中使用定义本标准采用下列定义纯文本由字符换行控制符和换页控制符等组成的文本它不提供也不允许格式化命令字体属性指示处理指令解释指令或内容编排等控制功能消息由信封和内容组成的能够在网络上传送的一个信息单位信封包含提供传送和投递的必要信息内容由要投递给接收方的对象组成所涉及的部分只包括消息内容的格式和某些语义以及信封的非技术规范信息消息由消息头字段信封和正文内容可选组成正文与消息头之间通过一个空行分开字段在没有特指的情况下字段是指消息中的有逻辑字符串区域一个字段可以分为多个子字段每个子字段也可以是一个有逻辑字符串消息头在没有特指的时候消息头是指电子邮件消息的信封部分每一个消息头字段可以看成是一个单个的有逻辑的字符行包括字段名和字段内容为了方便字段内容部分可以分成多行表示称为折叠消息头中主要有完成传送投递和扩展的字符类型以及编码等信息正文在没有特指的时候正文指消息的内容部分正文是要投递给对方的对象包括文本图像音频视频和应用程序等字符集在里所用的字符集是指一种将八位二进制字节串转换为可识别的字符串的方法注意这里并不需要在其他方面进行绝对明确的转换即不是所有的字符都可以通过给定的字符集进行表述以及一个字符集可能会提供不止一种将一个八位二进制字节串表示成一个特定字符串的方法它不仅包括将单个字符直接映射成单个八位二进制字节的规则如和而且在里还包括多字节编码字符集和交换技术等多用途因特网电子邮件扩展即多用途因特网电子邮件扩展是对以及和所定义的因特网文本消息格式标准进行的扩展它对消息格式进行了重新定义允许用字符集而不只是来表示的文本形式的消息内容有很多不同格式的可扩展的非文本形式的消息内容多组分消息内容用字符集而不只是来表示的文本形式的消息头信息与有关的是和是电子邮件消息头的字段里用来指定数据类型的关键参数它给出了消息中所使用的字符集名称中文字符在中收录并编码的所有汉字汉语符号少数民族文字及符号总要求电子邮件格式因特网文本消息格式标准因特网文本消息格式标准等同简单邮件传送协议等同多用途因特网邮件扩展格式本部分引用中与非代码及其传送有关的内容其他部分等同参考和只定义了因特网上代码邮件消息的标准传送格式传送非代码文本其中包括中文或其他多媒体数据应采用多用途因特网邮件扩展对进行扩充所定义的标准格式这些消息头字段标准格式的正式定义如下本定义中所隐含的消息头字段顺序应忽略任何不以开头的字段都可能因没有意义而忽略本定义中所隐含的消息头字段顺序应忽略其各种特定的消息头字段语法如下消息头字段用来声明因特网消息正文格式所采用的版本并且任何按文档编排的消息都必须包括如下消息头字段字段的正式定义如下消息头字段用来指明在含有项的正文中数据的性质给出媒体类型和子类型标识符以及提供某些媒体类型所需要的辅助信息以便正在接收的用户代理程序能选择一个合适的代理或机制去向用户表示这些数据或者用一个合适的方式处理这些数据消息头字段的值称为媒体类型分为顶层媒体类型声明数据的通用类型子类型指明与通用类型对应的具体格式和参数媒体子类型的修饰部分其定义如下媒体类型和子类型的匹配与大小写无关由标准途径定义的并在注册的扩充标记字符或后接任何中间没有空格的标记公开定义的扩充标记该标记必须按指定在注册属性的匹配与大小写无关任何除和的字符在参数值里使用时必须以引用串的形式出现这里类型子类型和参数名均与大小写无关参数值通常与大小写相关但有时也有意使用与大小写无关的形式参数的排列顺序不分先后参数依赖于媒体类型和子类型是一个可选项大多数参数都与一个具体的子类型相关实现程序可以忽略任何无法识别名称的参数初始的五种表示单一媒体组分的标准顶层媒体类型为文本信息子类型用来特指不包含任何格式化命令和指令的纯文本图像数据需要用一种显示设备去查看其信息定义的初始子类型有和等音频数据需要用一种音频输出设备去显示其内容视频数据是移动的图像需要通过专用的硬件和软件去播放初始的子类型是有等应用类数据典型情况是非中断性二进制数据和能被某个应用程序处理的信息子类型用于非中断性二进制数据的情况子类型用于传送材料初始的两种表示多种组合媒体的标准顶层媒体类型为由多种无关数据类型组成的数据已封装过的消息在使用媒体类型发送纯文本信息时使用参数可以指明子类型正文文本的字符集尤其是在包括有表示通用纯文本的子类型的时候有关参数的说明如下参数是字段里用来指定数据类型的关键参数给出消息中使用的字符集名称其形式可有如下两种参数的值与大小写无关参数不出现时的默认字符集是任何将来出现的子类型标准规范都必须指出是否同样使用参数以及可能要限定的参数附加的字符集可以通过登记注册消息头字段在简单邮件传送协议里限制邮件消息为位的代码数据每个文本行的长度包括不超过个字符因此有必要定义一种将各种媒体数据编码成这种位短行格式的机制这种编码机制在里由消息头字段来指明字段提供两条信息指明正文采用了何种编码转换方式以及对应地必须采用何种解码操作才能恢复数据成原样指出编码结果的范围是什么消息头字段的取值为一个指定编码类型的单个标记其正式语法格式和编码类型如下这些值都与大小写无关编码类型要求正文采用位的文本邮件表示方式如果消息头字段没有出现那么其默认取值是假定如果有必要实现机制可以定义私有的值但是必须使用来指明是非标准状态例如在消息字段的赋值中有一种是这种编码方法可是用一种编码形式不一定要可读来表示任意字节串详细内容见提示的附录字符集传送格式本标准规定以作为因特网电子邮件中中文字符信息的传送格式根据对因特网电子邮件中有关文本传送格式的扩充定义本节定义作为因特网电子邮件中新的基本字符集用于传送多八位编码的字符所涉及内容主要包括字符集编码格式和字段名称两部分目前只定义了平面中的字符随着新版本的颁布本标准也将作相应的修订和增补字符集编码格式定义作为因特网允许的基本字符集之一即在电子邮件消息中使用目前为作为字段的赋值之一在因特网消息头中按如下两种形式声明电子邮件文本的字符集为或这里只给出了在电子邮件中传送字符代码的特定头信息段其中是标识字符集的名称其具体内容在和中说明是传送字符代码的具体编码类型可以采用或其他编码方式有关编码的内容参阅本标准提示的附录赋值规则所有为注册使用的变体和版本均使用符合以下统一形式的名称其中是字符集标准标识号即国际标准是字符集标准的版本号对而言其构成形式为是的发行号目前只有表示是的编码形式目前已经颁布的有和两种形式表示字符集标准的变体形式目前有和两种当然也可以不采用变体而直接使用标准的原始编码方括号内的参数都是可选的赋值列表根据中的定义下面列出了的参数名称本标准的参数的赋值列表将随着信息技术发展逐步增补附录提示的附录与由于标准编码空间十分庞大传统的内码体系几乎无法表示整个字符集而且目前绝大多数的软件硬件体系和输入输出设备以及因特网的邮件几乎完全基于因此在实现时就必须考虑兼容性继承性问题采用编码的变体是解决这一问题的途径之一本附录列出了编码在具体应用实现中的两种变体形式和的编码规则与的映射关系及应用情况是主要针对目前基于的因特网电子邮件系统只能支持位码传送的现状而提出的一个编码的变体形式采用带换档字符的一个或多个位字节串表示字符串以便在只支持位传送的邮件系统中传送字符将字符集分为三个子集集集和集集是可直接编码的字符集包括字母数字和以下特殊字符和被忽略见表表集字符字符和值十进制集是可选直接编码的字符集包括下列字符和被忽略见表表集字符字符和值十进制表完字符和值十进制字符集中的和不包括在内因为这两个字符在应用中有不同的含义集是需要按编码规则编码的字符集参见附录用编码字符串表示字符的转换规则如下规则直接编码在上面定义的集中的字符按照直接编码集中的字符可以选择性的直接编码同样地它们中的许多字符禁止在头域中出现或者不能正确地通过某些邮件网关规则转换编码任何字符序列都可以使用集中的一列字符编码和一个前导变换字符值为字符后的八进制数被解释为基字符直到出现一个非基字符包括控制字符如回车和换行因此一个字符变换序列通常在一行的行尾结束作为一个例外如果一个序更以字符值为结束则这个字符被忽略其他结尾字符不能忽略正常处理作为一个特例作为的编码规则制表符回车和换行字符可以用它们的直接表示注意内容转换编码按规则使用这些字符这些用法不遵守的限制利用这三个规则一个字符变为行平均个位的码字符串例如字符串你好其编码为转换为串为是由联合工作组提出的一种与系统兼容的文件系统安全的转换格式并在附录中推荐采用个八位字节来表示中的一个字符第一个八位字节从左到右有几个就表示这个字符占几个八位字节第二个八位字节及以后的八位字节每一个以打头作为一个八位字节的标识以区分标识和后面的有效位所有的有效位串接起来表示一个字符真正有意义的位表示原字符的格式为一个八位字节以为先导表是编码方案表编码方案有效位最小值最大值二进制的位序列其中的位连接起来就组成了码若只表示即则只需三个八位字节的特点是兼容现有的基于字符的软硬件平台以及码的转换算法是目前使用比较广泛的一种的变体形式对于可以用两个编码表示附录提示的附录字符内容传送编码是一种用不可读的编码表示任意位序列的编码形式其编码和解码算法十分简单的编码算法是将位一组的输入位串转换成个输出的编码字符编码过程从左到右位输入串被分解为个位的位组每个位组的值为然后从表中取出相应的编码字符放入输出串中编码输出流所表示的行不超过个字符所有断行或出现在表以外的字符都将被编码软件忽略在解码时表以外的字符行中断以及其空白都表示传送出错并给出警告或出错消息表字符值编码值编码值编码值编码有关的详细内容参见附录提示的附录有关的赋值列表考虑到等同于的工业标准目前有一定的用户以及已经发布的版本特列出如下有关的参数名称的别名附录提示的附录实现参考模型总体结构本标准所给出的实现参考模型其总体结构如下图所示其中虚线框内的部分为本标准所规定的因特网电子邮件中文消息传送格式在电子邮件发送过程中对于在扩展平台上使用的本地字符集的纯文本信息通过映射转换的方法转换为字符集的纯文本信息对于在平台上直接使用字符集的纯文本信息对于字符集的纯文本信息通过可选的变体转换如等最后对其进行编码在电子邮件的相应部分中对所使用的字符集变体形式和编码类型进行标记然后向因特网电子邮件系统发送电子邮件在电子邮件接收过程中对于从因特网电子邮件系统接收到的电子邮件首先按照标记的编码类型对于其中的纯文本信息进行解码如果字符集字段有变体转换进行相应的
本文标题:GBT183042001信息技术因特网中文规范电子邮件传送格式
链接地址:https://www.777doc.com/doc-6361494 .html