北检院检测中心 | 点击量:13次 | 2024-12-11 15:13:06
GB 13000.1-1993 信息技术 通用多八位编码字符集(UCS) 第一部分:体系结构与基本多文种平面
标准中涉及的相关检测项目
《GB 13000.1-1993 信息技术 通用多八位编码字符集 (UCS) 第一部分: 体系结构与基本多文种平面》主要是关于字符编码体系的技术标准,本身不直接涉及具体的检测项目或检测方法,而是定义了字符编码的结构和使用规范。因此,它不会详细列出具体的检测项目和方法。然而,它在信息技术领域应用广泛,涵盖的产品主要包括字符编码相关的软件和系统。以下是与该标准相关的内容大概补充说明:
检测项目:- 编码正确性检测
- 兼容性检测
- 字符集完整性检测
- 字符映射测试:验证每个字符是否被正确编码。
- 兼容性测试:确保与其他标准(如UTF-8、UTF-16)的兼容性。
- 显示正确性测试:在设备和软件中正确显示字符。
- 操作系统
- 文本编辑软件
- 数据库系统
- 浏览器和其他网络应用
- 支持多语言的应用软件
这些信息技术产品和软件通常需要符合UCS的标准以确保字符数据的正确处理和交换。
GB 13000.1-1993 信息技术 通用多八位编码字符集(UCS) 第一部分:体系结构与基本多文种平面的基本信息
标准名:信息技术 通用多八位编码字符集(UCS) 第一部分:体系结构与基本多文种平面
标准号:GB 13000.1-1993
标准类别:国家标准(GB)
发布日期:1993-12-24
实施日期:1994-08-01
标准状态:现行
GB 13000.1-1993 信息技术 通用多八位编码字符集(UCS) 第一部分:体系结构与基本多文种平面的简介
规定了通用多八位编码字符集(UCS)它可用于世界上各种语言的书面形式以及附加符号的表示传输交换处理存储输入及显现。GB13000.1-1993信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面GB13000.1-1993
GB 13000.1-1993 信息技术 通用多八位编码字符集(UCS) 第一部分:体系结构与基本多文种平面的部分内容
中华人民共和国国家标准
信息技术通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面Information technology -Universal Multiple-OctetCoded Chararter Set (ucs)-
Part 1: Architecturc und Basic Multilingual PlaneGB 13000. 1--93
[S0/IEC 10646. 1- -1993
本标准等同采旧国际标准IS0/IEC10646,I—1993信息技术通用多八位编码字符集(LiCS)第·一部分;体系结构与基本多文种平面》1主题内容与适用范围
行13D0规定了通用多六位编码学符案UCS),它可用于界上存种语合的书面形式以及附加符号的表示、传输、交换、处理、存储、输人及显现。GB13000的这-部分规穿LICS的总体体系结构,以及:a.定义在GB-3000中使用的术语:h.描述本编码字符集的总体结构;c.
规定 UCS 的基本多文种平面(MP),并定义一个用于世界范用约冬种文字及各种语言书面形式的图形字符巢;
d.规定 BMP 的图形字符的编蚂表示及名称+e
规定LCS的肆八位(32位)正侧形式:UCS4:规定LCS的双八位(16位)BMP形式:UCS 2;规定控制功能的编码表示,
规宦未来对求缔码字符进行补充的管理办法。UCS 是一种与 GB 2811 所规定的编码体客不同的体系。从GB 2S1I中指明 LICS 的方法规定F17.2,
2符合性
2.1总则
在任何情说下,只要按本国家标准规筐的方法恢用专用字符,那么,下列符合性的要求便不再适用于这些专用字符本身。
2.2信息交换的符合性
如符合以下条件,便砍在用工交换的编码信息内的编码字符衍数提元素符合本国家标准年:在该端码宇符数据素内的全部图形宇符的编码表示都符合第章和第7章,及选自第14章的--种已标认的形式,并,且还符合选白第 15 章的一种已标识的实现等级:b,在该编码字符数据元素内所表示的全部图彩字符都来源于.-个已标识的下集(见第13章),c。在该编码字衍数据元素内的全部控制力能的编表示都符合第16章。符合性声明必须标识出所果用的形式,所用的实现等级以及所采用的以汇棠清单(或)学符造国豪技术监督局1993-12-24批准1994-08-01实施
单给出的子集。
2.3设备的符合性
GB13000.1-93
如巢一台设备符合下列项的要求,且符合项及c项一者之一或其全部要求,则称该设备符合本国家标准,
注:“设备这一术语(在4.17中)被定义为信息处理装备中的部件,它可以传送和(或)接收在编码字符数据元素方的编码信息。设备可以指常现密义上的输入/输出设备,也可指成用程序或网关功能等进程符合性声明必须标识出一个含有下面:项中规定的描述的文档,并且必须标识出所用的形式,所采用的实现等级、所采用的以汇集清单和(或)字符清单给山的子集以及依据第16章所采用的控制功能。
设备描述:符合GB13000的设备应是一种描述的对象,所谓描述,就是象下列b和c项所分别#
规定的那样,标识出用户向设备提供字符的手段,和(或)用户接收到这些字符后的辨识方式b始发设备:始发设备必须允许它的用户提供来自所采用的子集中的任意字符,并且能够依据所采用的形式及实现等级传送编码字符数据元素内的这些字符的编码表示。:接收设备:接收设备必须能够依据所采用的形式及实现等级,接收并解释编码字符数据元素内的任何字符的综码表示,并且必须使得来白所采用的于集中的任何相应字符以用户能识别的方式提供给用户。
对于所采用的子集中没有的任何相应字符,应以某种方法向用户提示,但不必区分这些字符。往:①可通过两种方法向用户提示:用同一个字符来表示所采用的子集中不具备的字符或者,当对某类用户凸适时,提供一种能鉴别的有声信号或可规信号②关于具有再传输能力的接收投备,可参见附录H(参考件)。3引用标准
下列标准所包含的条女通过在本标准中引用而构成为本标准的条文。在出版时,所示版本均为有效。这些标准都会被修订,使用本标准的各方应探讨、使用下列标准最新版本的可能性。GB2311-90信息处理七位和八位编码字符集代码扩充技术GB5261—85文字和符号成形设备用的增补控制功能4术语
下列定义适用于GB13000。
4.1基本多文种平面Basie Multilingual Plane(BMP)00组的 00 平面。
4.2块block
一组相邻接耳其有共同特征(诸如某种文字)的字符的汇集。4.3正则形式canonical form
规定本编码字符集中的字符的一种形式,它用四个几位表示每一个字符4,4编码字符数据元素(C-data-element (Coded-Character-Data-Elemcnt)被交换信息的一个元素,它山依据一个或多个已标识的编码宇符集标准的一些字符的编码表示序列组成。
4.5字位cell
行中可安排一个字符的位置。
4. 6 字符 character
供组织控制或表示数据用的元素集合中的一个元素。4.7字符边界characterboundaryGB 13000.1—93
在八位流出,某一字符的编码表示中的最后个八位与其下一个字符闷编码表示的第·个八位之间的分界。
4.8编码宁符coded chararter
字符及其码表示。
4.9编钙字符集coded characlerset一纽无歧义的规则,用于建立一个产符集和该字符集中的了符及其绵编码丧示之间的:一对成义系
4.10代码表codetahlc
示出·-种代码中分配给各八位的诸字符的表4.11组合用符combiningcharaclch本国家标准编码字符集中一个已标坂的子集中的一~种结构要素,用于与其前导的非组合用图形字符相组合,或者与个以非组合用字符为前导的组合用字符序列相组合(见 4. 13)。注:GE13000的这部分现定了包含组合用7符的若干个了集汇第。4.2兼容字符eornpatbilitycharaeter主要为现存编码字符集兼容而作为GF1300的编码字符收入的图形字符。4.13复序列composite scqucnce由一个非组合用字符后随·个或多个组合用学符所组成的图形字符的序列(见。4.11):注:用于复合序列的图形符号·-般是内该序列中每字径的图形符号的组合耐构成的。2复台房列不居字符,因此也不是GR130!字汇中的结购要素4. 14 挖制功能control [unction影响数据的记录、处理、传输或解释的一种动作,其编码表示由一个或多个八位成,4. 15 默认状态 default state在未明显地指定状态时所假设的状态。4. 16 明细代码表detailed code table示出一个个字符的代码装,并且通常示出一行之局部。4.17设备device
信息处理装备中的部件,能发送和(或)接收编码宁符数据元素内的编码信息(它可以是常规意义上的输入/输出设备,也可以是诸如应用程序或网关功能那样的进程)。4.18图形字符graphiccharecter不同于控制功能的字符,通常具有书写、打印或显示的可视表示。4.19图形符号graphic symol
图形字符或复合序列的可视衣示。4.20组group
本编码字符集编码空间的-个划分单位,具有256×256×256个字位。4.21 交换 interchange
采用信手段或可交换的媒体把字符编码数据从一个用户传送到另一个用处,4.22交互运作interwo-kin
允许两个或两个以上采用不同编码字符集的系统能翁义确切地交换字符编码数据的一种过,斯中可能涉及两种代码之间的转换。4.23八位ctet
被视为一体的一个有序的八个位(比特)的序列。4.24平面plane
纸的一个划分单短,具有256×256个字位。4.25 显现 μresentation+to presentGB 13000.1-93
书写、打印或显示一个图形等号的过程。4.26变形显现形式prcscniation form在某些文学的显现中,表示一个字符的某种图形符孕形式,这种形式依赖丁该字符相对下其他字符的位置。
4.27专用平面private use planes本编码孕符集中,其内容不击GB13000规定的面(见10.1)。4.28字汇rcpertoire
端码字符架表示的:个指定的字符集合,4.29 行row
半而的个划分单位,其有256个字位。4.30文字seript
用于一种或多种谱言的书的形试的率形学符的集合。4.31辅助平而supplementaryplanes睿纳未安排在基本多文种平面中的那些宁符的平面。4.32用产user
享用由设备提供的服务的个人或其他实体,(例如,若该“设备是代码转换器或网关功能,则用户实伴可以是诸而应用程序这样的进,)4.33区
代码表中字位的一个序列.由包含.个特定类别字符的一行或多行(整行或部分行)组成(见第8章)。
5UCS总体结构
本章描述通用多八位编码字符集(下称“本编码字符集\)的总体结构.并在图1及图2中加以说明,此结构的规范在后闻的各章中给山,在GB13000中.任何个八位的俏均出从00~FF的+十六进制记数法表示,见附录J(参号件)。本编码字箱集的正则形式,它的表达方法,恢用「一个被现为单:实体并由12B·个三维的组组成的四维编码空间,
注:闵此,缩码字符的止正则形式中最高八位的第8位叫用于设备的内部处理,只要在符合标准的编综码字符数据元率内其值被置为宰
每个组包今256个二维平南。每个下面包含256个-一维行,每个行包含256个字位。-一个字符被安排并编码于这个编码空间的一人字位上,否则,则声明该字位末被侠用,在止则形点中.用四个八位来表示每一个产符,并相应地指穿组、平面、行和字位,由于两个八位不足以包容过界上所右的符,而32位的表示义符合现代处理系统的体系结构,所以正则形式由四个八依组成。
肆八位正则形式可用作肆八位编码字符集,此时称它为CS-4,第个平面(00组中闪00平面)称作基本老文种平面。它包括字盘文字,音节义字及表意文字中通常使用的字符以及各种符号利数。BMF还有一个限制使用(RUJ)区,在此区中,宁符具有特殊的性状。其后的平面被视为辅助平而或专用乎面,用下容纳附归的图形学符。00组中具有平面八位值E0-FF的32个平而为·专用平面。本编码字符集中组八位值为60~7F的32个组为专用组。GB13000不规定专用区中字位的内容。每个字符均按照其组八位,平面八位、行八位、字位八位安排在本编码字对集中。除正则形式外,不国家标准又规定广-种双八位的BMP形式,内此,其本多文种平面可当作双八位编码字符集使用,标证为 UCS.2.
GB13000.1-93
为给出图形字符的了字汇,叫利用编码空间中的子集。附录G(参考件)规定了UCS的一种变换格式(UTF-1),它可用在对按照(B2311结构进行编码的控制字符的八位值敏感的通信系统中专输文本数据。6基本结构及用语
6.1 站构
GB13000规定的通用多八位编码字符集应被视为个单:的实体。整个编码字符集应被表达为包含 128 个组,其中每组有 256 个平而。每平面应被视为含有 256 行字符,每行256个字位。在表示平面内容(如图2)的代码表中水平轴应表示最低八做,其左侧八位值最小;而纵轴应表示较高八位,其项端八笠值最小。编码空间中每一轴线应出一个八笠进行编码。在每-个八位心最高位应为第8位,最低位应为第1,
相应地,分配结每一位的权应为:第8位
第7位
6.2字符的编码
第6位
第5位
第4位
第2位
第1位
一个肆八位岸列表示。该序列的在编码字符集的正则形式中,整个编码字符集内的每一·个字符须由最高八位成为组八位,最低八位应为宁位八位。这样,此序列可表示为:TTL. s.
组人位
(Graup-rtet)
平而八位
(Plane-octet)
其中,m.s. 意为最高人位,L 8,意为最低八。为省略起见,各八位文可写为
P-八位
行八位
(Row-ociet)
R-八位
字位八位
(Cell-octet)
C-八位
在适当场合,还可进一步缩写为 G、P、R 及 C。任意一个八位的值应由两个十六进制数字表示。例如:31或FE。若想以组,平面、行及字位的值来标识单个字符,则应以下列形式表示:0000 0030表示 DIGIT ZERO(数字 0)0000 0041表示LATIN CAFITAL[ETTER A(拉丁文大写字母A)当引用一个平面内的字符时,前面的四个零(表示组八位和平面八位)可以省略。例如:0030表示DIGII ZERO(整字
每个+间:251×256
个字做
(Each plant:
256×236
character
positions.1
GB 13000.1-93
(Group7F)