Schema
Schema简介
本章我们将用XML Schema文件对学生信息的XML文档进行约束,并加入老师的信息。实现了如下的功能:
对每个“学生”元素都用一个编号属性唯一标识。且编号的值要类似“B001”,即第一个字符为大写字母,后面跟三个数字。约束“电子邮箱”为“ewsd@163.com”的形式。“老师”元素用一个编号属性唯一标识。且编号的值要类似“GB001”。
Schema文件的部分内容如下:
对“年龄”元素和“身高”元素的值进行限制。即年龄必须是在26到18岁之间。身高必须在140.0cm到190.0cm之间。 代码如下:
xs:simpleType name="age">
xs:restriction base="xs:int">
xs:maxExclusive value="26">/xs:maxExclusive>
xs:minExclusive value="18">/xs:minExclusive>
/xs:restriction>
/xs:simpleType>
xs:simpleType name="length">
xs:restriction base="xs:float">
xs:maxExclusive value="190.0">/xs:maxExclusive>
xs:minExclusive value="140.0">/xs:minExclusive>
/xs:restriction>
/xs:simpleType>
Schema的诞生
XML在某些特殊的应用场合,对数据本身、数据的类型以及数据之间的联系都有一定的限制。这种限制不是由XML语法来规定的,而是在特殊的环境中所必须的一种限制。我们需要把这种限制用另外的方式表达出来,然后告诉用户和计算机。
Schema作为一种新的思想诞生了,Schema通常是一组为了描述某一类XML文档而定义好的一套规则。XML Schema与DTD一样,也是对某一类XML文档进行约束并确定其结构,包括对元素、属性、及数据类型的完整定义,及某个XML文档中所使用的元素、实体、元素的属性、元素与实体之间的关系的特殊约束。XML Schema最初是由微软提出并使用,后来在W3C的专家们充分讨论和论证的基础上,于1999年2月15日,W3C发布了一个需求定义,说明了新定义的Schema必须符合的要求。1999年5月6日,W3C完成并发布了Schema的定义。最终被确定成为一个标准。
Schema的优势
XML Schema文件使用XML语法,在其设计目的方面与DTD类似,但是在功能方面,XML Schema比DTD更完善,并且更容易扩展。相比DTD主要优势有以下几点:
(1)一个XML Schema文件同时也是一个XML文档,
(2)Schema定义了多种数据类型。在XML Schema文件中可以像在其他编程语言那样来定义数据类型,如整型、字符型、浮点型、布尔型、日期型等。
Schema的建立和使用
建立有效的Schema文件
一个有效的Schema文件的结构如下:
?xml version="1.0" encoding="UTF-8"?>
xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
elementFormDefault="qualified" attributeFormDefault="unqualified">
!-- 这里编写内容 -->
/xs:schema>
使用Xmlspy工具书写Schema
首先启动Xmlspy 2006企业版,然后点击菜单栏中的“文件”“新建”菜单项,打开“创建新文档”对话框,选择“xsd XML Schema file”文档类型,如下图:
点击“确定”按钮,进入文档编辑区,如下图:
内容编辑完成后,点击如图所示的工具栏中带黄色对勾()的按钮验证文件格式,如果格式良好,将显示带黄色对勾()的标记;反之,将显示带红色叉(X)的标记。点击图3-2所示的工具栏中带绿色对勾()的按钮验证文件有效性,如果文件有效,将显示带绿色对勾()的标记;反之,将显示带红色叉(X)的标记。
Schema简单类型元素
Schema类型的元素是Schema文件的根元素,每个Schema文件必须包含Schema类型的元素。Schema类型元素的属性有以下几种:
简单类型元素主要有: simpleType类型元素 element类型元素 attribute类型元素 enumeration类型元素 pattern类型元素 union类型元素 list类型元素
simpleType类型元素
simpleType类型用于定义一个简单类型的元素。
simpleType类型的属性有“final”、“id”和“name”。“final”属性指出派生的类型,防止该simpleType元素的指定派生类型,该值可以包含一个列表,该列表是list、union或restriction元素的子集。如下:
xs:simpleType>xs:restriction base="xs:positiveInteger">
!-- 限制取值范围 -->xs:maxExclusive value="100"/>
/xs:restriction>
/xs:simpleType>
xs:restriction :限制基类型元素
element类型元素
element用于定义一个普通的元素。一般格式如下:
element name="name" type="string">/element>
element name="age" type="int">/element>
element name="address" type="string">/element>
element元素的属性有name、abstract、block、default、final、fixed、id、nillable、maxOccurs、minOccurs、substitutionGroup和type
name属性的值是该element元素的元素名。
type属性的值是该element元素的数据类型
ref属性的值必须指向一个全局元素。
maxOccurs属性的值是元素在其父元素中出现的最大次数,它的取值为大于0或等于0的数,在默认状态下为unbounded
minOccurs属性的值是元素在其父元素中出现的最小次数,它的取值为大于0或等于0的数,在默认状态下为1
attribute类型元素
attribute用于声明一个属性元素。如:
?xml version="1.0" encoding="UTF-8"?>
xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
elementFormDefault="qualified"
attributeFormDefault="unqualified">
xs:attribute name="a">/xs:attribute>
/xs:schema>
attribute主要有name、default、fixed、id、 ref、type、use几种属性
(1)Default:指该attribute类型元素的名称具有默认值;
(2)fixed:指该attribute类型元素的名称具有固定的值 ;
(3)use:指示如何使用该attribute类型元素。use属性的值必须是“optional”、“prohibited”、“required”中的一种。“optional”表示该属性可以是任何值,并且该属性是可选的;“prohibited”表示不能使用该属性;“required”表示该属性必须出现一次。在默认状态下use的值是“optional”。
enumeration类型元素
enumeration类型用于显示某个元素或属性的枚举。enumeration类型元素的属性有“id”和“value”,id属性标识该值在枚举列表中的位置,value表示该enumeration类型元素的值。如下:
?xml version="1.0" encoding="UTF-8"?>
xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
elementFormDefault="qualified" attributeFormDefault="unqualified">
xs:attribute name="address">
xs:simpleType>
xs:restriction base="xs:string">
xs:enumeration value="北京"/>
xs:enumeration value="上海"/>
/xs:restriction>
/xs:simpleType>
/xs:attribute>
/xs:schema>
pattern类型元素
pattern类型主要用于对某个属性或元素的值进行约束,pattern类型的属性有“id”和“value”。“value”属性的值是被约束元素或属性的值的形式。如下:
?xml version="1.0" encoding="UTF-8"?>
xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
elementFormDefault="qualified" attributeFormDefault="unqualified">
xs:element name="id" type="mytype">
/xs:element>
xs:simpleType name="mytype">
xs:restriction base="xs:string">
xs:pattern value="\d3-[A-Z]2"/>
/xs:restriction>
/xs:simpleType>
/xs:schema>
union和list类型元素
list类型定义单个simpleType类型元素,而union类型定义多个simpleType类型元素。
list类型有“id”和“itemType”属性。
“itemType”属性是指在该元素中定义的内置数据类型或 simpleType元素的名称。包含list元素的simpleType元素是从“itemType”值指定的简单类型派生的。list值必须是限定名。对simpleType元素子级和“itemType”属性的使用是互相排斥的。
union类型有“id”和“memberTypes”属性。
“memberTypes”属性是指在该元素中定义的内置数据类型或simpleType元素的名称列表。包含union元素的simpleType元素是从“memberTypes”值指定的简单类型派生的。
?xml version="1.0" encoding="UTF-8"?>
xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
elementFormDefault="qualified" attributeFormDefault="unqualified">
xs:attribute name="id">
xs:simpleType>
xs:union memberTypes="first second" />
/xs:simpleType>
/xs:attribute>
!-- 第一个simpleType -->
xs:simpleType name="first">
xs:list itemType="second">/xs:list>
/xs:simpleType>
!-- 第二个simpleType -->
xs:simpleType name="second">
xs:restriction base="xs:string">
xs:enumeration value="b001"/>
xs:enumeration value="b002"/>
/xs:restriction>
/xs:simpleType>
/xs:schema>
Schema复杂类型元素
复杂类型是可以包含其他元素、属性和组的元素定义。 主要有以下几种:
sequence类型元素
complexType类型元素
choice类型元素
simpleContent类型元素
extension和restriction类型元素
group类型元素
attributeGroup类型元素
Schema的数据类型
简单数据类型
Schema定义了多种内置数据类型。我们在编写Schema文件时可以直接使用他们。内置数据类型又分为基本数据类型和派生数据类型。如下表所示:
简单数据类型
Schema定义了多种内置数据类型。我们在编写Schema文件时可以直接使用他们。内置数据类型又分为基本数据类型和派生数据类型。如下表所示:
string表示字符串
boolean表示布尔值
decimal表示任意精度数字
float表示单精度32位浮点数字
double表示双精度64位浮点数字
duration表示持续时间。duration的模式为PnYnMnDTnHnMnS
dateTime表示时间的特定实例。模式是CCYY-MM-DDThh:mm:ss
time表示每天重复的时间的实例,模式为hh:mm:ss.sss
date表示日历日期。模式为CCYY-MM-DD
gYearMonth表示特定公历年中的特定公历月
gYear表示公历年
gDay表示重复的公历日
gM onth表示每年重复的公历月
hexBinary表示任意十六进制编码的二进制数据
base64Binary表示Base64编码的任意二进制数据
anyURI表示按RFC 2396定义的URI
QName表示限定名
NOTATION表示NOTATION属性类型,QNames的集合
派生数据类型
由基本数据类型派生出来的数据类型有如下几种:
ID:用于唯一标识元素
IDREF:IDREF类型的含义和使用与DTD中的类似。
IDREFS:IDREFS类型的含义和使用与DTD中的类似。
ENTITY:实体类型,与DTD中的类似。
ENTITIES:ENTITIES类型的含义和使用与DTD中的类似。
NMTOKEN:NMTOKEN类型,与DTD中的类似。
NMTOKENS:NMTOKENS类型集,与DTD中的类似。
long:表示长整型数大小在-9223372036854775808和9223372036854775807之间
int:表示整型数,大小在-2147483648和2147483647之间。
short:表示短整型数,大小在-32768和32767之间。
byte:表示整型数,大小在-128和127之间。
数据类型的属性
每种数据类型都有不同的属性,数据类型的属性主要包括以下几种:
enumeration:在指定的数据项中选择,限定用户的选值。
fractionDigits:限定最大的小数位,用于控制精度。
length:指定数据的长度。
maxExclusive:指定数据的最大值,不包含该最大值。
maxInclusive:指定数据的最大值,包含该最大值。
maxLength:指定长度的最大值,长度单位取决于数据类型。
minExclusive:指定最小值,不包含该最小值。该值的数据类型必须与继承的数据类型相同。
minInclusive:指定最小值,包含该最小值。
minLength:指定最小长度。
pattern:指定数据的显示规范。
用户自定义数据类型
用户在对数据类型进行自定义时,主要是通过simpleType定义,并通过simpleType元素的name属性值作为该自定义数据类型的名称。如下:
?xml version="1.0" encoding="UTF-8"?>
xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
elementFormDefault="qualified" attributeFormDefault="unqualified">
!-- 自定义类型mytype -->
xs:simpleType name="mytype">
xs:restriction base="xs:string">
xs:enumeration value="男">/xs:enumeration>
xs:enumeration value="女">/xs:enumeration>
/xs:restriction>
/xs:simpleType>
!-- 使用自定义类型mytype -->
xs:element name="name" type="mytype"/>
/xs:schema>
复杂数据类型
复杂数据类型的定义主要是通过complexType定义。并通过complexType元素的name属性值作为该自定义数据类型的名称。如下:
?xml version="1.0" encoding="UTF-8"?>
xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
elementFormDefault="qualified" attributeFormDefault="unqualified">
xs:element name="student">
xs:complexType>
xs:sequence>
xs:element name="address" type="mytype" >
/xs:element>
/xs:sequence>
/xs:complexType>
/xs:element>
!-- 用complexType定义一个复杂数据类型mytype-->
xs:complexType name="mytype">
xs:sequence>
xs:element name="北京" type="xs:string"/>
xs:element name="上海" type="xs:string"/>
/xs:sequence>
/xs:complexType>
/xs:schema>
用Schema约束XML文档
使用schema合理控制元素之间的关系
元素与元素之间存在着父子关系、包含关系、继承关系等,我们可以通过Schema中定义的各种类型元素来描述元素之间的关系。例如我们可以用complexType和sequence类型来描述父子关系、包含关系,用group类型来描述兄弟关系等。如下:
!-- “Items”和“item”元素之间存在父子关系 -->
xs:complexType name="Items">
xs:sequence>
xs:element name="item" minOccurs="0"
maxOccurs="unbounded">
!--“item”和“productName”元素之间存在父子关系-->
xs:complexType>
xs:sequence>
xs:element name="productName" type="xs:string"/>
/xs:sequence>
/xs:complexType>
/xs:element>
/xs:sequence>
/xs:complexType>
使用schema文件对XML文档约束
在XML文档中使用已经编写好的schema文件的一般格式如下:
class xmlns="http://tempuri.org/po.xsd"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://tempuri.org/po.xsd test.xsd">
/class>
“class”表示根元素,其中xmlns:xsi是在文档中声明“XML 模式实例”名称空间,以授予对引用XML模式时需要的属性的访问权。当然,要添加前缀映射(xsi)和相关URL。xmlns是为所有没有前缀的元素提供缺省命名空间。
同时我们可以通过设置schemaLocation属性的值,让该文档应用多个schema文件。schemaLocation 属性如下:
xsi:schemaLocation="http://tempuri.org/po.xsd D:\XML\Schema\test1.xsd
D:\XML\Schema\test2.xsd">
实践项目——编写班级信息XML文档的XML Schema文件 >
程序的实现要求如下:
(1)使用Schema的内置数据类型和自定义数据类型来约束元素或属性的值。
(2)使用Schema简单类型元素和复杂类型元素来定义元素,以及描述个元素之间的关系。