XML入门精解之文件格式定义
发布时间:2008-02-25 13:57:00
DTD实际上可以看作一个或多个XML文件的模板,这些XML文件中的元素、元素的属性、元素的排列方式/顺序、元素能够包含的内容等,都必须符合DTD中的定义。XML文件中的元素,即我们所创建的标记,是根据我们应用的实际情况来创建的。想要创建一份完整性高、适应性广的DTD是非常困难的,因为各行各业都有他们自己的行业特点,所以DTD通常是以某种应用领域为定义的范围,如:医学、建筑、工商、行政。DTD定义的元素含盖范围越广泛,那么就越复杂。
DTD可以是一个完全独立的文件,也可以在XML文件中直接设定。所以,DTD分为外部DTD(在XML文件中调用另外已经编辑好的DTD)和内部DTD(在XML文件中直接设定DTD)两种。比如,有几十家相互联系的、合作伙伴关系的公司、厂商,他们相互之间的交换电子文档都是用XML文档。那么我们可以将这些XML文档的DTD放在某个地方,让所有交换的XML文档都使用此DTD,这是最方便的做法,同时也适用于公司内部的XML文件使用。
内部DTD
内部DTD是在XML文件的文件序言区域中定义的。语法:
〈!DOCTYPE element-name[........
]〉
〈!DOCTYPE :表示开始设定DTD,注意DOCUTYPE是大写。
Element-name :指定此DTD的根元素的名称,一个XML文件只能有一个根元素。注意,如果 XML文件使用了DTD,那么文件中的根元素就在这里指定。
[.........]〉 :在[ ]标记里面定义XML文件使用元素,然后用〉结束DTD的定义。
下面,我们来看一下怎样给XML文件定义DTD,请见例1。
例1中的DTD定义区可以看作是一个DTD定义的大概框架,为其他XML文件定义DTD,结构和例1的DTD差不多,只是可能需要添加、删除或者更改一些东西而已。在DTD定义的中间是元素设定,这是一个DTD的最主要部分,其主要语法如下:
〈!ELEMENT element-name element-definition〉
〈!ELEMENT:表示开始元素设置,注意此处ELEMENT关键字是大写。
element-name:表示要设置的元素的名称。
element-definition:指明要对此元素进行怎样的定义,就是说〈元素〉...〈/元素〉之间能够包含什么内容,是其他元素还是一般性的文字。
在例1中,大家可以看到,〈!ELEMENT 参考资料 (书籍)〉这个元素设定是声明了“参考资料”这个元素,并且它是作为“书籍”这个元素的父元素。〈!ELEMENT 书籍 (名称,作者,价格)〉这个元素设定声明了“书籍”这个元素,并且它是作为“名称”、“作者”、“价格”这三个元素的父元素。而〈!ELEMENT 名称 (#PCDATA)〉这个元素设定声明了“名称”这个元素,但是此元素仅仅包含一般文字,是基本元素,这是由#PCDATA关键字定义的。
在元素设置中,如果元素包含多个子元素,如:〈!ELEMENT 书籍 (名称,作者,价格)〉这种含多个子元素的声明,那么“名称”、“作者”、“价格”这些标记在XML文件中必须以上面排列的顺序出现,每个标记必须而且只能够出现一次。如果在设定元素时,按照〈!ELEMENT 书籍ANY〉,这样在元素下就可以包含任意被设定过的元素,出现的次数和顺序也不受限制,并且在该元素下,除了可以包含子元素以外,还能够包含一般的文字。有时候,在XML文件中,一个标记可能多次出现(或者不出现),那么我们除了在它们的父元素中用ANY关键字之外,还可以在元素的旁边加上特定的符号来控制标记出现的次数。这些符号见表1。
表1
符号 代表标记出现的次数
? 不出现或只出现一次
* 不出现或可出现多次
+ 必须出现一次以上
无符号 只能出现一次
例如:〈!ELEMENT 参考资料(书籍,报纸+,杂志?,网站)〉这个元素设定,“书籍”标记在XML文件中可以不出现或者出现多次;“报纸”标记必须出现一次以上;“杂志”标记可以不出现或只出现一次;而“网站”标记必须出现而且只能出现一次。
在一些父元素的声明中,有可能它包含的子元素是在多个子元素中选择一个来使用,那么我们声明此父元素时,就可以把它声明成选择性元素,例如:〈!ELEMENT 配偶 (妻子|丈夫)〉。可供选择的子元素用“|”分隔,这样,我们在XML文件中可以这样写:
〈配偶〉
〈丈夫〉张三〈/丈夫〉
〈/配偶〉
只从中选择一个子元素。
在我们的XML文件中,还可能包括很多“空元素”,即:元素是单独存在的,没有〈/元素〉这样的结束标记。那么在DTD中是用EMPTY关键字来声明的。如:〈!ELEMENT 元素名 EMPTY〉。在XML文件中,空元素不需要结束标记,但必须以〈/空元素名〉这样的写法。
在DTD中,还可以声明一些称为Entity的东西,让DTD和XML文件使用。我们可以把Entity看作是一个常量,它有一定的值。在DTD中,Entity的声明语法为:〈!ENTITY entity-name entity-definition〉。例如:我们在DTD中声明〈!ENTITY PC "(#PCDATA)"〉 ,那么在后面的元素设定中,就可以使用这个Entity来代替“(#PCDATA)”这个字符串,如:〈!ELEMENT 作者 (#PCDATA)〉可以写成〈!ELEMENT 作者 &&PC;〉。引用Entity的时候,必须要在Entity名称前面加上“&&”符号,后面加上“;”符号。
在例1中,〈!ATTLIST 价格 货币单位 CDATA #REQUIRED〉这一句是设定元素的属性,关于元素属性设置的语法为:〈!ATTLIST element-name attribute-name Type Default-value〉 。其中,〈!ATTLIST是开始属性的设定(注意大小写)。element-name是指明此属性设定是针对什么元素的;attribute-name是设定的属性的名称;Type是该属性的属性值的类别,属性值有多种,可以是一般的文字,或从几种属性值中取一种等,属性值的种类见表2。Default-value是指该属性的内定值种类,有四种不同的属性内定值(见表3)。
猜你喜欢
- 对文本类文件(*.txt;*.html;*.doc;等等),图片类文件(*.jpg;*.gif等等)直接点击链接时会在浏览器打开,而无法出现
- 没有使用动态语句直接报错 错误的 代码如下:alter proc testpapers as begin declare @tems nva
- 一、数字类型所谓的“数字类”,就是指 DECIMAL 和 NUMERIC,它们是同一种类型。它严格的
- 如何清除Vbscript惹出来的中文乱码? <script language=vbscript runat=s
- 今天开发富媒体广告遇到的问题 用JS控制flash 只在IE平台下有效 费尽周折才找到兼容的解决方案方法如下:重点在于 object的id属
- 注:所有文字,除注明网站类型外,其他均针对企业站点.请随时注意留言,若修改则会在首页提示文字里标注.若牵扯到业务方面的问题,我可能不会做过多
- <SCRIPT language="javascript"> function&nbs
- 网页布局中常有的一种情况就是网页主体部分分成一行两列;而在很多种情况下,设计师们常把左右两列的背景色设计成不同色彩,以实现内容块的明显区分;
- 看到豆瓣上有网友提了这个问题,看到回答的人不多,忍不住写了下面的内容。工作中最常用到的统计方法有哪些?根据我自己的经验给举些例子。1.通过一
- 我们知道,在js中,当object作为参数传递到函数中进行处理后,实际上是修改了传入的对象本身(或者说是对象的引用),但很多时候我们并不希望
- 很常见的一个图片轮播Flash,使用之后发现在IE下按F5刷新之后Flash区域就变成一大块背景色,内容轮播出不来了。有趣的是右键点击Fla
- 呵呵,先说明一下下面的程序大部分收集自网络,因为本人在asp编程中经常使用到随机函数,所以收集了一些这类的函数,并做了些注释,方便使用。首发
- 返回首页的链接地址,有三种方法:1、一般方法是,直接写对应的域名地址,<a href="http://www.zfnn.co
- Object 类型的对象虽然有 toString 方法,但结果却是 [Object Object] 让人没法理解的字符。比如简单的对象:{n
- IE 一如既往地带来问题。真的,我觉得 IE 坚持自己的一套无所谓,不支持或者不完全支持标准也无所谓。但是,IE6 IE7 IE8 这三个版
- 将有安全问题的SQL过程删除.比较全面.一切为了安全!删除了调用shell,注册表,COM组件的破坏权限MS SQL SERVER2000使
- 安装时建议你为MySQL管理创建一个用户和组。由该组用户运行mysql服务器并执行管理任务。(也可以以root身份运行服务器,但是不推荐)第
- 今天在看框架的时候无意间看到了document.compatMode,经过一番资料查找,终于搞懂了。文档模式在开发中貌似很少用到,最常见的是
- 作者:Roland Smart原文链接:http://www.adaptivepath.com/ideas/newsletter/archi
- 对于什么是好设计,一万个人那里至少有一万零一个答案。每个人都有自己的答案,有的人还不止一个答案。老师说,一定要在设计里灌注自己的思想,有了自