您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 第1章 XML基础知识
第一章XML基础知识蒲国林pugl@163.com四川文理学院计算机科学系课程目标XML简介XML文档的组成XML的语法规则元素的语法XML文档的有效性体验项目——编写关于班级学生信息的XML文档使用记事本编写某班级的学生信息,要求符合XML语法的规范。学生信息包括姓名、年龄、电子邮箱、身高、电话、单位等;单位又包含地址、邮编等信息,每个学生都要有一个“编号”属性作为标识。例如,姓名为“张三”的学生有两个电子邮箱,每个学生有电话或手机。XML代码如下所示:?xmlversion=1.0encoding=UTF-8?!--以下是某班级的学生信息,每个学生有姓名、年龄、电子邮箱、身高、电话、单位等信息,单位又有地址、邮编等信息,每个学生都要有一个“编号”属性作为标识。名为“张三”的学生有两个电子邮箱,每个学生要有电话或手机。--班级学生编号=A0001姓名张三/姓名年龄23/年龄电子邮箱zhangsan@163.com/电子邮箱电子邮箱zhangsan@yahoo.com/电子邮箱身高179.5/身高电话686868/电话单位公司地址上海/地址邮编100002/邮编/单位/学生学生编号=A0003姓名李四/姓名年龄24/年龄电子邮箱lisi@263.com/电子邮箱身高168.0/身高手机135013562554/手机单位地址北京/地址/单位/学生学生编号=A0002姓名王五/姓名年龄21/年龄电子邮箱wangwu@163.com/电子邮箱身高179.5/身高电话686868/电话单位XXXX公司/单位/学生/班级XML简介XML的起源和目的XML是ExtensibleMarkupLanguage的缩写,即可扩展标记语言。它是一种用来创建的标记的标记语言。1996年,万维网协会(或者叫W3C,)开始设计一种可扩展的标记语言,1998年2月,XML1.0成为了W3C的推荐标准。这种XML语言继承了SGML的规范,StandardGeneralizedMarkupLanguage(SGML)是一种基于记号文本的语言。关于SGML语言,我们会在本章的扩展部分给大家介绍,另外XML还保持了对现有的面向SGML系统的向下兼容性。XML将SGML的灵活性和强大功能与已经被广泛采用的HTML结合起来,简化了计算机对文档和数据交换的处理,使得现有的协议和软件更为协调,从而简化了数据的处理和传输。使用XML标记语言可以做到数据或数据结构在任何编程语言环境下的共享。例如我们在某个计算机平台上用某种编程语言编写了一些数据或数据结构,然后用XML标记语言进行处理,那样的话,其他人就可以在其他的计算机平台上来访问这些数据或数据结构,甚至可以用其他的编程语言来操作这些数据或数据结构了。这就是XML标记语言作为一种数据交换语言存在的价值。XMLSpy2006工具简介(1)XMLSpy是一个非常好的XML编辑器软件,在本书中主要使用XMLSpy2006企业版作为编辑XML的编辑器,安装完成后,打开XMLSpy2006编辑器,如下图所示:XMLSpy2006界面图(2)当编辑XML文档时,首先要新建XML文档,依次点击“文件”“新建”菜单项,在打开的“创建新文档”窗口中将文档类型设为“XMLDocument”,点击“确定”按钮,即弹出“新建文件”对话框,点击“取消”按钮后,就会创建一个XML文档,进入XML文档的编辑界面,如图1-2所示:文档编辑界面(3)在上图所示的文档编辑界面工具栏中,带黄色的对勾“”菜单(快捷键F7)用来检测某个XML文档的格式是否良好。使用绿色对勾“”菜单(快捷键F8)来检测某个XML文档格式是否有效。如下图显示了“黄底白勾的圆形标记”,表示该XML文档的格式良好;显示“绿底白勾的圆形标记”,表示该XML文档格式有效。:XML和HTML的区别XML和HTML都是用于操作数据或数据结构,在结构上大致是相同的,但它们在本质上却存在着明显的区别,它们的区别主要有以下几点:语法要求不同标记不同作用不同在HTML中不区分大小写,在XML中对大小写要求非常严格。HTML使用固有的标记,而XML没有固有标记。HTML用于显示页面,而XML用于描述页面内容的数据或数据的结构。HTML把数据和显示合在一起,在页面中把这些数据显示出来,而XML则将数据和显示分开。XML的优势每种语言的产生都能完成某些特定的功能,XML作为一种标记语言也不例外。XML最大的优势在于它能对各种编程语言编写的数据进行管理,使得在任何平台下都能通过解析器来读取XML数据。它的优势可归纳为以下几点:数据的搜索数据的显示数据的交换在XML中可以提取文档中任何位置的数据,XML将数据的结构和数据的显示形式分开,根据需要使数据呈现出多种显示方式。如HTML、PDF等格式。XML标记语言的语法非常简单,可以通过解析器在任何机器上解读。并可以在各种计算机平台上使用。逐渐成为一种数据交换的语言。XML中的数据用HTML的格式显示首先在同一个目录下新建两个文件:student.html文件和student.xml文件。student.xml文件用于存放学生信息,代码如下:?xmlversion=1.0encoding=GB2312?classusernamelily/usernamedate1986/11/02/dateemailajie@aolhoo.com/emailaddress北京/address/classstudent.html文件用于提取在student.xml文件保存的学生信息,并显示在页面上,代码如下:htmlheadscriptlanguage=JavaScriptfor=windowevent=onloadvarxmlDoc=newActiveXObject(Microsoft.XMLDOM);xmlDoc.async=false;xmlDoc.load(student.xml);nodes=xmlDoc.documentElement.childNodes;username.innerText=nodes.item(0).text;date.innerText=nodes.item(1).text;email.innerText=nodes.item(2).text;address.innerText=nodes.item(3).text;/scripttitle在HTML中调用XML数据/title/headbodybgcolor=#FFFFFF显示某个学生的信息:pb姓名:/bspanid=username/spanpb生日:/bspanid=date/spanpb信箱:/bspanid=email/spanpb地址:/bspanid=address/span/bodybrbr/htmlbrbr运行student.html页面,显示结果,如下图所示:XML文档的组成XML文档也属于纯文本文件,该文档一般如下四部分组成:XML文档注释XML标识及其内容XML文档的声明XML文档类型定义按照这种文档格式来编写的一个XML文件,如下所示:?xmlversion=1.0encoding=UTF-8?!--XML文档注释--?xml:stylesheettype=text/xslhref=stu.xsl?!--班级中学生的信息--classstudentnameJone/nameage20/age/student/class前三部分都是可选的XML文档有效性结构良好的XML文档如果某个文档符合XML语法规范,那么我们就说这个文档是“结构良好”的文档。使用本书讲到的XMLSpy2006工具就可以测试某文档是否为结构良好的XML文档。有效的XML文档所谓有效的XML文档是指通过了DTD的验证的,具有良好结构的XML文档,在此大家要明白XML文档可分为结构良好的XML文档和有效的XML文档,以及他们之间的关系。即具有结构良好的XML文档并不一定就是有效的XML文档,反之一个有效的XML文档必定是一个结构良好的XML文档。XML的基本语法XML的语法规则XML的语法规则既简单又严格,非常容易学习,在使用过程中只需认真仔细,没有多大困难。一般XML的语法规则大致可归纳为以下几点:正确的嵌套包含结束标记不可忽略区分大小写在HTML中某个标记有起始标记,却可以没有结束标记,但在XML文档中却不可以。在XML中严格区分大小写,主要表现在开始标记和结束标记的大小写必须相同。还包括文档的声明部分和文档类型定义部分的大小写区分。元素元素是XML文档的重要组成部分,在XML文档中必须存在元素。XML文档的元素一般是由标记头、标记末和标记间的字符串数据构成,如下代码所示:rootathisistest/a/root元素a的元素名或标签名元素a的值XML文档中的第一个元素被称为根元素,在任何一个XML文档中有且只有一个元素被称为根元素。其余所有的元素都是子元素,子元素必须正确的嵌套在根元素中。标记间的字符串数据就是该元素的值,在XML中,如果元素的值中存在空格,那么这些空格将按原样解析出来实体预定义实体表如下所示:实体名引用格式表示的符号lt<gt>amp&&apos''quot"实体在XML文档中的一般引用格式如下:&实体名;属性属性是用来修饰某个元素的,如:rootaattribute=aathisistest/a/root属性名属性值关于元素的属性需注意如下几个问题:属性的值必须用引号括起来,如:attribute1=“aa”或attribute3=‘aa';元素的属性以名和值成对出现;用来修饰同一个元素的属性的属性名不能相同;属性值不能包含“&”、“’”、“”等字符。CDATA节通过CDATA节可以通知分析器,在CDATA节包含的字符中没有标记。这样,如果文档包含可能会出现的标记字符,但我们又不是把它当作标记来使用,而只是属于文本字符,那么使用CDATA节来创建这样的文档就容易得多。CDATA节主要用于脚本语言内容、示例XML文档内容和HTML内容。如下所示:?xmlversion=1.0encoding=gb2312?程序titletest/title内容![CDATA[if(2010){return你好;}else{returnhello;}]]/内容/程序注意:在“![CDATA[”和“]]”之间不能再加入CDATA节或“]]”实践项目——编写关于班级学生信息的XML文档程序的实现要求如下:(1)用记事本编写某班级的学生信息,要求符合XML语言的规范。(2)编写中每个学生要有姓名、年龄、电子邮箱、身高、电话、单位等信息,单位又包含地址、邮编等信息。每个学生要有电话或手机。每个学生都要有一个“编号”属性作为标识。(3)使用XMLSpy2006工具来测试该文档是否是结构良好的XML文档。本章总结XML简介XML文档的组成XML的语法规则元素的语法XML文档的有效性
本文标题:第1章 XML基础知识
链接地址:https://www.777doc.com/doc-3378951 .html