您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > xml语言基础---简单介绍
XML解析一、XML基础1)什么是XMLXML是指可扩展标记语言(eXtensibleMarkupLanguage),它也是一种标记语言,很类似HTML。它被设计的宗旨是存储数据,而非显示数据。Html展示数据XML标签没有被预定义,需要用户自行定义标签。XML技术是W3C组织(WorldWideWebConsortium万维网联盟)发布的,目前遵循的是W3C组织于2000年发布的XML1.0规范。XML被广泛认为是继Java之后在Internet上最激动人心的新技术。W3CSchool(入门级)2)XML常见应用用于数据存储用在软件配置,用于描述模块之间的关系(如果著名的Struts、Spring和Hibernate都是基于XML作为配置文件的--SSH)android都是xml。图形界面都是用的xml在一个软件系统中,通过XML配置文件可以提高系统的灵活性。即程序的行为是通过XML文件来配置的,而不是硬编码。XML是一种通用的数据交换格式。(跨平台)二、XML语法语法较多,建议先直接上手写案例,成功之后再回来当回顾学习用一个XML文件主要包括以下几个部分:文档声明元素属性注释实体引用及CDATA区处理指令(PI:ProcessingInstruction)Xml约束1)文档声明在编写XML文档时,需要先使用文档声明来声明XML文档。且必须出现在文档的第一行。(前面注释都不允许)最简单的语法:?xmlversion=“1.0”?用encoding属性说明文档所使用的字符编码。保存在磁盘上的文件编码要与声明的编码一致。如:?xmlversion=“1.0”encoding=“utf-8”?用standalone属性说明文档是否独立,即是否依赖其他文档。如:?xmlversion=“1.0”encoding=“utf-8”standalone=“yes”?2)元素XML元素指XML文件中出现的标签。一个标签分为起始和结束标签(不能省略)。一个标签有如下几种书写形式:包含标签主体:mytagsomecontent/mytag不含标签主体:mytag/(有时也叫空标签)一个标签中可以嵌套若干子标签,但所有标签必须合理的嵌套,不允许有交叉嵌套。mytag1mytag2/mytag1/mytag2一个XML文档必须有且仅有一个根标签,其他标签都是这个根标签的子标签或孙标签。对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处理。例如:下面两段内容的意义是不一样的。网址ww.1000phone.copm/网址网址ww.1000phone.copm/网址--DOM解析由于在XML中,空格和换行都作为原始内容被处理,所以,在解析XML文件时要特殊处理下,绕过这些空格和换行符。元素命名规范:一个XML元素可以包含字母、数字以及其它一些可见字符,但必须遵守下面的一些规范区分大小写,例如,A和a是两个不同的标记。(与java、c变量命名一致)不能以数字或_(下划线)开头。不能以xml(或XML、或Xml等)开头。(xml为关键字,所以不能重复)不能包含空格。名称中间不能包含冒号(:)。一句话:像个正常人一样去写名称就行,不用关键字3)属性一个元素可以有多个属性,每个属性都有它自己的名称和取值,例如:mytagname=“value”…/属性值一定要用引号(单引号或双引号)引起来。属性名称的命名规范与元素的命名规范相同元素中属性没有顺序要求,但是不准重复。在XML技术中,标签属性所代表的信息也可以被改成用子元素的形式来描述4)注释XML中的注释语法为:!--这是注释--注意:XML声明之前不能有注释(xml声明必须放在文档第一行)注释不能嵌套5)实体引用及CDATA区实体引用在XML中,一些字符拥有特殊的意义。如果你把字符放在XML元素中,会发生错误,这是因为解析器会把它当作新元素的开始。如下这样会产生XML错误:messageifsalary1000then/message为了避免此类错误,需要把字符替换为实体引用,就像这样:messageifsalary<1000then/message在XML中有5个预定义的实体引用:<小于>大于&&和号''省略号"引号注意:严格地讲,在XML中仅有字符和&是非法的。省略号、引号和大于号是合法的,但是把它们替换为实体引用是个好的习惯。CDATA区术语CDATA指的是不应由XML解析器进行解析的文本数据(UnparsedCharacterData)。在XML元素中,和&是非法的。会产生错误,因为解析器会把该字符解释为新元素的开始。&也会产生错误,因为解析器会把该字符解释为字符实体的开始。某些文本,比如JavaScript代码,包含大量或&字符。为了避免错误,可以将脚本代码定义为CDATA。CDATA部分中的所有内容都会被解析器忽略。CDATA部分由![CDATA[开始,由]]结束:6)处理指令(了解即可)处理指令,简称PI(ProcessingInstruction)。作用:用来指挥软件如何解析XML文档。语法:必须以“?”作为开头,以“?”作为结尾。常用处理指令:XML声明:?xmlversion=“1.0”encoding=“GB2312”?xml-stylesheet指令:作用:指示XML文档所使用的CSS样式XSLT。7)XML约束(了解即可)为什么需要约束:XML都是用户自定义的标签,若出现小小的错误,软件程序将不能正确地获取文件中的内容而报错。什么是XML约束:约束文档定义了在XML中允许出现的元素名称、属性及元素出现的顺序等等。在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。常用的约束技术XMLDTD,XMLSchema作为普通工程师,一般是使用别人的约束文件,而不会自己去写约束。例如使用SSH框架开始时用到的xml文件,均要受框架的提供的xml的约束文件的约束三、SAX解析XML解析方式主要有:DOM(文档对象模型):将整个文件以树的结构存储到内存中,适合小文件,程序可读性高。Dom4jSAX(基于事件流的解析):省内存,程序可读性相比上述较差。PULL(Android自带解析器):也是基于事件流的解析本次,我们只学习SAX和PULL两种方式正式来学习SAX解析SimpleAPIsforXML,XML简单应用程序接口,在javax.xml.parsers包中,SAX解析是JDK自带的解析方式,包括一组接口和类1)SAX解析原理以事件驱动的方式解析,即找开始结束标签的方式SAX的工作原理简单地说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束、元素(element)开始与结束、等地方时通知事件处理函数,由事件处理函数做相应动作,然后继续同样的扫描,直至文档结束。所以有两个关键点:顺序扫描,事件处理函数2)案例:解析指定文件(标签无属性),并将文件中的信息存放到list中--需要先创建XML文件3)案例:解析指定文件(根标签有属性),并将文件中的信息存放到list中假设:我们给每个phone加一个id属性,那么在解析根节点的时候,就需要获取到id信息并赋值给对象。四、PULL解析在android系统中,很多资源文件中,很多都是xml格式,在android系统中解析这些xml的方式,是使用pul解析器进行解析的,它和sax解析一样,也是采用事件驱动进行解析的,同时,由于android内核已经内嵌了pull,所以我们不需要添加第三方的jar包来支持pull。1)案例:解析XML文件(不带属性)首先,需要jar包:kxml2-2.2.2.jar具体实现步骤如下:基本上跟sax的解析思路是一样的。几个关键的方法强调下:获取其状态码,区分现在是哪个事件源(文档开头,文档结尾,标签开头,标签结尾)获取标签名称获取标签的文本内容让指针继续往下解析下一个事件源2)案例:解析XML文件(带属性)3)PULLvsSAXPull解析器和SAX解析器虽有相似性但也有区别,他们的区别为:SAX解析器的工作方式是自动将事件推入注册的事件处理器进行处理,因此你不能控制事件的处理主动结束;而Pull解析器的工作方式为允许你的应用程序代码主动从解析器中获取事件,正因为是主动获取事件,因此可以在满足了需要的条件后不再获取事件,结束解析。五、作业解析books.xml文件,分别采用pull和sax的方式,要求独立编写完成。
本文标题:xml语言基础---简单介绍
链接地址:https://www.777doc.com/doc-2868308 .html